RU2820522C2 - Multimerizing polypeptides derived from domain with roll-type pentone base of adenovirus - Google Patents
Multimerizing polypeptides derived from domain with roll-type pentone base of adenovirus Download PDFInfo
- Publication number
- RU2820522C2 RU2820522C2 RU2021101625A RU2021101625A RU2820522C2 RU 2820522 C2 RU2820522 C2 RU 2820522C2 RU 2021101625 A RU2021101625 A RU 2021101625A RU 2021101625 A RU2021101625 A RU 2021101625A RU 2820522 C2 RU2820522 C2 RU 2820522C2
- Authority
- RU
- Russia
- Prior art keywords
- amino acid
- thr
- val
- leu
- positions
- Prior art date
Links
- 241000701161 unidentified adenovirus Species 0.000 title claims abstract description 213
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 122
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 121
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 116
- QGMRQYFBGABWDR-UHFFFAOYSA-N sodium;5-ethyl-5-pentan-2-yl-1,3-diazinane-2,4,6-trione Chemical compound [Na+].CCCC(C)C1(CC)C(=O)NC(=O)NC1=O QGMRQYFBGABWDR-UHFFFAOYSA-N 0.000 title abstract 10
- 150000001413 amino acids Chemical class 0.000 claims abstract description 167
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 76
- 210000004027 cell Anatomy 0.000 claims abstract description 74
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 73
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 52
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 46
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 46
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 46
- 108010038807 Oligopeptides Proteins 0.000 claims abstract description 31
- 102000015636 Oligopeptides Human genes 0.000 claims abstract description 31
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims abstract description 24
- 239000002245 particle Substances 0.000 claims abstract description 19
- 230000027455 binding Effects 0.000 claims abstract description 18
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 18
- 239000002773 nucleotide Substances 0.000 claims abstract description 17
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 14
- 238000003780 insertion Methods 0.000 claims abstract description 11
- 230000037431 insertion Effects 0.000 claims abstract description 11
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims abstract description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 4
- 239000000546 pharmaceutical excipient Substances 0.000 claims abstract description 4
- 239000003085 diluting agent Substances 0.000 claims abstract description 3
- 239000003937 drug carrier Substances 0.000 claims abstract description 3
- 241000598171 Human adenovirus sp. Species 0.000 claims description 272
- 241000282560 Macaca mulatta Species 0.000 claims description 84
- 241000990167 unclassified Simian adenoviruses Species 0.000 claims description 59
- CXURGFRDGROIKG-UHFFFAOYSA-N 3,3-bis(chloromethyl)oxetane Chemical compound ClCC1(CCl)COC1 CXURGFRDGROIKG-UHFFFAOYSA-N 0.000 claims description 47
- 239000000427 antigen Substances 0.000 claims description 44
- 108091007433 antigens Proteins 0.000 claims description 44
- 102000036639 antigens Human genes 0.000 claims description 44
- 108700025771 adenovirus penton Proteins 0.000 claims description 35
- 241001217856 Chimpanzee adenovirus Species 0.000 claims description 29
- 241000282575 Gorilla Species 0.000 claims description 29
- 241000701096 Human adenovirus 7 Species 0.000 claims description 27
- 239000012634 fragment Substances 0.000 claims description 26
- 241000813756 Simian adenovirus 49 Species 0.000 claims description 17
- 229910052717 sulfur Inorganic materials 0.000 claims description 14
- 206010028980 Neoplasm Diseases 0.000 claims description 12
- 101710173835 Penton protein Proteins 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 239000012678 infectious agent Substances 0.000 claims description 7
- 208000015181 infectious disease Diseases 0.000 claims description 6
- 229910052757 nitrogen Inorganic materials 0.000 claims description 6
- 229910052698 phosphorus Inorganic materials 0.000 claims description 6
- 108091035707 Consensus sequence Proteins 0.000 claims description 5
- 239000003814 drug Substances 0.000 claims description 5
- 108091008146 restriction endonucleases Proteins 0.000 claims description 5
- 208000035473 Communicable disease Diseases 0.000 claims description 4
- 108010042407 Endonucleases Proteins 0.000 claims description 4
- 201000011510 cancer Diseases 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 229910052799 carbon Inorganic materials 0.000 claims description 3
- 229910052739 hydrogen Inorganic materials 0.000 claims description 3
- 102000004533 Endonucleases Human genes 0.000 claims description 2
- 241000701124 Human adenovirus 35 Species 0.000 claims description 2
- 241000328826 Human adenovirus 52 Species 0.000 claims description 2
- 241000509400 Human adenovirus D37 Species 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 208000026278 immune system disease Diseases 0.000 claims description 2
- 235000015110 jellies Nutrition 0.000 claims description 2
- 239000008274 jelly Substances 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 241000701190 Human adenovirus 11 Species 0.000 claims 1
- 241001135574 Human adenovirus 12 Species 0.000 claims 1
- 241000205685 Human adenovirus 17 Species 0.000 claims 1
- 241000701137 Human adenovirus 41 Species 0.000 claims 1
- KJWMGLBVDNMNQW-VWTMXFPPSA-N Pectenotoxin 1 Chemical compound O[C@@H]1[C@H](C)CCO[C@]1(O)[C@H]1O[C@@H]2/C=C/C(/C)=C/[C@H](C)C[C@](C)(O3)CC[C@@H]3[C@](O3)(O4)CC[C@@]3(CO)C[C@@H]4[C@@H](O3)C(=O)C[C@]3(C)[C@@H](O)[C@@H](O3)CC[C@@]3(O3)CCC[C@H]3[C@@H](C)C(=O)O[C@@H]2C1 KJWMGLBVDNMNQW-VWTMXFPPSA-N 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 21
- 108020001580 protein domains Proteins 0.000 abstract description 8
- 108010085220 Multiprotein Complexes Proteins 0.000 abstract description 7
- 102000007474 Multiprotein Complexes Human genes 0.000 abstract description 7
- 238000004113 cell culture Methods 0.000 abstract description 4
- 230000028993 immune response Effects 0.000 abstract description 4
- 238000002255 vaccination Methods 0.000 abstract description 4
- 210000000987 immune system Anatomy 0.000 abstract description 3
- 230000000890 antigenic effect Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract 1
- 235000001014 amino acid Nutrition 0.000 description 88
- 235000018102 proteins Nutrition 0.000 description 30
- 108010049041 glutamylalanine Proteins 0.000 description 28
- 108010057821 leucylproline Proteins 0.000 description 26
- 229940125581 ImmunityBio COVID-19 vaccine Drugs 0.000 description 25
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 24
- 108010050848 glycylleucine Proteins 0.000 description 23
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 22
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 20
- 108010062796 arginyllysine Proteins 0.000 description 20
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 20
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 19
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 18
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 18
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 17
- 108010093581 aspartyl-proline Proteins 0.000 description 17
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 16
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 16
- 108010078274 isoleucylvaline Proteins 0.000 description 16
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 15
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 15
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 15
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 15
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 14
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 14
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 14
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 14
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 14
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 14
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 14
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 14
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 14
- 108010008355 arginyl-glutamine Proteins 0.000 description 14
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 13
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 13
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 13
- 241001135572 Human adenovirus E4 Species 0.000 description 13
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 13
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 13
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 13
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 13
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 13
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 13
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 13
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 12
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 12
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 12
- JUNZLDGUJZIUCO-IHRRRGAJSA-N Cys-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O JUNZLDGUJZIUCO-IHRRRGAJSA-N 0.000 description 12
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 12
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 12
- 208000022361 Human papillomavirus infectious disease Diseases 0.000 description 12
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 12
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 12
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 12
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 12
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 12
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 12
- 108010001267 Protein Subunits Proteins 0.000 description 12
- 102000002067 Protein Subunits Human genes 0.000 description 12
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 12
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 12
- JVTHMUDOKPQBOT-NSHDSACASA-N Trp-Gly-Gly Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O)=CNC2=C1 JVTHMUDOKPQBOT-NSHDSACASA-N 0.000 description 12
- 108010037850 glycylvaline Proteins 0.000 description 12
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 11
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 11
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 11
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 11
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 11
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 11
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 11
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 11
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 11
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 11
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 11
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 11
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 11
- 230000008696 hypoxemic pulmonary vasoconstriction Effects 0.000 description 11
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 11
- 108010029020 prolylglycine Proteins 0.000 description 11
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 10
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 10
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 10
- ZGXGVBYEJGVJMV-HJGDQZAQSA-N Glu-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O ZGXGVBYEJGVJMV-HJGDQZAQSA-N 0.000 description 10
- UOPBQSJRBONRON-STECZYCISA-N Ile-Met-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOPBQSJRBONRON-STECZYCISA-N 0.000 description 10
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 10
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 10
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 10
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 10
- 108010041407 alanylaspartic acid Proteins 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 230000010354 integration Effects 0.000 description 10
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 10
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 9
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 9
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 9
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 9
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 9
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 9
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 9
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 9
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 9
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 9
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 9
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 9
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 9
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 9
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 9
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 108010087924 alanylproline Proteins 0.000 description 9
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 9
- 108010078580 tyrosylleucine Proteins 0.000 description 9
- 241000701447 unidentified baculovirus Species 0.000 description 9
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 8
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 8
- RYEWQKQXRJCHIO-SRVKXCTJSA-N Asp-Asn-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RYEWQKQXRJCHIO-SRVKXCTJSA-N 0.000 description 8
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 8
- 241000282693 Cercopithecidae Species 0.000 description 8
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 8
- CSMHMEATMDCQNY-DZKIICNBSA-N Gln-Val-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CSMHMEATMDCQNY-DZKIICNBSA-N 0.000 description 8
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 8
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 8
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 8
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 8
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 8
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 8
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 8
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 8
- NERYDXBVARJIQS-JYBASQMISA-N Ser-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N)O NERYDXBVARJIQS-JYBASQMISA-N 0.000 description 8
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 8
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 8
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 8
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 8
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 8
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 8
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 8
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 8
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 8
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 8
- 241000700605 Viruses Species 0.000 description 8
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 8
- 108010018006 histidylserine Proteins 0.000 description 8
- 108010064235 lysylglycine Proteins 0.000 description 8
- 108010038320 lysylphenylalanine Proteins 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- SNBHMYQRNCJSOJ-CIUDSAMLSA-N Arg-Gln-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SNBHMYQRNCJSOJ-CIUDSAMLSA-N 0.000 description 7
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 7
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 7
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 7
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 7
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 7
- WDMNFNXKGSLIOB-GUBZILKMSA-N Asp-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N WDMNFNXKGSLIOB-GUBZILKMSA-N 0.000 description 7
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 7
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 7
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 7
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 7
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 7
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 7
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 7
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 7
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 7
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 7
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 7
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 7
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 7
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 7
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 7
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 7
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 7
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 7
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 7
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 7
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 7
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 7
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 7
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 7
- 108010016616 cysteinylglycine Proteins 0.000 description 7
- 108010036413 histidylglycine Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 108010012581 phenylalanylglutamate Proteins 0.000 description 7
- 108010031719 prolyl-serine Proteins 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 6
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 6
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 6
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 6
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 6
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 6
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 6
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 6
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 6
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 6
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 6
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 6
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 6
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 6
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 6
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 6
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 6
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 6
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 6
- JLCYOCDGIUZMKQ-JBACZVJFSA-N Glu-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N JLCYOCDGIUZMKQ-JBACZVJFSA-N 0.000 description 6
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 6
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 6
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 6
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 6
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 6
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 6
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 6
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 6
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 6
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 6
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 6
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 6
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 6
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 6
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 6
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 6
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 6
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 6
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 6
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 6
- 108010054530 RGDN peptide Proteins 0.000 description 6
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 6
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 6
- RTXKJFWHEBTABY-IHPCNDPISA-N Ser-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CO)N RTXKJFWHEBTABY-IHPCNDPISA-N 0.000 description 6
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 6
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 6
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 6
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 6
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 6
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 6
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 6
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 6
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 6
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 6
- JRXKIVGWMMIIOF-YDHLFZDLSA-N Tyr-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JRXKIVGWMMIIOF-YDHLFZDLSA-N 0.000 description 6
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 6
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 6
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 6
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 6
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 6
- 210000002950 fibroblast Anatomy 0.000 description 6
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 6
- 108010018625 phenylalanylarginine Proteins 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 6
- 108010044292 tryptophyltyrosine Proteins 0.000 description 6
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 5
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 5
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 5
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 5
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 5
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 5
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 5
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 5
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 5
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 5
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 5
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 5
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 5
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 5
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 5
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 5
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 5
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 5
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 5
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 5
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 5
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 5
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 5
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 5
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 5
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 5
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 5
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 5
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 5
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 5
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 5
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 5
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 5
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 5
- WXUUEPIDLLQBLJ-DCAQKATOSA-N Met-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WXUUEPIDLLQBLJ-DCAQKATOSA-N 0.000 description 5
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 5
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 5
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 5
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 5
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 5
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 5
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 5
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 5
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 5
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 5
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 5
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 5
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 5
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 5
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 5
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 5
- QRCBQDPRKMYTMB-IHPCNDPISA-N Tyr-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N QRCBQDPRKMYTMB-IHPCNDPISA-N 0.000 description 5
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 5
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 5
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 5
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 5
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 5
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 5
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 108010053037 kyotorphin Proteins 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 239000002953 phosphate buffered saline Substances 0.000 description 5
- 108010079317 prolyl-tyrosine Proteins 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 5
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 4
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 4
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 4
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 4
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 4
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 4
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 4
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 4
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 4
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 4
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 4
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 4
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 4
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 4
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 4
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 4
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 4
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 4
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 4
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 4
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 4
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 4
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 4
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 4
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 4
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 4
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 4
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 4
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 4
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 4
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 4
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- CWSZWFILCNSNEX-CIUDSAMLSA-N His-Ser-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CWSZWFILCNSNEX-CIUDSAMLSA-N 0.000 description 4
- FBVHRDXSCYELMI-PBCZWWQYSA-N His-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O FBVHRDXSCYELMI-PBCZWWQYSA-N 0.000 description 4
- 241000205704 Human adenovirus 25 Species 0.000 description 4
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 4
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 4
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 4
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 4
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 4
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 4
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 4
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 4
- XTSBLBXAUIBMLW-KKUMJFAQSA-N Met-Tyr-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N XTSBLBXAUIBMLW-KKUMJFAQSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 4
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 4
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 4
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 4
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 4
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 4
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 4
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 4
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 4
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 4
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 4
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 4
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 4
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 4
- 241000700584 Simplexvirus Species 0.000 description 4
- 108010052160 Site-specific recombinase Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 4
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 4
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 4
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 4
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 4
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 4
- YTVJTXJTNRWJCR-JBACZVJFSA-N Trp-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N YTVJTXJTNRWJCR-JBACZVJFSA-N 0.000 description 4
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 4
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 4
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 4
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 4
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 4
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 4
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 4
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 4
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 108010012058 leucyltyrosine Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 210000003705 ribosome Anatomy 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 3
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 3
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 3
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 3
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 3
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 3
- CUQUEHYSSFETRD-ACZMJKKPSA-N Asn-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N CUQUEHYSSFETRD-ACZMJKKPSA-N 0.000 description 3
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 3
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 3
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 3
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 3
- ODNWIBOCFGMRTP-SRVKXCTJSA-N Asp-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CN=CN1 ODNWIBOCFGMRTP-SRVKXCTJSA-N 0.000 description 3
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 3
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 3
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 3
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 3
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 3
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000222122 Candida albicans Species 0.000 description 3
- 241001502567 Chikungunya virus Species 0.000 description 3
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 3
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 3
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 3
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 3
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 3
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 3
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 3
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 3
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 3
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 3
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 3
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 3
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 3
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 3
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 3
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 3
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 3
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 3
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 3
- 241001135569 Human adenovirus 5 Species 0.000 description 3
- 241001545456 Human mastadenovirus B Species 0.000 description 3
- 241000620147 Human mastadenovirus C Species 0.000 description 3
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 3
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 3
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- 241000222722 Leishmania <genus> Species 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 3
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 3
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 3
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 3
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 3
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 3
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 3
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 3
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 3
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 3
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 3
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 3
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 3
- QVIZLAUEAMQKGS-GUBZILKMSA-N Pro-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 QVIZLAUEAMQKGS-GUBZILKMSA-N 0.000 description 3
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 3
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 3
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 3
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 3
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 3
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 3
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 3
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 3
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 3
- 241000256251 Spodoptera frugiperda Species 0.000 description 3
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 3
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 3
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 3
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 3
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 3
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 3
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 3
- OSMTVLSRTQDWHJ-JBACZVJFSA-N Tyr-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 OSMTVLSRTQDWHJ-JBACZVJFSA-N 0.000 description 3
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 3
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 3
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 3
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 3
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 3
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 3
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- -1 antibodies Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000002163 immunogen Effects 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- LKKMLIBUAXYLOY-UHFFFAOYSA-N 3-Amino-1-methyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C=C(N)N=C2C LKKMLIBUAXYLOY-UHFFFAOYSA-N 0.000 description 2
- WEVYNIUIFUYDGI-UHFFFAOYSA-N 3-[6-[4-(trifluoromethoxy)anilino]-4-pyrimidinyl]benzamide Chemical compound NC(=O)C1=CC=CC(C=2N=CN=C(NC=3C=CC(OC(F)(F)F)=CC=3)C=2)=C1 WEVYNIUIFUYDGI-UHFFFAOYSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 2
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 2
- VGMNWQOPSFBBBG-XUXIUFHCSA-N Ala-Leu-Leu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VGMNWQOPSFBBBG-XUXIUFHCSA-N 0.000 description 2
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 2
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 2
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 2
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 2
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 2
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 2
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 2
- 102000006306 Antigen Receptors Human genes 0.000 description 2
- 108010083359 Antigen Receptors Proteins 0.000 description 2
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 2
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 2
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 2
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 2
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 2
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 2
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 2
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 2
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- VMVUDJUXJKDGNR-FXQIFTODSA-N Asp-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N VMVUDJUXJKDGNR-FXQIFTODSA-N 0.000 description 2
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 2
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 2
- IQXSTXKVEMRMMB-XAVMHZPKSA-N Cys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N)O IQXSTXKVEMRMMB-XAVMHZPKSA-N 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 241000168726 Dictyostelium discoideum Species 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 2
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 2
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 2
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 2
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- MIWJDJAMMKHUAR-ZVZYQTTQSA-N Glu-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N MIWJDJAMMKHUAR-ZVZYQTTQSA-N 0.000 description 2
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 2
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 2
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 2
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- NNVXABCGXOLIEB-PYJNHQTQSA-N Ile-Met-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NNVXABCGXOLIEB-PYJNHQTQSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 102100031413 L-dopachrome tautomerase Human genes 0.000 description 2
- 101710093778 L-dopachrome tautomerase Proteins 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 2
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- 108050006654 Lipocalin Proteins 0.000 description 2
- 102000019298 Lipocalin Human genes 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 2
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- XFOAWKDQMRMCDN-ULQDDVLXSA-N Lys-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)CC1=CC=CC=C1 XFOAWKDQMRMCDN-ULQDDVLXSA-N 0.000 description 2
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 2
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 2
- 241001599018 Melanogaster Species 0.000 description 2
- 102100028389 Melanoma antigen recognized by T-cells 1 Human genes 0.000 description 2
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 2
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 2
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 2
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 2
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- FQUUYTNBMIBOHS-IHRRRGAJSA-N Phe-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FQUUYTNBMIBOHS-IHRRRGAJSA-N 0.000 description 2
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 2
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 2
- CXMSESHALPOLRE-MEYUZBJRSA-N Phe-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O CXMSESHALPOLRE-MEYUZBJRSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 2
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 2
- 241000701037 Rhadinovirus Species 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 2
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- 101710173694 Short transient receptor potential channel 2 Proteins 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 2
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 2
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 2
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 2
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- 102100030951 Tissue factor pathway inhibitor Human genes 0.000 description 2
- DVLHKUWLNKDINO-PMVMPFDFSA-N Trp-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DVLHKUWLNKDINO-PMVMPFDFSA-N 0.000 description 2
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 2
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 2
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 2
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 2
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 2
- FWOVTJKVUCGVND-UFYCRDLUSA-N Tyr-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FWOVTJKVUCGVND-UFYCRDLUSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 2
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 2
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000003953 foreskin Anatomy 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000001361 intraarterial administration Methods 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 210000002510 keratinocyte Anatomy 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010013555 lipoprotein-associated coagulation inhibitor Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 239000003440 toxic substance Substances 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 239000003656 tris buffered saline Substances 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- WEYNBWVKOYCCQT-UHFFFAOYSA-N 1-(3-chloro-4-methylphenyl)-3-{2-[({5-[(dimethylamino)methyl]-2-furyl}methyl)thio]ethyl}urea Chemical compound O1C(CN(C)C)=CC=C1CSCCNC(=O)NC1=CC=C(C)C(Cl)=C1 WEYNBWVKOYCCQT-UHFFFAOYSA-N 0.000 description 1
- QAPSNMNOIOSXSQ-YNEHKIRRSA-N 1-[(2r,4s,5r)-4-[tert-butyl(dimethyl)silyl]oxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O[Si](C)(C)C(C)(C)C)C1 QAPSNMNOIOSXSQ-YNEHKIRRSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- 102100030310 5,6-dihydroxyindole-2-carboxylic acid oxidase Human genes 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100021305 Acyl-CoA:lysophosphatidylglycerol acyltransferase 1 Human genes 0.000 description 1
- 101710137115 Adenylyl cyclase-associated protein 1 Proteins 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- CUOMGDPDITUMIJ-HZZBMVKVSA-N Ala-Phe-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 CUOMGDPDITUMIJ-HZZBMVKVSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- HIIJOGIBQXHFKE-HHKYUTTNSA-N Ala-Thr-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O HIIJOGIBQXHFKE-HHKYUTTNSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 102000052587 Anaphase-Promoting Complex-Cyclosome Apc3 Subunit Human genes 0.000 description 1
- 108700004606 Anaphase-Promoting Complex-Cyclosome Apc3 Subunit Proteins 0.000 description 1
- 108010049777 Ankyrins Proteins 0.000 description 1
- 102000008102 Ankyrins Human genes 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 101000719121 Arabidopsis thaliana Protein MEI2-like 1 Proteins 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- 102000016904 Armadillo Domain Proteins Human genes 0.000 description 1
- 108010014223 Armadillo Domain Proteins Proteins 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- ALKWEXBKAHPJAQ-NAKRPEOUSA-N Asn-Leu-Asp-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ALKWEXBKAHPJAQ-NAKRPEOUSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- JNCRAQVYJZGIOW-QSFUFRPTSA-N Asn-Val-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JNCRAQVYJZGIOW-QSFUFRPTSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- QQXOYLWJQUPXJU-WHFBIAKZSA-N Asp-Cys-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O QQXOYLWJQUPXJU-WHFBIAKZSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 102100035526 B melanoma antigen 1 Human genes 0.000 description 1
- 102000015735 Beta-catenin Human genes 0.000 description 1
- 108060000903 Beta-catenin Proteins 0.000 description 1
- 241000228405 Blastomyces dermatitidis Species 0.000 description 1
- 102000003930 C-Type Lectins Human genes 0.000 description 1
- 108090000342 C-Type Lectins Proteins 0.000 description 1
- 101150108242 CDC27 gene Proteins 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 102100025570 Cancer/testis antigen 1 Human genes 0.000 description 1
- 102100039510 Cancer/testis antigen 2 Human genes 0.000 description 1
- 102100026548 Caspase-8 Human genes 0.000 description 1
- 241000298898 Chimpanzee adenovirus Y25 Species 0.000 description 1
- 241000223205 Coccidioides immitis Species 0.000 description 1
- 201000007336 Cryptococcosis Diseases 0.000 description 1
- 241000221204 Cryptococcus neoformans Species 0.000 description 1
- 102000013701 Cyclin-Dependent Kinase 4 Human genes 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- 102000015833 Cystatin Human genes 0.000 description 1
- 108010025905 Cystine-Knot Miniproteins Proteins 0.000 description 1
- 102100025287 Cytochrome b Human genes 0.000 description 1
- 108010075028 Cytochromes b Proteins 0.000 description 1
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000289632 Dasypodidae Species 0.000 description 1
- 208000001490 Dengue Diseases 0.000 description 1
- 206010012310 Dengue fever Diseases 0.000 description 1
- 108700022150 Designed Ankyrin Repeat Proteins Proteins 0.000 description 1
- 101100216227 Dictyostelium discoideum anapc3 gene Proteins 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- 208000032163 Emerging Communicable disease Diseases 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 102000002090 Fibronectin type III Human genes 0.000 description 1
- 108050009401 Fibronectin type III Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- DBNLXHGDGBUCDV-KKUMJFAQSA-N Gln-Phe-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DBNLXHGDGBUCDV-KKUMJFAQSA-N 0.000 description 1
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 1
- QENSHQJGWGRPQS-QEJZJMRPSA-N Gln-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)N)C(O)=O)=CNC2=C1 QENSHQJGWGRPQS-QEJZJMRPSA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- WBBVTGIFQIZBHP-JBACZVJFSA-N Gln-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)N)N WBBVTGIFQIZBHP-JBACZVJFSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- ZQNCUVODKOBSSO-XEGUGMAKSA-N Glu-Trp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZQNCUVODKOBSSO-XEGUGMAKSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108010088729 HLA-A*02:01 antigen Proteins 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 102100028721 Hermansky-Pudlak syndrome 5 protein Human genes 0.000 description 1
- 101710094396 Hexon protein Proteins 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- PBVQWNDMFFCPIZ-ULQDDVLXSA-N His-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 PBVQWNDMFFCPIZ-ULQDDVLXSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 241000228404 Histoplasma capsulatum Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001042227 Homo sapiens Acyl-CoA:lysophosphatidylglycerol acyltransferase 1 Proteins 0.000 description 1
- 101000874316 Homo sapiens B melanoma antigen 1 Proteins 0.000 description 1
- 101000856237 Homo sapiens Cancer/testis antigen 1 Proteins 0.000 description 1
- 101000889345 Homo sapiens Cancer/testis antigen 2 Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101000954709 Homo sapiens Doublecortin domain-containing protein 2 Proteins 0.000 description 1
- 101000985516 Homo sapiens Hermansky-Pudlak syndrome 5 protein Proteins 0.000 description 1
- 101000614481 Homo sapiens Kidney-associated antigen 1 Proteins 0.000 description 1
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 1
- 101001134060 Homo sapiens Melanocyte-stimulating hormone receptor Proteins 0.000 description 1
- 101000578784 Homo sapiens Melanoma antigen recognized by T-cells 1 Proteins 0.000 description 1
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 1
- 101000874141 Homo sapiens Probable ATP-dependent RNA helicase DDX43 Proteins 0.000 description 1
- 101001109419 Homo sapiens RNA-binding protein NOB1 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 description 1
- 101000821981 Homo sapiens Sarcoma antigen 1 Proteins 0.000 description 1
- 101000665137 Homo sapiens Scm-like with four MBT domains protein 1 Proteins 0.000 description 1
- 101000766306 Homo sapiens Serotransferrin Proteins 0.000 description 1
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 1
- 241000620571 Human mastadenovirus A Species 0.000 description 1
- 241000886679 Human mastadenovirus D Species 0.000 description 1
- 241000886703 Human mastadenovirus E Species 0.000 description 1
- 241000886705 Human mastadenovirus F Species 0.000 description 1
- 101710123134 Ice-binding protein Proteins 0.000 description 1
- 101710082837 Ice-structuring protein Proteins 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- 108010010995 MART-1 Antigen Proteins 0.000 description 1
- 208000000932 Marburg Virus Disease Diseases 0.000 description 1
- 201000011013 Marburg hemorrhagic fever Diseases 0.000 description 1
- 102100034216 Melanocyte-stimulating hormone receptor Human genes 0.000 description 1
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 1
- CRGKLOXHKICQOL-GARJFASQSA-N Met-Gln-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N CRGKLOXHKICQOL-GARJFASQSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- 102100034256 Mucin-1 Human genes 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101150038013 PIR gene Proteins 0.000 description 1
- 102000036673 PRAME Human genes 0.000 description 1
- 108060006580 PRAME Proteins 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 1
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- OHIYMVFLQXTZAW-UFYCRDLUSA-N Phe-Met-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OHIYMVFLQXTZAW-UFYCRDLUSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- 241000224016 Plasmodium Species 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 1
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- 102100035724 Probable ATP-dependent RNA helicase DDX43 Human genes 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102100022491 RNA-binding protein NOB1 Human genes 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 241000710799 Rubella virus Species 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 102100021466 Sarcoma antigen 1 Human genes 0.000 description 1
- 102100038689 Scm-like with four MBT domains protein 1 Human genes 0.000 description 1
- 241000710961 Semliki Forest virus Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 101710173693 Short transient receptor potential channel 1 Proteins 0.000 description 1
- 241001618313 Simian adenovirus 20 Species 0.000 description 1
- 102100035748 Squamous cell carcinoma antigen recognized by T-cells 3 Human genes 0.000 description 1
- 101710185775 Squamous cell carcinoma antigen recognized by T-cells 3 Proteins 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108700019889 TEL-AML1 fusion Proteins 0.000 description 1
- 102100033082 TNF receptor-associated factor 3 Human genes 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- 241000223996 Toxoplasma Species 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 102100034593 Tripartite motif-containing protein 26 Human genes 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- WBZOZLNLXVBCNW-LTHWPDAASA-N Trp-Thr-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)[C@@H](C)O)=CNC2=C1 WBZOZLNLXVBCNW-LTHWPDAASA-N 0.000 description 1
- 241000223104 Trypanosoma Species 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 101710107540 Type-2 ice-structuring protein Proteins 0.000 description 1
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 1
- QNJYPWZACBACER-KKUMJFAQSA-N Tyr-Asp-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O QNJYPWZACBACER-KKUMJFAQSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- 102100027244 U4/U6.U5 tri-snRNP-associated protein 1 Human genes 0.000 description 1
- 101710155955 U4/U6.U5 tri-snRNP-associated protein 1 Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- COQLPRJCUIATTQ-UHFFFAOYSA-N Uranyl acetate Chemical compound O.O.O=[U]=O.CC(O)=O.CC(O)=O COQLPRJCUIATTQ-UHFFFAOYSA-N 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000710772 Yellow fever virus Species 0.000 description 1
- 241000907316 Zika virus Species 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010089975 arginyl-glycyl-aspartyl-serine Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 108050004038 cystatin Proteins 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 208000025729 dengue disease Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005227 gel permeation chromatography Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003978 infusion fluid Substances 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108010016441 mRNA maturase Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 238000012737 microarray-based gene expression Methods 0.000 description 1
- 210000002500 microbody Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000002794 monomerizing effect Effects 0.000 description 1
- 238000012243 multiplex automated genomic engineering Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 1
- 244000079416 protozoan pathogen Species 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000002702 ribosome display Methods 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 101150003560 trfA gene Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
- 229940051021 yellow-fever virus Drugs 0.000 description 1
Abstract
Description
Настоящее изобретение относится к разработке и получению новых полипептидных каркасов для оптимальной презентации олигопептидов, полипептидных последовательностей, белковых доменов, белков и/или белковых комплексов, состоящих из двух, нескольких или многих субъединиц. Такие олигопептиды, полипептидные последовательности, белковые домены и/или белки, представленные полипептидными каркасами по настоящему изобретению, могут включать антигенные частицы, которые стимулируют иммунную систему, чтобы вызвать иммунный ответ, например, для вакцинации или для получения антител или других связывающих молекул в культуре клеток, либо in vivo, либо in vitro в пробирке. В предпочтительном варианте осуществления полипептиды по настоящему изобретению собираются в вирусоподобные частицы (ВПЧ), оптимизированные для представления антигенов, применимых в контексте вакцинации против инфекционных агентов или опухолей.The present invention relates to the design and production of new polypeptide scaffolds for optimal presentation of oligopeptides, polypeptide sequences, protein domains, proteins and/or protein complexes consisting of two, several or many subunits. Such oligopeptides, polypeptide sequences, protein domains and/or proteins represented by the polypeptide scaffolds of the present invention may include antigenic particles that stimulate the immune system to elicit an immune response, for example, for vaccination or for the production of antibodies or other binding molecules in cell culture , either in vivo or in vitro in vitro. In a preferred embodiment, the polypeptides of the present invention are assembled into virus-like particles (VLPs) optimized to present antigens useful in the context of vaccination against infectious agents or tumors.
Предпосылкой для успешной разработки белкового каркаса для презентации олигопептидов, полипептидных последовательностей, белковых доменов, белков и/или белковых комплексов является компактный, стабильный домен мультимеризации, который может включать модальности, представляющие собой открытые и гибкие петлевые структуры, которые могут вмещать такие олигопептиды, полипептидные последовательности, белковые домены, белки и/или белковые комплексы. Предпочтительно, такие отображаемые частицы могут представлять собой иммуногенные антигены, которые представлены иммунной системе. Белки основания пентона (протомеры) из ряда серотипов аденовируса (Ag) собираются в пентамеры, которые затем образуют додекаэдры, напоминающие вирусоподобные частицы. В отличие от живого вируса, они не несут генетического материала, поэтому такие ВПЧ полезны с точки зрения безопасности.A prerequisite for the successful development of a protein scaffold for the presentation of oligopeptides, polypeptide sequences, protein domains, proteins and/or protein complexes is a compact, stable multimerization domain, which can include modalities that are open and flexible loop structures that can accommodate such oligopeptides, polypeptide sequences , protein domains, proteins and/or protein complexes. Preferably, such display particles may be immunogenic antigens that are presented to the immune system. Penton base proteins (protomers) from a number of adenovirus (Ag) serotypes assemble into pentamers, which then form dodecahedrons resembling virus-like particles. Unlike a live virus, they do not carry genetic material, so such HPVs are useful from a safety point of view.
Аденовирус представляет собой один из наиболее часто применяемых векторов генной терапии у людей. Оболочка аденовируса преимущественно состоит из двух различных типов белков, белка гексона и белка основания пентона, причем последний образует пентамерные сборки, к которым прикрепляются фибриллы, характерные для данного вируса. Было показано, что белки основания пентона некоторых серотипов аденовирусов способны к спонтанной самосборке в мультимерную суперструктуру при рекомбинантной экспрессии в отсутствие других аденовирусных компонентов. Такая супер структура представляет собой додекамер, образованный в общей сложности 60 белками основания аденовируса, расположенными в двенадцати идентичных копиях пентамерной "коронообразной" сборки (фиг. 1). Сам белок основания аденовируса имеет двухдоменную архитектуру, в которой один домен представляет собой бета-цилиндр, соединенный со вторым доменом, стабилизированным альфа-спиралями (фиг. 1В). Первый опосредует мультимеризацию в додекаэдр, что подтверждено мутационными исследованиями, в то время как последний представляет собой протяженные петли к растворителю на поверхности додекаэдра. Такие петли чрезвычайно вариабельны по длине и содержанию последовательностей у разных серотипов аденовирусов, в то время как остаток белка основания является высококонсервативным для всех видов. Додекаэдр аденовируса представляет собой очень универсальный каркас для отображения, например, для иммуногенных пептидов, которые можно вставлять в петли, заменяя встречающиеся в природе последовательности. Таким образом, буквально сотни гетер о логичных пептидов могут эффективно отображаться на одном додекаэдре, если все сайты инсерции заняты. Додекаэдр может быть получен рекомбинантным способом в очень больших количествах, он исключительно стабилен и может храниться при температуре окружающей среды в течение неопределенного времени. С применением таких очень выгодных характеристик, были разработаны синтетические частицы на основе додекаэдра, демонстрирующие иммуногенные пептиды в своих открытых петлях, для потенциального применения, включая онкоиммунологию и возникающие инфекционные заболевания.Adenovirus is one of the most commonly used gene therapy vectors in humans. The adenovirus envelope is predominantly composed of two different types of proteins, the hexon protein and the penton base protein, the latter forming pentameric assemblies to which fibrils characteristic of the virus are attached. The penton base proteins of some adenovirus serotypes have been shown to spontaneously self-assemble into a multimeric superstructure when expressed recombinantly in the absence of other adenoviral components. This superstructure is a dodecamer formed by a total of 60 adenovirus base proteins arranged in twelve identical copies of a pentameric “crown” assembly (Fig. 1). The adenovirus base protein itself has a two-domain architecture in which one domain is a beta-barrel connected to a second domain stabilized by alpha-helices (Fig. 1B). The former mediates multimerization into the dodecahedron, as confirmed by mutation studies, while the latter presents extensive solvent loops on the surface of the dodecahedron. Such loops are extremely variable in length and sequence content among different adenovirus serotypes, while the base protein residue is highly conserved across species. The adenovirus dodecahedron provides a very versatile display scaffold, for example for immunogenic peptides that can be inserted into loops to replace naturally occurring sequences. Thus, literally hundreds of heterologous peptides can effectively map onto a single dodecahedron if all insertion sites are occupied. The dodecahedron can be produced recombinantly in very large quantities, is extremely stable and can be stored at ambient temperatures indefinitely. Taking advantage of such highly advantageous characteristics, synthetic dodecahedron-based particles exhibiting immunogenic peptides in their open loops have been developed for potential applications including oncoimmunology and emerging infectious diseases.
В WO 2017167988 А1 раскрыты синтетические додекаэдры аденовируса, способствующие встраиванию эпитопа в открытые петли, а также раскрыто получение белка основания аденовируса.WO 2017167988 A1 discloses synthetic adenovirus dodecahedrons that facilitate epitope insertion into open loops, and also discloses the production of an adenovirus base protein.
Задача, лежащая в основе настоящего изобретения, заключается в обеспечении новой системы для презентации антигенов или другого груза через белковые каркасы, которые могут собираться в структуры ВПЧ.The objective of the present invention is to provide a new system for presenting antigens or other cargo through protein scaffolds that can assemble into HPV structures.
Вышеупомянутая техническая задача обеспечена вариантами осуществления настоящего изобретения, как определено в формуле настоящего изобретения, а также дополнительно описана в настоящем документе и проиллюстрирована сопроводительными графическими материалами.The above technical object is provided by embodiments of the present invention, as defined in the claims of the present invention, and is further described herein and illustrated by the accompanying drawings.
Настоящее изобретение основано, по меньшей мере частично, на обнаружении того факта, что структура белков основания пентона аденовируса представляет собой настоящую двухдоменную структуру, которая могла возникнуть в процессе эволюции в результате слияния генов (фиг. 1В). Указанные два домена, как оказалось, можно легко разделить на две отдельных компактных частицы: бета-цилиндр, содержащий информацию о мультимеризации, и домен альфа-спираль, напоминающая "корону".The present invention is based, at least in part, on the discovery that the structure of the adenovirus penton base proteins is a true two-domain structure that may have evolved through gene fusions (Fig. 1B). These two domains, as it turns out, can be easily divided into two separate compact particles: a beta-barrel containing information about multimerization, and an alpha-helix domain resembling a “crown”.
Следовательно, в соответствии с настоящим изобретением обеспечен полипептид "минимальной" мультимеризации, который может быть связан с антигеном или другими частицами, несущими груз, что обеспечивает максимальную универсальность и гибкость. Сконструированный таким образом полипептид по настоящему изобретению является производным аминокислотных последовательностей белков основания пентона аденовируса (также называемых в настоящем документе "протомерами основания пентона"), которые образуют домен бета-цилиндр основания пентона аденовирусов. Домен бета-цилиндр белков основания пентона аденовируса образует так называемый домен с укладкой типа рулет (jelly roll fold), содержащий восемь бета-листов с 1 по 8 (см. фиг. 2), Zubieta et al. (2005) Mol. Cell 17, 121-135. Авторами настоящего изобретения было неожиданно обнаружено, что для эффективной мультимеризации и, таким образом, отображения связанного груза, например, олигопептидов или полипептидов, таких как антигены или другие связанные частицы, например, лекарственные средства, метки, нуклеиновые кислоты, две петли (образующие домен «корона»), вставленные в последовательности между аминокислотными участками, образующими домен с укладкой типа рулет, могут быть полностью или в других вариантах осуществления частично заменены желаемыми неаденовирусными последовательностями такими как олигопептидные линкеры (с которыми, в свою очередь, могут быть связаны антигены или другой груз) или любой желаемой аминокислотной последовательностью, такой как полипептиды, белки, белковые домены, белковые комплексы и т.д.Therefore, the present invention provides a "minimally" multimerizing polypeptide that can be associated with antigen or other cargo-carrying particles, thereby providing maximum versatility and flexibility. The thus constructed polypeptide of the present invention is derived from the amino acid sequences of the adenovirus penton base proteins (also referred to herein as “penton base protomers”) that form the beta-barrel domain of the adenovirus penton base. The beta-barrel domain of the adenovirus penton base proteins forms a so-called jelly roll fold domain containing eight beta sheets 1 to 8 (see Fig. 2), Zubieta et al. (2005) Mol. Cell 17, 121-135. The inventors of the present invention have surprisingly discovered that for efficient multimerization and thus display of bound cargo, e.g., oligopeptides or polypeptides, such as antigens or other bound entities, e.g., drugs, tags, nucleic acids, two loops (forming a " crown") inserted into the sequences between the amino acid regions forming the roll-fold domain may be completely or in other embodiments partially replaced by desired non-adenoviral sequences such as oligopeptide linkers (to which, in turn, antigens or other cargo may be associated ) or any desired amino acid sequence, such as polypeptides, proteins, protein domains, protein complexes, etc.
Следовательно, в предпочтительных вариантах осуществления настоящего изобретения нуклеиновая кислота, лекарственное средство, метка и/или партнер по связыванию биологически связывающейся пары присоединен/присоединены к L1 и/или L2. "Биологически связывающаяся" пара в соответствии с настоящим изобретением представляет собой пары биологических частиц или соединений, соответственно, которые обычно встречаются в природе или которые по меньшей мере происходят от пар связывания, встречающихся в природе. Примеры включают, но не ограничиваются ими, антигены, антитела, фрагменты антител, диатела, миметики антител, рецепторы и их лиганды, биотин, стрептавидин и т.п.Therefore, in preferred embodiments of the present invention, the nucleic acid, drug, label and/or binding partner of the biological binding pair is/are attached to L 1 and/or L 2 . A “biologically binding” pair in accordance with the present invention are pairs of biological particles or compounds, respectively, that are commonly found in nature or that at least originate from binding pairs that are naturally occurring. Examples include, but are not limited to, antigens, antibodies, antibody fragments, diabodies, antibody mimetics, receptors and their ligands, biotin, streptavidin, and the like.
Такие частицы могут быть связаны с L1 и/или L2 с помощью средств, известных в данной области техники. При необходимости линкеры любого типа могут быть связаны с подходящей группой в положении в L1 и/или L2, и этот линкер затем присоединяется к желаемой частице. Типичные группы, присутствующие в L1 и/или L2, которые могут быть вовлечены в химическое связывание, включают группы NH2 и SH аминокислотных остатков, присутствующих в L1 и/или L2. Однако связывание груза с L1 и/или L2 не ограничено химическими связями, но также включает любые другие взаимодействия, такие как ионные взаимодействия, водородные связи и Ван-дер-Ваальсовы взаимодействия.Such particles can be associated with L 1 and/or L 2 using means known in the art. If desired, linkers of any type can be linked to a suitable group at a position in L 1 and/or L 2 and this linker is then attached to the desired particle. Typical groups present on L 1 and/or L 2 that may be involved in chemical coupling include the NH 2 and SH groups of amino acid residues present on L 1 and/or L 2 . However, the binding of cargo to L 1 and/or L 2 is not limited to chemical bonds, but also includes any other interactions such as ionic interactions, hydrogen bonds and van der Waals interactions.
Домен с укладкой типа рулет в соответствии с настоящим изобретением образован тремя аминокислотными участками (которые также могут называться, например, "сегментами" или "областями"): N-концевым участком, промежуточным участком и С-концевым участком. В нативном протомере основания пентона аденовируса сегменты петли обнаружены между N-концевым аминокислотным участком и промежуточным участком (большая петля) и между промежуточным аминокислотным участком и С-концевым аминокислотным участком (малая петля). Как указано выше, типичные неаденовирусные последовательности полипептида по настоящему изобретению, которые могут быть обозначены в данном документе как "линкеры", заменяют сегменты петли нативного протомера основания пентона аденовируса. В других вариантах осуществления настоящего изобретения одна из больших петель и малая петля нативного основания пентона могут присутствовать в полипептиде по настоящему изобретению и формировать L1 или L2.The roll-fold domain of the present invention is formed by three amino acid regions (which may also be referred to, for example, as “segments” or “regions”): an N-terminal region, an intermediate region, and a C-terminal region. In the native adenovirus penton base protomer, loop segments are found between the N-terminal amino acid region and the intermediate region (large loop) and between the intermediate amino acid region and the C-terminal amino acid region (small loop). As stated above, exemplary non-adenoviral polypeptide sequences of the present invention, which may be referred to herein as “linkers,” replace loop segments of the native adenovirus penton base protomer. In other embodiments of the present invention, one of the large loops and the small loop of the native penton base may be present in the polypeptide of the present invention and form L 1 or L 2 .
Таким образом, полипептид по настоящему изобретению обычно имеет структуру, представленную следующей общей формулой (I)Thus, the polypeptide of the present invention generally has the structure represented by the following general formula (I)
гдеWhere
А представляет собой N-концевой аминокислотный участок белка основания пентона аденовируса,A is the N-terminal amino acid region of the adenovirus penton base protein,
В представляет собой аминокислотный участок белка основания пентона аденовируса,B represents the amino acid region of the adenovirus penton base protein,
С представляет собой С-концевой аминокислотный участок основания пентона аденовируса,C represents the C-terminal amino acid region of the adenovirus penton base,
где В представляет собой аминокислотный участок, расположенный между А и С в последовательности указанного основания пентона аденовируса,where B is an amino acid region located between A and C in the sequence of the specified adenovirus penton base,
где А, В и С образуют домен с укладкой типа рулет указанного белка основания пентона аденовируса.where A, B and C form a roll-fold domain of the specified adenovirus penton base protein.
L1 и L2 представляют собой линкеры, как указано выше. Таким образом, L1 и L2 могут быть выбраны практически из любой аминокислотной последовательности (при условии, что она не препятствует мультимеризации полипептида). Таким образом, L1 и L2 могут быть одинаковыми или различными и независимо друг от друга выбраны из группы, состоящей из олигопептида, полипептида, белка и белкового комплекса. Последовательности L1 и L2, как правило, не являются аденовирусными, т.е. имеют аминокислотную последовательность из по меньшей мере 5, 6, 7, 8, 9 10 или более аминокислот, причем такая последовательность не существует или не встречается в известных последовательностях протомеров основания пентона любого серотипа аденовируса, более предпочтительно любого аденовирусного белка.L 1 and L 2 are linkers as above. Thus, L 1 and L 2 can be selected from virtually any amino acid sequence (provided that it does not interfere with multimerization of the polypeptide). Thus, L 1 and L 2 may be the same or different and are independently selected from the group consisting of an oligopeptide, a polypeptide, a protein and a protein complex. The L 1 and L 2 sequences, as a rule, are not adenoviral, i.e. have an amino acid sequence of at least 5, 6, 7, 8, 9, 10 or more amino acids, such sequence not existing or found in known penton base protomer sequences of any adenovirus serotype, more preferably any adenoviral protein.
В альтернативном варианте осуществления настоящего изобретения линкеры L1 и L2 могут быть выбраны из последовательностей петель (т.е. областей, содержащих первую и вторую петли RGD и/или вариабельную петлю, как раскрыто в WO 2017/167988 А1) основания пентона аденовируса. Однако в данном варианте осуществления последовательности сегментов петли происходят от аденовируса, имеющего серотип отличный от серотипа аденовируса, от которого происходят указанные аминокислотные участки А, В и С.Соответственно, в данном варианте осуществления настоящего изобретения обеспечены химеры протомеров основания пентона, где бета-цилиндр, домен с укладкой типа рулет происходит от одного подтипа аденовируса, тогда как L1 и L2 представляют собой полипептиды, содержащие сегменты петли RGD и/или вариабельные сегменты петли VL (образующие домен «корона»), происходящие от подтипа аденовируса, отличного от подтипа аденовируса, от которого происходит домен с укладкой типа рулет.In an alternative embodiment of the present invention, the linkers L 1 and L 2 can be selected from loop sequences (ie regions containing the first and second RGD loops and/or variable loop, as disclosed in WO 2017/167988 A1) of the adenovirus penton base. However, in this embodiment, the loop segment sequences are derived from an adenovirus having a serotype different from the adenovirus serotype from which said amino acid regions A, B, and C are derived. Accordingly, in this embodiment of the present invention, chimeras of penton base protomers are provided, wherein the beta-barrel, the roll fold domain is derived from one adenovirus subtype, whereas L 1 and L 2 are polypeptides containing RGD loop segments and/or variable VL loop segments (forming the crown domain) derived from a different adenovirus subtype , from which the roll-type domain originates.
В предпочтительном варианте осуществления настоящего изобретения, как показано на фиг. 2, аминокислотный участок А содержит бета-листы 1, 2 и 3 домена с укладкой типа рулет протомера основания пентона аденовируса, аминокислотный участок В содержит бета-листы 4 и 5 домена с укладкой типа рулет указанного протомера основания пентона аденовируса и аминокислотный участок С содержит бета-листы 6, 7 и 8 домена с укладкой типа рулет указанного протомера основания пентона аденовируса. Следует понимать, что каждый сегмент А, В и С может быть независимо получен из одного или различных аденовирусов.In a preferred embodiment of the present invention, as shown in FIG. 2, amino acid region A contains beta sheets 1, 2 and 3 of the domain with the roll type folding of the protomer of the adenovirus penton base, amino acid region B contains beta sheets 4 and 5 of the domain with the roll type folding of the specified protomer of the adenovirus penton base, and amino acid region C contains beta -sheets 6, 7 and 8 of the domain with a roll-type fold of the indicated protomer of the adenovirus penton base. It should be understood that segments A, B and C may each be independently derived from the same or different adenoviruses.
Предпочтительно аминокислотные участки А, В и С имеют аминокислотную последовательность, каждая из которых независимо происходит от последовательностей основания пентона, выбранных из группы, состоящей из оснований пентона аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd1S), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53).Preferably, amino acid regions A, B and C have an amino acid sequence each independently derived from penton base sequences selected from the group consisting of human adenovirus serotype 2 (hAd2) penton bases, human adenovirus serotype 3 (hAd3), human adenovirus serotype 4 (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25 ), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd1S), simian adenovirus serotype 20 (sAd20), simian adenovirus serotype 49 (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53).
Предпочтительные аминокислотные последовательности вышеупомянутых аденовирусных оснований пентона находятся в общедоступных базах данных, таких как UniProt и UniProtE, и особенно предпочтительные последовательности, описанные в данном документе для вышеупомянутых подтипов аденовирусов, представлены в UniProt Асе. № Q2Y0H9 (аденовируса человека 3 серотипа, SEQ ID NO: 1), UniProt Асе. № Р03276 (аденовируса человека 2 серотипа, SEQ ID NO: 2), UniProt Асе. № Q2KSF3 (аденовируса человека 4 серотипа, SEQ ID NO: 3), UniProt Асе. № Р12538 (аденовируса человека 5 серотипа, SEQ ID NO: 4), UniProt Асе. № Q9JFT6 (аденовируса человека 7 серотипа, SEQ ID NO: 5), UniProt Асе. № D2DM93 (аденовируса человека 11 серотипа, SEQ ID NO: 6), UniProt Асе. № Р36716 (аденовируса человека 12 серотипа, SEQ ID NO: 7), UniProt Асе. № F1DT65 (аденовируса человека 17 серотипа, SEQ ID NO: 8), UniProt Асе. № M0QUK0 (аденовируса человека 25 серотипа, SEQ ID NO: 9), UniProt Асе. № Q7T941 (аденовируса человека 35 серотипа, SEQ ID NO: 10), UniProt Асе. № Q912J1 (аденовируса человека 37 серотипа, SEQ ID NO: 11), UniProt Асе. № F8WQN4 (аденовируса человека 41 серотипа, SEQ ID NO: 12), UniProt Асе. № E5L3Q9 (аденовируса гориллы, SEQ ID NO: 13), UniProt Асе. № G9G849 (аденовируса шимпанзе, SEQ ID NO: 14), UniProt Асе. № H8PFZ9 (аденовируса обезьяны 18 серотипа, SEQ ID NO: 15), UniProt Асе. № F6KSU4 (аденовируса обезьяны 18 серотипа, SEQ ID NO: 16), UniProt Асе. № F2WTK5 (аденовируса обезьяны 49 серотипа, SEQ ID NO: 17), UniProt Асе. № A0A0A1EWW1 (аденовируса макака-резуса 51 серотипа, SEQ ID NO: 18), UniProt Асе. № A0A0A1EWX7 (аденовируса макака-резуса 52 серотипа, SEQ ID NO: 19) и UniProt Асе. № A0A0A1EWZ7 (аденовируса макака-резуса 53 серотипа, SEQ ID NO: 20).Preferred amino acid sequences of the above adenoviral penton bases are available in publicly available databases such as UniProt and UniProtE, and particularly preferred sequences described herein for the above adenovirus subtypes are provided in UniProt Ace. No. Q2Y0H9 (human adenovirus serotype 3, SEQ ID NO: 1), UniProt Ace. No. P03276 (human adenovirus serotype 2, SEQ ID NO: 2), UniProt Ace. No. Q2KSF3 (human adenovirus serotype 4, SEQ ID NO: 3), UniProt Ace. No. P12538 (human adenovirus serotype 5, SEQ ID NO: 4), UniProt Ace. No. Q9JFT6 (human adenovirus serotype 7, SEQ ID NO: 5), UniProt Ace. No. D2DM93 (human adenovirus serotype 11, SEQ ID NO: 6), UniProt Ace. No. P36716 (human adenovirus serotype 12, SEQ ID NO: 7), UniProt Ace. No. F1DT65 (human adenovirus serotype 17, SEQ ID NO: 8), UniProt Ace. No. M0QUK0 (human adenovirus serotype 25, SEQ ID NO: 9), UniProt Ace. No. Q7T941 (human adenovirus serotype 35, SEQ ID NO: 10), UniProt Ace. No. Q912J1 (human adenovirus serotype 37, SEQ ID NO: 11), UniProt Ace. No. F8WQN4 (human adenovirus serotype 41, SEQ ID NO: 12), UniProt Ace. No. E5L3Q9 (gorilla adenovirus, SEQ ID NO: 13), UniProt Ace. No. G9G849 (chimpanzee adenovirus, SEQ ID NO: 14), UniProt Ace. No. H8PFZ9 (simian adenovirus serotype 18, SEQ ID NO: 15), UniProt Ace. No. F6KSU4 (simian adenovirus serotype 18, SEQ ID NO: 16), UniProt Ace. No. F2WTK5 (simian adenovirus serotype 49, SEQ ID NO: 17), UniProt Ace. No. A0A0A1EWW1 (rhesus macaque adenovirus serotype 51, SEQ ID NO: 18), UniProt Ace. No. A0A0A1EWX7 (rhesus macaque adenovirus serotype 52, SEQ ID NO: 19) and UniProt Ace. No. A0A0A1EWZ7 (rhesus macaque adenovirus serotype 53, SEQ ID NO: 20).
Аминокислотные последовательности вышеуказанных оснований пентона представляют собой (в скобках указан соответствующий номер UniProt Асе):The amino acid sequences of the above penton bases are (the corresponding UniProt Ace number is indicated in parentheses):
Основание пентона hAd3 аденовируса человека 3 серотипа (Q2Y0H9), SEQ ID NO: 1:Human adenovirus serotype 3 hAd3 penton base (Q2Y0H9), SEQ ID NO: 1:
hAd2 (P03276), SEQ ID NO: 2:hAd2 (P03276), SEQ ID NO: 2:
hAd4 (Q2KSF3), SEQ ID NO: 3:hAd4 (Q2KSF3), SEQ ID NO: 3:
hAd5 (P12538), SEQ ID NO: 4:hAd5 (P12538), SEQ ID NO: 4:
hAd7 (Q9JFT6), SEQ ID NO: 5:hAd7 (Q9JFT6), SEQ ID NO: 5:
hAd11 (D2DM93), SEQ ID NO: 6:hAd11 (D2DM93), SEQ ID NO: 6:
hAd12 (P36716), SEQ ID NO: 7:hAd12 (P36716), SEQ ID NO: 7:
hAd17 (F1DT65), SEQ ID NO: 8:hAd17 (F1DT65), SEQ ID NO: 8:
hAd25 (MOQUKO), SEQ ID NO: 9:hAd25 (MOQUKO), SEQ ID NO: 9:
hAd35 (Q7T941), SEQ ID NO: 10:hAd35 (Q7T941), SEQ ID NO: 10:
hAd37 (Q912J1), SEQ ID NO: 11hAd37 (Q912J1), SEQ ID NO: 11
hAd41 (F8WQN4), SEQ ID NO: 12:hAd41 (F8WQN4), SEQ ID NO: 12:
Основание пентона аденовируса гориллы gorAd (E5L3Q9), SEQ ID NO: 13:Gorilla adenovirus penton base gorAd (E5L3Q9), SEQ ID NO: 13:
Основание пентона аденовируса шимпанзе chimpAd (G9G849), SEQ ID NO: 14:Chimpanzee adenovirus penton base chimpAd (G9G849), SEQ ID NO: 14:
Основание пентона аденовируса обезьяны 18 серотипа, sAd18 (H8PFZ9); SEQ ID NO: 15:Simian adenovirus serotype 18 penton base, sAd18 (H8PFZ9); SEQ ID NO: 15:
sAd20 (F6KSU4), SEQ ID NO: 16:sAd20 (F6KSU4), SEQ ID NO: 16:
sAd49 (F2WTK5), SEQ ID NO: 17:sAd49 (F2WTK5), SEQ ID NO: 17:
Основание пентона аденовируса макака-резуса 51 серотипа, rhAd51 (A0A0A1EWW1), SEQ ID NO: 18:Rhesus adenovirus penton base serotype 51, rhAd51 (A0A0A1EWW1), SEQ ID NO: 18:
rhAd52 (A0A0A1EWX7), SEQ ID NO: 19:rhAd52 (A0A0A1EWX7), SEQ ID NO: 19:
rhAd53 (A0A0A1EWZ7), SEQ ID NO: NO 20:rhAd53 (A0A0A1EWZ7), SEQ ID NO: NO 20:
Полипептид по настоящему изобретению не ограничивается теми известными специфическими последовательностями для аминокислотных участков А, В и С, образующих мультимеризационный домен с укладкой типа рулет упомянутых выше суб-и серотипов аденовируса, соответственно. Аминокислотные сегменты А, В и С могут также иметь аминокислотные последовательности, сходные с последовательностями известных протомеров оснований пентона аденовируса, при условии, что последовательности А, В и С таковы, что полученный полипептид принимает укладку типа рулет и собирается в пентамерные комплексы (также обозначаемые как "белки пентона"), двенадцать из которых, в свою очередь, самоорганизуются с образованием додекамерного суперкомплекса (ВПЧ по настоящему изобретению) в соответствующих условиях, как дополнительно описано ниже. Обычно такие похожие последовательности сегментов А, В и С имеют идентичность аминокислотной последовательности не менее 85%, более предпочтительно не менее 90%, еще более предпочтительно 95%, особенно предпочтительно не менее 98%, наиболее предпочтительно не менее 99%, с соответствующей аминокислотной последовательностью известного пентона основания аденовируса, предпочтительно с последовательностями SEQ ID NO: с 1 по 20, более предпочтительно, аминокислотные участки А, В и С, как представлено в таблицах 1-3 ниже.The polypeptide of the present invention is not limited to those known specific sequences for the amino acid regions A, B and C forming the roll-fold multimerization domain of the above-mentioned sub- and serotypes of adenovirus, respectively. The amino acid segments A, B and C may also have amino acid sequences similar to the sequences of known adenovirus penton base protomers, provided that the sequences of A, B and C are such that the resulting polypeptide adopts a roll fold and assembles into pentameric complexes (also referred to as "Penton proteins"), twelve of which, in turn, self-assemble to form the dodecameric supercomplex (DSC of the present invention) under appropriate conditions, as further described below. Typically, such similar sequences of segments A, B and C will have an amino acid sequence identity of at least 85%, more preferably at least 90%, even more preferably 95%, especially preferably at least 98%, most preferably at least 99%, with the corresponding amino acid sequence a known penton base of an adenovirus, preferably the sequences SEQ ID NO: 1 to 20, more preferably amino acid regions A, B and C, as presented in Tables 1-3 below.
В данном контексте аминокислотные последовательности указаны от N до С-конца с применением однобуквенного кода ИЮПАК, если не указано иное.In this context, amino acid sequences are indicated from N to C terminus using the IUPAC one-letter code unless otherwise noted.
Согласно предпочтительному варианту осуществления настоящего изобретения аминокислотный участок А имеет следующую консенсусную последовательность (SEQ ID NO: 21):In a preferred embodiment of the present invention, amino acid region A has the following consensus sequence (SEQ ID NO: 21):
где: аминокислотный участок А заканчивается на С-конце перед Z1 у остатка Т или у аминокислоты с Z1 по Z15,where: amino acid section A ends at the C-terminus before Z 1 at residue T or at amino acids Z 1 to Z15,
U представляет собой любую аминокислоту или отсутствует,U represents any amino acid or is absent,
X1 представляет собой Е или G,X 1 represents E or G,
Х2 представляет собой Е или S,X 2 represents E or S,
Х3 представляет собой L или V,X 3 represents L or V,
Х4 представляет собой А или S,X 4 represents A or S,
Х5 представляет собой L или Q,X 5 represents L or Q,
Х6 представляет собой Y или Е,X 6 represents Y or E,
Х7 представляет собой R или К,X 7 represents R or K,
Х8 представляет собой V или L,X 8 represents V or L,
Х9 представляет собой V или I,X 9 represents V or I,
Х10 представляет собой F или Y,X 10 represents F or Y,
Х11 представляет собой Т или S,X 11 represents T or S,
Х12 представляет собой А, или Т, или I, или G,X 12 represents A, or T, or I, or G,
Х13 представляет собой S или G,X 13 represents S or G,
Х14 представляет собой F или L,X 14 represents F or L,
Х15 представляет собой Е или D,X 15 represents E or D,
Х16 представляет собой А или G,X 16 represents A or G,
Х17 представляет собой D или Q,X 17 represents D or Q,
X18 представляет собой L или М,X 18 represents L or M,
Х19 представляет собой Н или R,X 19 represents H or R,
Z1, если присутствует, представляет собой N,Z 1 , if present, represents N,
Z2, если присутствует, представляет собой М,Z 2 , if present, represents M,
Z3, если присутствует, представляет собой Р,Z 3 , if present, represents P,
Z4, если присутствует, представляет собой N,Z 4 , if present, is N,
Z5, если присутствует, представляет собой V или I,Z 5 , if present, is V or I,
Z6, если присутствует, представляет собой N,Z 6 , if present, is N,
Z7, если присутствует, представляет собой Е или D,Z 7 , if present, is E or D,
Z8, если присутствует, представляет собой Y или F,Z 8 , if present, is Y or F,
Z9, если присутствует, представляет собой М,Z 9 , if present, is M,
Z10, если присутствует, представляет собой F, или S, или Y,Z 10 , if present, is F or S or Y,
Z11, если присутствует, является Т или S,Z 11 , if present, is T or S,
Z12, если присутствует, является S или N,Z 12 , if present, is S or N,
Z13, если присутствует, представляет собой K,Z 13 , if present, represents K,
Z14, если присутствует, представляет собой F,Z 14 , if present, is F,
Z16 если присутствует, представляет собой K.Z 16 if present represents K.
Более предпочтительные аминокислотные последовательности сегмента А полипептида по настоящему изобретению представлены в следующей таблице 1:More preferred amino acid sequences of the A segment of the polypeptide of the present invention are presented in the following table 1:
Согласно еще одному предпочтительному варианту осуществления настоящего изобретения аминокислотный участок В вышеуказанной общей формулы (I) имеет следующую последовательность (SEQ ID NO: 22):According to another preferred embodiment of the present invention, amino acid region B of the above general formula (I) has the following sequence (SEQ ID NO: 22):
где: аминокислотный участок В начинается на N-конце у аминокислоты с Z17 по Z27 или у аминокислоты Q после Z27,where: amino acid section B begins at the N-terminus of amino acids Z 17 to Z 27 or amino acid Q after Z 27 ,
аминокислотный участок В заканчивается на С-конце перед Z28 у аминокислоты L или у аминокислоты с Z28 по Z30,amino acid section B ends at the C-terminus before Z 28 of amino acid L or amino acids Z 28 to Z 30 ,
Z17, если присутствует, представляет собой L или S,Z 17 , if present, is L or S,
Z18, если присутствует, представляет собой Т или Р или С,Z 18 , if present, is T or P or C,
Z19, если присутствует, представляет собой Т или Р,Z 19 , if present, is T or P,
Z20, если присутствует, представляет собой Р или S или А или R,Z 20 , if present, is P or S or A or R,
Z21, если присутствует, представляет собой N или D,Z 21 , if present, is N or D,
Z22, если присутствует, представляет собой G или V,Z 22 , if present, is G or V,
Z23, если присутствует, представляет собой Н или Т,Z 23 , if present, is H or T,
Z24, если присутствует, представляет собой С,Z 24 , if present, is C,
Z25, если присутствует, представляет собой G,Z 25 , if present, represents G,
Z26, если присутствует, представляет собой А, или V, или S,Z 26 , if present, is A, or V, or S,
Z27, если присутствует, представляет собой Е или Q,Z 27 , if present, is E or Q,
Х20 представляет собой L или М,X 20 represents L or M,
Х21 представляет собой Q или K,X 21 represents Q or K,
Х22 представляет собой Q или R, или S,X 22 represents Q or R or S,
Х23 представляет собой V или I,X 23 represents V or I,
Х24 представляет собой S или N,X 24 represents S or N,
Х25 представляет собой Y или F,X 25 represents Y or F,
Х26 представляет собой А или V,X 26 represents A or V,
Z28, если присутствует, представляет собой М или L,Z 28 , if present, is M or L,
Z29, если присутствует, представляет собой Р,Z 29 , if present, is P,
Z30, если присутствует, представляет собой V или F.Z 30 , if present, is V or F.
Более предпочтительные аминокислотные последовательности сегмента В полипептида по настоящему изобретению представлены в следующей таблице 2:More preferred amino acid sequences of the B segment of the polypeptide of the present invention are presented in the following table 2:
Согласно дополнительному предпочтительному варианту осуществления настоящего изобретения сегмент С вышеуказанной общей формулы (I) имеет следующую последовательность (SEQ ID NO: 23):According to a further preferred embodiment of the present invention, segment C of the above general formula (I) has the following sequence (SEQ ID NO: 23):
где: аминокислотный участок С начинается на N-конце у аминокислоты с Z31 по Z33 или у аминокислоты А после Z33,where: amino acid section C begins at the N-terminus of amino acids Z 31 to Z 33 or amino acid A after Z 33 ,
Z31, если присутствует, представляет собой N,Z 31 , if present, is N,
Z32, если присутствует, представляет собой V,Z 32 , if present, represents V,
Z33, если присутствует, представляет собой Р,Z 33 , if present, is P,
Х27 представляет собой R или S или G,X 27 represents R or S or G,
Х28 представляет собой V или I,X 28 represents V or I,
Х29 представляет собой Y или Н,X 29 represents Y or H,
Х30 представляет собой А или S,X 30 represents A or S,
Х31 представляет собой R или K.X 31 represents R or K.
Более предпочтительные аминокислотные последовательности сегмента С полипептида по настоящему изобретению представлены в следующей таблице 3:More preferred amino acid sequences of the C segment of the polypeptide of the present invention are presented in the following table 3:
Особенно предпочтительные полипептиды по настоящему изобретению основаны на домене с укладкой типа рулет протомера основания пентона hAd3. В частности, предпочтительны полипептиды, где аминокислотный участок А имеет аминокислотную последовательность, начинающуюся с положения, выбранного из аминокислот с 1 по 48, наиболее предпочтительно положения аминокислоты 1, до положения аминокислоты, выбранного из положений с 129 по 144, наиболее предпочтительно положения аминокислоты 132, где аминокислотный участок В имеет аминокислотную последовательность, начинающуюся с положения, выбранного из положений с 398 по 409, наиболее предпочтительно положения аминокислоты 407, до положения, выбранного из положений с 440 по 443, наиболее предпочтительно положения аминокислоты 442, и где аминокислотный участок С имеет аминокислотную последовательность, начинающуюся с положения, выбранного из положения с 492 по 495, наиболее предпочтительно положения аминокислоты 493, до положения аминокислоты 544, где положения аминокислот относятся к последовательности, представленной в UniProt Асе. № QY0H9 (SEQ ID NO: 1).Particularly preferred polypeptides of the present invention are based on the roll-fold domain of the hAd3 penton base protomer. Particularly preferred are polypeptides wherein amino acid region A has an amino acid sequence starting from a position selected from amino acids 1 to 48, most preferably amino acid position 1, to an amino acid position selected from positions 129 to 144, most preferably amino acid position 132, wherein amino acid region B has an amino acid sequence starting from a position selected from positions 398 to 409, most preferably amino acid position 407, to a position selected from positions 440 to 443, most preferably amino acid position 442, and where amino acid region C has an amino acid a sequence starting at a position selected from positions 492 to 495, most preferably amino acid position 493, to amino acid position 544, where the amino acid positions refer to the sequence presented in UniProt Ace. No. QY0H9 (SEQ ID NO: 1).
Связывающие сегменты L1 и L2 полипептида по настоящему изобретению могут быть выбраны из о л иго пептидных линкеров, таких как олигопептиды, содержащие от 4 до 10 аминокислот, предпочтительно содержащие аминокислоты G и S. Предпочтительный пример представляет собой GGGS (SEQ ID 24). Другой пример представляет собой линкер, состоящий из G и S и имеющий несколько повторов GGS, например, 2, 3, 4, 5 или более повторов GGS. Особенно предпочтительный линкер этого типа id GGSGGS (SEQ ID NO: 25).The L 1 and L 2 binding segments of the polypeptide of the present invention can be selected from oligo peptide linkers, such as oligopeptides containing from 4 to 10 amino acids, preferably containing amino acids G and S. A preferred example is GGGS (SEQ ID 24). Another example is a linker consisting of G and S and having multiple GGS repeats, for example, 2, 3, 4, 5 or more GGS repeats. A particularly preferred linker of this type is id GGSGGS (SEQ ID NO: 25).
В других предпочтительных вариантах осуществления L1 представляет собой полипептидную последовательность, содержащую петлю RGD основания пентона аденовируса, имеющего серотип отличный от серотипа аденовируса(ов), от которого происходят указанные аминокислотные участки А, В и С и/или D представляет собой полипептидную последовательность, содержащую вариабельную петлю основания пентона аденовируса, имеющего серотип отличный от серотипа аденовируса, от которого происходят указанные аминокислотные участки А, В и С.In other preferred embodiments, L 1 is a polypeptide sequence comprising the RGD loop of a penton base of an adenovirus having a serotype different from the serotype of the adenovirus(es) from which said amino acid regions A, B and C are derived and/or D is a polypeptide sequence comprising a penton base variable loop of an adenovirus having a serotype different from the serotype of the adenovirus from which the indicated amino acid regions A, B and C are derived.
В дополнительных вариантах осуществления настоящего изобретения L1 представляет собой петлю RDG, a L2 представляет собой предпочтительно неаденовирусный олигопептид, предпочтительно из от 4 до 20 аминокислот, более предпочтительно из от 4 до 10 аминокислот, особенно предпочтительно олигопептидный линкер, состоящий из G и S, как определено выше. В аналогичных вариантах осуществления L2 представляет собой или содержит вариабельную петлю, a L1 представляет собой олигопептидный линкер, как определено выше. Согласно настоящему изобретению также предполагается, что L2 представляет собой или содержит петлю RGD, a L1 представляет собой олигопептидный линкер, и также предполагается, что L1 представляет собой вариабельную петлю, a L2 представляет собой олигопептидный линкер.In further embodiments of the present invention, L 1 is an RDG loop and L 2 is preferably a non-adenoviral oligopeptide, preferably 4 to 20 amino acids, more preferably 4 to 10 amino acids, especially preferably an oligopeptide linker consisting of G and S, as defined above. In similar embodiments, L 2 is or contains a variable loop and L 1 is an oligopeptide linker as defined above. According to the present invention, it is also contemplated that L 2 is or contains an RGD loop and L 1 is an oligopeptide linker, and it is also contemplated that L 1 is a variable loop and L 2 is an oligopeptide linker.
В других предпочтительных вариантах осуществления, как упоминалось выше, последовательности L1 и L2, соответственно, могут быть выбраны из последовательностей домена «корона» белков основания пентона аденовируса, отличного от аденовируса, от которого происходит домен мультимеризации. Обычно комбинация химеры домена «корона» и домена мультимеризации не ограничена. Предпочтительные химеры выбирают из комбинаций доменов «корона» и доменов мультимеризации, как указано выше. Домены «корона», необязательно и предпочтительно, включая неаденовирусные последовательности, встроенные в петлю RGD и/или вариабельную петлю соответствующего домена «корона», более предпочтительно раскрыты в WO 2017/167988 А1.In other preferred embodiments, as mentioned above, the L 1 and L 2 sequences, respectively, may be selected from the penton base protein crown domain sequences of an adenovirus other than the adenovirus from which the multimerization domain is derived. Generally, the combination of a crown domain chimera and a multimerization domain is not limited. Preferred chimeras are selected from combinations of crown domains and multimerization domains as described above. Crown domains, optionally and preferably including non-adenoviral sequences embedded in the RGD loop and/or variable loop of the corresponding crown domain, are more preferably disclosed in WO 2017/167988 A1.
Таким образом, понятно, что домены «корона» оснований пентона аденовируса обычно состоят из двух аминокислотных участков: так называемого большого фрагмента и малого фрагмента. Большой фрагмент домена «корона» расположен обычно на N-конце в аминокислотной последовательности соответствующего белка основания пентона аденовируса, тогда как малый фрагмент домена «корона» расположен обычно на С-конце. Согласно настоящему изобретению предпочтительно, чтобы большой фрагмент (содержащий петлю RGD, как упомянуто выше) соответствовал L1 общей формулы (I), и дополнительно предпочтительно, чтобы малый фрагмент (содержащий вариабельную петлю) соответствовал L2 общей формулы (I). Согласно некоторым вариантам осуществления настоящего изобретения большой и малый фрагменты происходят от одного и того же основания пентона аденовируса. Согласно другим вариантам осуществления настоящего изобретения большой фрагмент и малый фрагмент происходят от различных оснований пентона аденовируса или что только один из больших и малых фрагментов происходит от белка оснований пентона аденовируса, отличного от аденовируса, от которого происходит домен мультимеризации, т.е. от которого происходят аминокислотные участки А, В и С.Thus, it is clear that the crown domains of adenovirus penton bases usually consist of two amino acid regions: the so-called large fragment and small fragment. The large fragment of the crown domain is usually located at the N-terminus in the amino acid sequence of the corresponding adenovirus penton base protein, while the small fragment of the crown domain is usually located at the C-terminus. According to the present invention, it is preferable that the large fragment (containing the RGD loop as mentioned above) corresponds to L 1 of the general formula (I), and it is further preferable that the small fragment (containing the variable loop) corresponds to L 2 of the general formula (I). In some embodiments of the present invention, the large and small fragments are derived from the same adenovirus penton base. In other embodiments of the present invention, the large fragment and the small fragment are derived from different adenovirus penton bases, or that only one of the large and small fragments is derived from an adenovirus penton base protein different from the adenovirus from which the multimerization domain is derived, i.e. from which amino acid regions A, B and C are derived.
Предпочтительные домены «корона» для применения в химерных конструкциях по настоящему изобретению включают домены «корона», выбранные из группы, состоящей из оснований пентона аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd1S), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd 49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53).Preferred crown domains for use in the chimeric constructs of the present invention include crown domains selected from the group consisting of the penton bases of human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus serotype 4 (hAd4) , human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), adenovirus human serotype 35 (hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd1S), simian adenovirus serotype 20 (sAd20) , simian adenovirus serotype 49 (sAd 49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53).
Предпочтительные аминокислотные последовательности указанных выше оснований пентона аденовируса, применяемых для домена «корона», представлены в общедоступных базах данных, таких как UniProt и UniProtE, и особенно предпочтительные последовательности, описанные в данном документе для вышеупомянутых подтипов аденовирусов, представлены в UniProt Асе. № Q2Y0H9 (аденовируса человека 3 серотипа, SEQ ID NO: 1), UniProt Асе. № Р03276 (аденовируса человека 2 серотипа, SEQ ID NO: 2), UniProt Асе. № Q2KSF3 (аденовируса человека 4 серотипа, SEQ ID NO: 3), UniProt Асе. № PI2538 (аденовируса человека 5 серотипа, SEQ ID NO: 4), UniProt Асе. № Q9JFT6 (аденовируса человека 7 серотипа, SEQ ID NO: 5), UniProt Асе. № D2DM93 (аденовируса человека 11 серотипа, SEQ ID NO: 6), UniProt Асе. № Р36716 (аденовируса человека 12 серотипа, SEQ ID NO: 7), UniProt Асе. № F1DT65 (аденовируса человека 17 серотипа, SEQ ID NO: 8), UniProt Асе. № M0QUK0 (аденовируса человека 25 серотипа, SEQ ID NO: 9), UniProt Асе. № Q7T941 (аденовируса человека 35 серотипа, SEQ ID NO: 10), UniProt Асе. № Q912J1 (аденовируса человека 37 серотипа, SEQ ID NO: 11), UniProt Асе. № F8WQN4 (аденовируса человека 41 серотипа, SEQ ID NO: 12), UniProt Асе. № E5L3Q9 (аденовируса гориллы, SEQ ID NO: 13), UniProt Асе. № G9G849 (аденовируса шимпанзе, SEQ ID NO: 14), UniProt Асе. № H8PFZ9 (аденовируса обезьяны 18 серотипа, SEQ ID NO: 15), UniProt Асе. № F6KSU4 (аденовируса обезьяны 20 серотипа, SEQ ID NO: 16), UniProt Асе. № F2WTK5 (аденовируса обезьяны 49 серотипа, SEQ ID NO: 17), UniProt Асе. № A0A0A1EWW1 (аденовируса макака-резуса 51 серотипа, SEQ ID NO: 18), UniProt Асе. № A0A0A1EWX7 (аденовируса макака-резуса 52 серотипа, SEQ ID NO: 19) и UniProt Асе. № A0A0A1EWZ7 (аденовируса макака-резуса 53 серотипа, SEQ ID NO: 20).Preferred amino acid sequences of the above adenovirus penton bases used for the crown domain are provided in publicly available databases such as UniProt and UniProtE, and particularly preferred sequences described herein for the above adenovirus subtypes are provided in UniProt Ace. No. Q2Y0H9 (human adenovirus serotype 3, SEQ ID NO: 1), UniProt Ace. No. P03276 (human adenovirus serotype 2, SEQ ID NO: 2), UniProt Ace. No. Q2KSF3 (human adenovirus serotype 4, SEQ ID NO: 3), UniProt Ace. No. PI2538 (human adenovirus serotype 5, SEQ ID NO: 4), UniProt Ace. No. Q9JFT6 (human adenovirus serotype 7, SEQ ID NO: 5), UniProt Ace. No. D2DM93 (human adenovirus serotype 11, SEQ ID NO: 6), UniProt Ace. No. P36716 (human adenovirus serotype 12, SEQ ID NO: 7), UniProt Ace. No. F1DT65 (human adenovirus serotype 17, SEQ ID NO: 8), UniProt Ace. No. M0QUK0 (human adenovirus serotype 25, SEQ ID NO: 9), UniProt Ace. No. Q7T941 (human adenovirus serotype 35, SEQ ID NO: 10), UniProt Ace. No. Q912J1 (human adenovirus serotype 37, SEQ ID NO: 11), UniProt Ace. No. F8WQN4 (human adenovirus serotype 41, SEQ ID NO: 12), UniProt Ace. No. E5L3Q9 (gorilla adenovirus, SEQ ID NO: 13), UniProt Ace. No. G9G849 (chimpanzee adenovirus, SEQ ID NO: 14), UniProt Ace. No. H8PFZ9 (simian adenovirus serotype 18, SEQ ID NO: 15), UniProt Ace. No. F6KSU4 (simian adenovirus serotype 20, SEQ ID NO: 16), UniProt Ace. No. F2WTK5 (simian adenovirus serotype 49, SEQ ID NO: 17), UniProt Ace. No. A0A0A1EWW1 (rhesus macaque adenovirus serotype 51, SEQ ID NO: 18), UniProt Ace. No. A0A0A1EWX7 (rhesus macaque adenovirus serotype 52, SEQ ID NO: 19) and UniProt Ace. No. A0A0A1EWZ7 (rhesus macaque adenovirus serotype 53, SEQ ID NO: 20).
Наиболее предпочтительные последовательности больших фрагментов доменов «корона» для применения в химерных конструкциях по настоящему изобретению приведены в следующей таблице 4:The most preferred sequences of large fragments of crown domains for use in the chimeric constructs of the present invention are shown in the following table 4:
Наиболее предпочтительные последовательности больших фрагментов доменов «корона» для применения в химерных конструкциях по настоящему изобретению приведены в следующей таблице 5:The most preferred large crown domain fragment sequences for use in the chimeric constructs of the present invention are shown in the following Table 5:
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 2 серотипа (hAd2) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 2 (hAd2) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 3 (hAd3), human adenovirus serotype 4 (hAd4), human adenovirus 5 serotype (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 3 серотипа (hAd3) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 3 (hAd3) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 4 (hAd4), human adenovirus 5 serotype (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 4 серотипа (hAd4) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 4 (hAd4) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 5 serotype (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 5 серотипа (hAd5) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 5 (hAd5) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 7 серотипа (hAd7) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека серотипа 2 (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 7 (hAd7) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 11 серотипа (hAd11) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 11 (hAd11) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 12 серотипа (hAd12) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 12 (hAd12) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 17 серотипа (hAd17) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 17 (hAd17) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 25 (hAd25), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 25 серотипа (hAd25) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 25 (hAd25) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 35 ( hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 35 серотипа (hAd35) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 35 (hAd35) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 37 серотипа (hAd37) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 37 (hAd37) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса человека 41 серотипа (hAd41) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of human adenovirus serotype 41 (hAd41) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса гориллы (gorAd) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of a gorilla adenovirus (gorAd) is combined with the crown domain of a penton base of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus serotype 4 ( hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25) , human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса шимпанзе (ChimpAd) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of a chimpanzee adenovirus (ChimpAd) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus serotype 4 ( hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25) , human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса обезьяны 18 серотипа (sAd1S) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of simian adenovirus serotype 18 (sAd1S) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 20 (sAd20), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса обезьяны 20 серотипа (sAd20) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd1S), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of simian adenovirus serotype 20 (sAd20) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd1S), simian adenovirus 49 serotype (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса обезьяны 49 серотипа (sAd49) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of simian adenovirus serotype 49 (sAd49) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus 20 serotype (sAd20), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса макака-резуса 51 серотипа (rhAd51) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of rhesus macaque adenovirus serotype 51 (rhAd51) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), adenovirus human adenovirus serotype 4 (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus 25 serotype (hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), adenovirus monkey serotype 20 (sAd20), simian adenovirus serotype 49 (sAd49), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса макака-резуса 52 серотипа (rhAd52) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of rhesus macaque adenovirus serotype 52 (rhAd52) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), adenovirus human adenovirus serotype 4 (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus 25 serotype (hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), adenovirus monkey serotype 20 (sAd20), simian adenovirus serotype 49 (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Предпочтительный вариант осуществления настоящего изобретения представляет собой химеру, где домен мультимеризации аденовируса макака-резуса 53 серотипа (rhAd53) объединен с доменом «корона» основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 3 серотипа (hAd3), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd41), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51) и аденовируса макака-резуса 52 серотипа (rhAd52). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.A preferred embodiment of the present invention is a chimera wherein the multimerization domain of rhesus macaque adenovirus serotype 53 (rhAd53) is combined with the penton base crown domain of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 3 (hAd3), adenovirus human adenovirus serotype 4 (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus 25 serotype (hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd41), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), adenovirus monkey serotype 20 (sAd20), simian adenovirus serotype 49 (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51) and rhesus macaque adenovirus serotype 52 (rhAd52). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Особенно предпочтительный домен «корона» для получения химер по настоящему изобретению представляет собой домен «корона» белка основания пентона аденовируса человека 3 серотипа (hAd3). Предпочтительные последовательности в отношении положений аминокислот SEQ ID NO: 1 представлены в таблице 4 (большой фрагмент) и таблице 5 (малый фрагмент).A particularly preferred crown domain for producing chimeras of the present invention is the crown domain of the penton base protein of human adenovirus serotype 3 (hAd3). Preferred sequences with respect to amino acid positions of SEQ ID NO: 1 are presented in Table 4 (large fragment) and Table 5 (small fragment).
В еще более предпочтительных химерах по настоящему изобретению домен «корона» белка основания пентона аденовируса человека 3 серотипа (hAd3) объединен с доменом мультимеризации белка основания пентона аденовируса, выбранного из аденовируса человека 2 серотипа (hAd2), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса шимпанзе (ChimpAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.In even more preferred chimeras of the present invention, the crown domain of the penton base protein of human adenovirus serotype 3 (hAd3) is combined with the multimerization domain of the penton base protein of an adenovirus selected from human adenovirus serotype 2 (hAd2), human adenovirus serotype 4 (hAd4), adenovirus human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 (hAd25), human adenovirus 35 serotype (hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), chimpanzee adenovirus (ChimpAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), adenovirus monkey serotype 49 (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Особенно предпочтительный домен «корона» для получения химер по настоящему изобретению представляет собой домен «корона» основания пентона аденовируса шимпанзе (ChimpAd). Предпочтительные последовательности в отношении аминокислотных положений SEQ ID NO: 14 представлены в таблице 4 (большой фрагмент) и таблице 5 (малый фрагмент).A particularly preferred crown domain for producing chimeras of the present invention is the chimpanzee adenovirus penton base crown domain (ChimpAd). Preferred sequences with respect to amino acid positions of SEQ ID NO: 14 are presented in Table 4 (large fragment) and Table 5 (small fragment).
В еще более предпочтительных химерах по настоящему изобретению домен «корона» белка основания пентона аденовируса шимпанзе (ChimpAd) объединен с доменом мультимеризации белка основания пентона аденовируса, выбранного из аденовируса человека 3 серотипа (hAd3), аденовируса человека 2 серотипа (hAd2), аденовируса человека 4 серотипа (hAd4), аденовируса человека 5 серотипа (hAd5), аденовируса человека 7 серотипа (hAd7), аденовируса человека 11 серотипа (hAd11), аденовируса человека 12 серотипа (hAd12), аденовируса человека 17 серотипа (hAd17), аденовируса человека 25 серотипа (hAd25), аденовируса человека 35 серотипа (hAd35), аденовируса человека 37 серотипа (hAd37), аденовируса человека 41 серотипа (hAd41), аденовируса гориллы (gorAd), аденовируса обезьяны 18 серотипа (sAd18), аденовируса обезьяны 20 серотипа (sAd20), аденовируса обезьяны 49 серотипа (sAd49), аденовируса макака-резуса 51 серотипа (rhAd51), аденовируса макака-резуса 52 серотипа (rhAd52) и аденовируса макака-резуса 53 серотипа (rhAd53). Конкретные последовательности домена мультимеризации и домена «корона», выбранные для данной комбинации относятся к конкретным примерам в соответствии с таблицами с 1 по 5.In even more preferred chimeras of the present invention, the crown domain of a chimpanzee adenovirus penton base protein (ChimpAd) is combined with the multimerization domain of an adenovirus penton base protein selected from human adenovirus serotype 3 (hAd3), human adenovirus serotype 2 (hAd2), human adenovirus 4 serotype (hAd4), human adenovirus serotype 5 (hAd5), human adenovirus serotype 7 (hAd7), human adenovirus serotype 11 (hAd11), human adenovirus serotype 12 (hAd12), human adenovirus serotype 17 (hAd17), human adenovirus serotype 25 ( hAd25), human adenovirus serotype 35 (hAd35), human adenovirus serotype 37 (hAd37), human adenovirus serotype 41 (hAd41), gorilla adenovirus (gorAd), simian adenovirus serotype 18 (sAd18), simian adenovirus serotype 20 (sAd20), adenovirus monkey serotype 49 (sAd49), rhesus macaque adenovirus serotype 51 (rhAd51), rhesus macaque adenovirus serotype 52 (rhAd52) and rhesus macaque adenovirus serotype 53 (rhAd53). The specific multimerization domain and crown domain sequences selected for this combination refer to specific examples in accordance with Tables 1 to 5.
Как уже указано выше, один из основных вариантов осуществления настоящего изобретения представляет собой включение антигена, более конкретно антигена инфекционного агента, такого как вирус, бактерия или другой патоген, или опухолевый или раковый антиген, в один или оба из L1 и L2. Предпочтительные сайты включения антигенов в петли RGD и/или вариабельные петли аденовирусных доменов «корона» раскрыты в WO 2017/167988 А1. В контексте данного документа термин "антиген" относится к структуре, распознаваемой молекулами иммунного ответа, например, антителами, рецепторами Т-клеток (TCR) и т.д.As already indicated above, one of the main embodiments of the present invention is the inclusion of an antigen, more particularly an antigen of an infectious agent such as a virus, bacterium or other pathogen, or a tumor or cancer antigen, in one or both of L 1 and L 2 . Preferred insertion sites for antigens in RGD loops and/or variable loops of adenoviral crown domains are disclosed in WO 2017/167988 A1. As used herein, the term "antigen" refers to a structure recognized by immune response molecules, such as antibodies, T cell receptors (TCRs), etc.
Антигены инфекционных агентов включают, но не ограничиваются ими, например, вирусные инфекционные агенты, такие как ВИЧ, вирусы гепатита, такие как вирус гепатита А, вирус гепатита В или вирус гепатита С, вирус герпеса, вирус ветряной оспы, вирус краснухи, вирус желтой лихорадки, вирус лихорадки Денге, флавивирусы (например, вирус Зика), вирусы гриппа, марбургская вирусная болезнь, вирусы Эбола и арбовирусы, такие как вирус чикунгунья. Антигены бактериальных инфекционных агентов включают, но не ограничиваются ими, антигены, например, Legionella, Helicobacter, Vibrio, инфекционные штаммы Е. coli, Staphylococci, Salmonella и Streptococci. Антигены инфекционных патогенов простейших включают, но не ограничиваются ими, антигены Plasmodium, Trypanosoma, Leishmania и Toxoplasma. Дополнительные примеры антигенов патогенных агентов включают антигены грибковых патогенов, такие как антигены Cryptococcus neoformans, Histoplasma capsulatum, Coccidioides immitis, Blastomyces dermatitidis и Candida albicans.Infectious agent antigens include, but are not limited to, for example, viral infectious agents such as HIV, hepatitis viruses such as hepatitis A virus, hepatitis B virus or hepatitis C virus, herpes virus, varicella zoster virus, rubella virus, yellow fever virus , Dengue fever virus, flaviviruses (eg Zika virus), influenza viruses, Marburg virus disease, Ebola viruses and arboviruses such as chikungunya virus. Antigens of bacterial infectious agents include, but are not limited to, antigens, for example, Legionella, Helicobacter, Vibrio, infectious strains of E. coli, Staphylococci, Salmonella and Streptococci. Antigens of infectious protozoan pathogens include, but are not limited to, Plasmodium, Trypanosoma, Leishmania, and Toxoplasma antigens. Additional examples of pathogen antigens include fungal pathogen antigens, such as those of Cryptococcus neoformans, Histoplasma capsulatum, Coccidioides immitis, Blastomyces dermatitidis, and Candida albicans.
Конкретные примеры опухолевых антигенов, которые можно применять в соответствии с настоящим изобретением, включают, но не ограничиваются ими, 707-АР, AFP, ART-4, BAGE, бета-катенин/m, Bcr-abl, CAMEL, САР-1, CASP-8, CDC27/m, CDK4/m, CEA, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gp100, HAGE, HER-2/neu, HLA-A*0201-R170I, HPV-E7, HSP70-2M, HAST-2, hTERT (или hTRT), iCE, KIAA0205, LAGE, LDLR/FUT, MAGE, MART- 1/Melan-A, MC1R, миозин/м, MUC1, MUM-1, -2, -3, NA88-A, NY-ESO-1, pl90 minor bcr-abl, Pml/RAR.alpha., PRAME, PSA, PSM, RAGE, RU1 или RU2, SAGE, SART-1 или SART- 3, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/TNT2h WT1.Specific examples of tumor antigens that can be used in accordance with the present invention include, but are not limited to, 707-AP, AFP, ART-4, BAGE, beta-catenin/m, Bcr-abl, CAMEL, CAP-1, CASP -8, CDC27/m, CDK4/m, CEA, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gp100, HAGE, HER-2/neu, HLA-A*0201 -R170I, HPV-E7, HSP70-2M, HAST-2, hTERT (or hTRT), iCE, KIAA0205, LAGE, LDLR/FUT, MAGE, MART-1/Melan-A, MC1R, myosin/m, MUC1, MUM -1, -2, -3, NA88-A, NY-ESO-1, pl90 minor bcr-abl, Pml/RAR.alpha., PRAME, PSA, PSM, RAGE, RU1 or RU2, SAGE, SART-1 or SART-3, TEL/AML1, TPI/m, TRP-1, TRP-2, TRP-2/TNT2h WT1.
Особенно в контексте антигенов, включенных в полипептиды по настоящему изобретению, как L1 и/или L2, но также в отношении любого белок-белкового взаимодействия, такого как связывание рецептора с лигандом, можно включить процесс отбора и/или эволюции для обеспечения последовательностей, оптимизированных для связывания мишени, таких как оптимизированные антигены, для проявления улучшенного иммунного ответа. Предпочтительный способ представляет собой рибосомный дисплей, как подробно описано в публикации Schaffitzel et al. (2001) in: Protein-Protein Interactions, A Molecular Cloning Manual: In vitro selection and evolution of protein-ligand interaction by ribosome display (Golemis E., ed.), pages 535-567, Cold Spring Harbor Laboratory Press, New York. Преимуществом способа рибосомного дисплея является его полное выполнение in vitro на всех стадиях отбора. Другие возможные способы отбора также известны в данной области техники и включают фаговый дисплей (Smith (1985) Science 228, 1315-1317; Winter et al. (1994) Annu. Rev. Immunol. 12, 433-455), дрожжевую двухгибридную систему (Fields and Song (19899 Nature 340, 245-246, Chien et al. (1983) Proc. Natl. Acad. Sci. USA 88, 9578-9582) и способы отображения на клеточной поверхности (Georgiu et al. (1993) Trends Biotechnol. 11, 6-10, Boder and Wittrup (1997) Nat. Biotechnol. 15, 553-557).Particularly in the context of antigens included in the polypeptides of the present invention, such as L 1 and/or L 2 , but also in relation to any protein-protein interaction, such as receptor-ligand binding, a process of selection and/or evolution can be involved to provide sequences, optimized for target binding, such as optimized antigens, to exhibit an improved immune response. The preferred method is ribosomal display, as described in detail in Schaffitzel et al. (2001) in: Protein-Protein Interactions, A Molecular Cloning Manual: In vitro selection and evolution of protein-ligand interaction by ribosome display (Golemis E., ed.), pages 535-567, Cold Spring Harbor Laboratory Press, New York . The advantage of the ribosomal display method is its complete implementation in vitro at all stages of selection. Other possible selection methods are also known in the art and include phage display (Smith (1985) Science 228, 1315-1317; Winter et al. (1994) Annu. Rev. Immunol. 12, 433-455), yeast two-hybrid system ( Fields and Song (19899 Nature 340, 245-246, Chien et al. (1983) Proc. Natl. Acad. Sci. USA 88, 9578-9582) and cell surface display methods (Georgiu et al. (1993) Trends Biotechnol 11, 6-10, Boder and Wittrup (1997) Nat. Biotechnol. 15, 553-557).
Способ рибосомного дисплея в основном можно применять двумя путями для оптимизации антигенов или других аминокислотных последовательностей, участвующих в нацеливании на конкретную молекулу, с применением полипептидов по настоящему изобретению. Либо последовательность антигена (или другого связывающего агента) может быть выбрана первой из исходной библиотеки последовательностей полипептидов, которая может достигать 1014 индивидуальных последовательностей, чаще от 109 до 1010 последовательностей, необязательно с применением эволюционных процедур, как подробно описано в публикации Schaffitzel et al. (2001), выше. После выбора оптимизированных последовательностей антигена нуклеотидную последовательность, кодирующую ее, клонируют в соответствующий вектор по настоящему изобретению, так что экспрессируется полипептид, в котором оптимизированный антиген включен или представляет собой L1 и/или L2 согласно приведенной выше формуле (I).The ribosomal display method can generally be used in two ways to optimize antigens or other amino acid sequences involved in targeting a particular molecule using the polypeptides of the present invention. Alternatively, the antigen (or other binding agent) sequence may be selected first from an initial library of polypeptide sequences, which may be up to 10 14 individual sequences, typically 10 9 to 10 10 sequences, optionally using evolutionary procedures as detailed in Schaffitzel et al . (2001), supra. After selecting the optimized antigen sequences, the nucleotide sequence encoding it is cloned into the corresponding vector of the present invention, so that a polypeptide in which the optimized antigen is included or is L 1 and/or L 2 according to the above formula (I) is expressed.
Согласно альтернативному варианту осуществления данного аспекта настоящего изобретения, библиотека потенциальных последовательностей, кодирующих антиген, непосредственно клонируется в нуклеиновую кислоту по настоящему изобретению, так что каждая последовательность кодирует полипептид, который представляет собой часть или представляет собой, соответственно, один или оба из L1 и L2, как определено в формуле (I), выше. Полипептиды по настоящему изобретению, содержащие исходную библиотеку последовательностей антигенов (или, в других вариантах осуществления, другие связывающие последовательности), экспрессируются затем in vitro, и выбор оптимизированных последовательностей антигена (или другого связывающего агента) осуществляют в соответствии со способом рибосомного дисплея, как подробно описано в публикации Schaffitzel et al. (2001), выше.According to an alternative embodiment of this aspect of the present invention, a library of potential antigen coding sequences is directly cloned into a nucleic acid of the present invention such that each sequence encodes a polypeptide that is part of or represents, respectively, one or both of L 1 and L 2 as defined in formula (I) above. The polypeptides of the present invention containing the initial library of antigen sequences (or, in other embodiments, other binding sequences) are then expressed in vitro, and the selection of optimized antigen (or other binding agent) sequences is carried out in accordance with the ribosomal display method, as described in detail in Schaffitzel et al. (2001), supra.
Дополнительный вариант осуществления полипептидов по настоящему изобретению относится к полипептидам, где L1 и/или L2 представляют собой или связаны с, соответственно, последовательностями антител или частями антител, такими как фрагменты антител. В контексте настоящего изобретения термин "антитело" означает иммуноглобулин, специфически связывающийся с антигеном.A further embodiment of the polypeptides of the present invention relates to polypeptides wherein L 1 and/or L 2 are or are linked to, respectively, antibody sequences or portions of antibodies, such as antibody fragments. In the context of the present invention, the term "antibody" means an immunoglobulin that specifically binds to an antigen.
Термин "фрагмент антитела" относится к части антитела, которая сохраняет способность полного антитела специфически связываться с антигеном. Примеры фрагментов антител включают, но не ограничиваются ими, фрагменты Fab, фрагменты Fab', фрагменты F(ab')2, антитела, состоящие только из тяжелых цепей, однодоменные антитела (sdAb), фрагменты scFv, вариабельные фрагменты (Fv), домены VH, домены VL, нанотела, IgNAR (новые антигенные рецепторы иммуноглобулина), ди-scFv, биспецифические Т-клеточные агенты (BITE), молекулы, переориентирующие антитело двойной аффинности (DART), тройные тела, диатела, одноцепочечные диатела и т.п.The term "antibody fragment" refers to the portion of an antibody that retains the ability of the complete antibody to specifically bind an antigen. Examples of antibody fragments include, but are not limited to, Fab fragments, Fab' fragments, F(ab') 2 fragments, heavy chain only antibodies, single domain antibodies (sdAbs), scFv fragments, variable fragments (Fv), VH domains , VL domains, nanobodies, IgNARs (immunoglobulin novel antigen receptors), di-scFvs, bispecific T cell agents (BITEs), dual affinity antibody retargeting (DART) molecules, ternary bodies, diabodies, single-chain diabodies, etc.
"Диатело" представляет собой слитый белок или бивалентное антитело, которое может связывать различные антигены. Диатело состоит из двух одиночных белковых цепей (обычно двух scFv-фрагментов), каждая из которых содержит вариабельные фрагменты антитела. Таким образом, диатела содержат два антигенсвязывающих сайта и, таким образом, могут нацеливаться на один и тот же (моноспецифическое диатело) или различные антигены (биспецифическое диатело).A "diabody" is a fusion protein or bivalent antibody that can bind various antigens. The diabody consists of two single protein chains (usually two scFv fragments), each of which contains variable antibody fragments. Thus, diabodies contain two antigen-binding sites and thus can target the same (monospecific diabody) or different antigens (bispecific diabody).
Термин "однодоменное антитело", в контексте настоящего изобретения, относится к фрагментам антитела, состоящим из одного мономерного вариабельного домена антитела. Просто они включают только вариабельные области мономерной тяжелой цепи антител, состоящих только из тяжелых цепей, продуцируемых хрящевыми рыбами или верблюдовыми. В следствие различного происхождения их также называют фрагментами VHH или VNAR (вариабельный нового антигенный рецептор). Альтернативно, однодоменные антитела можно получить мономеризацией вариабельных доменов обычных мышиных или человеческих антител с помощью генной инженерии. Они обладают молекулярной массой приблизительно от 12 до 15 кДа и, таким образом, представляют собой самые маленькие фрагменты антител, способные распознавать антиген. Дополнительные примеры включают нанотела или наноантитела.The term "single domain antibody", as used herein, refers to antibody fragments consisting of a single monomeric antibody variable domain. They simply include only the variable regions of the monomeric heavy chain of antibodies consisting only of heavy chains produced by cartilaginous fish or camelids. Due to their different origins, they are also called VHH or VNAR (variable new antigen receptor) fragments. Alternatively, single domain antibodies can be produced by monomerizing the variable domains of conventional mouse or human antibodies using genetic engineering. They have a molecular weight of approximately 12 to 15 kDa and are thus the smallest antibody fragments capable of recognizing antigen. Additional examples include nanobodies or nanoantibodies.
Антигенсвязывающие частицы, применимые в контексте настоящего изобретения, также включают "миметики антител", в контексте настоящего описания относящиеся к соединениям, которые специфически связывают антигены, аналогичные антителам, но которые структурно не связаны с антителами. Обычно миметики антител представляют собой искусственные пептиды или белки с молярной массой от приблизительно 3 до 20 кДа, которые содержат один, два или более доступных доменов, специфически связывающихся с антигеном. Примеры включают, помимо прочего, LACI-D1 (липопротеин-ассоциированный ингибитор свертывания крови), аффилины, например, человеческий-γ В кристаллический или человеческий убиквитин, цистатин, Sac7D из Sulfolobus acidocaldarius, липокалин и антикалины, полученные из липокалинов, DARPins (сконструированные повторяющиеся домены анкирина), CH3-домен Fyn, Kunits-домен ингибиторов протеазы, монотела, например домен 10-го типа фибронектина III типа, аднектины: кноттины (минипротеины цистеиновых узлов), атримеры, эвитела, например связывающие агенты на основе CTLA4, аффитела, например, трехспиральный пучок из Z-домена протеина А из Staphylococcus aureus, транс-тела, например человеческий трансферрин, тетранектины, например мономерный или тримерный домен лектина С-типа человека, микротела, например ингибитор трипсина-П, аффилины, белки броненосцев, несущие повторы. Нуклеиновые кислоты и малые молекулы иногда также считаются миметиками антител (аптамеры), но не искусственными антителами, фрагментами антител и слитыми белками, состоящими из них. Общими преимуществами перед антителами являются лучшая растворимость, проникновение в ткани, устойчивость к нагреванию и воздействию ферментов, а также сравнительно низкие затраты при получении.Antigen-binding particles useful in the context of the present invention also include "antibody mimetics", as used herein, referring to compounds that specifically bind antigens similar to antibodies, but which are not structurally related to antibodies. Typically, antibody mimetics are artificial peptides or proteins with a molar mass of approximately 3 to 20 kDa that contain one, two, or more accessible domains that specifically bind an antigen. Examples include, but are not limited to, LACI-D1 (lipoprotein-associated coagulation inhibitor), affins such as human-γB crystalline or human ubiquitin, cystatin, Sac7D from Sulfolobus acidocaldarius, lipocalin and lipocalin-derived anticalins, DARPins (designed repeating ankyrin domains), Fyn CH3 domain, Kunits protease inhibitor domain, monobodies, e.g. fibronectin type III type 10 domain, adnectins: knottins (cysteine knot miniproteins), atrimers, evibodies, e.g. CTLA4-based binders, affibodies, e.g. , triple-stranded bundle from the Z domain of protein A from Staphylococcus aureus, trans-bodies, e.g. human transferrin, tetranectins, e.g. monomeric or trimeric domain of human C-type lectin, microbodies, e.g. trypsin inhibitor-P, affilins, armadillo repeat-bearing proteins. Nucleic acids and small molecules are sometimes also considered antibody mimetics (aptamers), but not artificial antibodies, antibody fragments, and fusion proteins composed of them. General advantages over antibodies are better solubility, tissue penetration, resistance to heat and enzymes, and relatively low production costs.
Как и нативные белки оснований пентона, полипептиды по настоящему изобретению собираются в пентамерные комплексы, 12 из которых, в свою очередь, собираются в вирусоподобные частицы (ВПЧ) в буферном растворе при значении рН предпочтительно от приблизительно 5,0 до приблизительно 8,0. Предпочтительные примеры представляют собой буферные условия при физиологических условиях или близких к ним, таких как фосфатно-солевой буфер (ФСБ), рН 7,4 или трис-буфер солевой (TBS) или TBS-T рН от 7,2 до 7,6. В таких условиях полипептиды по настоящему изобретнию образуют ВПЧ при температуре приблизительно от 20 до 42°С. Настоящее изобретение также относится к таким пентамерным комплексам и ВПЧ.Like native penton base proteins, the polypeptides of the present invention assemble into pentameric complexes, 12 of which are in turn assembled into virus-like particles (VLPs) in a buffer solution at a pH preferably from about 5.0 to about 8.0. Preferred examples are buffer conditions at or near physiological conditions, such as phosphate-buffered saline (PBS), pH 7.4, or Tris-buffered saline (TBS) or TBS-T pH 7.2 to 7.6. Under such conditions, the polypeptides of the present invention form VLPs at a temperature of approximately 20 to 42°C. The present invention also relates to such pentameric complexes and HPV.
Еще один объект настоящего изобретения относится к нуклеиновой кислоте, кодирующей полипептид, как определено в данном документе.Another aspect of the present invention relates to a nucleic acid encoding a polypeptide as defined herein.
Согласно настоящему изобретению термины "нуклеиновая кислота" и "полинуклеотид" применяются взаимозаменяемо и относятся к ДНК, РНК или видам, содержащим один или более аналогов нуклеотидов. Предпочтительные нуклеиновые кислоты или полинуклеотиды по настоящему изобретению представляют собой ДНК, более предпочтительно двухцепочечную (дц) ДНК. Нуклеотидные последовательности по настоящему изобретению представлены в направлении от 5' до 3', и применяется однобуквенный код ИЮПАК для оснований, если не указано иное.According to the present invention, the terms "nucleic acid" and "polynucleotide" are used interchangeably and refer to DNA, RNA, or species containing one or more nucleotide analogues. Preferred nucleic acids or polynucleotides of the present invention are DNA, more preferably double-stranded (ds) DNA. The nucleotide sequences of the present invention are presented in the 5' to 3' direction, and the single letter IUPAC code for bases is used unless otherwise indicated.
Другой вариант осуществления относится к нуклеиновой кислоте, полученной для вставки универсальных сегментов L1 и L2, как определено в общей формуле (1). То есть этот вариант нуклеиновой кислоты кодирует сегменты А, В и С, но имеет сайты инсерции между сегментами, кодирующими А и В, и между сегментами, кодирующими В и С.Another embodiment relates to a nucleic acid prepared to insert universal segments L 1 and L 2 as defined in general formula (1). That is, this nucleic acid variant encodes segments A, B, and C, but has insertion sites between the segments encoding A and B, and between the segments encoding B and C.
Таким образом, данный вариант осуществления может быть представлен следующей общей формулой (II):Thus, this embodiment can be represented by the following general formula (II):
гдеWhere
а представляет собой нуклеотидную последовательность, кодирующую А общей формулы (I),a is a nucleotide sequence encoding A of general formula (I),
b представляет собой нуклеотидную последовательность, кодирующую В общей формулы (I),b is a nucleotide sequence encoding B of general formula (I),
с представляет собой нуклеотидную последовательность, кодирующую С общей формулы (I), иc is a nucleotide sequence encoding C of general formula (I), and
l1, l2 каждый представляет собой нуклеотидную последовательность,l 1 , l 2 each represents a nucleotide sequence,
с is1 по is4 каждый независимо представляет собой нуклеотидную последовательность, содержащую по меньшей мере один сайт инсерции.is 1 to is 4 each independently represent a nucleotide sequence containing at least one insertion site.
Сайт инсерции в контексте указанного варианта осуществления настоящего изобретения предпочтительно представляет собой последовательность узнавания рестрикционного фермента или хоминг-эндонуклеазы. Более предпочтительно, каждый с is1 по is4 представляет собой различные сайты инсерции, более конкретно, каждый с is1 по is4 представляет собой последовательность распознавания различных рестрикционных ферментов. Предпочтительный вариант осуществления нуклеиновой кислоты, полученной для встраивания нуклеотидных последовательностей, кодирующих L1 и L2, имеет нуклеотидную последовательность, где is1 содержит сайт EcoRI, is2 содержит сайт RsrII, is3 содержит сайт SacI и 1&4 содержит сайтХЬа!The insertion site in the context of this embodiment of the present invention is preferably a restriction enzyme or homing endonuclease recognition sequence. More preferably, is 1 to is 4 each represents a different insertion site, more specifically, each is 1 to is 4 represents a different restriction enzyme recognition sequence. A preferred embodiment of the nucleic acid prepared for the insertion of nucleotide sequences encoding L 1 and L 2 has a nucleotide sequence where is 1 contains an EcoRI site, is 2 contains a RsrII site, is3 contains a SacI site and 1&4 contains an XLa site!
Сайты рестрикционных ферментов обычно хорошо известны специалисту в данной области техники. Предпочтительные примеры представляют собой такие, как определено выше, но сайты рестрикции могут быть выбраны из большого разнообразия, и рекомендации можно найти у различных производителей рестрикционных ферментов, таких как New England Biolabs, Inc., Ipswich, MA, USA.Restriction enzyme sites are usually well known to one skilled in the art. Preferred examples are as defined above, but restriction sites can be selected from a wide variety and recommendations can be found from various restriction enzyme manufacturers such as New England Biolabs, Inc., Ipswich, MA, USA.
Примеры таких сайтов хоминг-эндонуклеазы (НЕ) включают, но не ограничиваются ими, последовательности распознавания PI-SceI, I-CeuI, I-PpoI, I-HmuI, I-CreI, I-DmoI, PI-PfuI и I-MsoI, PI-PspI, I-Scel, другие члены группы LAGLIDAG и их варианты, SegH и Hef или другие хоминг-эндонуклеазы GIY-YIG, I-ApeII, I-Anil, цитохром b мРНК матураза bl3, PI-THI и PI-TfuII, PI-ThyI и другие, см. Stoddard B.L. (2005) Q. Rev. Biophys. 38, 49-95. Соответствующие ферменты представлены в продаже, например, от New England Biolabs Inc., Ipswich, MA, USA.Examples of such homing endonuclease (HE) sites include, but are not limited to, the recognition sequences PI-SceI, I-CeuI, I-PpoI, I-HmuI, I-CreI, I-DmoI, PI-PfuI, and I-MsoI. PI-PspI, I-Scel, other members of the LAGLIDAG group and their variants, SegH and Hef or other homing endonucleases GIY-YIG, I-ApeII, I-Anil, cytochrome b mRNA maturase bl3, PI-THI and PI-TfuII, PI-ThyI and others, see Stoddard B.L. (2005) Q. Rev. Biophys. 38, 49-95. Suitable enzymes are commercially available, for example, from New England Biolabs Inc., Ipswich, MA, USA.
В предпочтительных вариантах осуществления настоящего изобретения указанная выше нуклеиновая кислота дополнительно содержит по меньшей мере один сайт интеграции нуклеиновой кислоты в вектор или клетку-хозяин. Сайт интеграции может допускать временное или геномное включение.In preferred embodiments of the present invention, the above nucleic acid further comprises at least one site for integration of the nucleic acid into the vector or host cell. The integration site may allow transient or genomic inclusion.
Что касается интеграции в вектор, в частности в плазмиду или вирус, сайт интеграции предпочтительно является совместимым для интеграции нуклеиновой кислоты в аденовирус, аденоассоциированный вирус (AAV), автономный парвовирус, вирус простого герпеса (HSV), ретровирус, радиновирус, вирус Эпштейн-Барра, лентивирус, вирус леса Семлики или бакуловирус.With regard to integration into a vector, particularly a plasmid or virus, the integration site is preferably compatible for integration of the nucleic acid into an adenovirus, adeno-associated virus (AAV), autonomous parvovirus, herpes simplex virus (HSV), retrovirus, rhadinovirus, Epstein-Barr virus, lentivirus, Semliki forest virus or baculovirus.
Особенно предпочтительные сайты интеграции, которые могут быть включены в нуклеиновую кислоту по настоящему изобретению, могут быть выбраны из транспозонного элемента Tn7, сайтов связывания, специфичных для λ-интегразы, и сайт-специфичных рекомбиназ (SSR), в частности сайта LoxP или сайта рекомбинации, специфичного для рекомбиназы FLP (FRT). Другими предпочтительными механизмами интеграции нуклеиновой кислоты по настоящему изобретению являются специфические гомологичные рекомбинационные последовательности, такие как Ief2-603/Orf1629.Particularly preferred integration sites that may be included in the nucleic acid of the present invention may be selected from the Tn7 transposon element, λ integrase-specific binding sites, and site-specific recombinases (SSRs), in particular the LoxP site or recombination site, specific for FLP recombinase (FRT). Other preferred nucleic acid integration mechanisms of the present invention are specific homologous recombination sequences, such as Ief2-603/Orf1629.
В других предпочтительных вариантах осуществления настоящего изобретения описанная в настоящем документе нуклеиновая кислота дополнительно содержит один или более маркеров устойчивости для отбора против токсичных веществ. Предпочтительные примеры маркеров устойчивости, применимых в контексте настоящего изобретения, включают, но не ограничиваются ими, антибиотики, такие как ампициллин, хлорамфеникол, гентамицин, спектиномицин и маркеры устойчивости к канамицину.In other preferred embodiments of the present invention, the nucleic acid described herein further comprises one or more resistance markers for selection against toxic substances. Preferred examples of resistance markers useful in the context of the present invention include, but are not limited to, antibiotics such as ampicillin, chloramphenicol, gentamicin, spectinomycin and kanamycin resistance markers.
Нуклеиновая кислота по настоящему изобретению может также содержать один или более сайтов связывания рибосомы (RBS).The nucleic acid of the present invention may also contain one or more ribosome binding sites (RBS).
Еще один объект настоящего изобретения относится к вектору, содержащему нуклеиновую кислоту, как определено выше.Another aspect of the present invention relates to a vector containing a nucleic acid as defined above.
Предпочтительные векторы по настоящему изобретению представляют собой плазмиды, векторы экспрессии, векторы для переноса, более предпочтительно векторы для переноса генов эукариот, векторы для переноса генов, опосредованные временными или вирусными векторами. Другие векторы по настоящему изобретению представляют собой вирусы, такие как векторы аденовируса, векторы аденоассоциированного вируса (AAV), векторы автономных парвовирусов, векторы вируса простого герпеса (HSV), ретровирусные векторы, векторы радиновируса, векторы вируса Эпштейн-Барра, векторы лентивирусов, векторы вируса леса Семлики и бакуловирусные векторы.Preferred vectors of the present invention are plasmids, expression vectors, transfer vectors, more preferably eukaryotic gene transfer vectors, transient-mediated or viral vector-mediated gene transfer vectors. Other vectors of the present invention are viruses, such as adenovirus vectors, adeno-associated virus (AAV) vectors, autonomous parvovirus vectors, herpes simplex virus (HSV) vectors, retroviral vectors, rhadinovirus vectors, Epstein-Barr virus vectors, lentivirus vectors, virus vectors Semliki forests and baculovirus vectors.
Бакуловирусные векторы, подходящие для интеграции нуклеиновой кислоты по настоящему изобретению (например, присутствующие на подходящей плазмиде, такой как вектор для переноса), также представляют собой объект настоящего изобретения и предпочтительно содержат сайт-специфичные сайты интеграции, такие как сайт присоединения Tn7 (который может быть встроенным в ген lacZ для синего/белого скрининга продуктивной интеграции) и/или сайт LoxP. Дополнительные предпочтительные бакуловирусы по настоящему изобретению содержат (альтернативно или в дополнение к вышеописанным сайтам интеграции) ген экспрессии вещества, токсичного для хозяина, фланкированный последовательностями для гомологичной рекомбинации. Примером гена, экспрессирующего токсичное вещество, является ген дифтерийного токсина А. Предпочтительной парой последовательностей для гомологичной рекомбинации является, например, Isf2-603/Orf1629. Бакуловирус может также содержать дополнительный маркерный ген(ы), как описано выше, включая также флуоресцентные маркеры, такие как GFP, YFP и так далее. Конкретные примеры соответствующих бакуловирусов раскрыты, например, в WO 2010/100278 А1.Baculovirus vectors suitable for integrating the nucleic acid of the present invention (e.g., present on a suitable plasmid, such as a transfer vector) are also subject to the present invention and preferably contain site-specific integration sites, such as a Tn7 attachment site (which may be inserted into the lacZ gene for blue/white screening for productive integration) and/or the LoxP site. Further preferred baculoviruses of the present invention contain (alternatively or in addition to the integration sites described above) a host toxic expression gene flanked by sequences for homologous recombination. An example of a gene expressing a toxic substance is the diphtheria toxin A gene. A preferred sequence pair for homologous recombination is, for example, Isf2-603/Orf1629. The baculovirus may also contain additional marker gene(s) as described above, including also fluorescent markers such as GFP, YFP and so on. Specific examples of corresponding baculoviruses are disclosed, for example, in WO 2010/100278 A1.
Другие полезные векторы для применения по настоящему изобретению раскрыты в WO 2005/085456 А1.Other useful vectors for use in the present invention are disclosed in WO 2005/085456 A1.
Векторы, применимые в прокариотических клетках-хозяевах, содержат предпочтительно, помимо приведенных выше примеров маркерных генов (один или более из них), точку начала репликации (ori). Примеры представляют собой BR322, ColE1 и условные точки начала репликации, такие как OriV и R6Ky, причем последний является предпочтительным условным источником репликации, который делает распространение вектора по настоящему изобретению зависимым от гена pir в прокариотическом хозяине. OriV делает распространение вектора по настоящему изобретению зависимым от гена trfA в прокариотическом хозяине.Vectors useful in prokaryotic host cells preferably contain, in addition to the above examples of marker genes (one or more of them), an origin of replication (ori). Examples are BR322, ColE1 and conditional origins of replication such as OriV and R6Ky, the latter being the preferred conditional origin of replication that makes propagation of the vector of the present invention dependent on the pir gene in the prokaryotic host. OriV makes the distribution of the vector of the present invention dependent on the trfA gene in the prokaryotic host.
Кроме того, настоящее изобретение относится к клетке-хозяину, содержащей нуклеиновую кислоту по настоящему изобретению и/или вектор по настоящему изобретению.In addition, the present invention relates to a host cell containing a nucleic acid of the present invention and/or a vector of the present invention.
Клетки-хозяева могут быть прокариотическими или эукариотическими. Эукариотические клетки-хозяева могут быть, например, клетками млекопитающих, предпочтительно клетками человека. Примеры клеток-хозяев человека включают, но не ограничиваются ими, HeLa, Huh7, HEK293, HepG2, КАТО-III, IMR32, МТ-2, β-клетки поджелудочной железы, кератиноциты, фибробласты костного мозга, СНР212, первичные нервные клетки, W12, SK-N-MC, Saos-2, WI38, первичные гепатоциты, FLC4, 143ТК, DLD-1, эмбриональные фибробласты легких, первичные фибробласты крайней плоти, клетки MRC5 и MG63. Другие предпочтительные клетки-хозяева по настоящему изобретению представляют собой клетки свиней, предпочтительно клетки СРК, FS-13, РК-15, клетки крупного рогатого скота, предпочтительно клетки MDB, ВТ, клетки крупного рогатого скота, такие как клетки FLL-YFT. Другие эукариотические клетки, применимые в контексте настоящего изобретения, представляют собой клетки С.elegans. Дополнительно эукариотические клетки включают дрожжевые клетки, такие как S. cerevisiae, S. pombe, С.albicans и P. pastoris. Кроме того, настоящее изобретение относится к клеткам насекомых в качестве клеток-хозяев, которые включают клетки S. frugiperda, более предпочтительно клетки Sf9, Sf21, Express Sf+, High Five H5 и клетки D. melanogaster, в частности клетки S2 Schneider. К другим клеткам-хозяевам относятся клетки Dictyostelium discoideum и клетки паразитов, таких как Leishmania spec.Host cells can be prokaryotic or eukaryotic. Eukaryotic host cells may be, for example, mammalian cells, preferably human cells. Examples of human host cells include, but are not limited to, HeLa, Huh7, HEK293, HepG2, KATO-III, IMR32, MT-2, pancreatic β-cells, keratinocytes, bone marrow fibroblasts, CHP212, primary nerve cells, W12, SK-N-MC, Saos-2, WI38, primary hepatocytes, FLC4, 143TK, DLD-1, embryonic lung fibroblasts, primary foreskin fibroblasts, MRC5 and MG63 cells. Other preferred host cells of the present invention are porcine cells, preferably IBS cells, FS-13, PK-15, bovine cells, preferably MDB cells, BT cells, bovine cells such as FLL-YFT cells. Other eukaryotic cells useful in the context of the present invention are C. elegans cells. Additionally, eukaryotic cells include yeast cells such as S. cerevisiae, S. pombe, C. albicans and P. pastoris. Furthermore, the present invention relates to insect cells as host cells, which include S. frugiperda cells, more preferably Sf9, Sf21, Express Sf+, High Five H5 cells and D. melanogaster cells, in particular S2 Schneider cells. Other host cells include Dictyostelium discoideum cells and parasite cells such as Leishmania spec.
Прокариотические хозяева согласно настоящему изобретению включают бактерии, в частности Е. coli, например, коммерчески доступные штаммы, такие как ТОР10, DH5α, НВ101. BL21 (DE3) и др.Prokaryotic hosts according to the present invention include bacteria, in particular E. coli, for example commercially available strains such as TOP10, DH5α, HB101. BL21 (DE3), etc.
Специалист в данной области техники легко сможет выбрать подходящие пары векторной конструкции/клетки-хозяина для соответствующего размножения и/или переноса элементов нуклеиновой кислоты по настоящему изобретению в подходящего хозяина. Конкретные способы введения соответствующих векторных элементов и векторов в соответствующие клетки-хозяев а известны в данной области техники, и способы можно найти в последнем издании публикации Ausubel et al. (ed.) Current Protocols ш Molecular Biology, John Wiley & Sons, New York, USA.One skilled in the art will readily be able to select suitable vector construct/host cell pairs for appropriate propagation and/or transfer of the nucleic acid elements of the present invention into a suitable host. Specific methods for introducing appropriate vector elements and vectors into appropriate host cells are known in the art, and methods can be found in the latest edition of Ausubel et al. (ed.) Current Protocols in Molecular Biology, John Wiley & Sons, New York, USA.
В предпочтительных вариантах осуществления настоящего изобретения вектор, как определено выше, дополнительно включает сайт для сайт-специфичных рекомбиназ (SSR), предпочтительно один или более сайтов LoxP для Сге-1ох-специфической рекомбинации. В других предпочтительных вариантах осуществления вектор по настоящему изобретению содержит элемент транспозона, предпочтительно сайт прикрепления Тп7.In preferred embodiments of the present invention, the vector as defined above further includes a site for site-specific recombinases (SSRs), preferably one or more LoxP sites for Cre-1ox-specific recombination. In other preferred embodiments, the vector of the present invention contains a transposon element, preferably a Tn7 attachment site.
Кроме того, предпочтительно, чтобы сайт связывания, как определено выше, находился внутри маркерного гена. Такое расположение делает возможным отбор последовательностей, успешно интегрированных в сайт связывания, путем транспозиции. Согласно предпочтительным вариантам осуществления такой маркерный ген выбран из генов люциферазы, β-GAL, CAT, генов, кодирующих флуоресцентные белки, предпочтительно GFP, BFP, YFP, CFP и их варианты, а также гена lacZa.In addition, it is preferable that the binding site, as defined above, is located within the marker gene. This arrangement makes it possible to select sequences successfully integrated into the binding site by transposition. In preferred embodiments, such a marker gene is selected from luciferase genes, β-GAL, CAT, genes encoding fluorescent proteins, preferably GFP, BFP, YFP, CFP and variants thereof, and the lacZa gene.
Кроме того, настоящее изобретение относится к клетке-хозяину, содержащей нуклеиновую кислоту по настоящему изобретению и/или вектор по настоящему изобретению.In addition, the present invention relates to a host cell containing a nucleic acid of the present invention and/or a vector of the present invention.
Клетки-хозяева могут быть прокариотическими или эукариотическими. Эукариотические клетки-хозяева могут представлять собой, например, клетки млекопитающих, предпочтительно клетки человека. Примеры человеческих клеток-хозяев включают, но не ограничиваются ими, HeLa, Huh7, HEK293, HepG2, КАТО-III, IMR32, МТ-2, β-клетки поджелудочной железы, кератиноциты, фибробласты костного мозга, СНР212, первичные нервные клетки, W12, SK-N-MC, Saos-2, WI38, первичные гепатоциты, FLC4, 143TK, DLD-1, эмбриональные фибробласты легких, первичные фибробласты крайней плоти, клетки MRC5 и MG63. Дополнительные предпочтительные клетки-хозяева по настоящему изобретению представляют собой клетки свиней, предпочтительно клетки СРК, FS-13, РК-15, клетки крупного рогатого скота, предпочтительно клетки MDB, ВТ, клетки крупного рогатого скота, такие как клетки FLL-YFT. Другие эукариотические клетки, применимые в контексте настоящего изобретения, представляют собой клетки С.elegans. Дополнительные эукариотические клетки включают дрожжевые клетки, такие как S. cerevisiae, S. pombe, С.albicans и P. pastoris. Кроме того, настоящее изобретение относится к клеткам насекомых в качестве клеток-хозяев, которые включают клетки S. frugiperda, более предпочтительно клетки Sf9, Sf21, Express Sf+, High Five H5 и клетки D. melanogaster, особенно клетки S2 Schneider. Дополнительные клетки-хозяева включают клетки Dictyostelium discoideum и клетки паразитов, таких как Leishmania spec.Host cells can be prokaryotic or eukaryotic. Eukaryotic host cells may be, for example, mammalian cells, preferably human cells. Examples of human host cells include, but are not limited to, HeLa, Huh7, HEK293, HepG2, KATO-III, IMR32, MT-2, pancreatic β-cells, keratinocytes, bone marrow fibroblasts, CHP212, primary nerve cells, W12, SK-N-MC, Saos-2, WI38, primary hepatocytes, FLC4, 143TK, DLD-1, embryonic lung fibroblasts, primary foreskin fibroblasts, MRC5 and MG63 cells. Further preferred host cells of the present invention are porcine cells, preferably IBS cells, FS-13, PK-15, bovine cells, preferably MDB cells, BT cells, bovine cells such as FLL-YFT cells. Other eukaryotic cells useful in the context of the present invention are C. elegans cells. Additional eukaryotic cells include yeast cells such as S. cerevisiae, S. pombe, C. albicans and P. pastoris. Furthermore, the present invention relates to insect cells as host cells, which include S. frugiperda cells, more preferably Sf9, Sf21, Express Sf+, High Five H5 cells and D. melanogaster cells, especially S2 Schneider cells. Additional host cells include cells of Dictyostelium discoideum and cells of parasites such as Leishmania spec.
Прокариотические хозяева согласно настоящему изобретению включают бактерии, в частности Е. coli, например, коммерчески доступные штаммы, такие как TOP10, DH5a, НВ101, BL21 (DE3) и т.д.Prokaryotic hosts of the present invention include bacteria, in particular E. coli, for example commercially available strains such as TOP10, DH5a, HB101, BL21 (DE3), etc.
Специалист в данной области техники легко сможет выбрать подходящие пары конструкции вектор/клетка-хозяин для соответствующего размножения и/или переноса элементов нуклеиновых кислот по настоящему изобретению в подходящего хозяина. Конкретные способы введения соответствующих векторных элементов и векторов в соответствующие клетки-хозяева в равной степени известны в данной области техники, и способы описаны в последнем издании публикации Ausubel et al. (ed.) Current Protocols In Molecular Biology, John Wiley & Sons, New York, USA.One skilled in the art will readily be able to select suitable vector/host cell construct pairs for appropriate propagation and/or transfer of the nucleic acid elements of the present invention into a suitable host. Specific methods for introducing appropriate vector elements and vectors into appropriate host cells are equally known in the art, and methods are described in the latest edition of Ausubel et al. (ed.) Current Protocols In Molecular Biology, John Wiley & Sons, New York, USA.
Настоящее изобретение также относится к полипептиду, нуклеиновой кислоте, кодирующей такой полипептид, вектору, содержащему нуклеиновую кислоту, кодирующую полипептид, клетке-хозяину, содержащей такой вектор, а также ВПЧ, как определено выше, для применения в качестве лекарственного средства, в частности, для применения в лечении и/или предотвращении инфекционного заболевания, иммунного заболевания, опухоли или рака.The present invention also relates to a polypeptide, a nucleic acid encoding such a polypeptide, a vector containing a nucleic acid encoding a polypeptide, a host cell containing such a vector, and an HPV as defined above, for use as a drug, in particular for use in the treatment and/or prevention of an infectious disease, immune disease, tumor or cancer.
Следовательно, настоящее изобретение также относится к фармацевтическим композициям, содержащим полипептид, как определено в настоящем документе, нуклеиновую кислоту, кодирующую такой полипептид, вектор, содержащий нуклеиновую кислоту, кодирующую полипептид, клетку-хозяин, содержащую такой вектор, или ВПЧ, как описано выше, вместе с по меньшей мере одним фармацевтически приемлемым носителем, эксципиентом и/или разбавителем.Therefore, the present invention also relates to pharmaceutical compositions containing a polypeptide as defined herein, a nucleic acid encoding such a polypeptide, a vector containing a nucleic acid encoding the polypeptide, a host cell containing such a vector, or an HPV as described above, together with at least one pharmaceutically acceptable carrier, excipient and/or diluent.
Как правило, получение фармацевтических композиций в контексте настоящего изобретения, их дозировки и пути введения известны квалифицированному специалисту, и руководство можно найти в последнем издании Remington's Pharmaceutical Sciences (Mack publishing Co., Eastern, PA, USA).In general, the preparation of pharmaceutical compositions in the context of the present invention, their dosages and routes of administration are known to the skilled person, and guidance can be found in the latest edition of Remington's Pharmaceutical Sciences (Mack publishing Co., Eastern, PA, USA).
Фармацевтические композиции по настоящему изобретению содержат терапевтически эффективное количество активного ингредиента, как указано выше. Терапевтически эффективное количество зависит от активного ингредиента и, в частности, от пути введения. Фармацевтическую композицию по настоящему изобретению предпочтительно применяют путем парентерального введения, в частности путем инфузии, такой как внутривенная, внутриартериальная или внутрикостная инфузия, или путем инъекции, такой как внутривенная, внутриартериальная, внутрибрюшинная, внутримышечная, внутрикожная, подкожная или интратекальная инъекция. В случае противоопухолевой терапии фармацевтическая композиция, такая как фармацевтическая композиция, содержащая ВПЧ по настоящему изобретению, также может быть введена путем внутриопухолевой инъекции.The pharmaceutical compositions of the present invention contain a therapeutically effective amount of the active ingredient as defined above. The therapeutically effective amount depends on the active ingredient and, in particular, on the route of administration. The pharmaceutical composition of the present invention is preferably administered by parenteral administration, in particular by infusion, such as intravenous, intra-arterial or intraosseous infusion, or by injection, such as intravenous, intra-arterial, intraperitoneal, intramuscular, intradermal, subcutaneous or intrathecal injection. In the case of antitumor therapy, a pharmaceutical composition such as a pharmaceutical composition containing HPV of the present invention can also be administered by intratumoral injection.
Растворы для инъекций или инфузий по настоящему изобретению обычно содержат ВПЧ по настоящему изобретению в воде или водном буферном растворе, предпочтительно в изотоническом буфере при физиологическом значении рН. Жидкие фармацевтические композиции по настоящему изобретению могут содержать дополнительные ингредиенты, такие как фармацевтически приемлемые стабилизаторы, суспендирующие добавки, эмульгаторы и тому подобное. Другими ингредиентами фармацевтической композиции по настоящему изобретению являются вспомогательные вещества, в частности, в контексте применения конструкций по настоящему изобретению для целей вакцинации.The injection or infusion solutions of the present invention typically contain the HPV of the present invention in water or an aqueous buffer solution, preferably an isotonic buffer at physiological pH. The liquid pharmaceutical compositions of the present invention may contain additional ingredients such as pharmaceutically acceptable stabilizers, suspending agents, emulsifiers and the like. Other ingredients of the pharmaceutical composition of the present invention are excipients, in particular in the context of the use of the constructs of the present invention for vaccination purposes.
Следующий объект настоящего изобретения относится к способам лечения с применением полезных свойств полипептидов, нуклеиновых кислот, клеток-хозяев, векторов и/или ВПЧ по настоящему изобретению. В предпочтительном варианте осуществления настоящего изобретение обеспечен способ профилактики и/или лечения инфекционного заболевания, включающий стадию введения субъекту, предпочтительно человеку, терапевтически эффективного количества фармацевтической композиции, как определено выше, где фармацевтическая композиция содержит ВПЧ по настоящему изобретению, содержащие антигены (в частности, содержащиеся в L1 и/или L2 полипептида по настоящему изобретению, как определено выше) инфекционного агента, вызывающего инфекционное заболевание. Другой вариант осуществления представляет собой способ предотвращения и/или лечения опухоли или ракового заболевания на стадии введения терапевтически эффективного количества фармацевтической композиции, как определено выше, субъекту, предпочтительно человеку, где фармацевтическая композиция содержит ВПЧ по настоящему изобретению, содержащие один или более опухолевых антигенов (в частности, содержащихся в L1 и/или L2 полипептида по настоящему изобретению, как определено выше).Another aspect of the present invention relates to methods of treatment using the beneficial properties of the polypeptides, nucleic acids, host cells, vectors and/or HPVs of the present invention. In a preferred embodiment, the present invention provides a method of preventing and/or treating an infectious disease, comprising the step of administering to a subject, preferably a human, a therapeutically effective amount of a pharmaceutical composition as defined above, wherein the pharmaceutical composition contains HPVs of the present invention containing antigens (in particular, those containing in L 1 and/or L 2 of the polypeptide of the present invention, as defined above) of an infectious agent that causes an infectious disease. Another embodiment is a method of preventing and/or treating a tumor or cancer by administering a therapeutically effective amount of a pharmaceutical composition as defined above to a subject, preferably a human, wherein the pharmaceutical composition comprises HPVs of the present invention containing one or more tumor antigens (in particularly those contained in L 1 and/or L 2 of the polypeptide of the present invention, as defined above).
Настоящее изобретение дополнительно относится к способу получения полипептида, как описано в данном документе, включающему стадию культивирования рекомбинантной клетки-хозяина в подходящей среде, где клетка-хозяин содержит вектор, который содержит нуклеиновую кислоту, кодирующую полипептид, в условиях, обеспечивающих экспрессию указанного полипептида.The present invention further provides a method for producing a polypeptide as described herein, comprising the step of culturing a recombinant host cell in a suitable medium, wherein the host cell contains a vector that contains a nucleic acid encoding the polypeptide under conditions allowing expression of said polypeptide.
Предпочтительно, способ получения полипептида по настоящему изобретению дополнительно включает стадию выделения экспрессированного полипептида из клеток-хозяев и/или среды. Более предпочтительно, способ также включает стадию очистки выделенного полипептида с помощью средств очистки, известных в данной области техники, таких как центрифугирование, гель-проникающая хроматография, аффинная хроматография и т.д.Preferably, the method of producing a polypeptide of the present invention further includes the step of isolating the expressed polypeptide from host cells and/or media. More preferably, the method also includes the step of purifying the isolated polypeptide using purification means known in the art, such as centrifugation, gel permeation chromatography, affinity chromatography, etc.
Настоящее изобретение также относится к способу получения ВПЧ, как определено в данном документе, включающему стадию инкубации раствора полипептида в условиях, обеспечивающих сборку полипептида в ВПЧ, как описано ранее. Правильное образование ВПЧ можно проверить, исследуя раствор образца с помощью электронного микроскопа.The present invention also provides a method for producing VLPs, as defined herein, comprising the step of incubating a solution of the polypeptide under conditions allowing the polypeptide to assemble into the VLPs, as previously described. Proper formation of HPV can be verified by examining the sample solution using an electron microscope.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS
Фиг. 1: (А) Додекаэдры, образованные белками основания определенных серотипов аденовируса, представляют собой универсальный каркас.(В) Они содержат 60 копий белка основания аденовируса, которые можно разделить на домен «корона» (оранжевый) и домен мультимеризации (синий). В домене мультимеризации концы, образованные в результате расщепления, могут быть повторно соединены короткими олигопептидными линкерами, с образованием непрерывных полипептидных цепей. N-конец и С-конец белка основания содержатся в домене мультимеризации.Fig. 1: (A) Dodecahedrons formed by the base proteins of specific adenovirus serotypes constitute a universal scaffold. (B) They contain 60 copies of the adenovirus base protein, which can be divided into a crown domain (orange) and a multimerization domain (blue). In the multimerization domain, the ends formed by cleavage can be reconnected by short oligopeptide linkers to form continuous polypeptide chains. The N-terminus and C-terminus of the base protein are contained in the multimerization domain.
Фиг. 2: схема домена с укладкой типа рулет предпочтительного варианта осуществления полипептида по настоящему изобретению на основе протомера основания пентона hAd3.Fig. 2: Diagram of a roll-fold domain of a preferred embodiment of a polypeptide of the present invention based on the penton base protomer hAd3.
Фиг. 3: белок основания аденовируса схематически показан крайним слева. Домен «корона» (см. фиг. 1) окрашен в желтый цвет, домен мультимеризации окрашен в синий цвет. N- и С-концы белка основания содержатся в домене мультимеризации, который опосредует образование пентона и додекаэдра. Удаление домена «корона» приводит к автономному домену мультимеризации, который вместо прежнего домена «корона» теперь содержит олигопептиды, полипептиды, белки или белковые комплексы, как показано схематически в направлении от середины направо. Домены мультимеризации теперь дают начало вирусоподобным частицам, представляющим указанные частицы на своей поверхности. Естественно, домены «корона» и сконструированные домены «корона», происходящие от ряда серотипов аденовирусов, также могут быть приспособлены к каркасу доменов мультимеризации, включая сконструированные домены «корона», содержащие гетерологичные пептидные и полипептидные последовательности.Fig. 3: The adenovirus base protein is shown schematically on the far left. The crown domain (see Fig. 1) is colored yellow, the multimerization domain is colored blue. The N- and C-termini of the base protein are contained in a multimerization domain that mediates penton and dodecahedron formation. Removal of the crown domain results in an autonomous multimerization domain which, instead of the former crown domain, now contains oligopeptides, polypeptides, proteins or protein complexes, as shown schematically in a middle-to-right direction. Multimerization domains now give rise to virus-like particles presenting said particles on their surface. Naturally, corona domains and engineered corona domains derived from a number of adenovirus serotypes can also be adapted to a multimerization domain framework, including engineered corona domains containing heterologous peptide and polypeptide sequences.
Фиг. 4: додекаэдрическая платформа (ADDomer), полученная из аденовируса, показана схематично. Исходная частица показана слева. Белок основания образован доменом мультимеризации (синий) и доменом «корона» (желтый). 60 белков основания образуют вирусоподобные частицы (ВПЧ). Справа показаны ADDomers, отображающие (вместо домена «корона») множественные копии олигопептидов, полипептидов и белковых доменов, белков или белковых комплексов. Цветовая кодировка как на фиг. 3.Fig. 4: The adenovirus-derived dodecahedral platform (ADDomer) is shown schematically. The original particle is shown on the left. The base protein is formed by a multimerization domain (blue) and a crown domain (yellow). 60 base proteins form virus-like particles (VLPs). Shown on the right are ADDomers displaying (instead of a crown domain) multiple copies of oligopeptides, polypeptides and protein domains, proteins or protein complexes. Color coding as in fig. 3.
Фиг. 5: Схематическое изображение вектора рАСЕВас VAJB-CHIK.Fig. 5: Schematic representation of the vector pACEBac VAJB-CHIK.
Настоящее изобретение дополнительно проиллюстрировано следующим неограничивающим примером:The present invention is further illustrated by the following non-limiting example:
ПримерExample
Нуклеиновая кислота с последовательностью, обозначенной DNAsegVAJB-CHIK (SEQ ID NO: 26, фланкирована сайтом BamHI на 5' конце и сайтом HindIII на 3' конце, ggatcc в начале последовательности и aagctt в конце последовательности) была получена коммерческим поставщиком:The nucleic acid with the sequence designated DNAsegVAJB-CHIK (SEQ ID NO: 26, flanked by a BamHI site at the 5' end and a HindIII site at the 3' end, ggatcc at the beginning of the sequence and aagctt at the end of the sequence) was obtained from a commercial supplier:
Конструкцию клонировали в плазмиду для переноса рАСЕВас (Geneva Biotech, Женева, Швейцария) с применением сайтов расщепления BamHI и HindIII, в результате чего была получена конструкция рАСЕВас VAJB-CHIK (SEQ ID NO: 27):The construct was cloned into the pACEBac transfer plasmid (Geneva Biotech, Geneva, Switzerland) using BamHI and HindIII cleavage sites, resulting in the pACEBac construct VAJB-CHIK (SEQ ID NO: 27):
Для проверки правильности вставки применяли секвенирование ДНК. Открытая рамка считывания кодирует белок VAJB-CHIK (SEQ ID NO: 28), который содержит главный нейтрализующий эпитоп вируса чикунгунья STKDNFNVYKATRPYLAH (SEQ ID NO: 29) в петле L1.DNA sequencing was used to verify the correctness of the insertion. The open reading frame encodes the protein VAJB-CHIK (SEQ ID NO: 28), which contains the major neutralizing epitope of chikungunya virus STKDNFNVYKATRPYLAH (SEQ ID NO: 29) in the L1 loop.
VAJB-CHIK (SEQ ID NO: 28):VAJB-CHIK (SEQ ID NO: 28):
Затем pACEBac_VAJB-CHIK применяли для трансформации клеток DHlOEMBacY (Geneva Biotech, Женева, Швейцария), несущих бакул о вирусный геном EMBacY в качестве искусственной хромосомы (описан в Fitzgerald DJ et al. Nat Methods. 2006 Dec, 3(12): 1021-32 PMID: 17117155). Композитный бакуловирус с кассетой экспрессии для VAJB1, интегрированной посредством транспозиции Тп7 в клетки DHlOEMBacY, затем идентифицировали с помощью синего/белого скрининга, и рекомбинантный бакуловирус получали, как описано (там же). Культуры клеток насекомых Spodoptera frugiperda линии 21 (Sf21) инфицировали бакуловирус ом, полученным таким образом, как описано в Fitzgerald et al. (2006) Nat Methods, см. выше.pACEBac_VAJB-CHIK was then used to transform DHlOEMBacY cells (Geneva Biotech, Geneva, Switzerland) carrying the EMBacY viral genome as an artificial chromosome (described in Fitzgerald DJ et al. Nat Methods. 2006 Dec, 3(12): 1021-32 PMID: 17117155). A composite baculovirus with an expression cassette for VAJB1 integrated via Tn7 transposition into DHlOEMBacY cells was then identified by blue/white screening, and the recombinant baculovirus was produced as described (ibid.). Insect cell cultures of Spodoptera frugiperda line 21 (Sf21) were infected with baculovirus OM prepared as described in Fitzgerald et al. (2006) Nat Methods, see above.
Крупномасштабную (от 100 до 500 мл) экспрессию проводили в клетках Trichoplusia ni Hi5 во встряхиваемых колбах и экспрессию рекомбинантного белка с последующим измерением флуоресценции желтого флуоресцентного белка (YFP), как описано (Fitzgerald DJ et Nat Methods. 2006 Dec;3(12): 1021-32 PMID: 17117155). Когда флуоресценция YFP достигла плато (обычно через 72 часа после остановки пролиферации в культуре клеток, см. Fitzgerald et al, Nat Methods 2006), культуры клеток насекомых собирали и клетки осаждали центрифугированием (4000 g, 10 мин). Клетки замораживали в жидком азоте и хранили при минус 80 градусах Цельсия.Large scale (100 to 500 ml) expression was carried out in Trichoplusia ni Hi5 cells in shake flasks and expression of the recombinant protein followed by measurement of yellow fluorescent protein (YFP) fluorescence as described (Fitzgerald DJ et Nat Methods. 2006 Dec;3(12): 1021-32 PMID: 17117155). When YFP fluorescence reached a plateau (usually 72 hours after cell proliferation had ceased, see Fitzgerald et al, Nat Methods 2006), insect cell cultures were harvested and cells pelleted by centrifugation (4000 g, 10 min). The cells were frozen in liquid nitrogen and stored at minus 80 degrees Celsius.
Для получения белка клетки лизировали замораживанием-оттаиванием в фосфатно-солевом буфере (ФСБ), содержащем цельную смесь ингибиторов протеазы (Roche Ltd). Белок очищали путем нанесения градиента сахарозы от 15 до 40% мас./об. сахарозы и ультрацентрифугирования в течение ночи при 100000 g. Собирали градиент и определяли содержание белка с помощью денатурирующего электрофореза в полиакриламидном геле (SDS-PAGE) с последующим окрашиванием кумасси бриллиантовым голубым. Фракции, содержащие VAJB1, объединяли и подвергали диализу против ФСБ (или 10 мМ HEPES, рН 7,4, 50 мМ NaCl). Вторую стадию очистки проводили на колонке HiQ объемом 5 мл (BioRAD) с применением линейного градиента от 50 до 500 мМ NaCl. Образование пентамера и додекамера подтверждали с помощью электронной микроскопии с отрицательным окрашиванием (уранилацетат).To obtain protein, cells were lysed by freeze-thawing in phosphate-buffered saline (PBS) containing whole cocktail of protease inhibitors (Roche Ltd). The protein was purified by applying a sucrose gradient from 15 to 40% w/v. sucrose and ultracentrifugation overnight at 100,000 g. The gradient was collected and protein content was determined by denaturing polyacrylamide gel electrophoresis (SDS-PAGE) followed by Coomassie brilliant blue staining. Fractions containing VAJB1 were pooled and dialyzed against PBS (or 10 mM HEPES, pH 7.4, 50 mM NaCl). The second purification step was performed on a 5 mL HiQ column (BioRAD) using a linear gradient from 50 to 500 mM NaCl. The formation of pentamer and dodecamer was confirmed by electron microscopy with negative staining (uranyl acetate).
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ LIST OF SEQUENCES
<110> ИМОФОРОН ЛИМИТЕД <110> IMOFORON LIMITED
<120> МУЛЬТИМЕРИЗАЦИЯ ПОЛИПЕПТИДОВ, ПОЛУЧЕННЫХ ИЗ ДОМЕНА ТИПА <120> MULTIMERIZATION OF POLYPEPTIDES DERIVED FROM DOMAIN TYPE
«JELLY ROLL» ПЕНТОНА АДЕНОВИРУСА “JELLY ROLL” PENTON ADENOVIRUS
<130> I 2444 WO <130> I 2444 WO
<150> EP18186731.8 <150> EP18186731.8
<151> 2018-07-31 <151> 2018-07-31
<160> 29 <160> 29
<170> PatentIn версии 3.5 <170> PatentIn version 3.5
<210> 1 <210> 1
<211> 544 <211> 544
<212> ПРТ <212> PRT
<213> Аденовирус человека C серотипа 3 <213> Human adenovirus C serotype 3
<400> 1 <400> 1
Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15 1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile
20 25 30 20 25 30
Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45 35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr
50 55 60 50 55 60
Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95 85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110 100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125 115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys
130 135 140 130 135 140
Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val Asn Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Thr Val Asn
145 150 155 160 145 150 155 160
Asp Thr Tyr Asp His Lys Glu Asp Ile Leu Lys Tyr Glu Trp Phe Glu Asp Thr Tyr Asp His Lys Glu Asp Ile Leu Lys Tyr Glu Trp Phe Glu
165 170 175 165 170 175
Phe Ile Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu Phe Ile Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu
180 185 190 180 185 190
Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Ile Gly Arg Gln Asn Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Ile Gly Arg Gln Asn
195 200 205 195 200 205
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
210 215 220 210 215 220
Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr
225 230 235 240 225 230 235 240
Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
245 250 255 245 250 255
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
260 265 270 260 265 270
Arg His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu Arg His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu
275 280 285 275 280 285
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser
290 295 300 290 295 300
Lys Lys Asp Thr Thr Thr Glu Thr Thr Thr Leu Ala Val Ala Glu Glu Lys Lys Asp Thr Thr Thr Glu Thr Thr Thr Leu Ala Val Ala Glu Glu
305 310 315 320 305 310 315 320
Thr Ser Glu Asp Asp Asp Ile Thr Arg Gly Asp Thr Tyr Ile Thr Glu Thr Ser Glu Asp Asp Asp Ile Thr Arg Gly Asp Thr Tyr Ile Thr Glu
325 330 335 325 330 335
Lys Gln Lys Arg Glu Ala Ala Ala Ala Glu Val Lys Lys Glu Leu Lys Lys Gln Lys Arg Glu Ala Ala Ala Ala Glu Val Lys Lys Glu Leu Lys
340 345 350 340 345 350
Ile Gln Pro Leu Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu Ile Gln Pro Leu Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu
355 360 365 355 360 365
Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn
370 375 380 370 375 380
Tyr Gly Asn Pro Glu Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr Tyr Gly Asn Pro Glu Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr
385 390 395 400 385 390 395 400
Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp
405 410 415 405 410 415
Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Asn Asn Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Asn Asn
420 425 430 420 425 430
Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe
435 440 445 435 440 445
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ala Thr Ser Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ala Thr Ser
450 455 460 450 455 460
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg
465 470 475 480 465 470 475 480
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
485 490 495 485 490 495
Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln
500 505 510 500 505 510
Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
515 520 525 515 520 525
Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
530 535 540 530 535 540
<210> 2 <210> 2
<211> 571 <211> 571
<212> ПРТ <212> PRT
<213> Аденовирус человека C серотипа 2 <213> Human adenovirus C serotype 2
<400> 2 <400> 2
Met Gln Arg Ala Ala Met Tyr Glu Glu Gly Pro Pro Pro Ser Tyr Glu Met Gln Arg Ala Ala Met Tyr Glu Glu Gly Pro Pro Pro Ser Tyr Glu
1 5 10 15 1 5 10 15
Ser Val Val Ser Ala Ala Pro Val Ala Ala Ala Leu Gly Ser Pro Phe Ser Val Val Ser Ala Ala Pro Val Ala Ala Ala Leu Gly Ser Pro Phe
20 25 30 20 25 30
Asp Ala Pro Leu Asp Pro Pro Phe Val Pro Pro Arg Tyr Leu Arg Pro Asp Ala Pro Leu Asp Pro Pro Phe Val Pro Pro Arg Tyr Leu Arg Pro
35 40 45 35 40 45
Thr Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe Thr Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe
50 55 60 50 55 60
Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Thr Asp Val Ala Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Thr Asp Val Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile
85 90 95 85 90 95
Gln Asn Asn Asp Tyr Ser Pro Gly Glu Ala Ser Thr Gln Thr Ile Asn Gln Asn Asn Asp Tyr Ser Pro Gly Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110 100 105 110
Leu Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Leu Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His
115 120 125 115 120 125
Thr Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Thr Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys
130 135 140 130 135 140
Ala Arg Val Met Val Ser Arg Ser Leu Thr Lys Asp Lys Gln Val Glu Ala Arg Val Met Val Ser Arg Ser Leu Thr Lys Asp Lys Gln Val Glu
145 150 155 160 145 150 155 160
Leu Lys Tyr Glu Trp Val Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Leu Lys Tyr Glu Trp Val Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser
165 170 175 165 170 175
Glu Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Glu Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr
180 185 190 180 185 190
Leu Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Leu Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val
195 200 205 195 200 205
Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Phe Asp Pro Val Thr Gly Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Phe Asp Pro Val Thr Gly
210 215 220 210 215 220
Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile
225 230 235 240 225 230 235 240
Ile Leu Leu Pro Gly Cys Gly Val Asp Phe Thr His Ser Arg Leu Ser Ile Leu Leu Pro Gly Cys Gly Val Asp Phe Thr His Ser Arg Leu Ser
245 250 255 245 250 255
Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg
260 265 270 260 265 270
Ile Thr Tyr Asp Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Ile Thr Tyr Asp Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp
275 280 285 275 280 285
Val Asp Ala Tyr Gln Ala Ser Leu Lys Asp Asp Thr Glu Gln Gly Gly Val Asp Ala Tyr Gln Ala Ser Leu Lys Asp Asp Thr Glu Gln Gly Gly
290 295 300 290 295 300
Asp Gly Ala Gly Gly Gly Asn Asn Ser Gly Ser Gly Ala Glu Glu Asn Asp Gly Ala Gly Gly Gly Asn Asn Ser Gly Ser Gly Ala Glu Glu Asn
305 310 315 320 305 310 315 320
Ser Asn Ala Ala Ala Ala Ala Met Gln Pro Val Glu Asp Met Asn Asp Ser Asn Ala Ala Ala Ala Ala Met Gln Pro Val Glu Asp Met Asn Asp
325 330 335 325 330 335
His Ala Ile Arg Gly Asp Thr Phe Ala Thr Arg Ala Glu Glu Lys Arg His Ala Ile Arg Gly Asp Thr Phe Ala Thr Arg Ala Glu Glu Lys Arg
340 345 350 340 345 350
Ala Glu Ala Glu Ala Ala Ala Glu Ala Ala Ala Pro Ala Ala Gln Pro Ala Glu Ala Glu Ala Ala Ala Glu Ala Ala Ala Pro Ala Ala Gln Pro
355 360 365 355 360 365
Glu Val Glu Lys Pro Gln Lys Lys Pro Val Ile Lys Pro Leu Thr Glu Glu Val Glu Lys Pro Gln Lys Lys Pro Val Ile Lys Pro Leu Thr Glu
370 375 380 370 375 380
Asp Ser Lys Lys Arg Ser Tyr Asn Leu Ile Ser Asn Asp Ser Thr Phe Asp Ser Lys Lys Arg Ser Tyr Asn Leu Ile Ser Asn Asp Ser Thr Phe
385 390 395 400 385 390 395 400
Thr Gln Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Gln Thr Gln Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Gln
405 410 415 405 410 415
Thr Gly Ile Arg Ser Trp Thr Leu Leu Cys Thr Pro Asp Val Thr Cys Thr Gly Ile Arg Ser Trp Thr Leu Leu Cys Thr Pro Asp Val Thr Cys
420 425 430 420 425 430
Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro
435 440 445 435 440 445
Val Thr Phe Arg Ser Thr Ser Gln Ile Ser Asn Phe Pro Val Val Gly Val Thr Phe Arg Ser Thr Ser Gln Ile Ser Asn Phe Pro Val Val Gly
450 455 460 450 455 460
Ala Glu Leu Leu Pro Val His Ser Lys Ser Phe Tyr Asn Asp Gln Ala Ala Glu Leu Leu Pro Val His Ser Lys Ser Phe Tyr Asn Asp Gln Ala
465 470 475 480 465 470 475 480
Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr Ser Leu Thr His Val Phe Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr Ser Leu Thr His Val Phe
485 490 495 485 490 495
Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr
500 505 510 500 505 510
Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr
515 520 525 515 520 525
Leu Pro Leu Arg Asn Ser Ile Gly Gly Val Gln Arg Val Thr Ile Thr Leu Pro Leu Arg Asn Ser Ile Gly Gly Val Gln Arg Val Thr Ile Thr
530 535 540 530 535 540
Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile
545 550 555 560 545 550 555 560
Val Ser Pro Arg Val Leu Ser Ser Arg Thr Phe Val Ser Pro Arg Val Leu Ser Ser Arg Thr Phe
565 570 565 570
<210> 3 <210> 3
<211> 535 <211> 535
<212> ПРТ <212> PRT
<213> Аденовирус человека E серотипа 4 <213> Human adenovirus E serotype 4
<400> 3 <400> 3
Met Met Arg Arg Ala Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser Met Met Arg Arg Ala Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15 1 5 10 15
Val Met Gln Gln Ala Met Ala Ala Ala Ala Ala Ile Gln Pro Pro Leu Val Met Gln Gln Ala Met Ala Ala Ala Ala Ala Ile Gln Pro Pro Leu
20 25 30 20 25 30
Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg
35 40 45 35 40 45
Asn Ser Ile Arg Tyr Ser Glu Leu Thr Pro Leu Tyr Asp Thr Thr Arg Asn Ser Ile Arg Tyr Ser Glu Leu Thr Pro Leu Tyr Asp Thr Thr Arg
50 55 60 50 55 60
Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr
65 70 75 80 65 70 75 80
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp
85 90 95 85 90 95
Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg
100 105 110 100 105 110
Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro
115 120 125 115 120 125
Asn Val Asn Gln Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Asn Val Asn Gln Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met
130 135 140 130 135 140
Val Ser Arg Lys Thr Pro Asn Gly Val Thr Val Gly Asp Asn Tyr Asp Val Ser Arg Lys Thr Pro Asn Gly Val Thr Val Gly Asp Asn Tyr Asp
145 150 155 160 145 150 155 160
Gly Ser Gln Asp Glu Leu Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro Gly Ser Gln Asp Glu Leu Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro
165 170 175 165 170 175
Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala
180 185 190 180 185 190
Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu
195 200 205 195 200 205
Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp
210 215 220 210 215 220
Asp Pro Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Asp Pro Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala
225 230 235 240 225 230 235 240
Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr
245 250 255 245 250 255
Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe
260 265 270 260 265 270
Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Asp Gly Gly Asn Ile Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Asp Gly Gly Asn Ile
275 280 285 275 280 285
Pro Ala Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Glu Ser Pro Ala Leu Leu Asp Val Glu Ala Tyr Glu Lys Ser Lys Glu Glu Ser
290 295 300 290 295 300
Val Ala Ala Ala Thr Thr Ala Val Ala Thr Ala Ser Thr Glu Val Arg Val Ala Ala Ala Thr Thr Ala Val Ala Thr Ala Ser Thr Glu Val Arg
305 310 315 320 305 310 315 320
Asp Asp Asn Phe Ala Ser Ala Ala Ala Val Ala Ala Val Lys Ala Asp Asp Asp Asn Phe Ala Ser Ala Ala Ala Val Ala Ala Val Lys Ala Asp
325 330 335 325 330 335
Glu Thr Lys Ser Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Glu Thr Lys Ser Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys
340 345 350 340 345 350
Glu Arg Ser Tyr Asn Val Leu Ser Asp Lys Lys Asn Thr Ala Tyr Arg Glu Arg Ser Tyr Asn Val Leu Ser Asp Lys Lys Asn Thr Ala Tyr Arg
355 360 365 355 360 365
Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Arg Asp Lys Gly Val Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Arg Asp Lys Gly Val Arg
370 375 380 370 375 380
Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln
385 390 395 400 385 390 395 400
Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg
405 410 415 405 410 415
Ser Thr His Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Ser Thr His Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu
420 425 430 420 425 430
Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln
435 440 445 435 440 445
Gln Leu Arg Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Gln Leu Arg Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro
450 455 460 450 455 460
Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
465 470 475 480 465 470 475 480
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg
485 490 495 485 490 495
Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg
500 505 510 500 505 510
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg
515 520 525 515 520 525
Val Leu Ser Ser Arg Thr Phe Val Leu Ser Ser Arg Thr Phe
530 535 530 535
<210> 4 <210> 4
<211> 571 <211> 571
<212> ПРТ <212> PRT
<213> Аденовирус человека C серотипа 5 <213> Human adenovirus C serotype 5
<400> 4 <400> 4
Met Arg Arg Ala Ala Met Tyr Glu Glu Gly Pro Pro Pro Ser Tyr Glu Met Arg Arg Ala Ala Met Tyr Glu Glu Gly Pro Pro Pro Ser Tyr Glu
1 5 10 15 1 5 10 15
Ser Val Val Ser Ala Ala Pro Val Ala Ala Ala Leu Gly Ser Pro Phe Ser Val Val Ser Ala Ala Pro Val Ala Ala Ala Leu Gly Ser Pro Phe
20 25 30 20 25 30
Asp Ala Pro Leu Asp Pro Pro Phe Val Pro Pro Arg Tyr Leu Arg Pro Asp Ala Pro Leu Asp Pro Pro Phe Val Pro Pro Arg Tyr Leu Arg Pro
35 40 45 35 40 45
Thr Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe Thr Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe
50 55 60 50 55 60
Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Thr Asp Val Ala Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Thr Asp Val Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile
85 90 95 85 90 95
Gln Asn Asn Asp Tyr Ser Pro Gly Glu Ala Ser Thr Gln Thr Ile Asn Gln Asn Asn Asp Tyr Ser Pro Gly Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110 100 105 110
Leu Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Leu Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His
115 120 125 115 120 125
Thr Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Thr Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys
130 135 140 130 135 140
Ala Arg Val Met Val Ser Arg Leu Pro Thr Lys Asp Asn Gln Val Glu Ala Arg Val Met Val Ser Arg Leu Pro Thr Lys Asp Asn Gln Val Glu
145 150 155 160 145 150 155 160
Leu Lys Tyr Glu Trp Val Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Leu Lys Tyr Glu Trp Val Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser
165 170 175 165 170 175
Glu Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Glu Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr
180 185 190 180 185 190
Leu Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Leu Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val
195 200 205 195 200 205
Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Phe Asp Pro Val Thr Gly Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Phe Asp Pro Val Thr Gly
210 215 220 210 215 220
Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile
225 230 235 240 225 230 235 240
Ile Leu Leu Pro Gly Cys Gly Val Asp Phe Thr His Ser Arg Leu Ser Ile Leu Leu Pro Gly Cys Gly Val Asp Phe Thr His Ser Arg Leu Ser
245 250 255 245 250 255
Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg
260 265 270 260 265 270
Ile Thr Tyr Asp Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Ile Thr Tyr Asp Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp
275 280 285 275 280 285
Val Asp Ala Tyr Gln Ala Ser Leu Lys Asp Asp Thr Glu Gln Gly Gly Val Asp Ala Tyr Gln Ala Ser Leu Lys Asp Asp Thr Glu Gln Gly Gly
290 295 300 290 295 300
Gly Gly Ala Gly Gly Ser Asn Ser Ser Gly Ser Gly Ala Glu Glu Asn Gly Gly Ala Gly Gly Ser Asn Ser Ser Gly Ser Gly Ala Glu Glu Asn
305 310 315 320 305 310 315 320
Ser Asn Ala Ala Ala Ala Ala Met Gln Pro Val Glu Asp Met Asn Asp Ser Asn Ala Ala Ala Ala Ala Met Gln Pro Val Glu Asp Met Asn Asp
325 330 335 325 330 335
His Ala Ile Arg Gly Asp Thr Phe Ala Thr Arg Ala Glu Glu Lys Arg His Ala Ile Arg Gly Asp Thr Phe Ala Thr Arg Ala Glu Glu Lys Arg
340 345 350 340 345 350
Ala Glu Ala Glu Ala Ala Ala Glu Ala Ala Ala Pro Ala Ala Gln Pro Ala Glu Ala Glu Ala Ala Ala Glu Ala Ala Ala Pro Ala Ala Gln Pro
355 360 365 355 360 365
Glu Val Glu Lys Pro Gln Lys Lys Pro Val Ile Lys Pro Leu Thr Glu Glu Val Glu Lys Pro Gln Lys Lys Pro Val Ile Lys Pro Leu Thr Glu
370 375 380 370 375 380
Asp Ser Lys Lys Arg Ser Tyr Asn Leu Ile Ser Asn Asp Ser Thr Phe Asp Ser Lys Lys Arg Ser Tyr Asn Leu Ile Ser Asn Asp Ser Thr Phe
385 390 395 400 385 390 395 400
Thr Gln Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Gln Thr Gln Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro Gln
405 410 415 405 410 415
Thr Gly Ile Arg Ser Trp Thr Leu Leu Cys Thr Pro Asp Val Thr Cys Thr Gly Ile Arg Ser Trp Thr Leu Leu Cys Thr Pro Asp Val Thr Cys
420 425 430 420 425 430
Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro
435 440 445 435 440 445
Val Thr Phe Arg Ser Thr Arg Gln Ile Ser Asn Phe Pro Val Val Gly Val Thr Phe Arg Ser Thr Arg Gln Ile Ser Asn Phe Pro Val Val Gly
450 455 460 450 455 460
Ala Glu Leu Leu Pro Val His Ser Lys Ser Phe Tyr Asn Asp Gln Ala Ala Glu Leu Leu Pro Val His Ser Lys Ser Phe Tyr Asn Asp Gln Ala
465 470 475 480 465 470 475 480
Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr Ser Leu Thr His Val Phe Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr Ser Leu Thr His Val Phe
485 490 495 485 490 495
Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala Arg Pro Pro Ala Pro Thr
500 505 510 500 505 510
Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr
515 520 525 515 520 525
Leu Pro Leu Arg Asn Ser Ile Gly Gly Val Gln Arg Val Thr Ile Thr Leu Pro Leu Arg Asn Ser Ile Gly Gly Val Gln Arg Val Thr Ile Thr
530 535 540 530 535 540
Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile
545 550 555 560 545 550 555 560
Val Ser Pro Arg Val Leu Ser Ser Arg Thr Phe Val Ser Pro Arg Val Leu Ser Ser Arg Thr Phe
565 570 565 570
<210> 5 <210> 5
<211> 544 <211> 544
<212> ПРТ <212> PRT
<213> Аденовирус человека B серотипа 7 <213> Human adenovirus B serotype 7
<400> 5 <400> 5
Met Arg Arg Arg Ala Val Leu Gly Gly Ala Met Val Tyr Pro Glu Gly Met Arg Arg Arg Ala Val Leu Gly Gly Ala Met Val Tyr Pro Glu Gly
1 5 10 15 1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile
20 25 30 20 25 30
Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45 35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr
50 55 60 50 55 60
Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95 85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110 100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125 115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe Lys
130 135 140 130 135 140
Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Ile Val Asn Ala Arg Val Met Val Ser Arg Lys Ala Pro Glu Gly Val Ile Val Asn
145 150 155 160 145 150 155 160
Asp Thr Tyr Asp His Lys Glu Asp Ile Leu Lys Tyr Glu Trp Phe Glu Asp Thr Tyr Asp His Lys Glu Asp Ile Leu Lys Tyr Glu Trp Phe Glu
165 170 175 165 170 175
Phe Thr Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu Phe Thr Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu
180 185 190 180 185 190
Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Ile Gly Arg Gln Asn Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Glu Ile Gly Arg Gln Asn
195 200 205 195 200 205
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
210 215 220 210 215 220
Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr Arg Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr
225 230 235 240 225 230 235 240
Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
245 250 255 245 250 255
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
260 265 270 260 265 270
Arg His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu Arg His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu
275 280 285 275 280 285
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Ala Tyr Glu Glu Ser
290 295 300 290 295 300
Lys Lys Asp Thr Thr Thr Glu Thr Thr Thr Leu Ala Val Ala Glu Glu Lys Lys Asp Thr Thr Thr Glu Thr Thr Thr Leu Ala Val Ala Glu Glu
305 310 315 320 305 310 315 320
Thr Ser Glu Asp Asp Asn Ile Thr Arg Gly Asp Thr Tyr Ile Thr Glu Thr Ser Glu Asp Asp Asn Ile Thr Arg Gly Asp Thr Tyr Ile Thr Glu
325 330 335 325 330 335
Lys Gln Lys Arg Glu Ala Ala Ala Ala Glu Val Lys Lys Glu Leu Lys Lys Gln Lys Arg Glu Ala Ala Ala Ala Glu Val Lys Lys Glu Leu Lys
340 345 350 340 345 350
Ile Gln Pro Leu Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu Ile Gln Pro Leu Glu Lys Asp Ser Lys Ser Arg Ser Tyr Asn Val Leu
355 360 365 355 360 365
Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn
370 375 380 370 375 380
Tyr Gly Asn Pro Glu Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr Tyr Gly Asn Pro Glu Lys Gly Ile Arg Ser Trp Thr Leu Leu Thr Thr
385 390 395 400 385 390 395 400
Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp
405 410 415 405 410 415
Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Asn Asn Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Asn Asn
420 425 430 420 425 430
Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe
435 440 445 435 440 445
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ala Thr Ser Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ala Thr Ser
450 455 460 450 455 460
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg
465 470 475 480 465 470 475 480
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
485 490 495 485 490 495
Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln
500 505 510 500 505 510
Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
515 520 525 515 520 525
Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
530 535 540 530 535 540
<210> 6 <210> 6
<211> 557 <211> 557
<212> ПРТ <212> PRT
<213> Аденовирус человека B серотипа 11 <213> Human adenovirus B serotype 11
<400> 6 <400> 6
Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro
1 5 10 15 1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Thr Ala Val Met Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Thr Ala Val Met
20 25 30 20 25 30
Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45 35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln Tyr Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln Tyr
50 55 60 50 55 60
Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95 85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110 100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125 115 120 125
Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Asn Phe Lys Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Asn Phe Lys
130 135 140 130 135 140
Ala Arg Val Met Val Ser Arg Lys Pro Pro Glu Gly Ala Ala Val Gly Ala Arg Val Met Val Ser Arg Lys Pro Pro Glu Gly Ala Ala Val Gly
145 150 155 160 145 150 155 160
Asp Thr Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe Glu Asp Thr Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe Glu
165 170 175 165 170 175
Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Leu
180 185 190 180 185 190
Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln Asn Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln Asn
195 200 205 195 200 205
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
210 215 220 210 215 220
Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Tyr
225 230 235 240 225 230 235 240
Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
245 250 255 245 250 255
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
260 265 270 260 265 270
Lys Gln Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu Glu Lys Gln Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu Glu
275 280 285 275 280 285
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn Ser Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn Ser
290 295 300 290 295 300
Lys Lys Glu Gln Lys Ala Lys Ile Glu Ala Ala Ala Glu Ala Lys Ala Lys Lys Glu Gln Lys Ala Lys Ile Glu Ala Ala Ala Glu Ala Lys Ala
305 310 315 320 305 310 315 320
Asn Ile Val Ala Ser Asp Ser Thr Arg Val Ala Asn Ala Gly Glu Val Asn Ile Val Ala Ser Asp Ser Thr Arg Val Ala Asn Ala Gly Glu Val
325 330 335 325 330 335
Arg Gly Asp Asn Phe Ala Pro Thr Pro Val Pro Thr Ala Glu Ser Leu Arg Gly Asp Asn Phe Ala Pro Thr Pro Val Pro Thr Ala Glu Ser Leu
340 345 350 340 345 350
Leu Ala Asp Val Ser Gly Gly Thr Asp Val Lys Leu Thr Ile Gln Pro Leu Ala Asp Val Ser Gly Gly Thr Asp Val Lys Leu Thr Ile Gln Pro
355 360 365 355 360 365
Val Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val Leu Glu Asp Lys Val Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val Leu Glu Asp Lys
370 375 380 370 375 380
Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Tyr Gly Asp Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Asn Tyr Gly Asp
385 390 395 400 385 390 395 400
Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp Val
405 410 415 405 410 415
Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln
420 425 430 420 425 430
Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro Val Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro Val
435 440 445 435 440 445
Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Asn Glu Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Asn Glu
450 455 460 450 455 460
Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Ser Leu Thr His Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Ser Leu Thr His
465 470 475 480 465 470 475 480
Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro Pro Ala Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro Pro Ala
485 490 495 485 490 495
Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His
500 505 510 500 505 510
Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr
515 520 525 515 520 525
Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu
530 535 540 530 535 540
Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
545 550 555 545 550 555
<210> 7 <210> 7
<211> 497 <211> 497
<212> ПРТ <212> PRT
<213> Аденовирус человека A серотипа 12 <213> Human adenovirus A serotype 12
<400> 7 <400> 7
Met Arg Arg Ala Val Glu Leu Gln Thr Val Ala Phe Pro Glu Thr Pro Met Arg Arg Ala Val Glu Leu Gln Thr Val Ala Phe Pro Glu Thr Pro
1 5 10 15 1 5 10 15
Pro Pro Ser Tyr Glu Thr Val Met Ala Ala Ala Pro Pro Tyr Val Pro Pro Pro Ser Tyr Glu Thr Val Met Ala Ala Ala Pro Pro Tyr Val Pro
20 25 30 20 25 30
Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser
35 40 45 35 40 45
Glu Leu Ser Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Glu Leu Ser Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn
50 55 60 50 55 60
Lys Ser Ser Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Lys Ser Ser Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn
65 70 75 80 65 70 75 80
Phe Leu Thr Thr Val Val Gln Asn Asn Asp Tyr Ser Pro Ile Glu Ala Phe Leu Thr Thr Val Val Gln Asn Asn Asp Tyr Ser Pro Ile Glu Ala
85 90 95 85 90 95
Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp
100 105 110 100 105 110
Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn Val Asn Asp Phe Met Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn Val Asn Asp Phe Met
115 120 125 115 120 125
Phe Thr Thr Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys Thr Asn Phe Thr Thr Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys Thr Asn
130 135 140 130 135 140
Asn Glu Gly Gln Thr Ile Leu Glu Tyr Glu Trp Ala Glu Phe Val Leu Asn Glu Gly Gln Thr Ile Leu Glu Tyr Glu Trp Ala Glu Phe Val Leu
145 150 155 160 145 150 155 160
Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Met Asn Asn Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Met Asn Asn
165 170 175 165 170 175
Ala Ile Ile Glu His Tyr Leu Arg Val Gly Arg Gln His Gly Val Leu Ala Ile Ile Glu His Tyr Leu Arg Val Gly Arg Gln His Gly Val Leu
180 185 190 180 185 190
Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly
195 200 205 195 200 205
Trp Asp Pro Glu Thr Gln Leu Val Thr Pro Gly Val Tyr Thr Asn Glu Trp Asp Pro Glu Thr Gln Leu Val Thr Pro Gly Val Tyr Thr Asn Glu
210 215 220 210 215 220
Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe
225 230 235 240 225 230 235 240
Thr Glu Ser Arg Leu Ser Asn Ile Leu Gly Ile Arg Lys Arg Gln Pro Thr Glu Ser Arg Leu Ser Asn Ile Leu Gly Ile Arg Lys Arg Gln Pro
245 250 255 245 250 255
Phe Gln Glu Gly Phe Val Ile Met Tyr Glu His Leu Glu Gly Gly Asn Phe Gln Glu Gly Phe Val Ile Met Tyr Glu His Leu Glu Gly Gly Asn
260 265 270 260 265 270
Ile Pro Ala Leu Leu Asp Val Lys Lys Tyr Glu Asn Ser Leu Gln Asp Ile Pro Ala Leu Leu Asp Val Lys Lys Tyr Glu Asn Ser Leu Gln Asp
275 280 285 275 280 285
Gln Asn Thr Val Arg Gly Asp Asn Phe Ile Ala Leu Asn Lys Ala Ala Gln Asn Thr Val Arg Gly Asp Asn Phe Ile Ala Leu Asn Lys Ala Ala
290 295 300 290 295 300
Arg Ile Glu Pro Val Glu Thr Asp Pro Lys Gly Arg Ser Tyr Asn Leu Arg Ile Glu Pro Val Glu Thr Asp Pro Lys Gly Arg Ser Tyr Asn Leu
305 310 315 320 305 310 315 320
Leu Pro Asp Lys Lys Asn Thr Lys Tyr Arg Ser Trp Tyr Leu Ala Tyr Leu Pro Asp Lys Lys Asn Thr Lys Tyr Arg Ser Trp Tyr Leu Ala Tyr
325 330 335 325 330 335
Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr
340 345 350 340 345 350
Thr Pro Asp Val Thr Gly Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Thr Pro Asp Val Thr Gly Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro
355 360 365 355 360 365
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Ser Arg Gln Val Ser Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Ser Arg Gln Val Ser
370 375 380 370 375 380
Asn Tyr Pro Val Val Ala Ala Glu Leu Leu Pro Val His Ala Lys Ser Asn Tyr Pro Val Val Ala Ala Glu Leu Leu Pro Val His Ala Lys Ser
385 390 395 400 385 390 395 400
Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr
405 410 415 405 410 415
Ala Leu Thr Arg Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Ala Leu Thr Arg Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val
420 425 430 420 425 430
Arg Pro Pro Ala Ala Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Arg Pro Pro Ala Ala Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
435 440 445 435 440 445
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val
450 455 460 450 455 460
Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
465 470 475 480 465 470 475 480
Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg Thr Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg Thr
485 490 495 485 490 495
Phe Phe
<210> 8 <210> 8
<211> 517 <211> 517
<212> ПРТ <212> PRT
<213> Аденовирус человека D серотипа 17 <213> Human adenovirus D serotype 17
<400> 8 <400> 8
Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15 1 5 10 15
Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr
20 25 30 20 25 30
Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala
35 40 45 35 40 45
Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala
50 55 60 50 55 60
Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr
65 70 75 80 65 70 75 80
Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln
85 90 95 85 90 95
Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr
100 105 110 100 105 110
Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser
115 120 125 115 120 125
Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys His Pro Gln Gly Val Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys His Pro Gln Gly Val
130 135 140 130 135 140
Glu Ala Thr Asp Leu Ser Lys Asp Ile Leu Glu Tyr Glu Trp Phe Glu Glu Ala Thr Asp Leu Ser Lys Asp Ile Leu Glu Tyr Glu Trp Phe Glu
145 150 155 160 145 150 155 160
Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu
165 170 175 165 170 175
Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn
180 185 190 180 185 190
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe
195 200 205 195 200 205
Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr
210 215 220 210 215 220
Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly
225 230 235 240 225 230 235 240
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
245 250 255 245 250 255
Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Glu Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Glu
260 265 270 260 265 270
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Pro Lys Tyr Leu Glu Ser Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Pro Lys Tyr Leu Glu Ser
275 280 285 275 280 285
Lys Lys Lys Leu Glu Glu Ala Leu Glu Asn Ala Ala Lys Ala Asn Gly Lys Lys Lys Leu Glu Glu Ala Leu Glu Asn Ala Ala Lys Ala Asn Gly
290 295 300 290 295 300
Pro Ala Arg Gly Asp Ser Ser Val Ser Arg Glu Val Glu Lys Ala Ala Pro Ala Arg Gly Asp Ser Ser Val Ser Arg Glu Val Glu Lys Ala Ala
305 310 315 320 305 310 315 320
Glu Lys Glu Leu Val Ile Glu Pro Ile Lys Gln Asp Asp Ser Lys Arg Glu Lys Glu Leu Val Ile Glu Pro Ile Lys Gln Asp Asp Ser Lys Arg
325 330 335 325 330 335
Ser Tyr Asn Leu Ile Glu Gly Thr Met Asp Thr Leu Tyr Arg Ser Trp Ser Tyr Asn Leu Ile Glu Gly Thr Met Asp Thr Leu Tyr Arg Ser Trp
340 345 350 340 345 350
Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val Gln Ser Trp Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val Gln Ser Trp
355 360 365 355 360 365
Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu Gln Val Tyr
370 375 380 370 375 380
Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe Arg Ser Thr Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe Arg Ser Thr
385 390 395 400 385 390 395 400
Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met Pro Phe Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met Pro Phe
405 410 415 405 410 415
Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser Gln Leu Ile Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser Gln Leu Ile
420 425 430 420 425 430
Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Asp Asn Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Asp Asn
435 440 445 435 440 445
Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu
450 455 460 450 455 460
Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser
465 470 475 480 465 470 475 480
Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr
485 490 495 485 490 495
Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu
500 505 510 500 505 510
Ser Ser Arg Thr Phe Ser Ser Arg Thr Phe
515 515
<210> 9 <210> 9
<211> 520 <211> 520
<212> ПРТ <212> PRT
<213> Аденовирус человека 25 <213> Human adenovirus 25
<400> 9 <400> 9
Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15 1 5 10 15
Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr
20 25 30 20 25 30
Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala
35 40 45 35 40 45
Pro Gln Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Pro Gln Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala
50 55 60 50 55 60
Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr
65 70 75 80 65 70 75 80
Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln
85 90 95 85 90 95
Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr
100 105 110 100 105 110
Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser
115 120 125 115 120 125
Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys His Pro Glu Asn Val Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys His Pro Glu Asn Val
130 135 140 130 135 140
Asp Lys Thr Asp Leu Ser Gln Asp Lys Leu Glu Tyr Glu Trp Phe Glu Asp Lys Thr Asp Leu Ser Gln Asp Lys Leu Glu Tyr Glu Trp Phe Glu
145 150 155 160 145 150 155 160
Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu
165 170 175 165 170 175
Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn
180 185 190 180 185 190
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe
195 200 205 195 200 205
Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr
210 215 220 210 215 220
Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly
225 230 235 240 225 230 235 240
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
245 250 255 245 250 255
Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Glu Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Glu
260 265 270 260 265 270
Gly Gly Asn Ile Pro Ala Leu Leu Asp Thr Lys Lys Tyr Leu Asp Ser Gly Gly Asn Ile Pro Ala Leu Leu Asp Thr Lys Lys Tyr Leu Asp Ser
275 280 285 275 280 285
Lys Lys Glu Leu Glu Asp Ala Ala Lys Glu Ala Ala Lys Gln Gln Gly Lys Lys Glu Leu Glu Asp Ala Ala Lys Glu Ala Ala Lys Gln Gln Gly
290 295 300 290 295 300
Asp Gly Ala Val Thr Arg Gly Asp Thr His Leu Thr Val Ala Gln Glu Asp Gly Ala Val Thr Arg Gly Asp Thr His Leu Thr Val Ala Gln Glu
305 310 315 320 305 310 315 320
Lys Ala Ala Glu Lys Glu Leu Val Ile Val Pro Ile Glu Lys Asp Glu Lys Ala Ala Glu Lys Glu Leu Val Ile Val Pro Ile Glu Lys Asp Glu
325 330 335 325 330 335
Ser Asn Arg Ser Tyr Asn Leu Ile Lys Asp Thr His Asp Thr Met Tyr Ser Asn Arg Ser Tyr Asn Leu Ile Lys Asp Thr His Asp Thr Met Tyr
340 345 350 340 345 350
Arg Ser Trp Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val
355 360 365 355 360 365
Gln Ser Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu Gln Ser Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu
370 375 380 370 375 380
Gln Val Tyr Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe Gln Val Tyr Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe
385 390 395 400 385 390 395 400
Arg Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Arg Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu
405 410 415 405 410 415
Met Pro Phe Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser Met Pro Phe Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser
420 425 430 420 425 430
Gln Leu Ile Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe Gln Leu Ile Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe
435 440 445 435 440 445
Pro Asp Asn Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr Pro Asp Asn Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr
450 455 460 450 455 460
Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu
465 470 475 480 465 470 475 480
Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg
485 490 495 485 490 495
Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro
500 505 510 500 505 510
Arg Val Leu Ser Ser Arg Thr Phe Arg Val Leu Ser Ser Arg Thr Phe
515 520 515 520
<210> 10 <210> 10
<211> 561 <211> 561
<212> ПРТ <212> PRT
<213> Аденовирус человека B серотипа 35 <213> Human adenovirus B serotype 35
<400> 10 <400> 10
Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro Met Arg Arg Val Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Pro
1 5 10 15 1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Gln Ala Thr Ala Val Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Gln Ala Thr Ala Val
20 25 30 20 25 30
Met Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Met Gln Ser Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala
35 40 45 35 40 45
Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln
50 55 60 50 55 60
Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile
65 70 75 80 65 70 75 80
Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val
85 90 95 85 90 95
Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile
100 105 110 100 105 110
Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met
115 120 125 115 120 125
His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe
130 135 140 130 135 140
Lys Ala Arg Val Met Val Ser Arg Lys Pro Pro Asp Gly Ala Ala Val Lys Ala Arg Val Met Val Ser Arg Lys Pro Pro Asp Gly Ala Ala Val
145 150 155 160 145 150 155 160
Gly Asp Thr Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe Gly Asp Thr Tyr Asp His Lys Gln Asp Ile Leu Glu Tyr Glu Trp Phe
165 170 175 165 170 175
Glu Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp Glu Phe Thr Leu Pro Glu Gly Asn Phe Ser Val Thr Met Thr Ile Asp
180 185 190 180 185 190
Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln Leu Met Asn Asn Ala Ile Ile Asp Asn Tyr Leu Lys Val Gly Arg Gln
195 200 205 195 200 205
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
210 215 220 210 215 220
Phe Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val Phe Lys Leu Gly Trp Asp Pro Glu Thr Lys Leu Ile Met Pro Gly Val
225 230 235 240 225 230 235 240
Tyr Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Tyr Thr Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
245 250 255 245 250 255
Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Gly Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
260 265 270 260 265 270
Lys Lys Gln Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu Lys Lys Gln Pro Phe Gln Glu Gly Phe Lys Ile Leu Tyr Glu Asp Leu
275 280 285 275 280 285
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Asp Ala Tyr Glu Asn
290 295 300 290 295 300
Ser Lys Lys Glu Gln Lys Ala Lys Ile Glu Ala Ala Thr Ala Ala Ala Ser Lys Lys Glu Gln Lys Ala Lys Ile Glu Ala Ala Thr Ala Ala Ala
305 310 315 320 305 310 315 320
Glu Ala Lys Ala Asn Ile Val Ala Ser Asp Ser Thr Arg Val Ala Asn Glu Ala Lys Ala Asn Ile Val Ala Ser Asp Ser Thr Arg Val Ala Asn
325 330 335 325 330 335
Ala Gly Glu Val Arg Gly Asp Asn Phe Ala Pro Thr Pro Val Pro Thr Ala Gly Glu Val Arg Gly Asp Asn Phe Ala Pro Thr Pro Val Pro Thr
340 345 350 340 345 350
Ala Glu Ser Leu Leu Ala Asp Val Ser Glu Gly Thr Asp Val Lys Leu Ala Glu Ser Leu Leu Ala Asp Val Ser Glu Gly Thr Asp Val Lys Leu
355 360 365 355 360 365
Thr Ile Gln Pro Val Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val Thr Ile Gln Pro Val Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val
370 375 380 370 375 380
Leu Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr Leu Glu Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ser Tyr
385 390 395 400 385 390 395 400
Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr
405 410 415 405 410 415
Thr Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Thr Ser Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro
420 425 430 420 425 430
Asp Met Met Lys Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asp Met Met Lys Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
435 440 445 435 440 445
Asn Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser
450 455 460 450 455 460
Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Ser Thr
465 470 475 480 465 470 475 480
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ile
485 490 495 485 490 495
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
500 505 510 500 505 510
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val
515 520 525 515 520 525
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
530 535 540 530 535 540
Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr
545 550 555 560 545 550 555 560
Phe Phe
<210> 11 <210> 11
<211> 519 <211> 519
<212> ПРТ <212> PRT
<213> Аденовирус человека D37 <213> Human adenovirus D37
<400> 11 <400> 11
Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser Met Arg Arg Ala Val Val Ser Ser Ser Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15 1 5 10 15
Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr Val Met Ala Gln Ala Thr Leu Glu Val Pro Phe Val Pro Pro Arg Tyr
20 25 30 20 25 30
Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Met Ala Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala
35 40 45 35 40 45
Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Pro Leu Tyr Asp Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala
50 55 60 50 55 60
Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Asp Ile Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr
65 70 75 80 65 70 75 80
Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln Thr Val Val Gln Asn Asn Asp Phe Thr Pro Ala Glu Ala Ser Thr Gln
85 90 95 85 90 95
Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Thr Ile Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr
100 105 110 100 105 110
Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Thr Ser
115 120 125 115 120 125
Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys Lys Ala Glu Gly Ala Lys Phe Lys Ala Arg Val Met Val Ala Arg Lys Lys Ala Glu Gly Ala
130 135 140 130 135 140
Asp Ala Asn Asp Arg Ser Lys Asp Ile Leu Glu Tyr Gln Trp Phe Glu Asp Ala Asn Asp Arg Ser Lys Asp Ile Leu Glu Tyr Gln Trp Phe Glu
145 150 155 160 145 150 155 160
Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu Phe Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu
165 170 175 165 170 175
Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn Met Asn Asn Ala Ile Leu Glu Asn Tyr Leu Gln Val Gly Arg Gln Asn
180 185 190 180 185 190
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Ser Arg Asn Phe
195 200 205 195 200 205
Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Lys Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr
210 215 220 210 215 220
Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly Thr Tyr Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly
225 230 235 240 225 230 235 240
Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
245 250 255 245 250 255
Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Val Lys Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Tyr Glu Asp Leu Val
260 265 270 260 265 270
Gly Gly Asn Ile Pro Ala Leu Leu Asn Val Lys Glu Tyr Leu Lys Asp Gly Gly Asn Ile Pro Ala Leu Leu Asn Val Lys Glu Tyr Leu Lys Asp
275 280 285 275 280 285
Lys Glu Glu Ala Gly Lys Ala Asp Ala Asn Thr Ile Lys Ala Gln Asn Lys Glu Glu Ala Gly Lys Ala Asp Ala Asn Thr Ile Lys Ala Gln Asn
290 295 300 290 295 300
Asp Ala Val Pro Arg Gly Asp Asn Tyr Ala Ser Ala Ala Glu Ala Lys Asp Ala Val Pro Arg Gly Asp Asn Tyr Ala Ser Ala Ala Glu Ala Lys
305 310 315 320 305 310 315 320
Ala Ala Gly Lys Glu Ile Glu Leu Lys Ala Ile Leu Lys Asp Asp Ser Ala Ala Gly Lys Glu Ile Glu Leu Lys Ala Ile Leu Lys Asp Asp Ser
325 330 335 325 330 335
Asp Arg Ser Tyr Asn Val Ile Glu Gly Thr Thr Asp Thr Leu Tyr Arg Asp Arg Ser Tyr Asn Val Ile Glu Gly Thr Thr Asp Thr Leu Tyr Arg
340 345 350 340 345 350
Ser Trp Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val Gln Ser Trp Tyr Leu Ser Tyr Thr Tyr Gly Asp Pro Glu Lys Gly Val Gln
355 360 365 355 360 365
Ser Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu Gln Ser Trp Thr Leu Leu Thr Thr Pro Asp Val Thr Cys Gly Ala Glu Gln
370 375 380 370 375 380
Val Tyr Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe Arg Val Tyr Trp Ser Leu Pro Asp Leu Met Gln Asp Pro Val Thr Phe Arg
385 390 395 400 385 390 395 400
Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met Ser Thr Gln Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Met
405 410 415 405 410 415
Pro Phe Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser Gln Pro Phe Arg Ala Lys Ser Phe Tyr Asn Asp Leu Ala Val Tyr Ser Gln
420 425 430 420 425 430
Leu Ile Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Leu Ile Arg Ser Tyr Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro
435 440 445 435 440 445
Asp Asn Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Asp Asn Gln Ile Leu Cys Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
450 455 460 450 455 460
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg
465 470 475 480 465 470 475 480
Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg
485 490 495 485 490 495
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg
500 505 510 500 505 510
Val Leu Ser Ser Arg Thr Phe Val Leu Ser Ser Arg Thr Phe
515 515
<210> 12 <210> 12
<211> 508 <211> 508
<212> ПРТ <212> PRT
<213> Аденовирус человека F серотипа 41 <213> Human adenovirus F serotype 41
<400> 12 <400> 12
Met Arg Arg Ala Val Gly Val Pro Pro Val Met Ala Tyr Ala Glu Gly Met Arg Arg Ala Val Gly Val Pro Pro Val Met Ala Tyr Ala Glu Gly
1 5 10 15 1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asp Ser Pro Ala Pro Pro Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asp Ser Pro Ala
20 25 30 20 25 30
Thr Leu Glu Ala Leu Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Thr Leu Glu Ala Leu Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu
35 40 45 35 40 45
Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr
50 55 60 50 55 60
Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu
65 70 75 80 65 70 75 80
Asn Tyr Gln Asn Asp His Ser Asn Phe Gln Thr Thr Val Val Gln Asn Asn Tyr Gln Asn Asp His Ser Asn Phe Gln Thr Thr Val Val Gln Asn
85 90 95 85 90 95
Asn Asp Phe Thr Pro Ala Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Asn Asp Phe Thr Pro Ala Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp
100 105 110 100 105 110
Glu Arg Ser Arg Trp Gly Ala Asp Leu Lys Thr Ile Leu Arg Thr Asn Glu Arg Ser Arg Trp Gly Ala Asp Leu Lys Thr Ile Leu Arg Thr Asn
115 120 125 115 120 125
Met Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Lys Ala Arg Met Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Lys Ala Arg
130 135 140 130 135 140
Leu Met Val Glu Lys Lys Asn Lys Glu Thr Gly Leu Pro Arg Tyr Glu Leu Met Val Glu Lys Lys Asn Lys Glu Thr Gly Leu Pro Arg Tyr Glu
145 150 155 160 145 150 155 160
Trp Phe Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Trp Phe Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr
165 170 175 165 170 175
Ile Asp Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Glu Val Gly Ile Asp Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Glu Val Gly
180 185 190 180 185 190
Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr
195 200 205 195 200 205
Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro
210 215 220 210 215 220
Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro
225 230 235 240 225 230 235 240
Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly
245 250 255 245 250 255
Ile Arg Lys Arg Leu Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Ile Arg Lys Arg Leu Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu
260 265 270 260 265 270
Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Lys Tyr Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Lys Tyr
275 280 285 275 280 285
Glu Ala Ser Ile Gln Lys Ala Lys Glu Glu Gly Lys Glu Ile Gly Asp Glu Ala Ser Ile Gln Lys Ala Lys Glu Glu Gly Lys Glu Ile Gly Asp
290 295 300 290 295 300
Asp Thr Phe Ala Thr Arg Pro Gln Asp Leu Val Ile Glu Pro Val Ala Asp Thr Phe Ala Thr Arg Pro Gln Asp Leu Val Ile Glu Pro Val Ala
305 310 315 320 305 310 315 320
Lys Asp Ser Lys Asn Arg Ser Tyr Asn Leu Leu Pro Asn Asp Gln Asn Lys Asp Ser Lys Asn Arg Ser Tyr Asn Leu Leu Pro Asn Asp Gln Asn
325 330 335 325 330 335
Asn Thr Ala Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Asn Thr Ala Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro
340 345 350 340 345 350
Asn Lys Gly Val Gln Ser Trp Thr Leu Leu Thr Thr Ala Asp Val Thr Asn Lys Gly Val Gln Ser Trp Thr Leu Leu Thr Thr Ala Asp Val Thr
355 360 365 355 360 365
Cys Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Cys Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp
370 375 380 370 375 380
Pro Val Thr Phe Arg Pro Ser Thr Gln Val Ser Asn Tyr Pro Val Val Pro Val Thr Phe Arg Pro Ser Thr Gln Val Ser Asn Tyr Pro Val Val
385 390 395 400 385 390 395 400
Gly Val Glu Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Gly Val Glu Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln
405 410 415 405 410 415
Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val
420 425 430 420 425 430
Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro
435 440 445 435 440 445
Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly
450 455 460 450 455 460
Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile
465 470 475 480 465 470 475 480
Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val His Lys Ala Leu Gly Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val His Lys Ala Leu Gly
485 490 495 485 490 495
Ile Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe Ile Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe
500 505 500 505
<210> 13 <210> 13
<211> 575 <211> 575
<212> ПРТ <212> PRT
<213> Аденовирус гориллы B7 <213> Gorilla adenovirus B7
<400> 13 <400> 13
Met Met Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Met Met Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15 1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Ala Val Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Ala Val
20 25 30 20 25 30
Met Gln Pro Ser Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Met Gln Pro Ser Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala
35 40 45 35 40 45
Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln Pro Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Gln
50 55 60 50 55 60
Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile
65 70 75 80 65 70 75 80
Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ala Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val
85 90 95 85 90 95
Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Val Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile
100 105 110 100 105 110
Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met Asn Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met
115 120 125 115 120 125
His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe His Thr Asn Met Pro Asn Val Asn Glu Tyr Met Phe Ser Asn Lys Phe
130 135 140 130 135 140
Lys Ala Arg Val Met Val Ser Arg Glu Ala Ser Lys Ile Asp Ser Glu Lys Ala Arg Val Met Val Ser Arg Glu Ala Ser Lys Ile Asp Ser Glu
145 150 155 160 145 150 155 160
Lys Asn Asp Arg Ser Lys Asp Thr Leu Lys Tyr Glu Trp Phe Glu Phe Lys Asn Asp Arg Ser Lys Asp Thr Leu Lys Tyr Glu Trp Phe Glu Phe
165 170 175 165 170 175
Thr Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu Met Thr Leu Pro Glu Gly Asn Phe Ser Ala Thr Met Thr Ile Asp Leu Met
180 185 190 180 185 190
Asn Asn Ala Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Asn Asn Ala Ile Ile Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly
195 200 205 195 200 205
Val Leu Gln Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Val Leu Gln Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg
210 215 220 210 215 220
Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Thr Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Thr
225 230 235 240 225 230 235 240
Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Asp Cys Gly Val Tyr Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Asp Cys Gly Val
245 250 255 245 250 255
Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Asp Phe Thr Glu Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg
260 265 270 260 265 270
His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu Gly His Pro Phe Gln Glu Gly Phe Lys Ile Met Tyr Glu Asp Leu Glu Gly
275 280 285 275 280 285
Gly Asn Ile Pro Ala Leu Leu Asp Val Ala Glu Tyr Glu Lys Ser Lys Gly Asn Ile Pro Ala Leu Leu Asp Val Ala Glu Tyr Glu Lys Ser Lys
290 295 300 290 295 300
Lys Glu Ile Ala Ser Ser Thr Thr Thr Thr Ala Val Thr Thr Val Ala Lys Glu Ile Ala Ser Ser Thr Thr Thr Thr Ala Val Thr Thr Val Ala
305 310 315 320 305 310 315 320
Arg Asn Val Ala Asp Thr Ser Val Glu Ala Val Ala Val Ala Val Val Arg Asn Val Ala Asp Thr Ser Val Glu Ala Val Ala Val Ala Val Val
325 330 335 325 330 335
Asp Thr Ile Lys Ala Glu Asn Asp Ser Ala Val Arg Gly Asp Asn Phe Asp Thr Ile Lys Ala Glu Asn Asp Ser Ala Val Arg Gly Asp Asn Phe
340 345 350 340 345 350
Gln Ser Lys Asn Asp Met Lys Ala Ser Glu Glu Val Thr Val Val Pro Gln Ser Lys Asn Asp Met Lys Ala Ser Glu Glu Val Thr Val Val Pro
355 360 365 355 360 365
Val Ser Pro Pro Thr Val Thr Glu Thr Glu Thr Lys Glu Pro Thr Ile Val Ser Pro Pro Thr Val Thr Glu Thr Glu Thr Lys Glu Pro Thr Ile
370 375 380 370 375 380
Lys Pro Leu Glu Lys Asp Thr Lys Asp Arg Ser Tyr Asn Val Ile Ser Lys Pro Leu Glu Lys Asp Thr Lys Asp Arg Ser Tyr Asn Val Ile Ser
385 390 395 400 385 390 395 400
Gly Thr Asn Asp Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Thr Asn Asp Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr
405 410 415 405 410 415
Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser
420 425 430 420 425 430
Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Asp Val Thr Cys Gly Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met
435 440 445 435 440 445
Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr
450 455 460 450 455 460
Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr Pro Val Val Gly Ala Glu Leu Met Pro Val Phe Ser Lys Ser Phe Tyr
465 470 475 480 465 470 475 480
Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Thr Thr Ser Leu Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Gln Thr Thr Ser Leu
485 490 495 485 490 495
Thr His Ile Phe Asp Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro Thr His Ile Phe Asp Arg Phe Pro Glu Asn Gln Ile Leu Ile Arg Pro
500 505 510 500 505 510
Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr
515 520 525 515 520 525
Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg
530 535 540 530 535 540
Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys
545 550 555 560 545 550 555 560
Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
565 570 575 565 570 575
<210> 14 <210> 14
<211> 532 <211> 532
<212> ПРТ <212> PRT
<213> Аденовирус шимпанзе Y25 <213> Chimpanzee adenovirus Y25
<400> 14 <400> 14
Met Met Arg Arg Ala Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser Met Met Arg Arg Ala Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15 1 5 10 15
Val Met Gln Gln Ala Met Ala Ala Ala Ala Ala Met Gln Pro Pro Leu Val Met Gln Gln Ala Met Ala Ala Ala Ala Ala Met Gln Pro Pro Leu
20 25 30 20 25 30
Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg
35 40 45 35 40 45
Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg
50 55 60 50 55 60
Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr
65 70 75 80 65 70 75 80
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp
85 90 95 85 90 95
Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg
100 105 110 100 105 110
Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro
115 120 125 115 120 125
Asn Val Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Asn Val Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met
130 135 140 130 135 140
Val Ser Arg Lys Thr Pro Asn Gly Val Thr Val Thr Asp Gly Ser Gln Val Ser Arg Lys Thr Pro Asn Gly Val Thr Val Thr Asp Gly Ser Gln
145 150 155 160 145 150 155 160
Asp Ile Leu Glu Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Asp Ile Leu Glu Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn
165 170 175 165 170 175
Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile Asp Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile Asp
180 185 190 180 185 190
Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile
195 200 205 195 200 205
Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val
210 215 220 210 215 220
Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro
225 230 235 240 225 230 235 240
Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser Arg Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser Arg
245 250 255 245 250 255
Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly
260 265 270 260 265 270
Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu
275 280 285 275 280 285
Leu Asp Val Asp Ala Tyr Glu Lys Ser Lys Glu Glu Ser Ala Ala Ala Leu Asp Val Asp Ala Tyr Glu Lys Ser Lys Glu Glu Ser Ala Ala Ala
290 295 300 290 295 300
Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp Asn Ala Thr Ala Ala Val Ala Thr Ala Ser Thr Glu Val Arg Gly Asp Asn
305 310 315 320 305 310 315 320
Phe Ala Ser Pro Ala Ala Val Ala Ala Ala Glu Ala Ala Glu Thr Glu Phe Ala Ser Pro Ala Ala Val Ala Ala Ala Glu Ala Ala Glu Thr Glu
325 330 335 325 330 335
Ser Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Asp Arg Ser Ser Lys Ile Val Ile Gln Pro Val Glu Lys Asp Ser Lys Asp Arg Ser
340 345 350 340 345 350
Tyr Asn Val Leu Pro Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr Tyr Asn Val Leu Pro Asp Lys Ile Asn Thr Ala Tyr Arg Ser Trp Tyr
355 360 365 355 360 365
Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr
370 375 380 370 375 380
Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp Leu Leu Thr Thr Ser Asp Val Thr Cys Gly Val Glu Gln Val Tyr Trp
385 390 395 400 385 390 395 400
Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg
405 410 415 405 410 415
Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr Gln Val Ser Asn Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Val Tyr
420 425 430 420 425 430
Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg Ser Lys Ser Phe Phe Asn Glu Gln Ala Val Tyr Ser Gln Gln Leu Arg
435 440 445 435 440 445
Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ala Phe Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln
450 455 460 450 455 460
Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn
465 470 475 480 465 470 475 480
Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile
485 490 495 485 490 495
Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Arg Gly Val Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys
500 505 510 500 505 510
Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser
515 520 525 515 520 525
Ser Arg Thr Phe Ser Arg Thr Phe
530 530
<210> 15 <210> 15
<211> 508 <211> 508
<212> ПРТ <212> PRT
<213> Аденовирус обезьяны 18 <213> Monkey adenovirus 18
<400> 15 <400> 15
Met Arg Arg Ala Val Gly Val Pro Pro Val Met Ala Tyr Ala Glu Gly Met Arg Arg Ala Val Gly Val Pro Pro Val Met Ala Tyr Ala Glu Gly
1 5 10 15 1 5 10 15
Pro Pro Pro Ser Tyr Glu Thr Val Met Gly Ala Ala Asp Ser Pro Ala Pro Pro Pro Ser Tyr Glu Thr Val Met Gly Ala Ala Asp Ser Pro Ala
20 25 30 20 25 30
Thr Leu Glu Ala Leu Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Thr Leu Glu Ala Leu Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu
35 40 45 35 40 45
Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr
50 55 60 50 55 60
Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu
65 70 75 80 65 70 75 80
Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn
85 90 95 85 90 95
Asn Asp Phe Thr Pro Val Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Asn Asp Phe Thr Pro Val Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp
100 105 110 100 105 110
Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu Arg Thr Asn Glu Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu Arg Thr Asn
115 120 125 115 120 125
Met Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Met Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg
130 135 140 130 135 140
Leu Met Val Glu Lys Val Asn Lys Glu Thr Asn Ala Pro Arg Tyr Glu Leu Met Val Glu Lys Val Asn Lys Glu Thr Asn Ala Pro Arg Tyr Glu
145 150 155 160 145 150 155 160
Trp Phe Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Trp Phe Glu Phe Thr Leu Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr
165 170 175 165 170 175
Ile Asp Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Glu Val Gly Ile Asp Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Glu Val Gly
180 185 190 180 185 190
Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr
195 200 205 195 200 205
Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro
210 215 220 210 215 220
Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro
225 230 235 240 225 230 235 240
Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly
245 250 255 245 250 255
Ile Arg Lys Arg Met Pro Phe Gln Ala Gly Phe Gln Ile Met Tyr Glu Ile Arg Lys Arg Met Pro Phe Gln Ala Gly Phe Gln Ile Met Tyr Glu
260 265 270 260 265 270
Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ala Lys Tyr Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ala Lys Tyr
275 280 285 275 280 285
Glu Ala Ser Ile Gln Lys Ala Arg Glu Gln Gly Gln Glu Ile Arg Gly Glu Ala Ser Ile Gln Lys Ala Arg Glu Gln Gly Gln Glu Ile Arg Gly
290 295 300 290 295 300
Asp Asn Phe Thr Val Ile Pro Arg Asp Val Glu Ile Val Pro Val Glu Asp Asn Phe Thr Val Ile Pro Arg Asp Val Glu Ile Val Pro Val Glu
305 310 315 320 305 310 315 320
Lys Asp Ser Lys Asp Arg Ser Tyr Asn Leu Leu Pro Gly Asp Gln Thr Lys Asp Ser Lys Asp Arg Ser Tyr Asn Leu Leu Pro Gly Asp Gln Thr
325 330 335 325 330 335
Asn Thr Ala Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Asn Thr Ala Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro
340 345 350 340 345 350
Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Thr Asp Val Thr Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Thr Asp Val Thr
355 360 365 355 360 365
Cys Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Cys Gly Ser Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp
370 375 380 370 375 380
Pro Val Thr Phe Arg Pro Ser Ser Gln Val Ser Asn Tyr Pro Val Val Pro Val Thr Phe Arg Pro Ser Ser Gln Val Ser Asn Tyr Pro Val Val
385 390 395 400 385 390 395 400
Gly Val Glu Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Gly Val Glu Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln
405 410 415 405 410 415
Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val
420 425 430 420 425 430
Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro
435 440 445 435 440 445
Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly
450 455 460 450 455 460
Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile
465 470 475 480 465 470 475 480
Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val His Lys Ala Leu Gly Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val His Lys Ala Leu Gly
485 490 495 485 490 495
Ile Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe Ile Val Ala Pro Lys Val Leu Ser Ser Arg Thr Phe
500 505 500 505
<210> 16 <210> 16
<211> 512 <211> 512
<212> ПРТ <212> PRT
<213> Аденовирус обезьяны 20 <213> Monkey adenovirus 20
<400> 16 <400> 16
Met Arg Arg Ala Val Ala Ile Pro Ser Ala Ala Val Ala Leu Gly Pro Met Arg Arg Ala Val Ala Ile Pro Ser Ala Ala Val Ala Leu Gly Pro
1 5 10 15 1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Ala Ser Ala Asn Leu Gln Ala Pro Pro Pro Ser Tyr Glu Ser Val Met Ala Ser Ala Asn Leu Gln Ala Pro
20 25 30 20 25 30
Leu Glu Asn Pro Tyr Val Pro Pro Arg Tyr Leu Glu Pro Thr Gly Gly Leu Glu Asn Pro Tyr Val Pro Pro Arg Tyr Leu Glu Pro Thr Gly Gly
35 40 45 35 40 45
Arg Asn Ser Ile Arg Tyr Ser Glu Leu Thr Pro Leu Tyr Asp Thr Thr Arg Asn Ser Ile Arg Tyr Ser Glu Leu Thr Pro Leu Tyr Asp Thr Thr
50 55 60 50 55 60
Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Thr Leu Asn Arg Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Thr Leu Asn
65 70 75 80 65 70 75 80
Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Ser Val Val Gln Asn Ser Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Ser Val Val Gln Asn Ser
85 90 95 85 90 95
Asp Tyr Thr Pro Ala Glu Ala Ser Thr Gln Thr Ile Asn Leu Asp Asp Asp Tyr Thr Pro Ala Glu Ala Ser Thr Gln Thr Ile Asn Leu Asp Asp
100 105 110 100 105 110
Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr Asn Met Arg Ser Arg Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr Asn Met
115 120 125 115 120 125
Pro Asn Val Asn Glu Phe Met Phe Thr Asn Ser Phe Arg Ala Lys Leu Pro Asn Val Asn Glu Phe Met Phe Thr Asn Ser Phe Arg Ala Lys Leu
130 135 140 130 135 140
Met Val Ala His Glu Thr Asn Lys Asp Pro Val Tyr Lys Trp Val Glu Met Val Ala His Glu Thr Asn Lys Asp Pro Val Tyr Lys Trp Val Glu
145 150 155 160 145 150 155 160
Leu Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu Leu Thr Leu Pro Glu Gly Asn Phe Ser Glu Thr Met Thr Ile Asp Leu
165 170 175 165 170 175
Met Asn Asn Ala Ile Val Asp His Tyr Leu Ala Val Gly Arg Gln Asn Met Asn Asn Ala Ile Val Asp His Tyr Leu Ala Val Gly Arg Gln Asn
180 185 190 180 185 190
Gly Val Lys Glu Ser Glu Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Gly Val Lys Glu Ser Glu Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
195 200 205 195 200 205
Arg Leu Gly Trp Asp Pro Gln Thr Glu Leu Val Met Pro Gly Val Tyr Arg Leu Gly Trp Asp Pro Gln Thr Glu Leu Val Met Pro Gly Val Tyr
210 215 220 210 215 220
Thr Asn Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly Thr Asn Glu Ala Phe His Pro Asp Val Val Leu Leu Pro Gly Cys Gly
225 230 235 240 225 230 235 240
Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
245 250 255 245 250 255
Arg Met Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Val Arg Met Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Val
260 265 270 260 265 270
Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Pro Ala Tyr Glu Ala Ser Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Pro Ala Tyr Glu Ala Ser
275 280 285 275 280 285
Ile Thr Thr Val Ala Ala Lys Glu Val Arg Gly Asp Asn Phe Glu Ala Ile Thr Thr Val Ala Ala Lys Glu Val Arg Gly Asp Asn Phe Glu Ala
290 295 300 290 295 300
Ala Ala Ala Ala Ala Ala Thr Gly Ala Gln Pro Gln Ala Ala Pro Val Ala Ala Ala Ala Ala Ala Thr Gly Ala Gln Pro Gln Ala Ala Pro Val
305 310 315 320 305 310 315 320
Val Arg Pro Val Thr Gln Asp Ser Lys Gly Arg Ser Tyr Asn Ile Ile Val Arg Pro Val Thr Gln Asp Ser Lys Gly Arg Ser Tyr Asn Ile Ile
325 330 335 325 330 335
Thr Gly Thr Asn Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Thr Gly Thr Asn Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn
340 345 350 340 345 350
Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr
355 360 365 355 360 365
Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Met Pro Asp Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Met Pro Asp
370 375 380 370 375 380
Met Tyr Val Asp Pro Val Thr Phe Arg Ser Ser Gln Gln Val Ser Ser Met Tyr Val Asp Pro Val Thr Phe Arg Ser Ser Gln Gln Val Ser Ser
385 390 395 400 385 390 395 400
Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Ile His Ser Lys Ser Phe Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Ile His Ser Lys Ser Phe
405 410 415 405 410 415
Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Gln Thr Ala Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Gln Thr Ala
420 425 430 420 425 430
Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg
435 440 445 435 440 445
Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu
450 455 460 450 455 460
Thr Asp His Gly Thr Leu Pro Leu Gln Asn Ser Ile Arg Gly Val Gln Thr Asp His Gly Thr Leu Pro Leu Gln Asn Ser Ile Arg Gly Val Gln
465 470 475 480 465 470 475 480
Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr
485 490 495 485 490 495
Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Lys Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
500 505 510 500 505 510
<210> 17 <210> 17
<211> 511 <211> 511
<212> ПРТ <212> PRT
<213> Аденовирус обезьяны 49 <213> Monkey adenovirus 49
<400> 17 <400> 17
Met Arg Arg Ala Val Pro Ala Ala Ala Ile Pro Ala Thr Val Ala Tyr Met Arg Arg Ala Val Pro Ala Ala Ala Ile Pro Ala Thr Val Ala Tyr
1 5 10 15 1 5 10 15
Ala Asp Pro Pro Pro Ser Tyr Glu Ser Val Met Ala Gly Val Pro Ala Ala Asp Pro Pro Pro Ser Tyr Glu Ser Val Met Ala Gly Val Pro Ala
20 25 30 20 25 30
Thr Leu Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Thr Leu Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu
35 40 45 35 40 45
Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr
50 55 60 50 55 60
Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu
65 70 75 80 65 70 75 80
Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn
85 90 95 85 90 95
Asn Asp Phe Thr Pro Val Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Asn Asp Phe Thr Pro Val Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp
100 105 110 100 105 110
Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn
115 120 125 115 120 125
Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Ser Phe Arg Ala Lys Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Ser Phe Arg Ala Lys
130 135 140 130 135 140
Val Met Val Ser Arg Lys Gln Asn Glu Glu Gly Gln Thr Glu Leu Glu Val Met Val Ser Arg Lys Gln Asn Glu Glu Gly Gln Thr Glu Leu Glu
145 150 155 160 145 150 155 160
Tyr Glu Trp Val Glu Phe Val Leu Pro Glu Gly Asn Tyr Ser Glu Thr Tyr Glu Trp Val Glu Phe Val Leu Pro Glu Gly Asn Tyr Ser Glu Thr
165 170 175 165 170 175
Met Thr Leu Asp Leu Met Asn Asn Ala Ile Val Asp His Tyr Leu Leu Met Thr Leu Asp Leu Met Asn Asn Ala Ile Val Asp His Tyr Leu Leu
180 185 190 180 185 190
Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe
195 200 205 195 200 205
Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val
210 215 220 210 215 220
Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Val Val Leu Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Val Val Leu
225 230 235 240 225 230 235 240
Leu Pro Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu
245 250 255 245 250 255
Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile Met Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile Met
260 265 270 260 265 270
Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asn Val Lys Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asn Val Lys
275 280 285 275 280 285
Ala Tyr Glu Asp Ser Ile Ala Ala Ala Met Arg Lys His Asn Leu Pro Ala Tyr Glu Asp Ser Ile Ala Ala Ala Met Arg Lys His Asn Leu Pro
290 295 300 290 295 300
Leu Arg Gly Asp Val Phe Ala Val Gln Pro Gln Glu Ile Val Ile Gln Leu Arg Gly Asp Val Phe Ala Val Gln Pro Gln Glu Ile Val Ile Gln
305 310 315 320 305 310 315 320
Pro Val Glu Lys Asp Gly Lys Glu Arg Ser Tyr Asn Leu Leu Pro Asp Pro Val Glu Lys Asp Gly Lys Glu Arg Ser Tyr Asn Leu Leu Pro Asp
325 330 335 325 330 335
Asp Lys Asn Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Asp Lys Asn Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr
340 345 350 340 345 350
Gly Asp Pro Leu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Pro Gly Asp Pro Leu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Pro
355 360 365 355 360 365
Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Asp Leu Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro Asp Leu
370 375 380 370 375 380
Met Gln Asp Pro Val Thr Phe Arg Pro Ser Ser Gln Val Ser Asn Tyr Met Gln Asp Pro Val Thr Phe Arg Pro Ser Ser Gln Val Ser Asn Tyr
385 390 395 400 385 390 395 400
Pro Val Val Gly Ala Glu Leu Leu Pro Leu Gln Ala Lys Ser Phe Tyr Pro Val Val Gly Ala Glu Leu Leu Pro Leu Gln Ala Lys Ser Phe Tyr
405 410 415 405 410 415
Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu
420 425 430 420 425 430
Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro
435 440 445 435 440 445
Pro Ala Ala Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Pro Ala Ala Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr
450 455 460 450 455 460
Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Asp His Gly Thr Leu Pro Leu Arg Ser Ser Ile Ser Gly Val Gln Arg
465 470 475 480 465 470 475 480
Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys
485 490 495 485 490 495
Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Ala Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
500 505 510 500 505 510
<210> 18 <210> 18
<211> 505 <211> 505
<212> ПРТ <212> PRT
<213> Аденовирус макака-резуса 51 <213> Rhesus macaque adenovirus 51
<400> 18 <400> 18
Met Arg Arg Ala Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro Met Arg Arg Ala Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro
1 5 10 15 1 5 10 15
Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu
20 25 30 20 25 30
Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg
35 40 45 35 40 45
Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys
50 55 60 50 55 60
Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr
65 70 75 80 65 70 75 80
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp
85 90 95 85 90 95
Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg
100 105 110 100 105 110
Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro
115 120 125 115 120 125
Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Lys Leu Met Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Lys Leu Met
130 135 140 130 135 140
Val Glu Lys Ser Asn Ala Glu Thr Arg Gln Pro Arg Tyr Glu Trp Phe Val Glu Lys Ser Asn Ala Glu Thr Arg Gln Pro Arg Tyr Glu Trp Phe
145 150 155 160 145 150 155 160
Glu Phe Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Glu Phe Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp
165 170 175 165 170 175
Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Leu Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln
180 185 190 180 185 190
Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn
195 200 205 195 200 205
Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Phe Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val
210 215 220 210 215 220
Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys
225 230 235 240 225 230 235 240
Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Gly Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg
245 250 255 245 250 255
Lys Arg Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Lys Arg Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu
260 265 270 260 265 270
Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ser Lys Tyr Glu Ala Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val Ser Lys Tyr Glu Ala
275 280 285 275 280 285
Ser Ile Gln Arg Ala Lys Ala Glu Gly Arg Glu Ile Arg Gly Asp Thr Ser Ile Gln Arg Ala Lys Ala Glu Gly Arg Glu Ile Arg Gly Asp Thr
290 295 300 290 295 300
Phe Ala Val Ala Pro Gln Asp Leu Glu Ile Val Pro Leu Thr Lys Asp Phe Ala Val Ala Pro Gln Asp Leu Glu Ile Val Pro Leu Thr Lys Asp
305 310 315 320 305 310 315 320
Ser Lys Asp Arg Ser Tyr Asn Ile Ile Asn Asn Thr Thr Asp Thr Leu Ser Lys Asp Arg Ser Tyr Asn Ile Ile Asn Asn Thr Thr Asp Thr Leu
325 330 335 325 330 335
Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Tyr Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly
340 345 350 340 345 350
Val Arg Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Val Arg Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser
355 360 365 355 360 365
Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Gln Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr
370 375 380 370 375 380
Phe Arg Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu Phe Arg Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu
385 390 395 400 385 390 395 400
Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Leu Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr
405 410 415 405 410 415
Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Ser Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg
420 425 430 420 425 430
Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr
435 440 445 435 440 445
Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro
450 455 460 450 455 460
Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Leu Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala
465 470 475 480 465 470 475 480
Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala
485 490 495 485 490 495
Pro Lys Val Leu Ser Ser Arg Thr Phe Pro Lys Val Leu Ser Ser Arg Thr Phe
500 505 500 505
<210> 19 <210> 19
<211> 503 <211> 503
<212> ПРТ <212> PRT
<213> Аденовирус макака-резуса 52 <213> Rhesus macaque adenovirus 52
<400> 19 <400> 19
Met Arg Arg Ala Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro Met Arg Arg Ala Val Arg Val Thr Pro Ala Ala Tyr Glu Gly Pro Pro
1 5 10 15 1 5 10 15
Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Leu
20 25 30 20 25 30
Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Arg
35 40 45 35 40 45
Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Lys
50 55 60 50 55 60
Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr
65 70 75 80 65 70 75 80
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp
85 90 95 85 90 95
Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Arg
100 105 110 100 105 110
Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Pro
115 120 125 115 120 125
Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Leu Met Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Leu Met
130 135 140 130 135 140
Val Lys Lys Val Glu Asn Gln Pro Pro Glu Tyr Glu Trp Phe Glu Phe Val Lys Lys Val Glu Asn Gln Pro Pro Glu Tyr Glu Trp Phe Glu Phe
145 150 155 160 145 150 155 160
Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Met Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Met
165 170 175 165 170 175
Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Asn Gly Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Asn Gly
180 185 190 180 185 190
Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg
195 200 205 195 200 205
Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Thr Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Thr
210 215 220 210 215 220
Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val
225 230 235 240 225 230 235 240
Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg
245 250 255 245 250 255
Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu Gly
260 265 270 260 265 270
Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Lys Tyr Glu Gln Ser Val Gly Asn Ile Pro Ala Leu Leu Asp Val Thr Lys Tyr Glu Gln Ser Val
275 280 285 275 280 285
Gln Arg Ala Lys Ala Glu Gly Arg Glu Ile Arg Gly Asp Thr Phe Ala Gln Arg Ala Lys Ala Glu Gly Arg Glu Ile Arg Gly Asp Thr Phe Ala
290 295 300 290 295 300
Val Ser Pro Gln Asp Leu Val Ile Glu Pro Leu Glu His Asp Ser Lys Val Ser Pro Gln Asp Leu Val Ile Glu Pro Leu Glu His Asp Ser Lys
305 310 315 320 305 310 315 320
Asn Arg Ser Tyr Asn Leu Leu Pro Asn Lys Thr Asp Thr Ala Tyr Arg Asn Arg Ser Tyr Asn Leu Leu Pro Asn Lys Thr Asp Thr Ala Tyr Arg
325 330 335 325 330 335
Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Lys Gly Val Arg
340 345 350 340 345 350
Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Gln Gln Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Gln Gln
355 360 365 355 360 365
Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Arg
370 375 380 370 375 380
Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu Leu Leu Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu Leu Leu
385 390 395 400 385 390 395 400
Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln
405 410 415 405 410 415
Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Phe Pro Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Phe Pro
420 425 430 420 425 430
Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Val
435 440 445 435 440 445
Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg
450 455 460 450 455 460
Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg
465 470 475 480 465 470 475 480
Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Lys Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Lys
485 490 495 485 490 495
Val Leu Ser Ser Arg Thr Phe Val Leu Ser Ser Arg Thr Phe
500 500
<210> 20 <210> 20
<211> 504 <211> 504
<212> ПРТ <212> PRT
<213> Аденовирус макака-резуса 53 <213> Rhesus macaque adenovirus 53
<400> 20 <400> 20
Met Arg Arg Ala Val Arg Val Thr Pro Ala Val Tyr Ala Glu Gly Pro Met Arg Arg Ala Val Arg Val Thr Pro Ala Val Tyr Ala Glu Gly Pro
1 5 10 15 1 5 10 15
Pro Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr Pro Pro Ser Tyr Glu Ser Val Met Gly Ser Ala Asn Val Pro Ala Thr
20 25 30 20 25 30
Leu Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly Leu Glu Ala Pro Tyr Val Pro Pro Arg Tyr Leu Gly Pro Thr Glu Gly
35 40 45 35 40 45
Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr
50 55 60 50 55 60
Lys Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Lys Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn
65 70 75 80 65 70 75 80
Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn
85 90 95 85 90 95
Asp Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu Asp Phe Thr Pro Thr Glu Ala Gly Thr Gln Thr Ile Asn Phe Asp Glu
100 105 110 100 105 110
Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Leu His Thr Asn Met
115 120 125 115 120 125
Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Leu Pro Asn Ile Asn Glu Phe Met Ser Thr Asn Lys Phe Arg Ala Arg Leu
130 135 140 130 135 140
Met Val Glu Lys Thr Ser Gly Gln Pro Pro Lys Tyr Glu Trp Phe Glu Met Val Glu Lys Thr Ser Gly Gln Pro Pro Lys Tyr Glu Trp Phe Glu
145 150 155 160 145 150 155 160
Phe Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu Phe Thr Ile Pro Glu Gly Asn Tyr Ser Glu Thr Met Thr Ile Asp Leu
165 170 175 165 170 175
Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Asn Met Asn Asn Ala Ile Val Asp Asn Tyr Leu Gln Val Gly Arg Gln Asn
180 185 190 180 185 190
Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Gly Val Leu Glu Ser Asp Ile Gly Val Lys Phe Asp Thr Arg Asn Phe
195 200 205 195 200 205
Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr Arg Leu Gly Trp Asp Pro Val Thr Lys Leu Val Met Pro Gly Val Tyr
210 215 220 210 215 220
Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Thr Asn Glu Ala Phe His Pro Asp Ile Val Leu Leu Pro Gly Cys Gly
225 230 235 240 225 230 235 240
Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Val Asp Phe Thr Gln Ser Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys
245 250 255 245 250 255
Arg Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu Arg Arg Pro Phe Gln Glu Gly Phe Gln Ile Met Tyr Glu Asp Leu Glu
260 265 270 260 265 270
Gly Gly Asn Ile Pro Gly Leu Leu Asp Val Pro Ala Tyr Glu Gln Ser Gly Gly Asn Ile Pro Gly Leu Leu Asp Val Pro Ala Tyr Glu Gln Ser
275 280 285 275 280 285
Leu Gln Gln Ala Gln Glu Glu Gly Arg Val Thr Arg Gly Asp Thr Phe Leu Gln Gln Ala Gln Glu Glu Gly Arg Val Thr Arg Gly Asp Thr Phe
290 295 300 290 295 300
Ala Thr Ala Pro Asn Glu Val Val Ile Lys Pro Leu Leu Lys Asp Ser Ala Thr Ala Pro Asn Glu Val Val Ile Lys Pro Leu Leu Lys Asp Ser
305 310 315 320 305 310 315 320
Lys Asp Arg Ser Tyr Asn Ile Ile Thr Asp Thr Thr Asp Thr Leu Tyr Lys Asp Arg Ser Tyr Asn Ile Ile Thr Asp Thr Thr Asp Thr Leu Tyr
325 330 335 325 330 335
Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Asn Gly Val Arg Ser Trp Phe Leu Ala Tyr Asn Tyr Gly Asp Pro Glu Asn Gly Val
340 345 350 340 345 350
Arg Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Gln Arg Ser Trp Thr Ile Leu Thr Thr Thr Asp Val Thr Cys Gly Ser Gln
355 360 365 355 360 365
Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Thr Phe
370 375 380 370 375 380
Arg Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu Leu Arg Pro Ser Thr Gln Val Ser Asn Phe Pro Val Val Gly Thr Glu Leu
385 390 395 400 385 390 395 400
Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Leu Pro Val His Ala Lys Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser
405 410 415 405 410 415
Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Phe Gln Leu Ile Arg Gln Ser Thr Ala Leu Thr His Val Phe Asn Arg Phe
420 425 430 420 425 430
Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro Thr Ile Thr Thr
435 440 445 435 440 445
Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly Thr Leu Pro Leu
450 455 460 450 455 460
Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Ser Ser Ile Ser Gly Val Gln Arg Val Thr Ile Thr Asp Ala Arg
465 470 475 480 465 470 475 480
Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly Val Val Ala Pro
485 490 495 485 490 495
Lys Val Leu Ser Ser Arg Thr Phe Lys Val Leu Ser Ser Arg Thr Phe
500 500
<210> 21 <210> 21
<211> 144 <211> 144
<212> ПРТ <212> PRT
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Консенсусная последовательность аминокислотного участка A <223> Consensus sequence of amino acid region A
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (1)..(47) <222> (1)..(47)
<223> В этом положении нет аминокислоты или какой-либо аминокислоты <223> There is no amino acid or any amino acid at this position
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (50)..(50) <222> (50)..(50)
<223> E или G <223> E or G
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (59)..(59) <222> (59)..(59)
<223> E или S <223> E or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (60)..(60) <222> (60)..(60)
<223> L или V <223> L or V
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (61)..(61) <222> (61)..(61)
<223> A или S <223> A or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (63)..(63) <222> (63)..(63)
<223> L или Q <223> L or Q
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (64)..(64) <222> (64)..(64)
<223> Y или E <223> Y or E
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (68)..(68) <222> (68)..(68)
<223> R или K <223> R or K
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (69)..(69) <222> (69)..(69)
<223> V или L <223> V or L
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (92)..(92) <222> (92)..(92)
<223> L или Q <223> L or Q
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (96)..(96) <222> (96)..(96)
<223> V или I <223> V or I
<220>и <220>i
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (101)..(101) <222> (101)..(101)
<223> F или Y <223> F or Y
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (102)..(102) <222> (102)..(102)
<223> T или S <223> T or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (104)..(104) <222> (104)..(104)
<223> A, или T, или I, или G <223> A or T or I or G
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (107)..(107) <222> (107)..(107)
<223> S или G <223> S or G
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (113)..(113) <222> (113)..(113)
<223> F или L <223> F or L
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (115)..(115) <222> (115)..(115)
<223> E или D <223> E or D
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (121)..(121) <222> (121)..(121)
<223> A или G <223> A or G
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (122)..(122) <222> (122)..(122)
<223> D или Q <223> D or Q
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (127)..(127) <222> (127)..(127)
<223> L или M <223> L or M
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (128)..(128) <222> (128)..(128)
<223> H или R <223>H or R
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (130)..(130) <222> (130)..(130)
<223> нет аминокислоты или, если присутствует, N <223> no amino acid or, if present, N
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (131)..(131) <222> (131)..(131)
<223> нет аминокислоты или, если присутствует, M <223> no amino acid or, if present, M
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (132)..(132) <222> (132)..(132)
<223> нет аминокислоты или, если присутствует, P <223> no amino acid or, if present, P
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (133)..(133) <222> (133)..(133)
<223> нет аминокислоты или, если присутствует, N <223> no amino acid or, if present, N
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (134)..(134) <222> (134)..(134)
<223> нет аминокислоты или, если присутствует, V, или I <223> no amino acid or, if present, V, or I
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (135)..(135) <222> (135)..(135)
<223> нет аминокислоты или, если присутствует, N <223> no amino acid or, if present, N
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (136)..(136) <222> (136)..(136)
<223> нет аминокислоты или, если присутствует, E, или D <223> no amino acid or, if present, E, or D
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (137)..(137) <222> (137)..(137)
<223> нет аминокислоты или, если присутствует, Y, или F <223> no amino acid or, if present, Y, or F
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (138)..(138) <222> (138)..(138)
<223> нет аминокислоты или, если присутствует, M <223> no amino acid or, if present, M
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (139)..(139) <222> (139)..(139)
<223> нет аминокислоты или, если присутствует, F, или S, или Y <223> no amino acid or, if present, F, or S, or Y
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (140)..(140) <222> (140)..(140)
<223> нет аминокислоты или, если присутствует, T, или S <223> no amino acid or, if present, T, or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (141)..(141) <222> (141)..(141)
<223> нет аминокислоты или, если присутствует, S, или N <223> no amino acid or, if present, S, or N
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (142)..(142) <222> (142)..(142)
<223> нет аминокислоты или, если присутствует, K <223> no amino acid or, if present, K
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (143)..(143) <222> (143)..(143)
<223> нет аминокислоты или, если присутствует, F <223> no amino acid or, if present, F
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (144)..(144) <222> (144)..(144)
<223> нет аминокислоты или, если присутствует, K <223> no amino acid or, if present, K
<400> 21 <400> 21
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15 1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30 20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro
35 40 45 35 40 45
Thr Xaa Gly Arg Asn Ser Ile Arg Tyr Ser Xaa Xaa Xaa Pro Xaa Xaa Thr Xaa Gly Arg Asn Ser Ile Arg Tyr Ser Xaa Xaa Xaa Pro Xaa Xaa
50 55 60 50 55 60
Asp Thr Thr Xaa Xaa Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Asp Thr Thr Xaa Xaa Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Xaa Thr Thr Val Xaa Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Xaa Thr Thr Val Xaa
85 90 95 85 90 95
Gln Asn Asn Asp Xaa Xaa Pro Xaa Glu Ala Xaa Thr Gln Thr Ile Asn Gln Asn Asn Asp Xaa Xaa Pro Xaa Glu Ala Xaa Thr Gln Thr Ile Asn
100 105 110 100 105 110
Xaa Asp Xaa Arg Ser Arg Trp Gly Xaa Xaa Leu Lys Thr Ile Xaa Xaa Xaa Asp Xaa Arg Ser Arg Trp Gly Xaa Xaa Leu Lys Thr Ile Xaa Xaa
115 120 125 115 120 125
Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140 130 135 140
<210> 22 <210> 22
<211> 46 <211> 46
<212> ПРТ <212> PRT
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Консенсусная последовательность аминокислотного участка B <223> Consensus sequence of amino acid region B
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (1)..(1) <222> (1)..(1)
<223> нет аминокислоты или, если присутствует, L, или S <223> no amino acid or, if present, L, or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (2)..(2) <222> (2)..(2)
<223> нет аминокислоты или, если присутствует, T, или P, или C <223> no amino acid or, if present, T, or P, or C
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (3)..(3) <222> (3)..(3)
<223> нет аминокислоты или, если присутствует, T, или P <223> no amino acid or, if present, T, or P
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (4)..(4) <222> (4)..(4)
<223> нет аминокислоты или, если присутствует, P, или S, или A, или R <223> no amino acid or, if present, P or S or A or R
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (5)..(5) <222> (5)..(5)
<223> нет аминокислоты или, если присутствует, N, или D <223> no amino acid or, if present, N, or D
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (6)..(6) <222> (6)..(6)
<223> нет аминокислоты или, если присутствует, G, или V <223> no amino acid or, if present, G, or V
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (7)..(7) <222> (7)..(7)
<223> нет аминокислоты или, если присутствует, H, или T <223> no amino acid or, if present, H, or T
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (8)..(8) <222> (8)..(8)
<223> нет аминокислоты или, если присутствует, C <223> no amino acid or, if present, C
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (9)..(9) <222> (9)..(9)
<223> нет аминокислоты или, если присутствует, G <223> no amino acid or, if present, G
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (10)..(10) <222> (10)..(10)
<223> нет аминокислоты или, если присутствует, A, или V, или S <223> no amino acid or, if present, A, or V, or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (11)..(11) <222> (11)..(11)
<223> нет аминокислоты или, если присутствует, E, или Q <223> no amino acid or, if present, E, or Q
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (20)..(20) <222> (20)..(20)
<223> L или M <223> L or M
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (22)..(22) <222> (22)..(22)
<223> Q или K <223> Q or K
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (31)..(31) <222> (31)..(31)
<223> Q, или R, или S <223> Q, or R, or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (33)..(33) <222> (33)..(33)
<223> V или I <223> V or I
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (34)..(34) <222> (34)..(34)
<223> S или N <223> S or N
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (36)..(36) <222> (36)..(36)
<223> Y или F <223> Y or F
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (41)..(41) <222> (41)..(41)
<223> A или V <223> A or V
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (44)..(44) <222> (44)..(44)
<223> нет аминокислоты или, если присутствует, M, или L <223> no amino acid or, if present, M, or L
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (45)..(45) <222> (45)..(45)
<223> нет аминокислоты или, если присутствует, P <223> no amino acid or, if present, P
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (46)..(46) <222> (46)..(46)
<223> нет аминокислоты или, если присутствует, V, или F <223> no amino acid or, if present, V, or F
<400> 22 <400> 22
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Val Tyr Trp Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Val Tyr Trp Ser
1 5 10 15 1 5 10 15
Leu Pro Asp Xaa Met Xaa Asp Pro Val Thr Phe Arg Ser Thr Xaa Gln Leu Pro Asp Xaa Met Xaa Asp Pro Val Thr Phe Arg Ser Thr Xaa Gln
20 25 30 20 25 30
Xaa Xaa Asn Xaa Pro Val Val Gly Xaa Glu Leu Xaa Xaa Xaa Xaa Xaa Asn Xaa Pro Val Val Gly Xaa Glu Leu Xaa Xaa Xaa
35 40 45 35 40 45
<210> 23 <210> 23
<211> 53 <211> 53
<212> ПРТ <212> PRT
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Консенсусная последовательность аминокислотного участка C <223> Consensus sequence of amino acid region C
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (1)..(1) <222> (1)..(1)
<223> нет аминокислоты или, если присутствует, N <223> no amino acid or, if present, N
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (2)..(2) <222> (2)..(2)
<223> нет аминокислоты или, если присутствует, V <223> no amino acid or, if present, V
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (3)..(3) <222> (3)..(3)
<223> нет аминокислоты или, если присутствует, P <223> no amino acid or, if present, P
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (18)..(18) <222> (18)..(18)
<223> R, или S, или G <223> R, or S, or G
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (25)..(25) <222> (25)..(25)
<223> V или I <223> V or I
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (44)..(44) <222> (44)..(44)
<223> A или S <223> A or S
<220> <220>
<221> MISC_FEATURE <221> MISC_FEATURE
<222> (46)..(46) <222> (46)..(46)
<223> R или K <223> R or K
<400> 23 <400> 23
Xaa Xaa Xaa Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser Xaa Xaa Xaa Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Ser Ser
1 5 10 15 1 5 10 15
Ile Xaa Gly Val Gln Arg Val Thr Xaa Thr Asp Ala Arg Arg Arg Thr Ile Xaa Gly Val Gln Arg Val Thr Xaa Thr Asp Ala Arg Arg Arg Thr
20 25 30 20 25 30
Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Xaa Pro Xaa Val Leu Cys Pro Tyr Val Tyr Lys Ala Leu Gly Ile Val Xaa Pro Xaa Val Leu
35 40 45 35 40 45
Ser Ser Arg Thr Phe Ser Ser Arg Thr Phe
50 50
<210> 24 <210> 24
<211> 4 <211> 4
<212> ПРТ <212> PRT
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Связывающий сегмент <223> Linking segment
<400> 24 <400> 24
Gly Gly Gly Ser Gly Gly Gly Ser
1 1
<210> 25 <210> 25
<211> 6 <211> 6
<212> ПРТ <212> PRT
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Связывающий сегмент <223> Linking segment
<400> 25 <400> 25
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 15
<210> 26 <210> 26
<211> 778 <211> 778
<212> ДНК <212> DNA
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Конструкция DNAsegVAJB-CHIK <223> Design of DNAsegVAJB-CHIK
<400> 26 <400> 26
ggatccatga ggagacgagc cgtgctaggc ggagcggtgg tgtatccgga gggtcctcct 60 ggatccatga ggagacgagc cgtgctaggc ggagcggtgg tgtatccgga gggtcctcct 60
ccttcttacg agagcgtgat gcagcaacag gcggcgatga tacagccccc actggaggct 120 ccttcttacg agagcgtgat gcagcaacag gcggcgatga tacagccccc actggaggct 120
cccttcgtac ccccacggta cctggcgcct acggaaggga gaaacagcat tcgttactcg 180 cccttcgtac ccccacggta cctggcgcct acggaaggga gaaacagcat tcgttactcg 180
gagctgtcgc ccctgtacga taccaccaag ttgtatctgg tggacaacaa gtcggcggac 240 gagctgtcgc ccctgtacga taccaccaag ttgtatctgg tggacaacaa gtcggcggac 240
atcgcctccc tgaactatca gaacgaccac agcaacttcc tgaccacggt ggtgcagaac 300 atcgcctccc tgaactatca gaacgaccac agcaacttcc tgaccacggt ggtgcagaac 300
aatgacttta cccccacgga ggctagcacc cagaccatca actttgacga gcggtcgcga 360 aatgacttta cccccacgga ggctagcacc cagaccatca actttgacga gcggtcgcga 360
tggggcggtc agctgaagac catcatgcac accaacatgc ccggaggtga aaacctgtat 420 tggggcggtc agctgaagac catcatgcac accaacatgc ccggaggtga aaacctgtat 420
tttcagagca ccaaagataa ctttaacgtg tataaagcga cccgcccgta tctggcgcat 480 tttcagagca ccaaagataa ctttaacgtg tataaagcga cccgcccgta tctggcgcat 480
ggaggtgcag agcaggtcta ctggtcgctc cctgacatga tgcaagaccc agtcaccttc 540 ggaggtgcag agcaggtcta ctggtcgctc cctgacatga tgcaagaccc agtcaccttc 540
cgctccacaa gacaagtcaa caactaccca gtggtgggtg cagagcttat gcccggtgga 600 cgctccacaa gacaagtcaa caactaccca gtggtgggtg cagagcttat gcccggtgga 600
agcggaggta gcgttcctgc tctcacagat cacgggaccc tgccgttacg cagcagtatc 660 agcggaggta gcgttcctgc tctcacagat cacgggaccc tgccgttacg cagcagtatc 660
cggggagtcc agcgcgtgac cgttactgac gccagacgcc gcacctgtcc ctacgtttac 720 cggggagtcc agcgcgtgac cgttactgac gccagacgcc gcacctgtcc ctacgtttac 720
aaggccctgg gcatagtcgc gccgcgcgtt ctttcaagcc gcactttctg ataagctt 778 aaggccctgg gcatagtcgc gccgcgcgtt ctttcaagcc gcactttctg ataagctt 778
<210> 27 <210> 27
<211> 3699 <211> 3699
<212> ДНК <212> DNA
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Конструкция pACEBac_VAJB-CHIK <223> Construction pACEBac_VAJB-CHIK
<400> 27 <400> 27
accggttgac ttgggtcaac tgtcagacca agtttactca tatatacttt agattgattt 60 accggttgac ttgggtcaac tgtcagacca agtttactca tatatacttt agattgattt 60
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 120 aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 120
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 180 caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 180
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 240 aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 240
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 300 accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 300
aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg 360 aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg 360
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 420 ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 420
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 480 agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 480
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 540 accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 540
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 600 gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 600
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 660 tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 660
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 720 cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 720
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 780 cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 780
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 840 cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 840
ctttcctgcg ttatcccctg attgacttgg gtcgctcttc ctgtggatgc gcagatgccc 900 ctttcctgcg ttatcccctg attgacttgg gtcgctcttc ctgtggatgc gcagatgccc 900
tgcgtaagcg ggtgtgggcg gacaataaag tcttaaactg aacaaaatag atctaaacta 960 tgcgtaagcg ggtgtgggcg gacaataaag tcttaaactg aacaaaatag atctaaacta 960
tgacaataaa gtcttaaact agacagaata gttgtaaact gaaatcagtc cagttatgct 1020 tgacaataaa gtcttaaact agacagaata gttgtaaact gaaatcagtc cagttatgct 1020
gtgaaaaagc atactggact tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc 1080 gtgaaaaagc atactggact tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc 1080
aaattgcccg tcgtattaaa gaggggcgtg gccaagggca tgtaaagact atattcgcgg 1140 aaattgcccg tcgtattaaa gaggggcgtg gccaagggca tgtaaagact atattcgcgg 1140
cgttgtgaca atttaccgaa caactccgcg gccgggaagc cgatctcggc ttgaacgaat 1200 cgttgtgaca atttaccgaa caactccgcg gccgggaagc cgatctcggc ttgaacgaat 1200
tgttaggtgg cggtacttgg gtcgatatca aagtgcatca cttcttcccg tatgcccaac 1260 tgttaggtgg cggtacttgg gtcgatatca aagtgcatca cttcttcccg tatgcccaac 1260
tttgtataga gagccactgc gggatcgtca ccgtaatctg cttgcacgta gatcacataa 1320 tttgtataga gagccactgc gggatcgtca ccgtaatctg cttgcacgta gatcacataa 1320
gcaccaagcg cgttggcctc atgcttgagg agattgatga gcgcggtggc aatgccctgc 1380 gcaccaagcg cgttggcctc atgcttgagg agattgatga gcgcggtggc aatgccctgc 1380
ctccggtgct cgccggagac tgcgagatca tagatataga tctcactacg cggctgctca 1440 ctccggtgct cgccggagac tgcgagatca tagatataga tctcactacg cggctgctca 1440
aacttgggca gaacgtaagc cgcgagagcg ccaacaaccg cttcttggtc gaaggcagca 1500 aacttgggca gaacgtaagc cgcgagagcg ccaacaaccg cttcttggtc gaaggcagca 1500
agcgcgatga atgtcttact acggagcaag ttcccgaggt aatcggagtc cggctgatgt 1560 agcgcgatga atgtcttact acggagcaag ttcccgaggt aatcggagtc cggctgatgt 1560
tgggagtagg tggctacgtc tccgaactca cgaccgaaaa gatcaagagc agcccgcatg 1620 tgggagtagg tggctacgtc tccgaactca cgaccgaaaa gatcaagagc agcccgcatg 1620
gatttgactt ggtcagggcc gagcctacat gtgcgaatga tgcccatact tgagccacct 1680 gatttgactt ggtcagggcc gagcctacat gtgcgaatga tgcccatact tgagccacct 1680
aactttgttt tagggcgact gccctgctgc gtaacatcgt tgctgctgcg taacatcgtt 1740 aactttgttt tagggcgact gccctgctgc gtaacatcgt tgctgctgcg taacatcgtt 1740
gctgctccat aacatcaaac atcgacccac ggcgtaacgc gcttgctgct tggatgcccg 1800 gctgctccat aacatcaaac atcgacccac ggcgtaacgc gcttgctgct tggatgcccg 1800
aggcatagac tgtacaaaaa aacagtcata acaagccatg aaaaccgcca ctgcgccgtt 1860 aggcatagac tgtacaaaaa aacagtcata acaagccatg aaaaccgcca ctgcgccgtt 1860
accaccgctg cgttcggtca aggttctgga ccagttgcgt gagcgcatac gctacttgca 1920 accaccgctg cgttcggtca aggttctgga ccagttgcgt gagcgcatac gctacttgca 1920
ttacagttta cgaaccgaac aggcttatgt caactgggtt cgtgccttca tccgtttcca 1980 ttacagttta cgaaccgaac aggcttatgt caactgggtt cgtgccttca tccgtttcca 1980
cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc gccataactt cgtatagcat 2040 cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc gccataactt cgtatagcat 2040
acattatacg aagttatctg taactataac ggtcctaagg tagcgagttt aaacactagt 2100 acattatacg aagttatctg taactataac ggtcctaagg tagcgagttt aaacactagt 2100
atcgattcgc gacctactcc ggaatattaa tagatcatgg agataattaa aatgataacc 2160 atcgattcgc gacctactcc ggaatattaa tagatcatgg agataattaa aatgataacc 2160
atctcgcaaa taaataagta ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta 2220 atctcgcaaa taaataagta ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta 2220
taaatattcc ggattattca taccgtccca ccatcgggcg cggatccatg aggagacgag 2280 taaatattcc ggattattca taccgtccca ccatcgggcg cggatccatg aggagacgag 2280
ccgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcttac gagagcgtga 2340 ccgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcttac gagagcgtga 2340
tgcagcaaca ggcggcgatg atacagcccc cactggaggc tcccttcgta cccccacggt 2400 tgcagcaaca ggcggcgatg atacagcccc cactggaggc tcccttcgta cccccacggt 2400
acctggcgcc tacggaaggg agaaacagca ttcgttactc ggagctgtcg cccctgtacg 2460 acctggcgcc tacggaaggg agaaacagca ttcgttactc ggagctgtcg cccctgtacg 2460
ataccaccaa gttgtatctg gtggacaaca agtcggcgga catcgcctcc ctgaactatc 2520 ataccaccaa gttgtatctg gtggacaaca agtcggcgga catcgcctcc ctgaactatc 2520
agaacgacca cagcaacttc ctgaccacgg tggtgcagaa caatgacttt acccccacgg 2580 agaacgacca cagcaacttc ctgaccacgg tggtgcagaa caatgacttt acccccacgg 2580
aggctagcac ccagaccatc aactttgacg agcggtcgcg atggggcggt cagctgaaga 2640 aggctagcac cgaccacatc aactttgacg agcggtcgcg atggggcggt cagctgaaga 2640
ccatcatgca caccaacatg cccggaggtg aaaacctgta ttttcagagc accaaagata 2700 ccatcatgca caccaacatg cccggaggtg aaaacctgta ttttcagagc accaaagata 2700
actttaacgt gtataaagcg acccgcccgt atctggcgca tggaggtgca gagcaggtct 2760 actttaacgt gtataaagcg acccgcccgt atctggcgca tggaggtgca gagcaggtct 2760
actggtcgct ccctgacatg atgcaagacc cagtcacctt ccgctccaca agacaagtca 2820 actggtcgct ccctgacatg atgcaagacc cagtcacctt ccgctccaca agacaagtca 2820
acaactaccc agtggtgggt gcagagctta tgcccggtgg aagcggaggt agcgttcctg 2880 acaactaccc agtggtgggt gcagagctta tgcccggtgg aagcggaggt agcgttcctg 2880
ctctcacaga tcacgggacc ctgccgttac gcagcagtat ccggggagtc cagcgcgtga 2940 ctctcacaga tcacgggacc ctgccgttac gcagcagtat ccggggagtc cagcgcgtga 2940
ccgttactga cgccagacgc cgcacctgtc cctacgttta caaggccctg ggcatagtcg 3000 ccgttactga cgccagacgc cgcacctgtc cctacgttta caaggccctg ggcatagtcg 3000
cgccgcgcgt tctttcaagc cgcactttct gataagcttc catcaacttt gacgagcggt 3060 cgccgcgcgt tctttcaagc cgcactttct gataagcttc catcaacttt gacgagcggt 3060
cgcgatgggg cggtcagctg aagaccatca tgcacaccaa catgcccaac gtgaacgagt 3120 cgcgatgggg cggtcagctg aagaccatca tgcacaccaa catgcccaac gtgaacgagt 3120
acatgttcag caacaagttc aaggcgaggg agcttgtcga gaagtactag aggatcataa 3180 acatgttcag caacaagttc aaggcgaggg agcttgtcga gaagtactag aggatcataa 3180
tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc 3240 tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc 3240
tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 3300 tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 3300
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 3360 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 3360
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg atctgatcac 3420 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg atctgatcac 3420
tgcttgagcc tagaagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 3480 tgcttgagcc tagaagatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 3480
gccaccgctg agcaataact atcataaccc ctagggtata cccatctaat tggaaccaga 3540 gccaccgctg agcaataact atcataaccc ctagggtata cccatctaat tggaaccaga 3540
taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg 3600 taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg 3600
ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt 3660 ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt 3660
tccacccctc ccagttccca actattttgt ccgcccaca 3699 tccacccctc ccagttccca actattttgt ccgcccaca 3699
<210> 28 <210> 28
<211> 254 <211> 254
<212> ПРТ <212> PRT
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Белок VAJB-CHIK <223> VAJB-CHIK protein
<400> 28 <400> 28
Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly Met Arg Arg Arg Ala Val Leu Gly Gly Ala Val Val Tyr Pro Glu Gly
1 5 10 15 1 5 10 15
Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile Pro Pro Pro Ser Tyr Glu Ser Val Met Gln Gln Gln Ala Ala Met Ile
20 25 30 20 25 30
Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro Gln Pro Pro Leu Glu Ala Pro Phe Val Pro Pro Arg Tyr Leu Ala Pro
35 40 45 35 40 45
Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr Thr Glu Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ser Pro Leu Tyr
50 55 60 50 55 60
Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Asp Thr Thr Lys Leu Tyr Leu Val Asp Asn Lys Ser Ala Asp Ile Ala
65 70 75 80 65 70 75 80
Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val Ser Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Val
85 90 95 85 90 95
Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Gln Asn Asn Asp Phe Thr Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn
100 105 110 100 105 110
Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His Phe Asp Glu Arg Ser Arg Trp Gly Gly Gln Leu Lys Thr Ile Met His
115 120 125 115 120 125
Thr Asn Met Pro Gly Gly Glu Asn Leu Tyr Phe Gln Ser Thr Lys Asp Thr Asn Met Pro Gly Gly Glu Asn Leu Tyr Phe Gln Ser Thr Lys Asp
130 135 140 130 135 140
Asn Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu Ala His Gly Gly Asn Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu Ala His Gly Gly
145 150 155 160 145 150 155 160
Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val Ala Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp Pro Val
165 170 175 165 170 175
Thr Phe Arg Ser Thr Arg Gln Val Asn Asn Tyr Pro Val Val Gly Ala Thr Phe Arg Ser Thr Arg Gln Val Asn Asn Tyr Pro Val Val Gly Ala
180 185 190 180 185 190
Glu Leu Met Pro Gly Gly Ser Gly Gly Ser Val Pro Ala Leu Thr Asp Glu Leu Met Pro Gly Gly Ser Gly Gly Ser Val Pro Ala Leu Thr Asp
195 200 205 195 200 205
His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val His Gly Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val
210 215 220 210 215 220
Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala
225 230 235 240 225 230 235 240
Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe Leu Gly Ile Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
245 250 245 250
<210> 29 <210> 29
<211> 18 <211> 18
<212> ПРТ <212> PRT
<213> Вирус чикунгуньи <213> Chikungunya virus
<400> 29 <400> 29
Ser Thr Lys Asp Asn Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu Ser Thr Lys Asp Asn Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu
1 5 10 15 1 5 10 15
Ala HisAla His
<---<---
Claims (185)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP18186731.8 | 2018-07-31 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021101625A RU2021101625A (en) | 2022-09-01 |
| RU2820522C2 true RU2820522C2 (en) | 2024-06-04 |
Family
ID=
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2507257C1 (en) * | 2012-08-07 | 2014-02-20 | Общество с ограниченной ответственностью "НТфарма" | Recombinant pseudo adenoviral particle based on human being adenovirus genome of 5-th serotype for induction of specific immunity to influenza virus a of h1n1 subtype and method of its use as component for vaccine production |
| WO2017167988A1 (en) * | 2016-03-31 | 2017-10-05 | The European Molecular Biology Laboratory | Adenoviral coat protein derived delivery vehicles |
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2507257C1 (en) * | 2012-08-07 | 2014-02-20 | Общество с ограниченной ответственностью "НТфарма" | Recombinant pseudo adenoviral particle based on human being adenovirus genome of 5-th serotype for induction of specific immunity to influenza virus a of h1n1 subtype and method of its use as component for vaccine production |
| WO2017167988A1 (en) * | 2016-03-31 | 2017-10-05 | The European Molecular Biology Laboratory | Adenoviral coat protein derived delivery vehicles |
Non-Patent Citations (1)
| Title |
|---|
| CHLOE ZUBIETA et al. The Structure of the Human Adenovirus 2 Penton, MOLECULAR CELL,Vol. 17, No. 1, 01 January 2005 (2005-01-01), p. 121-135. SZURGOT INGA et al. Self-adjuvanting influenza candidate vaccine presenting epitopes for cell-mediated immunity on a proteinaceous multivalent nanoplatform, VACCINE,Vol. 31, No. 40, 20 July 2013 (2013-07-20), p. 4338-4346. GARCEL A et al. Protein transduction into human cells by adenovirus dodecahedron using WW domains as universal adaptors, 01 April 2006 (2006-04-01), Vol. 8, No. 4, p. 524-531. XU HAI et al. Immunogenicity of T7 bacteriophage nanoparticles displaying G-H loop of foot-and-mouth disease virus (FMDV), VETERINARY MICROBIOLOGY,Vol. 205, 04 May 2017 (2017-05-04), p. 46-52. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20210038626A (en) | Multimerized polypeptide derived from the jellyroll fold domain of adenovirus Fenton base | |
| KR102622910B1 (en) | Pd-1 homing endonuclease variants, compositions, and methods of use | |
| JP2020520654A5 (en) | ||
| KR20200032174A (en) | Enhanced chimeric antigen receptors and uses thereof | |
| CN109415739A (en) | Adenovirus coat protein-derived delivery vector | |
| US10906943B2 (en) | Virus-like particles with high-density coating for inducing the expression of antibodies | |
| CN112912112A (en) | Liver-specific nucleic acid regulatory elements and methods and uses thereof | |
| CN106232813A (en) | The vaccine of prevention egg drop syndrome (EDS) | |
| CN115427071A (en) | Compositions comprising LTB and pathogenic antigens and uses thereof | |
| CN115427558A (en) | Fusions of site-specific recombinases for efficient and specific genome editing | |
| RU2820522C2 (en) | Multimerizing polypeptides derived from domain with roll-type pentone base of adenovirus | |
| US10620214B2 (en) | Chloroalkane penetration method for quantifying access of a molecule into a cell | |
| KR102679920B1 (en) | Composition for targeting cancer cell comprising a strain expressing monomeric streptavidin and a biotinylated compound | |
| CN101133163A (en) | Isolated chimeric protein of modified 2,4-dioxotetrahydropteridine synthase | |
| US20230101439A1 (en) | Engineered Polypeptides Derived From Variable Domain of Adenovirus Penton Base | |
| KR102679923B1 (en) | A construct expressing monomeric streptavidin | |
| WO2005077976A2 (en) | Coiled-coil domains from c4b-binding protein | |
| US20210147870A1 (en) | Compositions and methods for the treatment of stargardt disease | |
| KR102774499B1 (en) | In vivo microbial tracking platform comprising a strain expressing pre-targeting protein | |
| Kim et al. | Engineering of Recombinant Human Papillomavirus 16 L1 Protein for Incorporation with para-Azido-L-Phenylalanine | |
| NL2027815B1 (en) | Genomic integration | |
| CN110272914A (en) | A kind of double fluorescence GLUTs tracer plasmids, preparation method and its application | |
| RU2813282C2 (en) | Virus-like particles with high-density coating for induction of antibody expression | |
| Dau | The role of cell-penetrating peptides in the induction of T cell responses by virus-like particles | |
| RU2779747C2 (en) | Chimeric antigen receptors targeted to fc receptor-like protein 5, and their use |