KR20210018351A - 타입 39 인유두종 바이러스 l1 단백질의 돌연변이체 - Google Patents
타입 39 인유두종 바이러스 l1 단백질의 돌연변이체 Download PDFInfo
- Publication number
- KR20210018351A KR20210018351A KR1020207038070A KR20207038070A KR20210018351A KR 20210018351 A KR20210018351 A KR 20210018351A KR 1020207038070 A KR1020207038070 A KR 1020207038070A KR 20207038070 A KR20207038070 A KR 20207038070A KR 20210018351 A KR20210018351 A KR 20210018351A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- ser
- hpv39
- thr
- val
- Prior art date
Links
- 108700005307 Human papillomavirus HPV L1 Proteins 0.000 title 1
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 316
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 316
- 239000002245 particle Substances 0.000 claims abstract description 58
- 208000015181 infectious disease Diseases 0.000 claims abstract description 45
- 238000004519 manufacturing process Methods 0.000 claims abstract description 28
- 230000003472 neutralizing effect Effects 0.000 claims abstract description 26
- 201000010099 disease Diseases 0.000 claims abstract description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 23
- 229960005486 vaccine Drugs 0.000 claims abstract description 20
- 206010008342 Cervix carcinoma Diseases 0.000 claims abstract description 16
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims abstract description 16
- 201000010881 cervical cancer Diseases 0.000 claims abstract description 16
- 206010059313 Anogenital warts Diseases 0.000 claims abstract description 15
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 12
- 230000002265 prevention Effects 0.000 claims abstract description 6
- 125000000539 amino acid group Chemical group 0.000 claims description 95
- 150000001413 amino acids Chemical class 0.000 claims description 43
- 208000009608 Papillomavirus Infections Diseases 0.000 claims description 37
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 33
- 238000006467 substitution reaction Methods 0.000 claims description 33
- 241000588724 Escherichia coli Species 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 13
- 102000039446 nucleic acids Human genes 0.000 claims description 13
- 150000007523 nucleic acids Chemical class 0.000 claims description 13
- 238000004587 chromatography analysis Methods 0.000 claims description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 239000006228 supernatant Substances 0.000 claims description 9
- 230000035772 mutation Effects 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 6
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 6
- 239000003937 drug carrier Substances 0.000 claims description 5
- 238000004191 hydrophobic interaction chromatography Methods 0.000 claims description 5
- 239000006166 lysate Substances 0.000 claims description 5
- 229910052588 hydroxylapatite Inorganic materials 0.000 claims description 4
- 238000002156 mixing Methods 0.000 claims description 4
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 claims description 4
- 238000005277 cation exchange chromatography Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 208000022361 Human papillomavirus infectious disease Diseases 0.000 claims 20
- 238000002360 preparation method Methods 0.000 abstract description 4
- 241000282465 Canis Species 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 273
- 241000701806 Human papillomavirus Species 0.000 description 266
- 241000701789 Human papillomavirus type 56 Species 0.000 description 128
- 241000341651 Human papillomavirus type 53 Species 0.000 description 92
- 239000002671 adjuvant Substances 0.000 description 89
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 83
- 229910052782 aluminium Inorganic materials 0.000 description 83
- 241000699670 Mus sp. Species 0.000 description 55
- 239000012634 fragment Substances 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 50
- 235000001014 amino acid Nutrition 0.000 description 40
- 229940024606 amino acid Drugs 0.000 description 38
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 36
- 230000003053 immunization Effects 0.000 description 27
- 238000002649 immunization Methods 0.000 description 27
- 108091028043 Nucleic acid sequence Proteins 0.000 description 25
- 239000000872 buffer Substances 0.000 description 24
- 238000002255 vaccination Methods 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 22
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 22
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 21
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 20
- 108010020688 glycylhistidine Proteins 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 19
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 18
- 230000001681 protective effect Effects 0.000 description 18
- 239000011780 sodium chloride Substances 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 16
- 108010093581 aspartyl-proline Proteins 0.000 description 16
- 241000880493 Leptailurus serval Species 0.000 description 15
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 15
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 15
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 14
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 14
- 108010065395 Neuropep-1 Proteins 0.000 description 14
- 108010054813 diprotin B Proteins 0.000 description 14
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 14
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 14
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 14
- 108010026333 seryl-proline Proteins 0.000 description 14
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 13
- NJONQBYLTANINY-IHPCNDPISA-N Phe-Trp-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CC(N)=O)C(O)=O NJONQBYLTANINY-IHPCNDPISA-N 0.000 description 13
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 13
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 13
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 13
- 108010057821 leucylproline Proteins 0.000 description 13
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 13
- 108010071207 serylmethionine Proteins 0.000 description 13
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 12
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 12
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 12
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 12
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 12
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 12
- 108010090894 prolylleucine Proteins 0.000 description 12
- 108010061238 threonyl-glycine Proteins 0.000 description 12
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 11
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 11
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 11
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 11
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 11
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 11
- 108010090461 DFG peptide Proteins 0.000 description 11
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 11
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 11
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 11
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 11
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 11
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 11
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 11
- 108010092114 histidylphenylalanine Proteins 0.000 description 11
- 108010064235 lysylglycine Proteins 0.000 description 11
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 10
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 10
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 10
- VKAWJBQTFCBHQY-GUBZILKMSA-N Cys-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N VKAWJBQTFCBHQY-GUBZILKMSA-N 0.000 description 10
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 10
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 10
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 10
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 10
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 10
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 10
- 108010065920 Insulin Lispro Proteins 0.000 description 10
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 10
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 10
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 10
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 10
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 10
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 10
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 10
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 10
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 10
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 10
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 10
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 10
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 10
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 10
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 10
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 10
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 10
- 108010062796 arginyllysine Proteins 0.000 description 10
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 10
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 9
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 9
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 9
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 9
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 9
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 9
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 9
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 9
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 9
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 9
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 9
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 9
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 9
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 9
- FPNWKONEZAVQJF-GUBZILKMSA-N His-Asn-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FPNWKONEZAVQJF-GUBZILKMSA-N 0.000 description 9
- FHCNLXMTQJNJNH-KBIXCLLPSA-N Ile-Cys-Gln Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)O FHCNLXMTQJNJNH-KBIXCLLPSA-N 0.000 description 9
- ZIPOVLBRVPXWJQ-SPOWBLRKSA-N Ile-Cys-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N ZIPOVLBRVPXWJQ-SPOWBLRKSA-N 0.000 description 9
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 9
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 9
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 9
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 9
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 9
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 9
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 9
- WNJXJJSGUXAIQU-UFYCRDLUSA-N Met-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 WNJXJJSGUXAIQU-UFYCRDLUSA-N 0.000 description 9
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 9
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 9
- QMABBZHZMDXHKU-FKBYEOEOSA-N Pro-Tyr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QMABBZHZMDXHKU-FKBYEOEOSA-N 0.000 description 9
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 9
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 9
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 9
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 9
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 9
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 9
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 108010073101 phenylalanylleucine Proteins 0.000 description 9
- 108010080629 tryptophan-leucine Proteins 0.000 description 9
- 108010029384 tryptophyl-histidine Proteins 0.000 description 9
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 8
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 8
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 8
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 8
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 8
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 8
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 8
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 8
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 8
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 8
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 8
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 8
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 8
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 8
- LHMWTCWZARHLPV-CIUDSAMLSA-N Gln-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LHMWTCWZARHLPV-CIUDSAMLSA-N 0.000 description 8
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 8
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 8
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 8
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 8
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 8
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 8
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 8
- AHEBIAHEZWQVHB-QTKMDUPCSA-N His-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O AHEBIAHEZWQVHB-QTKMDUPCSA-N 0.000 description 8
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 8
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 8
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 8
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 8
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 8
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 8
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 8
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 8
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 8
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 8
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 8
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 8
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 8
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 8
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 8
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 8
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 8
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 8
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 8
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 8
- UTQBQJNSNXJNIH-IHPCNDPISA-N Trp-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N UTQBQJNSNXJNIH-IHPCNDPISA-N 0.000 description 8
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 8
- GHUNBABNQPIETG-MELADBBJSA-N Tyr-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O GHUNBABNQPIETG-MELADBBJSA-N 0.000 description 8
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 8
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 8
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 8
- 108010008355 arginyl-glutamine Proteins 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 108010047857 aspartylglycine Proteins 0.000 description 8
- 108010024607 phenylalanylalanine Proteins 0.000 description 8
- 108010015796 prolylisoleucine Proteins 0.000 description 8
- 210000002966 serum Anatomy 0.000 description 8
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 7
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 7
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 7
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 7
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 7
- 241000190569 Human papillomavirus type 68 Species 0.000 description 7
- 241001531237 Human papillomavirus type 70 Species 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 229960002566 papillomavirus vaccine Drugs 0.000 description 7
- 238000004062 sedimentation Methods 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 6
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 6
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 6
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 6
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 6
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 6
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 6
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 6
- WLBZWXXGSOLJBA-HOCLYGCPSA-N Trp-Gly-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 WLBZWXXGSOLJBA-HOCLYGCPSA-N 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010027338 isoleucylcysteine Proteins 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 5
- 241000701824 Human papillomavirus type 39 Species 0.000 description 5
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 5
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 5
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 108010060199 cysteinylproline Proteins 0.000 description 5
- 238000001493 electron microscopy Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000016784 immunoglobulin production Effects 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 4
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 4
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 4
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 4
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 4
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 4
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 4
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 4
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 4
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 4
- 101710135729 Major capsid protein L1 Proteins 0.000 description 4
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 4
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 4
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 4
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 4
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 4
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 4
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 4
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 4
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 4
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 4
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 4
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000011097 chromatography purification Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 239000002808 molecular sieve Substances 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 239000008363 phosphate buffer Substances 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 3
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 3
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 3
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 3
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 3
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 3
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 3
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 3
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 3
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 3
- KVPHTGVUMJGMCX-BIIVOSGPSA-N Asp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)C(=O)O KVPHTGVUMJGMCX-BIIVOSGPSA-N 0.000 description 3
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 3
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 3
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 3
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 3
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 3
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 3
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 3
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 3
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 3
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 3
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 3
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 3
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 3
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 3
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 3
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 3
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 3
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 3
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 3
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 3
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 3
- JVEKQAYXFGIISZ-HOCLYGCPSA-N His-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JVEKQAYXFGIISZ-HOCLYGCPSA-N 0.000 description 3
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 3
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 3
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 3
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 3
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 3
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 3
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 3
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 3
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 3
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 3
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 3
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 3
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 3
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 3
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 3
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 3
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 3
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 3
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 3
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 3
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 3
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 3
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 3
- PVSPJQWHEIQTEH-JYJNAYRXSA-N Met-Val-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PVSPJQWHEIQTEH-JYJNAYRXSA-N 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 3
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 3
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 3
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 3
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 3
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 3
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 3
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 3
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 3
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 3
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 3
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 3
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 3
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 3
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 3
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 3
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 3
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 3
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 3
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 3
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 3
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 3
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 3
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 3
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 3
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 3
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 3
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 3
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 3
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 3
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 3
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 3
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 3
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 3
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 3
- AWEGFIJXYWGBCA-XIRDDKMYSA-N Trp-His-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AWEGFIJXYWGBCA-XIRDDKMYSA-N 0.000 description 3
- IQXWAJUIAQLZNX-IHPCNDPISA-N Trp-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N IQXWAJUIAQLZNX-IHPCNDPISA-N 0.000 description 3
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 3
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 3
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 3
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 3
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 3
- WGHVMKFREWGCGR-SRVKXCTJSA-N Val-Arg-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WGHVMKFREWGCGR-SRVKXCTJSA-N 0.000 description 3
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 3
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 3
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 3
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 3
- CFIBZQOLUDURST-IHRRRGAJSA-N Val-Tyr-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N CFIBZQOLUDURST-IHRRRGAJSA-N 0.000 description 3
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010053037 kyotorphin Proteins 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 2
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 2
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 2
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 2
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 2
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- OFYVKOXTTDCUIL-FXQIFTODSA-N Asp-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OFYVKOXTTDCUIL-FXQIFTODSA-N 0.000 description 2
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 2
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 2
- HHABWQIFXZPZCK-ACZMJKKPSA-N Cys-Gln-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N HHABWQIFXZPZCK-ACZMJKKPSA-N 0.000 description 2
- CUXIOFHFFXNUGG-HTFCKZLJSA-N Cys-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CS)N CUXIOFHFFXNUGG-HTFCKZLJSA-N 0.000 description 2
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 2
- PNEAWXSKCKCHDK-XIRDDKMYSA-N Cys-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CS)N)C(O)=O)C1=CN=CN1 PNEAWXSKCKCHDK-XIRDDKMYSA-N 0.000 description 2
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 2
- 229940124897 Gardasil Drugs 0.000 description 2
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 2
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 2
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- ZGKXAUIVGIBISK-SZMVWBNQSA-N Glu-His-Trp Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]cn1)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O ZGKXAUIVGIBISK-SZMVWBNQSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 2
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 2
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 2
- 241000341655 Human papillomavirus type 16 Species 0.000 description 2
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- OEQKGSPBDVKYOC-ZKWXMUAHSA-N Ile-Gly-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OEQKGSPBDVKYOC-ZKWXMUAHSA-N 0.000 description 2
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 2
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 2
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 2
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 2
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 2
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 2
- 231100000645 Reed–Muench method Toxicity 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 2
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 2
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 2
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 2
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 2
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 2
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 2
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 2
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000740 bleeding effect Effects 0.000 description 2
- 210000005252 bulbus oculi Anatomy 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 239000007928 intraperitoneal injection Substances 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000003002 pH adjusting agent Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 239000012536 storage buffer Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 1
- XAGIMRPOEJSYER-CIUDSAMLSA-N Ala-Cys-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XAGIMRPOEJSYER-CIUDSAMLSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 1
- KGAJCJXBEWLQDZ-UBHSHLNASA-N Asp-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N KGAJCJXBEWLQDZ-UBHSHLNASA-N 0.000 description 1
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 239000012617 Butyl Sepharose™ 4 Fast Flow Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- ZMWOJVAXTOUHAP-ZKWXMUAHSA-N Cys-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N ZMWOJVAXTOUHAP-ZKWXMUAHSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- RKQAYOWLSFLJEE-SVSWQMSJSA-N Ile-Thr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N RKQAYOWLSFLJEE-SVSWQMSJSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- NQSFIPWBPXNJII-PMVMPFDFSA-N Lys-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 NQSFIPWBPXNJII-PMVMPFDFSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 1
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- MOQDPPUMFSMYOM-KKUMJFAQSA-N Ser-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N MOQDPPUMFSMYOM-KKUMJFAQSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 238000003917 TEM image Methods 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- GHXXDFDIDHIEIL-WFBYXXMGSA-N Trp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GHXXDFDIDHIEIL-WFBYXXMGSA-N 0.000 description 1
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 1
- LAIUAVGWZYTBKN-VHWLVUOQSA-N Trp-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O LAIUAVGWZYTBKN-VHWLVUOQSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 1
- MWUYSCVVPVITMW-IGNZVWTISA-N Tyr-Tyr-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 MWUYSCVVPVITMW-IGNZVWTISA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 239000003093 cationic surfactant Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002270 exclusion chromatography Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- IYDGMDWEHDFVQI-UHFFFAOYSA-N phosphoric acid;trioxotungsten Chemical compound O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.OP(O)(O)=O IYDGMDWEHDFVQI-UHFFFAOYSA-N 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000004262 preparative liquid chromatography Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 239000012557 regeneration buffer Substances 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940031351 tetravalent vaccine Drugs 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/025—Papovaviridae, e.g. papillomavirus, polyomavirus, SV40, BK virus, JC virus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20023—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20071—Demonstrated in vivo effect
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
돌연변이된 HPV39 L1 단백질 (또는 이의 변이체), 이를 암호화하는 서열, 제조 방법, 및 상기를 포함하는 바이러스-유사 입자를 개시하며, 여기에서 상기 단백질 (또는 이의 변이체) 및 상기 바이러스-유사 입자는 적어도 2개 타입의 HPV(예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 대한 중화 항체의 생성을 유도할 수 있고 따라서 이들을 상기 적어도 2개 타입의 HPV에 의한 감염, 상기 감염에 의해 유발된 질환, 예를 들어 자궁경부암 및 뾰족콘딜로마(condyloma acuminatum)의 예방에 사용할 수 있다. 본 발명은 또한 상기 적어도 2개 타입의 HPV에 의한 감염 및 상기 감염에 의해 유발된 질환, 예를 들어 자궁경부암 및 뾰족콘딜로마를 예방하기 위한 약학적 조성물 또는 백신의 제조에서 상기 단백질 및 상기 바이러스-유사 입자의 용도에 관한 것이다.
Description
본 발명은 분자 바이러스학 및 면역학 분야에 관한 것이다. 특히, 본 발명은 돌연변이된 HPV39 L1 단백질(또는 이의 변이체), 이를 암호화하는 서열, 이의 제조 방법 및 이를 포함하는 바이러스-유사 입자에 관한 것으로, 상기 단백질(또는 이의 변이체) 및 바이러스-유사 입자는 적어도 2개 타입(types)의 HPV(예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 대한 중화 항체의 생성을 유도할 수 있고 따라서 이들을 상기 적어도 2개 타입의 HPV에 의한 감염, 상기 감염에 의해 유발된 질환, 예를 들어 자궁경부암 및 뾰족콘딜로마(condyloma acuminatum)의 예방에 사용할 수 있다. 본 발명은 또한 상기 적어도 2개 타입의 HPV에 의한 감염 및 상기 감염에 의해 유발된 질환, 예를 들어 자궁경부암 및 뾰족콘딜로마를 예방하기 위한 약학적 조성물 또는 백신의 제조에서 상기 단백질 및 상기 바이러스-유사 입자의 용도에 관한 것이다.
인유두종 바이러스(Human Papillomavirus: HPV)는 주로 피부 및 점막에 사마귀를 유발한다. HPV 타입은 종양형성과의 관련성에 따라 고위험 타입 및 저위험 타입으로 분류된다. 이 중에서, 고위험 HPV 타입에 의한 감염은 여성에서 자궁경부암을 포함한 생식기 암의 주요 원인인 것으로 입증되었으며; 저위험 HPV 타입은 주로 뾰족콘딜로마를 유발한다. HPV 감염의 예방 및 억제에 가장 유효한 방법은 HPV 백신, 특히 자궁경부암을 일으키는 고위험 HPV 타입에 대한 백신을 접종하는 것이다.
HPV의 주요 캡시드 단백질 L1은 속이 빈 바이러스-유사 입자(Virus-Like Particle: VLP)로 자가조립하는 특성을 가지고 있다 (Doorbar, J. and P.H. Gallimore. 1987. J Virol, 61(9): 2793-9). HPV VLP는 주요 캡시드 단백질 L1의 72개 오량체로 구성된 대칭적인 정이십면체 구조를 가진다. HPV VLP는 구조 면에서 천연 HPV와 매우 유사하고, 천연 바이러스의 중화 에피토프 대부분을 유지하며, 고역가 중화 항체의 생성을 유도할 수 있다 (Kirnbauer, R., F. Booy, et al. 1992 Proc Natl Acad Sci U S A 89(24): 12180-4).
그러나, 기존 연구들은 HPV VLP가 주로 동일한 HPV 타입에 대한 중화 항체 생성을 유도하고, 동일한 HPV 타입에 대한 보호 면역을 생성하며, 매우 상동성이 높은 몇가지 HPV 타입들 간에는 낮은 교차-보호 효과만을 가진다 (Sara L. Bissett, Giada Mattiuzzo, et al. 2014 Vaccine. 32:6548-6555). 따라서, 기존의 HPV 백신들은 보호 범위가 매우 제한적이다. 일반적으로, 하나의 HPV 타입의 VLP는 동일한 HPV 타입에 의한 감염의 예방에만 사용될 수 있다. 이 경우에, HPV 백신의 보호 범위를 확대해야 하는 경우, 유일한 방법은 백신에 보다 많은 타입의 HPV의 VLP를 추가하는 것이다. 현재, Merck의 가다실®(HPV16, 18, 6 및 11에 대한 4가 백신), GSK의 서바릭스®(HPV16 및 18에 대한 2가 백신), 및 Merck의 가다실®9(HPV6, 11, 16, 18, 31, 33, 45, 52 및 58에 대한 9가 백신)를 포함하는 상업적으로 입수가능한 HPV 백신들은 다수의 HPV 타입의 VLP들을 혼합하여 제조된다. 그러나, 이와 같은 방법은 HPV 백신의 생산비용을 크게 증가시키고, 예방접종 용량의 증가로 인해 안전성 문제를 야기할 수 있다.
따라서, 다수의 HPV 타입에 의한 감염, 및 상기 감염에 의해 유발된 질환, 예를 들어 자궁경부암 및 뾰족콘딜로마를 보다 경제적이고 효과적으로 예방하기 위해, 다수의 HPV 타입에 대한 보호 중화 항체의 생성을 유도할 수 있는 HPV 바이러스-유사 입자의 개발이 당업계에서 시급하다.
본 발명은 적어도 부분적으로 본 발명자들의 놀라운 발견: 타입 39 인유두종 바이러스(HPV)의 특정 조각을 제2 타입 HPV (예를 들어 HPV68)의 L1 단백질의 상응하는 조각으로 치환 후에, 이에 따라 수득된 돌연변이된 HPV39 L1 단백질이 유기체에서 HPV39및 제2 타입 HPV (예를 들어 HPV68)에 대한 고-역가 중화 항체의 생성을 유도할 수 있으며, 이의 보호 효과는 HPV39 VLP 및 제2 타입 HPV의 VLP의 혼합물의 효과에 필적하고, HPV68에 대한 이의 보호 효과는 HPV68 VLP 단독의 경우에 필적하며, 제2 타입 HPV (예를 들어 HPV68)에 대한 이의 보호 효과는 제2 타입 HPV VLP 단독의 경우에 필적한다는 발견에 기초한다.
또한, 상기 치환에 기초하여, HPV39 L1 단백질의 다른 1개 또는 2개의 특정 조각은 제3 타입 HPV (예를 들어 HPV70)의 L1 단백질의 상응하는 조각으로 추가적으로 치환될 수 있고, 이에 따라 수득된 이중 치환을 갖는 돌연변이된 HPV39 L1 단백질은 HPV39, 제2 타입 HPV (예를 들어 HPV68) 및 제3 타입 HPV (예를 들어 HPV70)에 대한 고-역가 중화 항체의 생성을 유도할 수 있고; 이의 보호 효과는 HPV39 VLP, 제2 타입 HPV VLP 및 제3 타입 HPV VLP의 혼합물의 효과에 필적하고, HPV39에 대한 이의 보호 효과는 HPV39 VLP 단독의 경우에 필적하며, 제2 타입 HPV (예를 들어 HPV68)에 대한 이의 보호 효과는 제2 타입 HPV VLP 단독의 경우에 필적하고, 제3 타입 HPV (예를 들어 HPV70)에 대한 이의 보호 효과는 제3 타입 HPV VLP 단독의 경우에 필적한다.
따라서, 일 양상에서, 본 발명은 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 제공하며, 야생형 HPV39 L1 단백질과 비교하여, 상기 돌연변이된 HPV39 L1 단백질은 하기 돌연변이를 갖고:
(1) 1-25개 아미노산, 예를 들어, 1-5, 1-10, 1-15, 1-20, 5-15, 10-15, 10-20, 또는 15-20개 아미노산의 N-말단 절단; 및
(2) 상기 야생형 HPV39 L1 단백질의 269-288번 위치의 아미노산 잔기의, 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환;
상기 변이체는 상기 돌연변이된 HPV39 L1 단백질과 오직 하나 또는 그 이상 (예를 들어 1, 2, 3, 4, 5, 6, 7, 8 또는 9개) 아미노산의 치환 (바람직하게는 보존적 치환), 부가 또는 치환만이 상이하고, 상기 돌연변이된 HPV39 L1 단백질의 기능, 즉 적어도 2개 타입의 HPV (예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 대한 중화 항체의 생성을 유도하는 능력을 유지한다.
일부 바람직한 구체예에서, 상기 돌연변이된 HPV39 L1 단백질은 선택적으로, 추가로 하기 돌연변이를 갖는다:
(3)(a) 상기 야생형 HPV39 L1 단백질의 117-140번 위치의 아미노산 잔기의, 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환; 또는
(b) 상기 야생형 HPV39 L1 단백질의 169-181번 위치의 아미노산 잔기의, 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환; 또는
(c) 상기 야생형 HPV39 L1 단백질의 347-358번 위치의 아미노산 잔기의, 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환.
일부 바람직한 구체예에서, 상기 돌연변이된 L1 단백질은 야생형 HPV39 L1 단백질과 비교하여, N-말단에서 절단된 3, 5, 8, 10, 12, 15, 18, 20 또는 22개의 아미노산을 갖는다. 일부 바람직한 구체예에서, 상기 돌연변이된 HPV39 L1 단백질은 야생형 HPV39 L1 단백질과 비교하여, N-말단에서 절단된 15개의 아미노산을 갖는다.
일부 바람직한 구체예에서, 상기 제2 타입의 야생형 HPV는 HPV68이다. 일부 바람직한 구체예에서, 상기 (2)에 기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기이다. 일부 바람직한 구체예에서, 상기 제3 타입의 야생형 HPV는 HPV70이다. 일부 바람직한 구체예에서, 상기 (3)(a)에 기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 잔기이다. 일부 바람직한 구체예에서, 상기 (3)(b)에 기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV70 L1 단백질의 170-182번 위치의 아미노산 잔기이다. 일부 바람직한 구체예에서, 상기 (3)(c)에 기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV70 L1 단백질의 348-359번 위치의 아미노산 잔기이다.
일부 바람직한 구체예에서, 상기 야생형 HPV39 L1 단백질은 서열번호 1에 제시된 아미노산 서열을 갖는다.
일부 바람직한 구체예에서, 상기 야생형 HPV68 L1 단백질은 서열번호 2에 제시된 아미노산 서열을 갖는다.
일부 바람직한 구체예에서, 상기 야생형 HPV70 L1 단백질은 서열번호 3에 제시된 아미노산 서열을 갖는다.
일부 바람직한 구체예에서, 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기는 서열번호 25에 제시된 서열을 갖는다.
일부 바람직한 구체예에서, 야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 잔기는 서열번호 26에 제시된 서열을 갖는다.
일부 바람직한 구체예에서, 야생형 HPV70 L1 단백질의 170-182번 위치의 아미노산 잔기는 서열번호 27에 제시된 서열을 갖는다.
일부 바람직한 구체예에서, 야생형 HPV70 L1 단백질의 348-359번 위치의 아미노산 잔기는 서열번호 28에 제시된 서열을 갖는다.
일부 바람직한 구체예에서, 상기 돌연변이된 HPV39 L1 단백질은 서열번호 7, 10, 11 및 12로 이루어진 군으로부터 선택된 아미노산 서열을 갖는다.
또 다른 양상에서, 본 발명은 상기 기재된 바와 같은 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 암호화하는 단리된 핵산을 제공한다. 또 다른 양상에서, 본 발명은 상기 단리된 핵산을 포함하는 벡터를 제공한다. 일부 바람직한 구체예에서, 본 발명에 따른 상기 단리된 핵산은 서열번호 19, 22, 23 및 24로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 갖는다.
관심 폴리뉴클레오타이드의 삽입에 유용한 벡터는 클로닝 벡터 및 발현 벡터를 포함하지만 이에 제한되지 않으며 당업계에 잘 알려져 있다. 일 구체예에서, 상기 벡터는, 예를 들어 플라스미드, 코스미드, 파지 등이다.
또 다른 양상에서, 본 발명은 또한 상기 단리된 핵산 또는 벡터를 포함하는 숙주 세포에 관한 것이다. 상기 숙주 세포는 E. coli 세포와 같은 원핵생물 세포, 효모 세포, 곤충 세포, 식물 세포 및 동물 세포(예를 들어 포유동물 세포, 예를 들어 마우스 세포, 인간 세포 등)와 같은 진핵 세포를 포함하지만 이에 제한되는 것은 아니다. 본 발명에 따른 상기 숙주 세포는 또한 세포주, 예를 들어 293T 세포 및 293TT 세포일 수 있다.
또 다른 양상에서, 본 발명은 본 발명에 따른 돌연변이된 HPV39 L1 단백질 또는 그의 변이체를 포함하거나 또는 이들로 이루어지는 HPV 바이러스-유사 입자에 관한 것이다.
일부 바람직한 구체예에서, 본 발명에 따른 상기 HPV 바이러스-유사 입자는 N-말단에서 절단된 1-25개 아미노산, 예를 들어, 1-5, 1-10, 1-15, 1-20, 5-15, 10-15, 10-20 또는 15-20개 아미노산, 예를 들어 야생형 HPV39 L1 단백질과 비교하여, 3, 5, 8, 11, 13, 15, 18, 20 또는 22개의 아미노산, 및 야생형 HPV39 L1 단백질의 269-288번 위치의 아미노산 잔기의 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기에 의한 치환을 갖는 돌연변이된 HPV39 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 발명에 따른 상기 HPV 바이러스-유사 입자는 N-말단에서 절단된 1-25개 아미노산, 예를 들어, 1-5, 1-10, 1-15, 1-20, 5-15, 10-15, 10-20 또는 15-20개 아미노산, 예를 들어 야생형 HPV39 L1 단백질과 비교하여, 3, 5, 8, 11, 13, 15, 18, 20 또는 22개의 아미노산, 및 야생형 HPV39 L1 단백질의 269-288번 위치의 아미노산 잔기의 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기에 의한 치환, 및 야생형 HPV39 L1 단백질의 117-140번 위치의 아미노산 잔기의 야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 잔기에 의한 치환을 갖는 돌연변이된 HPV39 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 발명에 따른 상기 HPV 바이러스-유사 입자는 N-말단에서 절단된 1-25개 아미노산, 예를 들어, 1-5, 1-10, 1-15, 1-20, 5-15, 10-15, 10-20 또는 15-20개 아미노산, 예를 들어 야생형 HPV39 L1 단백질과 비교하여, 3, 5, 8, 11, 13, 15, 18, 20 또는 22개의 아미노산, 및 야생형 HPV39 L1 단백질의 269-288번 위치의 아미노산 잔기의 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기에 의한 치환, 및 야생형 HPV39 L1 단백질의 169-181번 위치의 아미노산 잔기의 야생형 HPV70 L1 단백질의 170-182번 위치의 아미노산 잔기에 의한 치환을 갖는 돌연변이된 HPV39 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 발명에 따른 상기 HPV 바이러스-유사 입자는 N-말단에서 절단된 1-25개 아미노산, 예를 들어, 1-5, 1-10, 1-15, 1-20, 5-15, 10-15, 10-20 또는 15-20개 아미노산, 예를 들어 야생형 HPV39 L1 단백질과 비교하여, 3, 5, 8, 11, 13, 15, 18, 20 또는 22개의 아미노산, 및 야생형 HPV39 L1 단백질의 269-288번 위치의 아미노산 잔기의 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기에 의한 치환, 및 야생형 HPV39 L1 단백질의 347-358번 위치의 아미노산 잔기의 야생형 HPV70 L1 단백질의 348-359번 위치의 아미노산 잔기에 의한 치환을 갖는 돌연변이된 HPV39 L1 단백질을 포함한다.
특정 바람직한 구체예에서, 본 발명에 따른 상기 HPV 바이러스-유사 입자는 서열번호 7, 10, 11 또는 12에 제시된 서열을 갖는 돌연변이된 HPV39 L1 단백질을 포함한다.
또 다른 양상에서, 본 발명은 또한 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체, 상기 단리된 핵산, 상기 벡터, 상기 숙주 세포 또는 상기 HPV 바이러스-유사 입자를 포함하는 조성물에 관한 것이다. 일부 바람직한 구체예에서, 상기 조성물은 본 발명에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 포함한다. 일부 바람직한 구체예에서, 상기 조성물은 본 발명에 따른 HPV 바이러스-유사 입자를 포함한다.
또 다른 양상에서, 본 발명은 또한 본 발명에 따른 HPV 바이러스-유사 입자 및 임의로 약학적으로 허용 가능한 담체 및/또는 부형제를 포함하는 약학적 조성물 또는 백신에 관한 것이다. 본 발명에 따른 약학적 조성물 또는 백신을 HPV 감염, 또는 HPV 감염에 의해 유발된 질환, 예를 들어 자궁경부암 및 뾰족콘딜로마의 예방에 사용할 수 있다.
일부 바람직한 구체예에서, 상기 HPV 바이러스-유사 입자는 HPV 감염 또는 HPV 감염에 의해 유발된 질환의 예방에 유효한 양으로 존재한다. 일부 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)이다. 일부 바람직한 구체예에서, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마로 이루어지는 군으로부터 선택된다.
본 발명에 따른 약학적 조성물 또는 백신은 당업계에 잘 알려진 방법, 예를 들어 경구 또는 주사에 의해 투여될 수 있지만 이에 제한되지 않는다. 본 발명에서, 특히 바람직한 투여 경로는 주사이다.
일부 바람직한 구체예에서, 본 발명에 따른 약학적 조성물 또는 백신을 단위 투여형으로 투여한다. 예를 들어, 본 발명을 제한하는 것은 아니지만, 각각의 단위 투여량은 5 ㎍ 내지 80 ㎍, 바람직하게는 20 ㎍ 내지 40 ㎍ 의 HPV 바이러스-유사 입자를 함유한다.
또 다른 양상에서, 본 발명은 상술한 바와 같은 돌연변이된 HPV39 L1 단백질 또는 이의 변이체의 제조 방법에 관한 것으로, 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 숙주 세포에서 발현시키는 단계, 및 그런 다음 상기 숙주 세포의 배양물로부터 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 회수하는 단계를 포함한다.
일부 바람직한 구체예에서, 상기 숙주 세포는 대장균(E. coli)이다.
일부 바람직한 구체예에서, 상기 방법은 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 E. coli에서 발현시키는 단계, 그런 다음 E. coli의 용해물 상층액을 정제함으로써 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 수득하는 단계를 포함한다. 일부 바람직한 구체예에서, 크로마토그래피(예를 들어 양이온-교환 크로마토그래피, 하이드록시아파타이트 크로마토그래피 및/또는 소수성 상호작용 크로마토그래피)에 의해 상기 E.coli의 용해물 상층액으로부터 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 회수한다.
또 다른 양상에서, 본 발명은 본 발명에 따른 HPV 바이러스-유사 입자를 약학적으로 허용 가능한 담체 및/또는 부형제와 혼합하는 단계를 포함하는 백신의 제조방법에 관한 것이다.
또 다른 양상에서, 본 발명은 HPV 감염 또는 HPV 감염에 의해 유발된 질환을 예방하는 방법에 관한 것으로, 대상체에 예방학적 유효량의 HPV 바이러스-유사 입자 또는 약학적 조성물 또는 백신을 투여하는 것을 포함한다. 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)이다. 또 다른 바람직한 구체예에서, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마를 포함하나 이에 제한되지 않는다. 또 다른 바람직한 구체예에서, 상기 대상체는 포유동물, 예를 들어 인간이다.
또 다른 양상에서, 본 발명은 또한 HPV 감염 또는 HPV 감염에 의해 유발된 질환의 예방을 위한 약학적 조성물 또는 백신의 제조에서 본 발명에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체 또는 HPV 바이러스-유사 입자의 용도에 관한 것이다. 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)이다. 또 다른 바람직한 구체예에서, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마를 포함하나 이에 제한되지 않는다.
또 다른 양상에서, 본 발명은 또한 HPV 감염 또는 HPV 감염에 의해 유발된 질환의 예방을 위한 본 발명에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체 또는 HPV 바이러스-유사 입자에 관한 것이다. 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)이다. 또 다른 바람직한 구체예에서, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마를 포함하나 이에 제한되지 않는다.
본 발명에서 용어의 정의
본 발명에서, 달리 명시되지 않는 한, 본 명세서에서 사용되는 과학 및 기술 용어들은 당업자에 의해 일반적으로 이해되는 의미를 갖는다. 더욱이, 본원에서 사용되는 세포 배양, 분자 유전학, 핵산 화학 및 면역학의 실험 작업들은 해당 분야에서 널리 사용되는 통상적인 작업들이다. 한편, 본 발명의 이해를 돕기 위해, 관련 용어의 정의 및 설명을 하기와 같이 제공한다.
본 발명에 따르면, 용어 "제2 타입의 야생형 HPV"는 HPV39 이외의 야생형 HPV 타입을 지칭한다. 본 발명에서, 제2 타입의 야생형 HPV는 바람직하게는 야생형 HPV68이다.
본 발명에 따르면, 용어 "제3 타입의 야생형 HPV"는 HPV39 및 제2 타입의 야생형 HPV 이외의 야생형 HPV 타입을 지칭한다. 본 발명에서, 제3 타입의 야생형 HPV는 바람직하게는 야생형 HPV70이다.
본 발명에 따르면, 표현 "상응하는 위치"는 서열들을 최적으로 정렬시킬 때, 즉 서열들을 가장 높은 백분율의 동일성이 획득되도록 정렬시킬 때 비교되는 상기 서열들의 등가(equivalent) 위치를 지칭한다.
본 발명에 따르면, 용어 "야생형 HPV39 L1 단백질"은 66형 인유두종 바이러스(HPV39)의 천연 주요 캡시드 단백질 L1을 지칭한다. 야생형 HPV39 L1 단백질의 서열은 당업계에 주지되어 있으며, 공개된 데이터베이스에서 찾을 수 있다 (예를 들어 NCBI 데이터베이스의 등록 번호 P24838.1, ARQ82617.1, AGU90549.1 및 AEP23084.1).
본 발명에서, 야생형 HPV39 L1 단백질의 아미노산 서열을 언급하는 경우, 이는 서열번호 1에 제시된 바와 같은 서열을 참조하여 설명된다. 예를 들어, 표현 "야생형 HPV39 L1 단백질의 53-61번 위치의 아미노산 잔기"는 서열번호 1에 제시된 바와 같은 폴리펩타이드의 53-61번 위치의 아미노산 잔기를 지칭한다. 그러나, 당업자는 야생형 HPV39가 다양한 단리물을 포함할 수 있으며 다양한 단리물들 간에 L1 단백질의 아미노산 서열의 차이가 있을 수도 있음을 이해한다. 더욱이, 당업자는 서열의 차이가 있을 수도 있지만, L1 단백질의 아미노산 서열은 상이한 HPV39 단리물들간에 매우 높은 동일성 (일반적으로 95% 초과, 예를 들어 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과)을 가지며, 실질적으로 동일한 생물학적 기능을 가짐을 이해한다. 따라서, 본 발명에서, 용어 "야생형 HPV39 L1 단백질"이란 용어는 서열번호 1에 제시된 바와 같은 단백질뿐만 아니라 다양한 HPV39 단리물의 L1 단백질 (예를 들어 P24838.1, ARQ82617.1, AGU90549.1 및 AEP23084.1로 제시되는 HPV39 L1 단백질)을 포함한다. 더욱이, 야생형 HPV39 L1 단백질의 서열 단편이 기술될 때, 이는 서열번호 1의 서열 단편뿐만 아니라, 다양한 HPV39 단리물의 L1 단백질의 상응하는 서열 단편도 포함한다. 예를 들어, 표현 "야생형 HPV39 L1 단백질의 53-61번 위치의 아미노산 잔기"는 서열번호 1의 53-61번 위치의 아미노산 잔기 및 다양한 HPV39 단리물의 L1 단백질의 상응하는 단편을 포함한다.
본 발명에 따르면, 용어 "야생형 HPV68 L1 단백질"은 56형 인유두종 바이러스(HPV68)의 천연 주요 캡시드 단백질 L1을 지칭한다. 야생형 HPV68 L1 단백질의 서열은 당업계에 주지되어 있으며, 공개된 데이터베이스에서 찾을 수 있다 (예를 들어 NCBI 데이터베이스의 등록 번호 AAZ39498.1, AGU90717.1, P4669.1 및 AGU90703.1).
본 발명에서, 야생형 HPV68 L1 단백질의 아미노산 서열을 언급하는 경우, 이는 서열번호 2에 제시된 바와 같은 서열을 참조하여 설명된다. 예를 들어, 표현 "야생형 HPV68 L1 단백질의 53-61번 위치의 아미노산 잔기"는 서열번호 2에 제시된 바와 같은 폴리펩타이드의 53-61번 위치의 아미노산 잔기를 지칭한다. 그러나, 당업자는 야생형 HPV68이 다양한 단리물을 포함할 수 있으며 다양한 단리물들 간에 L1 단백질의 아미노산 서열의 차이가 있을 수도 있음을 이해한다. 더욱이, 당업자는 서열의 차이가 있을 수도 있지만, L1 단백질의 아미노산 서열은 상이한 HPV68 단리물들간에 매우 높은 동일성 (일반적으로 95% 초과, 예를 들어 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과)을 가지며, 실질적으로 동일한 생물학적 기능을 가짐을 이해한다. 따라서, 본 발명에서, 용어 "야생형 HPV68 L1 단백질"이란 용어는 서열번호 2에 제시된 바와 같은 단백질뿐만 아니라 다양한 HPV68 단리물의 L1 단백질 (예를 들어 AAZ39498.1, AGU90717.1, P4669.1 및 AGU90703.1로 제시되는 HPV68 L1 단백질)을 포함한다. 더욱이, 야생형 HPV68 L1 단백질의 서열 단편이 기술될 때, 이는 서열번호 2의 서열 단편뿐만 아니라, 다양한 HPV68 단리물의 L1 단백질의 상응하는 서열 단편도 포함한다. 예를 들어, 표현 "야생형 HPV68 L1 단백질의 53-61번 위치의 아미노산 잔기"는 서열번호 2의 53-61번 위치의 아미노산 잔기 및 다양한 HPV68 단리물의 L1 단백질의 상응하는 단편을 포함한다.
본 발명에 따르면, 용어 "야생형 HPV70 L1 단백질"은 53형 인유두종 바이러스(HPV70)의 천연 주요 캡시드 단백질 L1을 지칭한다. 야생형 HPV70 L1 단백질의 서열은 당업계에 주지되어 있으며, 공개된 데이터베이스에서 찾을 수 있다 (예를 들어 NCBI 데이터베이스의 등록 번호 AGU90846.1, AGU90854.1, AAC54879.1 및 P50793.1).
본 발명에서, 야생형 HPV70 L1 단백질의 아미노산 서열을 언급하는 경우, 이는 서열번호 3에 제시된 바와 같은 서열을 참조하여 설명된다. 예를 들어, 표현 "야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 잔기"는 서열번호 3에 제시된 바와 같은 폴리펩타이드의 117-141번 위치의 아미노산 잔기를 지칭한다. 그러나, 당업자는 야생형 HPV70이 다양한 단리물을 포함할 수 있으며 다양한 단리물들 간에 L1 단백질의 아미노산 서열의 차이가 있을 수도 있음을 이해한다. 더욱이, 당업자는 서열의 차이가 있을 수도 있지만, L1 단백질의 아미노산 서열은 상이한 HPV70 단리물들간에 매우 높은 동일성 (일반적으로 95% 초과, 예를 들어 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과)을 가지며, 실질적으로 동일한 생물학적 기능을 가짐을 이해한다. 따라서, 본 발명에서, 용어 "야생형 HPV70 L1 단백질"이란 용어는 서열번호 3에 제시된 바와 같은 단백질뿐만 아니라 다양한 HPV70 단리물의 L1 단백질 (예를 들어 AGU90846.1, AGU90854.1, AAC54879.1 및 P50793.1로 제시되는 HPV70 L1 단백질)을 포함한다. 더욱이, 야생형 HPV70 L1 단백질의 서열 단편이 기술될 때, 이는 서열번호 3의 서열 단편뿐만 아니라, 다양한 HPV70 단리물의 L1 단백질의 상응하는 서열 단편도 포함한다. 예를 들어, 표현 "야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 잔기"는 서열번호 3의 117-141번 위치의 아미노산 잔기 및 다양한 HPV70 단리물의 L1 단백질의 상응하는 단편을 포함한다.
본 발명에 따르면, 표현 "상응하는 서열 단편" 또는 "상응하는 단편"은 서열들을 최적으로 정렬시킬 때, 즉 서열들을 가장 높은 백분율의 동일성이 획득되도록 정렬시킬 때 비교되는 상기 서열들의 등가(equivalent) 위치에 위치하는 단편을 지칭한다.
본 발명에 따르면, 표현 "X 아미노산의 N-말단 절단" 또는 "N-말단에서 절단된 X 아미노산을 가짐"은 단백질의 N-말단의 1 내지 X번 위치의 아미노산 잔기의, 개시 코돈 (단백질 번역을 개시하기 위한)에 의해 암호화된 메티오닌 잔기에 의한 치환을 지칭한다. 예를 들어 N-말단에서 절단된 15개 아미노산을 갖는 HPV39 L1 단백질은 야생형 HPV39 L1 단백질의 N-말단의 1 내지 15번 위치의 아미노산 잔기를, 개시 코돈에 의해 암호화된 메티오닌 잔기로 치환하여 얻으지는 단백질을 지칭한다.
본 발명에 따르면, 용어 "변이체"는 단백질의 아미노산 서열이 하나 이상 (예를 들어 1, 2, 3, 4, 5, 6, 7, 8 또는 9개) 아미노산의 치환 (바람직하게는 보존적 치환), 부가 또는 결실을 갖거나, 또는 본 발명에 따른 돌연변이된 HPV39 L1 단백질 (예를 들어 서열번호 7, 8, 9, 10 또는 11에 제시된 바와 같은 단백질)과 비교하여 적어도 90%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 가지며, 상기 돌연변이된 HPV39 L1 단백질의 기능을 유지하는 단백질을 지칭한다. 본 발명에서, 용어 "돌연변이된 HPV39 L1 단백질의 기능"이란 용어는 적어도 2개 타입의 HPV(예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 대한 중화 항체의 생성을 유도하는 능력을 지칭한다. 용어 "동일성(identity)"은 뉴클레오타이드 서열들 또는 아미노산 서열들 간의 유사성의 척도를 지칭한다. 일반적으로, 서열들은 최대 일치가 획득되도록 정렬되었다. "동일성"은 당업계에서 잘 알려진 의미를 가지며 공개된 알고리즘 (예를 들어 BLAST)에 의해 계산될 수 있다.
본 발명에 따르면, 용어 "동일성"은 2개의 폴리펩타이드 또는 2개의 핵산 간의 일치 정도를 지칭한다. 비교를 위한 2개의 서열이 특정 위치에서 염기 또는 아미노산의 동일한 단량체 서브유닛을 갖는 경우 (예를 들어 2개의 DNA 분자가 각각 특정한 위치에서 아데닌을 갖거나, 또는 2개의 폴리펩타이드가 각각 특정한 위치에서 리신을 갖는 경우), 상기 2개의 분자는 상기 부위에서 일치한다. 2개 서열 간의 동일성 백분율은 비교를 위한 부위의 총 수에 걸쳐 상기 2개 서열에 의해 공유된 일치하는 부위 수 x 100의 함수이다. 예를 들어 2개 서열의 10개 부위 중 6개가 일치하는 경우, 이들 2개 서열은 60%의 동일성을 갖는다. 예를 들어, DNA 서열: CTGACT 및 CAGGTT는 50%의 동일성을 공유한다 (6개 부위 중 3개가 일치). 일반적으로 2개 서열의 비교를 최대 일치를 생성시키는 방식으로 수행한다. 상기와 같은 정렬을 예를 들어 컴퓨터 프로그램, 예를 들어 Needleman, et al의 방법(J. Mol. Biol. 48:443-453, 1970)에 기초한 Align 프로그램 (DNAstar, Inc)을 사용하여 수행할 수 있다. 2개 아미노산 서열 간의 동일성 백분율은 또한, ALIGN 프로그램에 통합된 E. Meyers 및 W. Miller의 알고리즘 (Comput. Appl. Biosci., 4:11-17 (1988))을 사용하여 결정될 수 있고, 이는 PAM120 가중치 잔기 표를 사용하고, 12의 갭 길이 페널티 (gap length penalty) 및 4의 갭 페널티 (gap penalty)를 사용한다. 또한, 2개 아미노산 서열 간의 동일성 백분율은 GCG 소프트웨어 패키지 (http://www.gcg.com에서 사용가능)에서 GAP 프로그램에 통합된 Needleman 및 Wunsch의 알고리즘 (J. Mol. Biol. 48:443-453, 1970)을 사용하여 결정될 수 있고, 이는 Blossum 62 매트릭스 또는 PAM250 매트릭스를 사용하고, 16, 14, 12, 10, 8, 6, 또는 4의 갭 가중치 (gap weight) 및 1, 2, 3, 4, 5, 또는 6의 길이 가중치 (length weight)를 사용한다.
본원에서 사용되는, 용어 "보존적 치환"은 아미노산 서열을 포함하는 단백질/폴리펩타이드의 필수적인 성질에 불리한 영향을 미치거나 또는 상기 성질을 변화시키지 않는 아미노산 치환을 지칭한다. 예를 들어, 보존적 치환은 당업계에 공지된 표준 기술, 예를 들어 부위-지향된 돌연변이 유발 및 PCR-매개된 돌연변이 유발에 의해 도입시킬 수 있다. 보존적 아미노산 치환은 아미노산 잔기가 유사한 사이드 체인을 갖는 또 다른 아미노산 잔기, 예를 들어 상응하는 아미노산 잔기와 물리적으로 또는 기능적으로 유사한 (예를 들어 유사한 크기, 모양, 전하, 공유 결합 또는 수소 결합을 형성시키는 능력을 포함한 화학적 성질 등을 갖는) 잔기로 치환되는 치환을 포함한다. 유사한 사이드 체인을 갖는 아미노산 잔기의 패밀리(families)가 당업계에 정의되었다. 이들 패밀리는 염기성 사이드 체인을 갖는 아미노산 (예를 들어 리신, 아르기닌 및 히스티딘), 산성 사이드 체인을 갖는 아미노산 (예를 들어 아스파트산 및 글루탐산), 하전되지 않은 극성 사이드 체인을 갖는 아미노산(예를 들어 글리신, 아스파라진, 글루타민, 세린, 트레오닌, 티로신, 시스테인, 트립토판), 비극성 사이드 체인을 갖는 아미노산 (예를 들어 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌), β-분지된 사이드 체인을 갖는 아미노산 (예를 들어 트레오닌, 발린, 이소류신) 및 방향족 사이드 체인을 갖는 아미노산(예를 들어 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다. 따라서, 일반적으로 보존적 치환은 상응하는 아미노산 잔기의, 동일한 사이드 체인 패밀리로부터의 또 다른 아미노산 잔기에 의한 치환을 지칭한다. 아미노산 보존적 치환의 확인 방법은 당해 기술분야에 잘 알려져 있다 (예를 들어 Brummell et al., Biochem. 32: 1180-1187 (1993); [Kobayashi et al., Protein Eng. 12(10): 879-884 (1999); 및 Burks et al., Proc. Natl. Acad. Sci. USA 94: 412-417 (1997), 이는 본원에 참조로 포함됨).
본 발명에 따르면, 용어 "E.coli 발현 시스템"은 E.coli(균주) 및 벡터로 이루어지는 발현 시스템을 지칭하며, 여기에서 상기 E.coli (균주)는 상업적으로 입수할 수 있는 균주로부터 유래하고, ER2566, BL21 (DE3), B834 (DE3), 및 BLR (DE3)을 포함하나 이에 제한되지 않는다.
본 발명에 따르면, 용어 "벡터"는 삽입된 폴리뉴클레오티드를 가질 수 있는 핵산 운반체 도구를 지칭한다. 벡터가 삽입된 폴리뉴클레오티드에 의해 암호화된 단백질의 발현을 허용하는 경우, 상기 벡터를 발현 벡터라 한다. 상기 벡터는 숙주 세포 내로의 형질전환, 형질도입 또는 형질감염에 의해 상기 숙주 세포에서 발현되는 운반되는 유전물질 요소를 가질 수 있다. 벡터는 당업자에게 잘 알려져 있으며, 플라스미드, 파지, 코스미드 등을 포함하나 이에 제한되지 않는다.
본 발명에 따르면, 용어 "약학적으로 허용가능한 담체 및/또는 부형제"는 대상체 및 활성 성분에 약물학적으로 및/또는 생리학적으로 적합한 담체 및/또는 부형제를 지칭하며, 이들은 당업계에 주지되어 있고 (예를 들어, Remington's Pharmaceutical Sciences. Edited by Gennaro AR, 19th ed. Pennsylvania: Mack Publishing Company, 1995), pH 조절제, 계면활성제, 항원보강제, 및 이온 강도 증강제를 포함하나 이에 제한되지 않는다. 예를 들어, pH 조절제는 포스페이트 버퍼를 포함하나 이에 제한되지 않고; 계면활성제는 양이온 계면활성제, 음이온 계면활성제, 또는 비-이온성 계면활성제, 예를 들어 트윈-80을 포함하나 이에 제한되지 않고; 어쥬번트는 알루미늄 어쥬번트(예를 들어 수산화 알루미늄), 및 프로인트 어쥬번트(예를 들어 프로인트 완전 어쥬번트)를 포함하나 이에 제한되지 않고; 이온 강도 증강제는 NaCl을 포함하나 이에 제한되지 않는다.
본 발명에 따르면, 용어 "유효량"은 의도하는 목적을 유효하게 성취할 수 있는 양을 지칭한다. 예를 들어, 질환 (예를 들어 HPV 감염) 예방 유효량은 질환 (예를 들어 HPV 감염)의 발생을 예방하거나, 억제하거나 또는 지연시키기에 유효한 양을 지칭한다. 상기와 같은 유효량의 측정은 당업자의 능력 내에 있다.
본 발명에 따르면, 용어 "크로마토그래피"는 이온 교환 크로마토그래피 (예를 들어 양이온 교환 크로마토그래피), 소수성 상호작용 크로마토그래피, 흡수성 크로마토그래피 (예를 들어 하이드록시아파타이트 크로마토그래피), 젤 여과 크로마토그래피 (젤 배제 크로마토그래피), 및 친화성 크로마토그래피를 포함하나 이에 제한되지 않는다.
본 발명에 따르면, 용어 "용해물 상층액(lysate supernatant)"은 다음의 단계에 의해 생성된 용액을 지칭한다: 숙주 세포 (예를 들어 E.coli)를 용해 버퍼에서 파쇄시키고, 이어서 불용성 물질을 상기 파쇄된 숙주 세포를 함유하는 용해된 용액으로부터 제거한다. 다양한 용해 버퍼가 당업계에 주지되어 있으며, 트리스 버퍼, 포스페이트 버퍼, HEPES 버퍼, MOPS 버퍼 등을 포함하나 이에 제한되는 것은 아니다. 또한, 숙주 세포의 파쇄는 당업자에 의해 균질화 파쇄, 초음파 처리, 분쇄, 고압 압출, 리소자임 처리 등을 포함하나 이에 제한되지 않는 주지된 방법에 의해 달성될 수 있다. 불용성 물질의 제거 방법 또한, 당업자에게 잘 알려져 있고 여과 및 원심분리를 포함하나 이에 제한되지 않는다.
연구에 따르면 HPV39 및 다른 HPV 타입(들)(예를 들어 HVP68 및 HPV70) 간에 어느 정도의 교차-보호가 존재하지만, 이러한 교차-보호는 매우 낮으며, 일반적으로 동일한 HPV 타입의 보호 수준의 1% 미만, 심지어는 1000 분의 1에 불과하다. 따라서, HPV39 백신을 접종 받은 피험자는 여전히 다른 HPV 타입(들)(예를 들어 HPV68 및 HPV70)에 의해 감염될 위험이 높다.
본 발명은 돌연변이된 HPV39 L1 단백질 및 이에 의해 형성된 HPV 바이러스-유사 입자를 제공한다. 본 발명에 따른 HPV 바이러스-유사 입자는 HPV39 및 다른 HPV 타입(들)(예를 들어 HPV68 및 HPV70)에 대해 현저한 교차-보호를 제공할 수 있다. 특히, 동일한 예방접종 용량에서, 본 발명에 따른 HPV 바이러스-유사 입자는 유기체에서 적어도 2개 타입의 HPV(예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 대해 고-역가 중화 항체의 생성을 유도할 수 있으며, 그 효과는 다수 HPV 타입의 VLP의 혼합물(예를 들어 HPV39 VLP 및 HPV68 VLP의 혼합물, 또는 HPV39 VLP, HPV68 VLP 및 HPV70 VLP의 혼합물)의 효과와 비슷하다. 따라서, 본 발명에 따른 HPV 바이러스-유사 입자는 동시에 적어도 2개 타입의 HPV(예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 의한 감염뿐만 아니라 상기 감염과 관련된 질환을 예방할 수 있으며, 현저하게 이로운 기술적 효과를 가진다. 이는 특히 HPV 백신의 보호 범위의 확대 및 HPV 백신의 생산 비용을 줄이는 측면에서 상당한 이점을 갖는다.
본 발명의 구체예는 도면 및 실시예를 참조하여 더욱 상세하게 설명된다. 그러나, 당업자는 하기 도면 및 실시예가 본 발명의 범위를 한정하기 보다는 단지 본 발명을 설명하기 위한 것임을 이해할 것이다. 하기 도면 및 바람직한 실시예의 상세한 설명에 따르면, 본 발명의 다양한 목적 및 이점들은 당업자에게 자명하다.
도 1은 실시예 1의 정제된 돌연변이된 단백질의 SDS-PAGE 결과를 나타낸다. 레인 1: 단백질 분자량 마커; 레인 2: HPV39N15 (N-말단에서 절단된 15개 아미노산을 갖는 HPV39 L1 단백질); 레인 3: HPV68N0 (N-말단에서 절단된 0개 아미노산을 갖는 HPV68 L1 단백질, 즉, 전장 야생형 HPV68 L1 단백질); 레인 4: H39N15-68T1; 레인 5: H39N15-68T2; 레인 6: H39N15-68T3; 레인 7: H39N15-68T4; 레인 8: H39N15-68T5; 레인 9: 단백질 분자량 마커; 레인 10: H39N15-68T4; 레인 11: HPV70N10 (N-말단에서 절단된 10개 아미노산을 갖는 HPV70 L1 단백질); 레인 12: H39N15-68T4-70S1; 레인 13: H39N15-68T4-70S2; 레인 14: H39N15-68T4-70S3; 레인 15: H39N15-68T4-70S5. 상기 결과는 크로마토그래피 정제 후, H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5 단백질이 약 90%의 순도를 가짐을 보였다.
도 2는 HPV L1 광범위 항체 4B3을 사용하여 결정된, 실시예 1에서 준비한 돌연변이된 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5의 웨스턴 블롯 결과를 나타낸다. 레인 1: HPV39N15; 레인 2: HPV68N0; 레인 3: H39N15-68T1; 레인 4: H39N15-68T2; 레인 5: H39N15-68T3; 레인 6: H39N15-68T4; 레인 7: H39N15-68T5; 레인 8: H39N15-68T4; 레인 9: HPV70N10; 레인 10: H39N15-68T4-70S1; 레인 11: H39N15-68T4-70S2; 레인 12: H39N15-68T4-70S3; 레인 13: H39N15-68T4-70S5. 상기 결과는 돌연변이된 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5가 광범위 항체 4B3에 의해 특이적으로 인식될 수 있음을 보였다.
도 3은 단백질 HPV39N15, H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, 및 H39N15-68T5를 포함하는 샘플들을 분자체 크로마토그래피(molecular sieve chromatography)로 분석한 결과를 나타낸다. 상기 결과는 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, 또는 H39N15-68T5를 포함하는 샘플들의 첫번째 단백질 피크가 약 13-14분째에 나타났으며, 이는 HPV39N15의 경우에 필적함을 보였다. 이는 이들 돌연변이된 단백질들이 모두 VLP로 조립될 수 있음을 나타낸다.
도 4는 단백질 HPV39N15, HPV68L1N0, HPV70N10, H39N15-68T4, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5을 포함하는 샘플들을 분자체 크로마토그래피로 분석한 결과를 나타낸다. 상기 결과는 단백질 H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 또는 H39N15-68T4-70S5를 포함하는 샘플들의 첫번째 단백질 피크가 약 13-14분째에 나타났으며, 이는 HPV39N15, HPV68L1N0, HPV70N10 및 H39N15-68T4 VLP의 경우에 필적함을 보였다. 이는 이들 돌연변이된 단백질들이 모두 VLP로 조립될 수 있음을 나타낸다.
도 5A-5L은 HPV39N15 VLP, HPV68L1N0 VLP, HPV70N10 VLP, H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, H39N15-68T5 VLP, H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP의 침강 속도 분석 결과를 나타낸다. 도 5A, HPV39N15 VLP; 도 5B, HPV68L1N0 VLP; 도 5C, H39N15-68T1 VLP; 도 5D, H39N15-68T2 VLP; 도 5E, H39N15-68T3 VLP; 도 5F, H39N15-68T4 VLP; 도 5G, H39N15-68T5 VLP; 도 5H, HPV70N10 VLP; 도 5I, H39N15-68T4-70S1 VLP; 도 5J, H39N15-68T4-70S2 VLP; 도 5K, H39N15-68T4-70S3 VLP; 도 5L, H39N15-68T4-70S5 VLP. 상기 결과는 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, H39N15-68T5 VLP, H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP의 침강 계수가 각각 136S, 151S, 138S, 145S, 135S, 124S, 108S, 99S 및 127S임을 보였다. 이는 돌연변이된 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 및 H39N15-68T4-70S5가 크기 및 형태 면에서 야생형 VLP (HPV39N15 VLP, 115S; HPV68N0 VLP, 153S; HPV70N10 VLP, 144S)와 유사한 바이러스-유사 입자로 조립될 수 있음을 나타낸다.
도 6A-6L은 다양한 VLP 샘플의 TEM 사진 (100,000 x 배율로 촬영됨, Bar=0.1μm)을 나타낸다. 도6A, HPV39N15 VLP; 도6B, HPV68L1N0 VLP; 도 6C, HPV70N10 VLP; 도 6D, H39N15-68T1 VLP; 도 6E, H39N15-68T2 VLP; 도 6F, H39N15-68T3 VLP; 도 6G, H39N15-68T4 VLP; 도 6H, H39N15-68T5 VLP; 도 6I, H39N15-68T4-70S1 VLP; 도 6J, H39N15-68T4-70S2 VLP; 도 6K, H39N15-68T4-70S3 VLP; 도 6L, H39N15-68T4-70S5 VLP. 상기 결과는 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5가 HPV39N15, HPV68L1N0 및 HPV70N10와 유사하고, 약 25-30 nm의 반경을 갖는 VLP로 조립될 수 있음을 보였다.
도 7A-7C는 마우스를 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, 또는 H39N15-68T5 VLP로 접종한 후 마우스 혈청 내 중화 항체 역가 결과를 나타낸다. 도 7A: 알루미늄 어쥬번트 그룹 1(면역화 용량 5 μg, 알루미늄 어쥬번트 사용); 도 7B: 알루미늄 어쥬번트 그룹 2 (면역화 용량 1 μg, 알루미늄 어쥬번트 사용); 도 7C: 알루미늄 어쥬번트 그룹 3 (면역화 용량 0.2 μg, 알루미늄 어쥬번트 사용). 상기 결과는 H39N15-68T4 VLP가 마우스에서 HPV39에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV39N15 VLP 단독의 경우보다 살짝 약했지만, 동일한 용량에서 HPV68N0 VLP 단독의 경우보다 현저하게 더 높고; 마우스에서 HPV68에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV68N0 VLP 단독의 경우보다 살짝 약했지만, 동일한 용량에서 HPV39N15 VLP 단독의 경우보다 현저하게 더 높음을 보였다. 이는 H39N15-68T4 VLP가 HPV39 및 HPV68에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
도 8A-8C는 마우스를 H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP, 및 H39N15-68T4-70S5 VLP로 접종한 후 마우스 혈청 내 중화 항체 역가 결과를 나타낸다. 도 8A: 알루미늄 어쥬번트 그룹 1(면역화 용량 5 μg, 알루미늄 어쥬번트 사용); 도 8B: 알루미늄 어쥬번트 그룹 2 (면역화 용량 1 μg, 알루미늄 어쥬번트 사용); 도 8C: 알루미늄 어쥬번트 그룹 3 (면역화 용량 0.2 μg, 알루미늄 어쥬번트 사용). 상기 결과는 H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5 VLP가 마우스에서 HPV39에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이들의 보호 효과는 동일한 용량의 HPV39N15 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우보다 살짝 약했지만, 동일한 용량에서 HPV68N0 VLP 단독 및 HPV70N10 VLP의 경우보다 현저히 높고; 마우스에서 HPV68에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV68N0 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 효과에 필적하며, 동일한 용량의 HPV39N15 VLP 단독 및 HPV70N10 VLP의 경우보다 현저히 높고; 마우스에서 HPV70에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV70N10 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 효과에 필적하며, 동일한 용량에서 HPV39N15 VLP 단독 및 HPV68N0 VLP 단독의 경우보다 현저히 높음을 보였다. 이는 H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP가 HPV39, HPV68 및 HPV70에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
도 9는 HPV39N15 VLP, HPV68N0 VLP, HPV70N10 VLP, H39N15-68T4 VLP, H39N15-68T4-70S2 VLP, 및 H39N15-68T4-70S5 VLP의 열안정성 검측 결과를 나타내며, A는 HPV39N15 VLP의 열안정성 검측 결과를 나타내고; B는 HPV68L1N0 VLP의 열안정성 검측 결과를 나타내고; C는 HPV70N10 VLP의 열안정성 검측 결과를 나타내고; D는 H39N15-68T4 VLP VLP의 열안정성 검측 결과를 나타내고; E는 H39N15-68T4-70S2 VLP의 열안정성 검측 결과를 나타내고; F는 H39N15-68T4-70S5 VLP의 열안정성 검측 결과를 나타낸다. 상기 결과는 이들 단백질에 의해 형성된 모든 VLP들이 매우 높은 열안정성을 가짐을 나타낸다.
도 10은 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 초저온-전자 현미경법(cryo-EM) 사진 및 복원된 3차원 구조를 나타내며, A는 H39N15-68T4-70S2 VLP의 초저온-전자 현미경법 사진을 나타내고; B는 H39N15-68T4-70S2 VLP의 복원된 3차원 구조를 나타내고; C는 H39N15-68T4-70S5 VLP의 초저온-전자 현미경법 사진을 나타내고; D는 H39N15-68T4-70S5 VLP의 복원된 3차원 구조를 나타낸다. 상기 복원된 3차원 구조는 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP 둘 다 72개 캡소머(capsomers)(형태학적 서브유닛, 펜타머)를 가진 T=7 정이십면체 구조 (h=1, k=2)를 가짐을 보였다. 준평형 원리 (quasi-equivalence)와 일치하는 전통적인 정이십면체 바이러스 캡시드와 달리, H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 구조에서 모든 구성요소 서브유닛은 헥사머가 없는 펜타머였다. 더욱이, 상기 2개 VLP들은 55 nm의 외부 직경을 가졌다. 이는 이전에 보고된 천연 HPV 바이러스 입자 및 진핵 발현 시스템 (예를 들어 폭스바이러스 발현 시스템)에서 제조된 HPV VLP의 3차원 구조와 유사했다 (Baker TS, Newcomb WW, Olson NH. et al. Biophys J. (1991), 60(6): 1445-1456. Hagensee ME, Olson NH, Baker TS, et al. J Virol. (1994), 68(7):4503-4505. Buck CB, Cheng N, Thompson CD. et al. J Virol. (2008), 82(11): 5190-7).
도 2는 HPV L1 광범위 항체 4B3을 사용하여 결정된, 실시예 1에서 준비한 돌연변이된 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5의 웨스턴 블롯 결과를 나타낸다. 레인 1: HPV39N15; 레인 2: HPV68N0; 레인 3: H39N15-68T1; 레인 4: H39N15-68T2; 레인 5: H39N15-68T3; 레인 6: H39N15-68T4; 레인 7: H39N15-68T5; 레인 8: H39N15-68T4; 레인 9: HPV70N10; 레인 10: H39N15-68T4-70S1; 레인 11: H39N15-68T4-70S2; 레인 12: H39N15-68T4-70S3; 레인 13: H39N15-68T4-70S5. 상기 결과는 돌연변이된 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5가 광범위 항체 4B3에 의해 특이적으로 인식될 수 있음을 보였다.
도 3은 단백질 HPV39N15, H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, 및 H39N15-68T5를 포함하는 샘플들을 분자체 크로마토그래피(molecular sieve chromatography)로 분석한 결과를 나타낸다. 상기 결과는 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, 또는 H39N15-68T5를 포함하는 샘플들의 첫번째 단백질 피크가 약 13-14분째에 나타났으며, 이는 HPV39N15의 경우에 필적함을 보였다. 이는 이들 돌연변이된 단백질들이 모두 VLP로 조립될 수 있음을 나타낸다.
도 4는 단백질 HPV39N15, HPV68L1N0, HPV70N10, H39N15-68T4, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5을 포함하는 샘플들을 분자체 크로마토그래피로 분석한 결과를 나타낸다. 상기 결과는 단백질 H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 또는 H39N15-68T4-70S5를 포함하는 샘플들의 첫번째 단백질 피크가 약 13-14분째에 나타났으며, 이는 HPV39N15, HPV68L1N0, HPV70N10 및 H39N15-68T4 VLP의 경우에 필적함을 보였다. 이는 이들 돌연변이된 단백질들이 모두 VLP로 조립될 수 있음을 나타낸다.
도 5A-5L은 HPV39N15 VLP, HPV68L1N0 VLP, HPV70N10 VLP, H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, H39N15-68T5 VLP, H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP의 침강 속도 분석 결과를 나타낸다. 도 5A, HPV39N15 VLP; 도 5B, HPV68L1N0 VLP; 도 5C, H39N15-68T1 VLP; 도 5D, H39N15-68T2 VLP; 도 5E, H39N15-68T3 VLP; 도 5F, H39N15-68T4 VLP; 도 5G, H39N15-68T5 VLP; 도 5H, HPV70N10 VLP; 도 5I, H39N15-68T4-70S1 VLP; 도 5J, H39N15-68T4-70S2 VLP; 도 5K, H39N15-68T4-70S3 VLP; 도 5L, H39N15-68T4-70S5 VLP. 상기 결과는 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, H39N15-68T5 VLP, H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP의 침강 계수가 각각 136S, 151S, 138S, 145S, 135S, 124S, 108S, 99S 및 127S임을 보였다. 이는 돌연변이된 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 및 H39N15-68T4-70S5가 크기 및 형태 면에서 야생형 VLP (HPV39N15 VLP, 115S; HPV68N0 VLP, 153S; HPV70N10 VLP, 144S)와 유사한 바이러스-유사 입자로 조립될 수 있음을 나타낸다.
도 6A-6L은 다양한 VLP 샘플의 TEM 사진 (100,000 x 배율로 촬영됨, Bar=0.1μm)을 나타낸다. 도6A, HPV39N15 VLP; 도6B, HPV68L1N0 VLP; 도 6C, HPV70N10 VLP; 도 6D, H39N15-68T1 VLP; 도 6E, H39N15-68T2 VLP; 도 6F, H39N15-68T3 VLP; 도 6G, H39N15-68T4 VLP; 도 6H, H39N15-68T5 VLP; 도 6I, H39N15-68T4-70S1 VLP; 도 6J, H39N15-68T4-70S2 VLP; 도 6K, H39N15-68T4-70S3 VLP; 도 6L, H39N15-68T4-70S5 VLP. 상기 결과는 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5가 HPV39N15, HPV68L1N0 및 HPV70N10와 유사하고, 약 25-30 nm의 반경을 갖는 VLP로 조립될 수 있음을 보였다.
도 7A-7C는 마우스를 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, 또는 H39N15-68T5 VLP로 접종한 후 마우스 혈청 내 중화 항체 역가 결과를 나타낸다. 도 7A: 알루미늄 어쥬번트 그룹 1(면역화 용량 5 μg, 알루미늄 어쥬번트 사용); 도 7B: 알루미늄 어쥬번트 그룹 2 (면역화 용량 1 μg, 알루미늄 어쥬번트 사용); 도 7C: 알루미늄 어쥬번트 그룹 3 (면역화 용량 0.2 μg, 알루미늄 어쥬번트 사용). 상기 결과는 H39N15-68T4 VLP가 마우스에서 HPV39에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV39N15 VLP 단독의 경우보다 살짝 약했지만, 동일한 용량에서 HPV68N0 VLP 단독의 경우보다 현저하게 더 높고; 마우스에서 HPV68에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV68N0 VLP 단독의 경우보다 살짝 약했지만, 동일한 용량에서 HPV39N15 VLP 단독의 경우보다 현저하게 더 높음을 보였다. 이는 H39N15-68T4 VLP가 HPV39 및 HPV68에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
도 8A-8C는 마우스를 H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP, 및 H39N15-68T4-70S5 VLP로 접종한 후 마우스 혈청 내 중화 항체 역가 결과를 나타낸다. 도 8A: 알루미늄 어쥬번트 그룹 1(면역화 용량 5 μg, 알루미늄 어쥬번트 사용); 도 8B: 알루미늄 어쥬번트 그룹 2 (면역화 용량 1 μg, 알루미늄 어쥬번트 사용); 도 8C: 알루미늄 어쥬번트 그룹 3 (면역화 용량 0.2 μg, 알루미늄 어쥬번트 사용). 상기 결과는 H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5 VLP가 마우스에서 HPV39에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이들의 보호 효과는 동일한 용량의 HPV39N15 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우보다 살짝 약했지만, 동일한 용량에서 HPV68N0 VLP 단독 및 HPV70N10 VLP의 경우보다 현저히 높고; 마우스에서 HPV68에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV68N0 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 효과에 필적하며, 동일한 용량의 HPV39N15 VLP 단독 및 HPV70N10 VLP의 경우보다 현저히 높고; 마우스에서 HPV70에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV70N10 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 효과에 필적하며, 동일한 용량에서 HPV39N15 VLP 단독 및 HPV68N0 VLP 단독의 경우보다 현저히 높음을 보였다. 이는 H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP가 HPV39, HPV68 및 HPV70에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
도 9는 HPV39N15 VLP, HPV68N0 VLP, HPV70N10 VLP, H39N15-68T4 VLP, H39N15-68T4-70S2 VLP, 및 H39N15-68T4-70S5 VLP의 열안정성 검측 결과를 나타내며, A는 HPV39N15 VLP의 열안정성 검측 결과를 나타내고; B는 HPV68L1N0 VLP의 열안정성 검측 결과를 나타내고; C는 HPV70N10 VLP의 열안정성 검측 결과를 나타내고; D는 H39N15-68T4 VLP VLP의 열안정성 검측 결과를 나타내고; E는 H39N15-68T4-70S2 VLP의 열안정성 검측 결과를 나타내고; F는 H39N15-68T4-70S5 VLP의 열안정성 검측 결과를 나타낸다. 상기 결과는 이들 단백질에 의해 형성된 모든 VLP들이 매우 높은 열안정성을 가짐을 나타낸다.
도 10은 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 초저온-전자 현미경법(cryo-EM) 사진 및 복원된 3차원 구조를 나타내며, A는 H39N15-68T4-70S2 VLP의 초저온-전자 현미경법 사진을 나타내고; B는 H39N15-68T4-70S2 VLP의 복원된 3차원 구조를 나타내고; C는 H39N15-68T4-70S5 VLP의 초저온-전자 현미경법 사진을 나타내고; D는 H39N15-68T4-70S5 VLP의 복원된 3차원 구조를 나타낸다. 상기 복원된 3차원 구조는 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP 둘 다 72개 캡소머(capsomers)(형태학적 서브유닛, 펜타머)를 가진 T=7 정이십면체 구조 (h=1, k=2)를 가짐을 보였다. 준평형 원리 (quasi-equivalence)와 일치하는 전통적인 정이십면체 바이러스 캡시드와 달리, H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 구조에서 모든 구성요소 서브유닛은 헥사머가 없는 펜타머였다. 더욱이, 상기 2개 VLP들은 55 nm의 외부 직경을 가졌다. 이는 이전에 보고된 천연 HPV 바이러스 입자 및 진핵 발현 시스템 (예를 들어 폭스바이러스 발현 시스템)에서 제조된 HPV VLP의 3차원 구조와 유사했다 (Baker TS, Newcomb WW, Olson NH. et al. Biophys J. (1991), 60(6): 1445-1456. Hagensee ME, Olson NH, Baker TS, et al. J Virol. (1994), 68(7):4503-4505. Buck CB, Cheng N, Thompson CD. et al. J Virol. (2008), 82(11): 5190-7).
본 발명에 관련된 서열들 중 일부를 하기 표 1에 제공한다.
서열번호 | 설명 |
1 | 야생형 HPV39 L1 단백질 |
2 | 야생형 HPV68 L1 단백질, HPV68N0 |
3 | 야생형 HPV70 L1 단백질 |
4 | HPV68 L1 단백질의 조각 1을 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T1 |
5 | HPV68 L1 단백질의 조각 2를 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T2 |
6 | HPV68 L1 단백질의 조각 3을 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T3 |
7 | HPV68 L1 단백질의 조각 4를 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T4 |
8 | HPV68 L1 단백질의 조각 5를 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T5 |
9 | HPV68 L1 단백질의 조각 4 및 HPV70 L1 단백질의 조각 1을 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T4-70S1 |
10 | HPV68 L1 단백질의 조각 4 및 HPV70 L1 단백질의 조각 2를 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T4-70S2 |
11 | HPV68 L1 단백질의 조각 4 및 HPV70 L1 단백질의 조각 3을 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T4-70S3 |
12 | HPV68 L1 단백질의 조각 4 및 HPV70 L1 단백질의 조각 5을 포함하는 돌연변이된 HPV39 L1 단백질, H39N15-68T4-70S5 |
13 | 서열번호 1을 암호화하는 DNA 서열 |
14 | 서열번호 2를 암호화하는 DNA 서열 |
15 | 서열번호 3을 암호화하는 DNA 서열 |
16 | 서열번호 4를 암호화하는 DNA 서열 |
17 | 서열번호 5를 암호화하는 DNA 서열 |
18 | 서열번호 6을 암호화하는 DNA 서열 |
19 | 서열번호 7을 암호화하는 DNA 서열 |
20 | 서열번호 8을 암호화하는 DNA 서열 |
21 | 서열번호 9를 암호화하는 DNA 서열 |
22 | 서열번호 10을 암호화하는 DNA 서열 |
23 | 서열번호 11을 암호화하는 DNA 서열 |
24 | 서열번호 12를 암호화하는 DNA 서열 |
25 | 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 서열, 즉 HPV68 L1 단백질의 조각 4 |
26 | 야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 서열, 즉 HPV70 L1 단백질의 조각 2 |
27 | 야생형 HPV70 L1 단백질의 170-182번 위치의 아미노산 서열, 즉 HPV70 L1 단백질의 조각 3 |
28 | 야생형 HPV70 L1 단백질의 348-359번 위치의 아미노산 서열, 즉 HPV70 L1 단백질의 조각 5 |
29 | N-말단에서 절단된 15개 아미노산을 갖는 HPV39 L1 단백질, HPV39N15 |
30 | 서열번호 29를 암호화하는 DNA 서열 |
31 | N-말단에서 절단된 10개 아미노산을 갖는 HPV70 L1 단백질, HPV70N10 |
32 | 서열번호 31을 암호화하는 DNA 서열 |
33 | 야생형 HPV68 L1 단백질의 53-61번 위치의 아미노산 서열, 즉 HPV68 L1 단백질의 조각 1 |
34 | 야생형 HPV68 L1 단백질의 117-151번 위치의 아미노산 서열, 즉 HPV68 L1 단백질의 조각 2 |
35 | 야생형 HPV68 L1 단백질의 170-182번 위치의 아미노산 서열, 즉 HPV68 L1 단백질의 조각 3 |
36 | 야생형 HPV68 L1 단백질의 348-359번 위치의 아미노산 서열, 즉 HPV68 L1 단백질의 조각 5 |
37 | 야생형 HPV70 L1 단백질의 53-61번 위치의 아미노산 서열, 즉 HPV70 L1 단백질의 조각 1 |
서열 1 (서열번호 1):
MALWRSSDSMVYLPPPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDAIPAQLYIKGTDIRANPGSSVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 2 (서열번호 2):
MALWRASDNMVYLPPPSVAKVVNTDDYVTRTGMYYYAGTSRLLTVGHPYFKVPMSGGRKQGIPKVSAYQYRVFRVTLPDPNKFSVPESTLYNPDTQRMVWACVGVEIGRGQPLGVGLSGHPLYNRLDDTENSPFSSNKNPKDSRDNVAVDCKQTQLCIIGCVPAIGEHWAKGKSCKPTNVQQGDCPPLELVNTPIEDGDMIDTGYGAMDFGTLQETKSEVPLDICQSVCKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDTIPTDMYIKGTDIRETPSSYVYAPSPSGSMVSSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTTTDSTVPAVYDSNKFKEYVRHVEEYDLQFIFQLCTITLSTDVMSYIHTMNPAILDDWNFGVAPPPSASLVDTYRYLQSAAITCQKDAPAPVKKDPYDGLNFWNVDLKEKFSSELDQFPLGRKFLLQAGVRRRPTIGPRKRTATAATTSTSKHKRKRVSK
서열 3 (서열번호 3):
MALWRSSDNTVYLPPPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVPVNGGRKQEIPKVSAYQYRVFRVSLPDPNKFGLPDPSLYNPDTQRLVWACIGVEIGRGQPLGVGVSGHPLYNRLDDTENSHFSSAVNTQDSRDNVSVDYKQTQLCIIGCVPAMGEHWAKGKACKSTTVQQGDCPPLELVNTAIEDGDMIDTGYGAMDFRTLQETKSEVPLDICQSVCKYPDYLQMSADVYGDSMFFCLRKEQLFARHFWNRGGMVGDTIPSELYIKGTDIRDRPGTHVYSPSPSGSMVSSDSQLFNKPYWLHKAQGHNNGICWHNQLFITVVDTTRSTNFTLSACTETAIPAVYSPTKFKEYTRHVEEYDLQFIFQLCTITLTADVMAYIHTMNPAILDNWNIGVTPPPSASLVDTYRYLQSAAIACQKDAPAPEKKDPYDDLKFWNVDLKEKFSTELDQFPLGRKFLLQVGARRRPTIGPRKRPASAKSSSSASKHKRKRVSK
서열 4 (서열번호 4):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVPMSGGRKQGIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDAIPAQLYIKGTDIRANPGSSVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 5 (서열번호 5):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGLSGHPLYNRLDDTENSPFSSNKNPKDSRDNVAVDCKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDAIPAQLYIKGTDIRANPGSSVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 6 (서열번호 6):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWAKGKSCKPTNVQQGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDAIPAQLYIKGTDIRANPGSSVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 7 (서열번호 7):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDTIPTDMYIKGTDIRETPSSYVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 8 (서열번호 8):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDAIPAQLYIKGTDIRANPGSSVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSTDSTVPAVYDSNKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 9 (서열번호 9):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVPVNGGRKQEIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDTIPTDMYIKGTDIRETPSSYVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 10 (서열번호 10):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGVSGHPLYNRLDDTENSHFSSAVNTQDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDTIPTDMYIKGTDIRETPSSYVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 11 (서열번호 11):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWAKGKACKSTTVQQGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDTIPTDMYIKGTDIRETPSSYVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 12 (서열번호 12):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDTIPTDMYIKGTDIRETPSSYVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSTETAIPAVYSPTKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 13 (서열번호 13):
ATGGCCCTCTGGCGCAGCTCCGATTCCATGGTCTACCTCCCCCCCCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACCGCGGCGGCATGGTCGGCGATGCAATCCCCGCACAGCTCTACATCAAGGGGACCGACATCCGCGCCAATCCAGGCTCCAGCGTGTATTGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 14 (서열번호 14):
ATGGCACTGTGGAGAGCCAGCGACAACATGGTGTACCTGCCCCCTCCCAGCGTGGCCAAGGTGGTCAACACCGACGACTACGTGACCCGGACCGGCATGTACTACTACGCCGGCACCTCTCGGCTCCTGACCGTGGGCCACCCCTACTTCAAGGTGCCCATGAGCGGCGGCAGAAAGCAGGGCATCCCCAAGGTGTCCGCCTACCAGTACCGGGTGTTCAGAGTGACCCTGCCCGACCCCAACAAGTTCAGCGTGCCCGAGAGCACCCTGTACAACCCCGACACCCAGCGGATGGTCTGGGCCTGCGTGGGCGTGGAGATCGGCAGAGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTACAATCGGCTGGACGACACCGAGAACAGCCCCTTCAGCAGCAACAAGAACCCCAAGGACAGCCGGGACAACGTGGCCGTGGACTGCAAGCAGACCCAGCTGTGCATCATCGGCTGCGTGCCTGCCATTGGCGAGCACTGGGCCAAGGGCAAGAGCTGCAAGCCCACCAACGTGCAGCAGGGCGACTGCCCCCCTCTGGAACTGGTCAACACACCCATCGAGGACGGCGACATGATCGACACCGGCTACGGCGCCATGGACTTCGGCACCCTGCAGGAAACCAAGAGCGAGGTCCCCCTGGACATCTGCCAGAGCGTGTGCAAGTACCCCGACTACCTGCAGATGAGCGCCGACGTGTACGGCGACAGCATGTTCTTTTGCCTGCGGCGGGAGCAGCTGTTCGCCCGGCACTTCTGGAACAGAGGCGGCATGGTCGGCGACACCATCCCCACCGACATGTACATCAAGGGCACCGACATCAGAGAGACACCCAGCAGCTACGTGTACGCCCCCAGCCCCAGCGGCAGCATGGTGTCCAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCCCAGGGCCACAACAACGGCATCTGCTGGCACAACCAGCTGTTTCTGACCGTGGTGGACACCACCAGAAGCACCAACTTCACCCTGAGCACCACCACCGACAGCACCGTGCCCGCCGTGTACGACAGCAATAAGTTCAAAGAATACGTGCGGCACGTGGAGGAATACGACCTGCAGTTCATCTTCCAGCTGTGTACCATCACCCTGTCCACCGACGTGATGAGCTACATCCACACCATGAACCCCGCCATCCTGGACGACTGGAACTTCGGCGTGGCCCCTCCCCCTAGCGCCAGCCTGGTGGATACCTACAGATACCTGCAGAGCGCCGCCATCACCTGCCAGAAGGACGCCCCTGCCCCCGTGAAGAAGGACCCCTACGACGGCCTGAACTTCTGGAATGTGGACCTGAAAGAGAAGTTCAGCAGCGAGCTGGACCAGTTCCCCCTGGGCCGGAAGTTCCTGCTGCAAGCCGGCGTGCGGAGAAGGCCCACCATCGGCCCCAGAAAGCGGACCGCCACCGCAGCCACAACCTCCACCTCCAAGCACAAGCGGAAGCGGGTGTCCAAGTGA
서열 15 (서열번호 15):
ATGGCTTTGTGGCGGTCTAGTGACAACACGGTGTATTTGCCACCCCCTTCTGTGGCGAAGGTTGTCAATACAGATGATTATGTAACACGTACAGGCATATATTATTATGCTGGAAGCTCTCGCTTATTAACAGTAGGGCATCCTTATTTTAAGGTACCTGTAAATGGTGGCCGCAAGCAGGAAATACCTAAGGTGTCTGCATATCAGTATAGGGTATTTAGGGTATCCCTACCTGATCCTAATAAGTTTGGCCTTCCGGATCCTTCCCTTTATAATCCTGACACACAACGCCTGGTATGGGCCTGTATAGGTGTGGAAATTGGTAGAGGCCAGCCATTGGGCGTTGGTGTTAGTGGACATCCTTTATATAATAGATTGGATGATACTGAAAATTCACATTTTTCCTCTGCTGTTAATACACAGGACAGTAGGGACAATGTGTCTGTGGACTATAAGCAGACACAGTTATGTATTATAGGCTGTGTTCCTGCTATGGGAGAGCACTGGGCAAAGGGCAAGGCCTGTAAGTCCACTACTGTACAACAGGGCGATTGTCCACCATTAGAATTAGTTAATACTGCAATTGAGGATGGCGATATGATAGATACAGGCTATGGAGCCATGGACTTTCGTACATTGCAGGAAACCAAAAGTGAGGTACCACTAGATATTTGCCAATCCGTGTGTAAATATCCTGATTATTTGCAGATGTCTGCTGATGTATATGGGGACAGTATGTTTTTTTGTTTGCGCAAGGAACAGTTATTTGCCAGACACTTTTGGAATAGAGGTGGCATGGTGGGCGACACAATACCTTCAGAGTTATATATTAAAGGCACGGATATACGTGATCGTCCTGGTACTCATGTATATTCCCCTTCCCCAAGTGGCTCTATGGTTTCTTCTGATTCCCAGTTGTTTAATAAGCCCTATTGGTTGCATAAGGCCCAGGGACACAATAATGGCATTTGTTGGCATAACCAGTTGTTTATTACTGTGGTGGACACTACACGTAGTACTAATTTTACATTGTCTGCCTGCACCGAAACAGCCATACCTGCTGTATATAGCCCTACAAAGTTTAAGGAATATACTAGGCATGTGGAGGAATATGATTTACAATTTATATTTCAGTTGTGTACTATCACATTAACTGCAGACGTTATGGCCTACATCCATACTATGAATCCTGCAATTTTGGACAATTGGAATATAGGCGTTACCCCTCCACCATCTGCAAGCTTGGTGGACACGTATAGGTATTTACAATCAGCAGCTATAGCATGTCAGAAGGATGCTCCTGCACCTGAAAAAAAGGATCCCTATGACGATTTAAAATTTTGGAATGTTGATTTAAAGGAAAAGTTTAGTACAGAACTAGATCAGTTTCCTTTGGGGCGCAAATTTTTACTACAGGTAGGGGCTCGCAGACGTCCTACTATAGGCCCTCGCAAACGCCCTGCATCAGCTAAATCGTCTTCCTCAGCCTCTAAACACAAACGGAAACGTGTGTCCAAGTAA
서열 16 (서열번호 16):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTGCCCATGAGCGGCGGCAGAAAGCAGGGCATCCCCAAGGTGTCCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACCGCGGCGGCATGGTCGGCGATGCAATCCCCGCACAGCTCTACATCAAGGGGACCGACATCCGCGCCAATCCAGGCTCCAGCGTGTATTGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 17 (서열번호 17):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGCAGAGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTACAATCGGCTGGACGACACCGAGAACAGCCCCTTCAGCAGCAACAAGAACCCCAAGGACAGCCGGGACAACGTGGCCGTGGACTGCAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACCGCGGCGGCATGGTCGGCGATGCAATCCCCGCACAGCTCTACATCAAGGGGACCGACATCCGCGCCAATCCAGGCTCCAGCGTGTATTGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 18 (서열번호 18):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGCCAAGGGCAAGAGCTGCAAGCCCACCAACGTGCAGCAGGGCGACTGCCCCCCTCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACCGCGGCGGCATGGTCGGCGATGCAATCCCCGCACAGCTCTACATCAAGGGGACCGACATCCGCGCCAATCCAGGCTCCAGCGTGTATTGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 19 (서열번호 19):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACAGAGGCGGCATGGTCGGCGACACCATCCCCACCGACATGTACATCAAGGGCACCGACATCAGAGAGACACCCAGCAGCTACGTGTACTGT CCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 20 (서열번호 20):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACCGCGGCGGCATGGTCGGCGATGCAATCCCCGCACAGCTCTACATCAAGGGGACCGACATCCGCGCCAATCCAGGCTCCAGCGTGTATTGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCACCGACAGCACCGTGCCCGCCGTGTACGACAGCAATAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 21 (서열번호 21):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTTAAGGTACCTGTAAATGGTGGCCGCAAGCAGGAAATACCTAAGGTGTCTGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACAGAGGCGGCATGGTCGGCGACACCATCCCCACCGACATGTACATCAAGGGCACCGACATCAGAGAGACACCCAGCAGCTACGTGTACTGT CCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 22 (서열번호 22):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGTAGAGGCCAGCCATTGGGCGTTGGTGTTAGTGGACATCCTTTATATAATAGATTGGATGATACTGAAAATTCACATTTTTCCTCTGCTGTTAATACACAGGACAGTAGGGACAATGTGTCTGTGGACTATAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACAGAGGCGGCATGGTCGGCGACACCATCCCCACCGACATGTACATCAAGGGCACCGACATCAGAGAGACACCCAGCAGCTACGTGTAC TGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 23 (서열번호 23):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGCAAAGGGCAAGGCCTGTAAGTCCACTACTGTACAACAGGGCGATTGTCCACCACTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACAGAGGCGGCATGGTCGGCGACACCATCCCCACCGACATGTACATCAAGGGCACCGACATCAGAGAGACACCCAGCAGCTACGTGTACTGT CCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 24 (서열번호 24):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACAGAGGCGGCATGGTCGGCGACACCATCCCCACCGACATGTACATCAAGGGCACCGACATCAGAGAGACACCCAGCAGCTACGTGTACTGT CCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCACCGAAACAGCCATACCTGCTGTATATAGCCCTACAAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 25 (서열번호 25):
TIPTDMYIKGTDIRETPSSY
서열 26 (서열번호 26):
VSGHPLYNRLDDTENSHFSSAVNTQ
서열 27 (서열번호 27):
AKGKACKSTTVQQ
서열 28 (서열번호 28):
TETAIPAVYSPT
서열 29 (서열번호 29):
MPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVGMNGGRKQDIPKVSAYQYRVFRVTLPDPNKFSIPDASLYNPETQRLVWACVGVEVGRGQPLGVGISGHPLYNRQDDTENSPFSSTTNKDSRDNVSVDYKQTQLCIIGCVPAIGEHWGKGKACKPNNVSTGDCPPLELVNTPIEDGDMIDTGYGAMDFGALQETKSEVPLDICQSICKYPDYLQMSADVYGDSMFFCLRREQLFARHFWNRGGMVGDAIPAQLYIKGTDIRANPGSSVYCPSPSGSMVTSDSQLFNKPYWLHKAQGHNNGICWHNQLFLTVVDTTRSTNFTLSTSIESSIPSTYDPSKFKEYTRHVEEYDLQFIFQLCTVTLTTDVMSYIHTMNSSILDNWNFAVAPPPSASLVDTYRYLQSAAITCQKDAPAPEKKDPYDGLKFWNVDLREKFSLELDQFPLGRKFLLQARVRRRPTIGPRKRPAASTSSSSATKHKRKRVSK
서열 30 (서열번호 30):
ATGCCCAGCGTCGCCAAGGTCGTGAACACCGACGACTACGTCACCCGCACCGGGATCTACTACTACGCCGGGTCCAGCCGCCTGCTGACCGTGGGCCACCCCTACTTCAAGGTCGGCATGAACGGCGGGCGCAAGCAGGATATCCCCAAGGTCAGCGCCTACCAGTACCGCGTGTTCCGCGTCACCCTCCCAGACCCCAACAAGTTCTCCATCCCCGACGCCAGCCTGTACAACCCCGAGACCCAGCGCCTGGTGTGGGCCTGCGTGGGCGTCGAAGTCGGGCGCGGGCAGCCCCTCGGCGTCGGCATCTCCGGCCACCCCCTGTACAACCGCCAGGACGACACCGAGAATAGCCCCTTCAGCAGCACAACAAACAAGGATTCCCGCGACAACGTCAGCGTCGACTACAAGCAGACCCAGCTCTGTATCATCGGGTGCGTCCCAGCAATCGGCGAACACTGGGGCAAGGGCAAGGCCTGTAAGCCAAACAACGTGAGCACCGGCGATTGCCCCCCCCTGGAGCTGGTGAATACACCCATCGAAGACGGCGACATGATCGACACCGGGTACGGCGCCATGGATTTCGGCGCCCTCCAGGAGACAAAGTCCGAAGTCCCCCTGGACATCTGCCAGAGCATCTGCAAGTACCCCGACTACCTCCAGATGAGCGCCGACGTCTACGGCGATTCCATGTTCTTCTGCCTGCGCCGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACCGCGGCGGCATGGTCGGCGATGCAATCCCCGCACAGCTCTACATCAAGGGGACCGACATCCGCGCCAATCCAGGCTCCAGCGTGTATTGTCCAAGCCCATCCGGCAGCATGGTGACAAGCGACAGCCAGCTGTTCAACAAGCCCTACTGGCTGCACAAGGCACAGGGGCATAATAACGGCATCTGCTGGCACAACCAGCTGTTCCTGACCGTCGTCGATACCACACGCTCCACAAATTTCACCCTGAGCACAAGCATCGAAAGCAGCATCCCCAGCACCTACGACCCCAGCAAGTTCAAGGAGTACACACGCCACGTCGAAGAATACGACCTGCAGTTCATCTTCCAGCTCTGCACCGTGACCCTGACCACCGACGTCATGAGCTACATCCACACCATGAACAGCAGCATCCTCGATAACTGGAACTTCGCCGTGGCCCCCCCCCCCAGCGCATCCCTCGTGGATACCTATCGCTATCTGCAGAGCGCCGCAATCACCTGCCAGAAGGACGCCCCCGCCCCCGAGAAGAAGGACCCCTACGATGGCCTGAAGTTCTGGAACGTCGATCTGCGCGAGAAGTTCTCCCTGGAGCTGGACCAGTTCCCCCTCGGCCGCAAGTTCCTCCTCCAGGCACGCGTGCGCCGCCGCCCCACCATCGGCCCACGCAAGCGCCCCGCCGCCAGCACCAGCAGCAGCAGCGCCACCAAGCACAAGCGCAAGCGCGTCAGCAAGTGA
서열 31 (서열번호 31):
MVYLPPPSVAKVVNTDDYVTRTGIYYYAGSSRLLTVGHPYFKVPVNGGRKQEIPKVSAYQYRVFRVSLPDPNKFGLPDPSLYNPDTQRLVWACIGVEIGRGQPLGVGVSGHPLYNRLDDTENSHFSSAVNTQDSRDNVSVDYKQTQLCIIGCVPAMGEHWAKGKACKSTTVQQGDCPPLELVNTAIEDGDMIDTGYGAMDFRTLQETKSEVPLDICQSVCKYPDYLQMSADVYGDSMFFCLRKEQLFARHFWNRGGMVGDTIPSELYIKGTDIRDRPGTHVYSPSPSGSMVSSDSQLFNKPYWLHKAQGHNNGICWHNQLFITVVDTTRSTNFTLSACTETAIPAVYSPTKFKEYTRHVEEYDLQFIFQLCTITLTADVMAYIHTMNPAILDNWNIGVTPPPSASLVDTYRYLQSAAIACQKDAPAPEKKDPYDDLKFWNVDLKEKFSTELDQFPLGRKFLLQVGARRRPTIGPRKRPASAKSSSSASKHKRKRVSK
서열 32 (서열번호 32):
ATGGTGTATTTGCCACCCCCTTCTGTGGCGAAGGTTGTCAATACAGATGATTATGTAACACGTACAGGCATATATTATTATGCTGGAAGCTCTCGCTTATTAACAGTAGGGCATCCTTATTTTAAGGTACCTGTAAATGGTGGCCGCAAGCAGGAAATACCTAAGGTGTCTGCATATCAGTATAGGGTATTTAGGGTATCCCTACCTGATCCTAATAAGTTTGGCCTTCCGGATCCTTCCCTTTATAATCCTGACACACAACGCCTGGTATGGGCCTGTATAGGTGTGGAAATTGGTAGAGGCCAGCCATTGGGCGTTGGTGTTAGTGGACATCCTTTATATAATAGATTGGATGATACTGAAAATTCACATTTTTCCTCTGCTGTTAATACACAGGACAGTAGGGACAATGTGTCTGTGGACTATAAGCAGACACAGTTATGTATTATAGGCTGTGTTCCTGCTATGGGAGAGCACTGGGCAAAGGGCAAGGCCTGTAAGTCCACTACTGTACAACAGGGCGATTGTCCACCATTAGAATTAGTTAATACTGCAATTGAGGATGGCGATATGATAGATACAGGCTATGGAGCCATGGACTTTCGTACATTGCAGGAAACCAAAAGTGAGGTACCACTAGATATTTGCCAATCCGTGTGTAAATATCCTGATTATTTGCAGATGTCTGCTGATGTATATGGGGACAGTATGTTTTTTTGTTTGCGCAAGGAACAGTTATTTGCCAGACACTTTTGGAATAGAGGTGGCATGGTGGGCGACACAATACCTTCAGAGTTATATATTAAAGGCACGGATATACGTGATCGTCCTGGTACTCATGTATATTCCCCTTCCCCAAGTGGCTCTATGGTTTCTTCTGATTCCCAGTTGTTTAATAAGCCCTATTGGTTGCATAAGGCCCAGGGACACAATAATGGCATTTGTTGGCATAACCAGTTGTTTATTACTGTGGTGGACACTACACGTAGTACTAATTTTACATTGTCTGCCTGCACCGAAACAGCCATACCTGCTGTATATAGCCCTACAAAGTTTAAGGAATATACTAGGCATGTGGAGGAATATGATTTACAATTTATATTTCAGTTGTGTACTATCACATTAACTGCAGACGTTATGGCCTACATCCATACTATGAATCCTGCAATTTTGGACAATTGGAATATAGGCGTTACCCCTCCACCATCTGCAAGCTTGGTGGACACGTATAGGTATTTACAATCAGCAGCTATAGCATGTCAGAAGGATGCTCCTGCACCTGAAAAAAAGGATCCCTATGACGATTTAAAATTTTGGAATGTTGATTTAAAGGAAAAGTTTAGTACAGAACTAGATCAGTTTCCTTTGGGGCGCAAATTTTTACTACAGGTAGGGGCTCGCAGACGTCCTACTATAGGCCCTCGCAAACGCCCTGCATCAGCTAAATCGTCTTCCTCAGCCTCTAAACACAAACGGAAACGTGTGTCCAAGTAA
서열 33 (서열번호 33):
PMSGGRKQG
서열 34 (서열번호 34):
LSGHPLYNRLDDTENSPFSSNKNPKDSRDNVAVDC
서열 35 (서열번호 35):
AKGKSCKPTNVQQ
서열 36 (서열번호 36):
TDSTVPAVYDSN
서열 37 (서열번호 37):
PVNGGRKQE
본 발명은 하기 실시예를 참조하여 추가로 설명되며, 여기서 실시예는 본 발명을 제한한다기 보다는 본 발명을 설명하기 위한 목적으로만 사용된다. 달리 명시되지 않는 한, 본 발명에 사용된 분자생물학적 실험방법 및 면역학적 분석들은 실질적으로 문헌[Sambrook J et al., Molecular Cloning: A Laboratory Manual (Second Edition), Cold Spring Harbor Laboratory Press, 1989], 및 문헌[F. M. Ausubel et al., Short Protocols in Molecular Biology, 3rd Edition, John Wiley & Sons, Inc., 1995]에 기재된 바와 같은 방법에 따라 실질적으로 수행되며; 제한 효소는 제조사가 권장하는 조건하에서 사용된다. 당업자는 상기 실시예가 본 발명을 설명하기 위해 사용되지만, 본 발명의 보호 범위를 제한하고자 하는 것은 아님을 이해한다.
실시예 1. 돌연변이된 HPV39 L1 단백질의 발현 및 정제
발현 벡터의 구축
HPV68 L1 단백질로부터의 조각을 포함하는 돌연변이된 HPV39 L1 단백질을 암호화하는 발현 벡터를 다중-부위 돌연변이유발을 위해 PCR에 의해 구축하였으며, 이 때 사용된 초기 주형은 플라스미드 pTO-T7-HPV39N15C (N-말단에서 절단된 15개 아미노산을 갖는 HPV39 L1 단백질을 암호화; 표 2에서 39L1N15로 약칭)였다. 각각의 PCR에 대한 주형 및 프라이머를 표 2에 나타내었으며, PCR에 대한 증폭 조건은 다음과 같았다: 94℃에서 10분간 변성; 25 사이클 (94℃에서 50초간 변성, 일정 기간 동안 주어진 온도에서 어닐링, 및 72℃에서 7.5분간 연장); 및 최종적으로 72℃에서 10분간 연장. 어닐링 온도 및 시간을 표 2에 나열하였다. 상기 사용된 PCR 프라이머의 서열을 표 3에 나열하였다.
증폭 산물(50 ㎕)에 대하여, 2 ㎕의 제한 엔도뉴클레아제 DpnI (Fermentas (MBI), Cat.No.FD1704, 2500U/튜브)를 첨가하고, 생성 혼합물을 37℃에서 60분간 배양하였다. 10 ㎕의 소화 산물을 사용하여 염화 칼슘 방법에 의해 제조된 40 ㎕ 수용성 E. coli ER2566(New England Biolabs로부터 구입)을 형질전환시켰다. 상기 형질전환된 E. coli를 카나마이신(25 ㎎/㎖ 의 최종 농도로, 본 명세서에서 이후에도 동일함)을 함유하는 고형 LB 배지(상기 LB 배지의 성분들: 10 g/L 펩톤, 5 g/L 효모 분말, 10 g/L NaCl, 본 명세서에서 이후에도 동일함)상에 도말하고, 단일 콜로니가 명확하게 관찰될 때까지 37℃에서 10 내지 12시간 동안 정적 배양하였다. 단일 콜로니를 수집하여 4 ㎖ 액체 LB 배지(카나마이신 함유)를 함유하는 튜브에 접종하고, 37℃에서 10시간 동안 220 rpm으로 진탕 배양한 다음, 이어서 1 ㎖ 박테리아 용액을 취하여 -70℃에서 보관하였다. 플라스미드를 E. coli로부터 추출하고, T7 프라이머를 사용하여 상기 플라스미드에 삽입된 관심 단편의 뉴클레오타이드 서열을 시퀀싱하였다. 시퀀싱 결과, 상기 구축된 플라스미드(발현 벡터)에 삽입된 관심 단편의 뉴클레오타이드 서열은 서열번호 16이고, 이의 암호화된 아미노산 서열은 서열번호 4인 것으로 나타났다 (상응하는 단백질을 H39N15-68T1로 표시함). 상기 돌연변이된 H39N15-68T1은, 야생형 HPV39 L1 단백질의 53-61번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 53-61번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다.
깁슨(Gibson) 조립 (Gibson DG, Young L, Chuang RY, Venter JC, Hutchison CA, Smith HO. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods. 2009; 6:343-5. doi: 10.1038/nmeth.1318)을 사용하여 다른 돌연변이된 HPV39 L1 단백질을 암호화하는 발현 벡터를 구축하였으며, 상기 돌연변이된 HPV39 L1 단백질은 HPV68 L1로부터의 특정 조각 및 HPV70L1로부터의 특정 조각을 포함하였다. 간단히 말해서, 돌연변이를 포함하는 짧은 단편 및 돌연변이를 포함하지 않는 긴 단편을 PCR에 의해 얻은 다음, 깁슨 조립 시스템을 사용하여 두 단편을 결찰(ligate)하여 고리를 형성하였다. 사용된 초기 주형은 플라스미드 pTO-T7-HPV39N15 (N-말단에서 절단된 15개 아미노산을 갖는 HPV39 L1 단백질을 암호화; 표 2에서 39L1N15로 약칭), 플라스미드 pTO-T7-HPV68L1 (HPV68 L1 단백질을 암호화; 표 2에서 68L1N0로 약칭), 플라스미드 pTO-T7-H39N15-68T4 (돌연변이된 단백질 H39N15-68T4를 암호화; 표 2에서 H39N15-68T4로 약칭) 및 플라스미드 pTO-T7-HPV70N10 (N-말단에서 절단된 10개 아미노산을 갖는 HPV70 L1 단백질을 암호화; 표 2에서 70L1N10로 약칭)를 포함하였다. 각각의 PCR에 대한 주형 및 프라이머를 표 2에 나타내었으며, 짧은 단편을 증폭하기 위한 PCR의 증폭 조건은 다음과 같았다: 94℃에서 10분간 변성; 25 사이클 (94℃에서 50초간 변성, 일정 기간 동안 주어진 온도에서 어닐링, 및 72℃에서 1분간 연장); 및 최종적으로 72℃에서 10분간 연장. 긴 단편을 증폭하기 위한 PCR의 증폭 조건은 다음과 같았다: 94℃에서 10분간 변성; 25 사이클 (94℃에서 50초간 변성, 일정 기간 동안 주어진 온도에서 어닐링, 및 72℃에서 7.5분간 연장); 및 최종적으로 72℃에서 10분간 연장. 상기 사용된 PCR 프라이머의 서열을 표 3에 나타내었다. 상기 증폭 산물을 전기영동한 후, DNA 추출 키트 (BEYOTIME, Cat.No.D0033)를 사용하여 관심 단편을 회수하고, 농도를 측정하였다. 증폭에 의해 얻은 짧은 단편 및 긴 단편을 2:1의 몰비 (총 부피 3 μL)로 혼합하고, 이어서 3μL의 2 X 깁슨 조립 Master Mix (NEB로부터 구입, T5 엑소뉴클레아제, Phusion DNA 폴리머라제, Taq DNA 리가아제를 포함)를 첨가하고, 50℃에서 1시간 동안 반응시켰다.
상기 조립된 생성물 (6μL)을 사용하여 40 μL 수용성 E. coli ER2566 (New England Biolabs로부터 구입)을 형질전환시켰다. 상기 형질전환된 E. coli를 카나마이신을 함유하는 고형 LB 배지 상에 도말하고, 단일 콜로니가 명확하게 관찰될 때까지 37℃에서 10 내지 12시간 동안 정적 배양하였다. 단일 콜로니를 수집하여 4 ㎖ 액체 LB 배지(카나마이신 함유)를 함유하는 튜브에 접종하고, 37℃에서 10시간 동안 220 rpm으로 진탕 배양한 다음, 이어서 1 ㎖ 박테리아 용액을 취하여 -70℃에서 보관하였다. 플라스미드를 E. coli로부터 추출하고, T7 프라이머를 사용하여 상기 플라스미드에 삽입된 관심 단편의 뉴클레오타이드 서열을 시퀀싱하였다. 시퀀싱 결과, 상기 구축된 플라스미드(발현 벡터)에 삽입된 관심 단편의 뉴클레오타이드 서열은 각각 서열번호 17, 18, 19, 20, 21, 22, 23, 및 24인 것으로 나타났다 (상응하는 단백질들을 각각 H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5로 표시함).
상기 돌연변이된 단백질 H39N15-68T2는, 야생형 HPV39 L1 단백질의 117-150번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 117-151번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다. 상기 돌연변이된 단백질 H39N15-68T3은, 야생형 HPV39 L1 단백질의 169-181번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 170-182번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다. 상기 돌연변이된 단백질 H39N15-68T4는, 야생형 HPV39 L1 단백질의 269-288번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 270-289번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다. 상기 돌연변이된 단백질 H39N15-68T5는, 야생형 HPV39 L1 단백질의 347-358번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 348-359번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다.
상기 돌연변이된 단백질 H39N15-68T4-70S1은, 야생형 HPV39 L1 단백질의 269-288번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 270-289번째 아미노산 잔기로 치환, 및 야생형 HPV39 L1 단백질의 53-61번째 아미노산 잔기를 야생형 HPV70 L1 단백질의 53-61번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다. 상기 돌연변이된 단백질 H39N15-68T4-70S2는, 야생형 HPV39 L1 단백질의 269-288번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 270-289번째 아미노산 잔기로 치환, 및 야생형 HPV39 L1 단백질의 117-140번째 아미노산 잔기를 야생형 HPV70 L1 단백질의 117-141번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다. 상기 돌연변이된 단백질 H39N15-68T4-70S3은, 야생형 HPV39 L1 단백질의 269-288번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 270-289번째 아미노산 잔기로 치환, 및 야생형 HPV39 L1 단백질의 169-181번째 아미노산 잔기를 야생형 HPV70 L1 단백질의 170-182번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다. 상기 돌연변이된 단백질 H39N15-68T4-70S5는, 야생형 HPV39 L1 단백질의 269-288번째 아미노산 잔기를 야생형 HPV68 L1 단백질의 270-289번째 아미노산 잔기로 치환, 및 야생형 HPV39 L1 단백질의 347-358번째 아미노산 잔기를 야생형 HPV70 L1 단백질의 348-359번째 아미노산 잔기로 치환한다는 점에서 HPV39N15와 다르다.
주형 | 상류 프라이머 | 하류 프라이머 | 생성물 | 어닐링 온도 /시간 |
39L1N15 | H39N15-68T1-F | H39N15-68T1-R | H39N15-68T1 | 56℃/50s |
39L1N15 | G-V-H39N15-68T2-F | G-V-H39N15-68T2-R | H39N15-68T2 긴 단편 |
56℃/50s |
39L1N15 | G-V-H39N15-68T3-F | G-V-H39N15-68T3-R | H39N15-68T3 긴 단편 |
56℃/50s |
39L1N15 | G-V-H39N15-68T4-F | G-V-H39N15-68T4-R | H39N15-68T4 긴 단편 |
56℃/50s |
39L1N15 | G-V-H39N15-68T5-F | G-V-H39N15-68T5-R | H39N15-68T5 긴 단편 |
56℃/50s |
68L1N0 | G-H39N15-68T2-F | G-H39N15-68T2-R | H39N15-68T2 짧은 단편 |
56℃/30s |
68L1N0 | G-H39N15-68T3-F | G-H39N15-68T3-R | H39N15-68T3 짧은 단편 |
56℃/30s |
68L1N0 | G-H39N15-68T4-F | G-H39N15-68T4-R | H39N15-68T4 짧은 단편 |
56℃/30s |
68L1N0 | G-H39N15-68T5-F | G-H39N15-68T5-R | H39N15-68T5 짧은 단편 |
56℃/30s |
H39N15-68T4 | G-V-H39N15-68T4-70S1-F | G-V-H39N15-68T4-70S1-R | H39N15-68T4-70S1 긴 단편 |
56℃/50s |
H39N15-68T4 | G-V-H39N15-68T4-70S2-F | G-V-H39N15-68T4-70S2-R | H39N15-68T4-70S2 긴 단편 |
56℃/50s |
H39N15-68T4 | G-V-H39N15-68T4-70S3-F | G-V-H39N15-68T4-70S3-R | H39N15-68T4-70S3 긴 단편 |
56℃/50s |
H39N15-68T4 | G-V-H39N15-68T4-70S5-F | G-V-H39N15-68T4-70S5-R | H39N15-68T4-70S5 긴 단편 |
56℃/50s |
70L1N10 | G-H39N15-68T4-70S1-F | G-H39N15-68T4-70S1-R | H39N15-68T4-70S1 짧은 단편 |
56℃/30s |
70L1N10 | G-H39N15-68T4-70S2-F | G-H39N15-68T4-70S2-R | H39N15-68T4-70S2 짧은 단편 |
56℃/30s |
70L1N10 | G-H39N15-68T4-70S3-F | G-H39N15-68T4-70S3-R | H39N15-68T4-70S3 짧은 단편 |
56℃/30s |
70L1N10 | G-H39N15-68T4-70S5-F | G-H39N15-68T4-70S5-R | H39N15-68T4-70S5 짧은 단편 |
56℃/30s |
서열번호 | 프라이머 이름 | 서열(5'-3') |
38 | H39N15-68T1-F | TTCAAGGTCCCCATGAGCGGCGGGCGCAAGCAGGATATCCCCAAGGTC |
39 | H39N15-68T1-R | CCCGCCGCTCATGGGGACCTTGAAGTAGGGGTGGCCCACGGTCAGCAG |
40 | G-V- H39N15-68T2-F | GACTTCGACGCCCACGCAGGCCCA |
41 | G-V- H39N15-68T2-R | AAGCAGACCCAGCTCTGTATCATC |
42 | G-V- H39N15-68T3-F | TTCGCCGATTGCTGGGACGCACCC |
43 | G-V- H39N15-68T3-R | CTGGAGCTGGTGAATACACCCATC |
44 | G-V- H39N15-68T4-F | GTGGCGGGCGAAGAGCTGCTCGCG |
45 | G-V- H39N15-68T4-R | TGTCCAAGCCCATCCGGCAGCATG |
46 | G-V- H39N15-68T5-F | GCTTGTGCTCAGGGTGAAATTTGTGGAGCG |
47 | G-V- H39N15-68T5-F | TTCAAGGAGTACACACGCCACGTCGAAGAA |
48 | G- H39N15-68T2-F | TGGGCCTGCGTGGGCGTCGAAGTCGGCAGAGGCCAGCCCCTGGGC |
49 | G- H39N15-68T2-R | GATGATACAGAGCTGGGTCTGCTTGCAGTCCACGGCCACGTTGTC |
50 | G- H39N15-68T3-F | GGGTGCGTCCCAGCAATCGGCGAACACTGGGCCAAGGGCAAGAGC |
51 | G- H39N15-68T3-R | GATGGGTGTATTCACCAGCTCCAGAGGGGGGCAGTCGCCCTGCTG |
52 | G- H39N15-68T4-F | CGCGAGCAGCTCTTCGCCCGCCACTTCTGGAACAGAGGCGGCATG |
53 | G- H39N15-68T4-R | CATGCTGCCGGATGGGCTTGGACAGTACACGTAGCTGCTGGGTGT |
54 | G- H39N15-68T5-F | CGCTCCACAAATTTCACCCTGAGCACAAGCACCGACAGCACCGTGCCCGCC |
55 | G- H39N15-68T5-R | TTCTTCGACGTGGCGTGTGTACTCCTTGAACTTATTGCTGTCGTACACGGC |
56 | G-V- H39N15-68T4-70S1-F | GTAGGGGTGGCCCACGGTCAG |
57 | G-V- H39N15-68T4-70S1-R | GCCTACCAGTACCGCGTGTTC |
58 | G-V- H39N15-68T4-70S2-F | GACTTCGACGCCCACGCAGGC |
59 | G-V- H39N15-68T4-70S2-R | AAGCAGACCCAGCTCTGTATC |
60 | G-V- H39N15-68T4-70S3-F | TTCGCCGATTGCTGGGACGCA |
61 | G-V- H39N15-68T4-70S3-R | CTGGAGCTGGTGAATACACCC |
62 | G-V- H39N15-68T4-70S5-F | GCTTGTGCTCAGGGTGAAATT |
63 | G-V- H39N15-68T4-70S5-R | TTCAAGGAGTACACACGCCAC |
64 | G- H39N15-68T4-70S1-F | CTGACCGTGGGCCACCCCTACTTTAAGGTACCTGTAAATGGT |
65 | G- H39N15-68T4-70S1-R | GAACACGCGGTACTGGTAGGCAGACACCTTAGGTATTTCCTG |
66 | G- H39N15-68T4-70S2-F | GCCTGCGTGGGCGTCGAAGTCGGTAGAGGCCAGCCATTGGGC |
67 | G- H39N15-68T4-70S2-R | GATACAGAGCTGGGTCTGCTTATAGTCCACAGACACATTGTC |
68 | G- H39N15-68T4-70S3-F | TGCGTCCCAGCAATCGGCGAACACTGGGCAAAGGGCAAGGCC |
69 | G- H39N15-68T4-70S3-R | GGGTGTATTCACCAGCTCCAGTGGTGGACAATCGCCCTGTTGTAC |
70 | G- H39N15-68T4-70S5-F | AATTTCACCCTGAGCACAAGCACCGAAACAGCCATACCTGCT |
71 | G- H39N15-68T4-70S5-R | GTGGCGTGTGTACTCCTTGAACTTTGTAGGGCTATATACAGC |
돌연변이된 단백질의 대규모 발현
재조합 플라스미드 pTO-T7-H39N15-68T1, pTO-T7- H39N15-68T2, pTO-T7-H39N15-68T3, pTO-T7-H39N15-68T4, pTO-T7-H39N15-68T5, pTO-T7-H39N15-68T4-70S1, pTO-T7-H39N15-68T4-70S2, pTO-T7-H39N15-68T4-70S3, 및 pTO-T7-H39N15-68T4-70S5을 각각 포함하는 E. coli 용액을 -70℃ 냉장고에서 꺼내어, 카나마이신을 함유하는 100 mL LB 액체 배지에 접종하고, 각각 200 rpm 및 37℃ 조건에서 약 8시간 동안 배양하였다. 그런 다음, 상기 배양물을 카나마이신을 함유하는 500mL LB 배지로 옮기고 (1 mL 박테리아 용액을 옮기고), 추가로 배양하였다. 상기 박테리아 농도가 약 0.6의 OD600에 도달했을 때, 배양 온도를 25℃로 낮추고 500 ㎕의 IPTG를 각 배양 보틀에 첨가하였다. 상기 배양을 8시간 동안 추가로 수행하였다. 배양을 끝낸 후에, 박테리아를 원심분리에 의해 수집하였다. 각각 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 및 H39N15-68T4-70S5 단백질을 발현하는 박테리아를 수득하였다.
돌연변이된 단백질을 발현하는 박테리아의 파쇄
상기 수득된 박테리아를 1g 박테리아 대 10 ㎖ 용해 버퍼(20 mM Tris 버퍼, pH 7.2, 300 mM NaCl)의 비율로 재-현탁하였다. 상기 박테리아를 초음파 기구를 사용하여 30분 동안 파쇄하였다. 상기 파쇄된 박테리아를 함유하는 용해 버퍼를 13500 rpm(30000 g)에서 15분 동안 원심분리하고, 상층액(즉 파쇄된 박테리아의 상층액)을 수득하였다.
돌연변이된 단백질의 크로마토그래피 정제
장비: GE Healthcare (즉 the original Amershan Pharmacia Co.)에 의해 제조된 AKTA Explorer 100 분취용 액체 크로마토그래피 시스템
크로마토그래피 매질: SP 세파로스 4 패스트 플로우 (GE Healthcare Co.), CHT-II (Bio-RAD로부터 구입) 및 부틸 세파로스 4 패스트 플로우 (GE Healthcare Co.)
버퍼: 버퍼 A (20 mM 포스페이트 버퍼, pH8.0, 20 mM DTT); 및 버퍼 B (20 mM 포스페이트 버퍼, pH8.0, 20 mM DTT, 2M NaCl). 하기 용출(elution) 프로토콜에서 사용되는 서로 다른 농도의 NaCl을 포함하는 버퍼들은 버퍼 A 및 버퍼 B를 특정 비율로 혼합하여 준비하였다.
샘플: 상기에서 수득한, 각각의 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5를 함유하는 파쇄된 박테리아의 상층액
용출 프로토콜:
(1) SP 세파로스 4 패스트 플로우에 의해 파쇄된 박테리아 상층액의 양이온 교환 정제: 상기 샘플을 상기 컬럼에 로딩한 다음, 불필요한 단백질을 400 mM NaCl을 함유하는 버퍼 (80% 버퍼 A + 20% 버퍼 B)로 용출시킨 다음 관심 단백질을 800 mM NaCl을 함유하는 버퍼 (60% 버퍼 A + 40% 버퍼 B)로 용출시키고, 상기 800 mM NaCl을 함유하는 버퍼로 용출된 분획을 수집하였다;
(2) CHTII(하이드록시아파타이트 크로마토그래피)에 의한 상기 단계 (1)에서 수득한 용출 분획의 크로마토그래피 정제: 상기 단계 (1)에서 수득한 용출 분획을 NaCl 농도가 0.5M로 감소되도록 희석시키고; 상기 샘플을 상기 컬럼에 로딩한 다음, 불필요한 단백질을 500 mM NaCl을 함유하는 버퍼 (75% 버퍼 A + 25% 버퍼 B)로 용출시킨 다음, 관심 단백질을 1000 mM NaCl을 함유하는 버퍼 (50% 버퍼 A + 50% 버퍼 B)로 용출시키고, 상기 1000 mM NaCl을 함유하는 버퍼로 용출된 분획을 수집하였다;
(3) HIC(소수성 상호작용 크로마토그래피)에 의한 상기 단계 (2)에서 수득된 용출 분획의 크로마토그래피 정제: 상기 샘플을 상기 컬럼에 로딩한 다음, 불필요한 단백질을 1000 mM NaCl을 함유하는 버퍼로 용출시키고, 관심 단백질을 200 mM NaCl을 함유하는 버퍼 (90% 버퍼 A + 10% 버퍼 B)로 용출시키고, 상기 200 mM NaCl을 함유하는 버퍼로 용출된 분획을 수집하였다.
상기 단계 (3)에서 수득한 150 ㎕ 용출 분획을 30 ㎕ 의 6x 로딩 버퍼 (1L, 300ml의 1M TB 6.8, 600ml의 100% 글리세롤, 120g의 SDS, 6g의 브로모페놀 블루, 및 50ml의 β-머캅토에탄올을 포함)에 첨가하였다. 상기 생성된 용액을 균일하게 혼합하고 80℃ 워터 배스에서 10분 동안 배양하였다. 그런 다음 10 ㎕ 의 상기 생성된 샘플에 120 V에서 120분 동안 10% SDS-PAGE를 가하고; 쿠마씨 브릴리언트 블루에 의해 상기 전기영동 밴드를 염색하였다. 상기 전기영동 결과를 도 1에 나타내었다. 상기 결과는 상기 정제 단계 후, H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5 단백질이 90%의 순도를 가짐을 보였다.
유사한 방법에 의해, E. coli 및 플라스미드 pTO-T7-HPV39N15를 사용하여 HPV39N15 단백질을 제조 및 정제하고; E. coli 및 플라스미드 pTO-T7-HPV68L1N0를 사용하여 HPV68N0 단백질을 제조 및 정제하고; E. coli 및 플라스미드 pTO-T7-HPV70N10를 사용하여 HPV70N5 단백질을 제조 및 정제하였다.
돌연변이된 단백질의 웨스턴 블롯 분석
상기 방법으로 정제된 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3, 및 H39N15-68T4-70S5 단백질을 전기영동하였다. 전기영동 후, HPV L1 단백질에 대한 광범위 항체 4B3을 이용하여 웨스턴 블롯 분석을 수행하였으며, 그 결과를 도 2에 나타내었다. 상기 결과는 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 및 H39N15-68T4-70S5가 광범위 항체 4B3에 의해 특이적으로 인식될 수 있음을 보였다.
실시예 2: HPV 바이러스-유사 입자의 조립 및 입자의 형태학적 검출
HPV 바이러스-유사 입자의 조립
제공된 부피(약 2 ㎖)의 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 또는 H39N15-68T4-70S5를 (1) 2L 저장 버퍼 (20 mM 소듐 포스페이트 버퍼 pH 6.5, 0.5 M NaCl); (2) 2L 재생 버퍼 (50 mM 소듐 포스페이트 버퍼 pH 6.0, 2 mM CaCl2, 2mM MgCl2, 0.5 M NaCl); 및 (3) 20 mM 소듐 포스페이트 버퍼 pH 7.0, 0.5 M NaCl에 연속적으로 투석시켰다. 상기 투석을 상기 각각의 3개의 버퍼에서 12시간 동안 수행하였다.
유사한 방법에 의해, HPV39N15, HPV68N0 및 HPV70N10 단백질을 각각 HPV39N15 VLP, HPV68N0 VLP 및 HPV70N10 VLP로 조립하였다.
분자체 크로마토그래피 분석
상기 투석된 샘플에 대해 1120 컴팩트 LC 고성능 액체 크로마토그래피 시스템 (Agilent Technologies)의 분자체 크로마토그래피 분석을 수행하였으며, 여기에서 상기 사용된 분석 컬럼은 TSK Gel PW5000xl 7.8x300 ㎜ 였다. 상기 분석 결과를 도 3 및 4에 나타내었다. 상기 결과는 단백질 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 또는 H39N15-68T4-70S5를 포함하는 샘플의 첫번째 단백질 피크가 약 13-14분째에 나타나고, 이는 HPV39N15 VLP, HPV68N0 VLP 및 HPV70N10 VLP의 경우에 필적함을 보였다. 이는 이들 단백질 모두가 VLP로 조립될 수 있음을 나타낸다.
침강 속도 분석
침강 속도 분석용 기구는 Beckman XL-A 분석학적 초원심분리기로, 광학 검사 시스템 및 An-50Ti 및 An-60Ti 로터가 구비되어있다. HPV39N15 VLP, HPV68N0 VLP, HPV70N10 VLP, H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, H39N15-68T5 VLP, H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP의 침강 계수를 침강 속도 방법에 의해 분석하였다. 상기 결과를 도 5A-5L에 나타내었다. 상기 결과는 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP, H39N15-68T5 VLP, H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP의 침강 계수가 각각 136S, 151S, 138S, 145S, 135S, 124S, 108S, 99S 및 127S임을 보였다. 이는 상기 제조된 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 및 H39N15-68T4-70S5가 크기 및 형태 면에서 야생형 VLP (HPV39N15 VLP, 115S; HPV68N0 VLP, 153S; HPV70N10 VLP, 144S)와 유사한 바이러스-유사 입자로 조립될 수 있음을 나타낸다.
바이러스-유사 입자의 형태학적 시험
VLP를 포함하는 100 ㎕ 샘플을 투과 전자 현미경(TEM)으로 관찰하였다. 사용된 장비는 JEOL Ltd에 의해 공급된 100kV 투과 전자 현미경이다 (100,000x 배율). 간단히 말해서, 13.5 ㎕ 샘플을 2% 포스포텅스텐산 (pH 7.0)으로 음으로 염색하고, 탄소-코팅된 구리 격자에 고정시킨 다음, TEM으로 관찰하였다. 상기 결과를 도 6A-6L에 나타내었다. 상기 결과는 H39N15-68T1, H39N15-68T2, H39N15-68T3, H39N15-68T4, H39N15-68T5, H39N15-68T4-70S1, H39N15-68T4-70S2, H39N15-68T4-70S3 및 H39N15-68T4-70S5가 바이러스-유사 입자로 조립될 수 있고, 이들 돌연변이된 단백질들에 의해 조립된 바이러스-유사 입자들이 균일한 크기를 가지며, 약 25- 30 nm의 반경을 가짐을 보였다. 야생형 HPV39N15, HPV68N0 및 HPV70N10에 의해 조립된 바이러스-유사 입자들 또한 약 25-30 nm의 반경을 가졌으며, 균일한 크기를 가졌다. 이는 이들 돌연변이된 단백질들이 야생형 HPV39, HPV68 및 HPV70 L1 단백질과 유사하며, 균일한 크기를 갖는 VLP로 조립될 수 있음을 암시한다.
실시예 3: 바이러스-유사 입자로 면역화된 마우스 혈청의 중화 항체 역가 평가 1
이 실험에서, 사용된 바이러스-유사 입자는 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP 및 H39N15-68T5 VLP이다.
이 실험에서, 백신 접종 스케쥴은 표 4에 나타내었다. 모든 마우스 (6주령의 BalB/c 암컷 마우스)를 3개 그룹으로 나누었다: 알루미늄 어쥬번트 그룹 1 (면역화 용량 5 μg, 알루미늄 어쥬번트 사용), 알루미늄 어쥬번트 그룹 2 (면역화 용량 1 μg, 알루미늄 어쥬번트 사용), 및 알루미늄 어쥬번트 그룹 3 (면역화 용량 0.2 μg, 알루미늄 어쥬번트 사용). 각 그룹은 8개의 하위 그룹으로 더 나누어졌다. 대조군 하위그룹 1 및 2는 각각 HPV39N15 VLP 단독 및 HPV68N0 VLP 단독으로 면역화되었고, 대조군 하위그룹 3은 혼합된 HPV39/HPV68 VLP (즉 HPV39N15 VLP 및 HPV68N0 VLP 의 혼합물, 각 VLP에 대해 주어진 면역화 용량으로 혼합됨)로 면역화되었다. 실험군 하위그룹 1, 2, 3, 4 및 5는 각각 H39N15-68T1 VLP, H39N15-68T2 VLP, H39N15-68T3 VLP, H39N15-68T4 VLP 및 H39N15-68T5 VLP 로 면역화되었다.
알루미늄 어쥬번트 그룹 1-3에서, 5마리의 마우스/하위그룹을 각각 5 μg, 1 μg, 및 0.2 μg의 면역화 용량 및 1 mL의 주사 부피로 복강내 주사하였다. 모든 마우스들은 0주차에 첫번째 백신 접종을 받은 다음, 각각 2주차, 4주차에 부스터 백신 접종을 받았다. 6주차에, 안와 출혈을 통해 혈액 샘플을 수집하고, 혈청 내 HPV39 및 HPV68에 대한 항체 역가를 분석하였다. 상기 분석 결과를 도 7A-7C에 나타내었다. 상기 결과는 H39N15-68T4 VLP가 마우스에서 HPV39에 대한 고-역가 중화 항체의 생성을 유도할 수 있음을 나타내며, 이의 보호 효과는 동일한 용량의 HPV39N15 VLP 단독의 경우보다 살짝 약했으나, 동일한 용량에서 HPV68N0 VLP 단독의 경우보다 현저히 우수하였고; 마우스에서 HPV68에 대한 고-역가 중화 항체의 생성을 유도할 수 있고, 이의 보호 효과는 동일한 용량의 HPV68N0 VLP 단독보다 살짝 약했으나, 동일한 용량에서 HPV39N15 VLP 단독의 경우보다 현저히 우수하였다. 이는 H39N15-68T4 VLP가 HPV39 및 HPV68에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
그룹 | 백신접종 항원 | 어쥬번트 | 면역화 용량 | 수 | 백신접종 절차(주) |
알루미늄 어쥬번트 그룹 1 | HPV39N15 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 |
HPV68N0 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
혼합된 HPV39/HPV68 VLP | 알루미늄 어쥬번트 | 각 VLP에 대해 5μg | 5 | 0, 2, 4 | |
H39N15-68T1 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T2 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T3 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T4 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T5 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
알루미늄 어쥬번트 그룹 2 | HPV39N15 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 |
HPV68N0 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
혼합된 HPV39/HPV68 VLP | 알루미늄 어쥬번트 | 각 VLP에 대해 1μg | 5 | 0, 2, 4 | |
H39N15-68T1 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T2 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T3 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T4 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T5 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
알루미늄 어쥬번트 그룹 3 | HPV39N15 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 |
HPV68N0 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
혼합된 HPV39/HPV68 VLP | 알루미늄 어쥬번트 | 각 VLP에 대해 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T1 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T2 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T3 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T4 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T5 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 |
실시예 4: 혈청전환 유도에 대한 바이러스-유사 입자의 ED
50
평가 1
이 실험에서, 사용된 바이러스-유사 입자는 H39N15-68T4 VLP이다.
6주령의 BalB/c 암컷 마우스 (8마리 마우스)를 단일 복강내 주사로 알루미늄 어쥬번트로 백신 접종했으며, 여기에서 H39N15-68T4 VLP는 (면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg) 실험군에서 사용하였고, HPV68N0 VLP 단독 (면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg), HPV39N15 VLP 단독 (면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg) 또는 혼합된 HPV39/HPV68 VLP (즉 HPV39N15 VLP 및 HPV68N0 VLP의 혼합물, 각 VLP에 대해 면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg); 면역화 부피는 1mL였다. 또한, 백신 희석에 사용된 희석제를 블랭크 대조군으로 사용하였다. 각 그룹에서 8마리의 마우스가 백신 접종 되었고, 백신 접종 후 5주차에 안구에서 정맥혈을 수집하였다. 혈청에서 HPV에 대한 항체를 검출하고, Reed-Muench 방법 (Reed LJ MH. A simple method of estimating fifty percent endpoints. Am J Hyg. 1938; 27:493-7)으로, 혈청전환 유도에 대한 ED50 (즉 마우스에서 항체 생성을 유도)을 각 샘플에서 계산하였다. 상기 결과를 표 5-8에 나타내었다.
타입 | 용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 8 | 100.00% | 0.019 |
0.300 | 8 | 8 | 100.00% | ||
0.100 | 8 | 6 | 88.89% | ||
0.033 | 8 | 8 | 83.33% | ||
0.011 | 8 | 2 | 20.00% | ||
HPV68 | 0.900 | 8 | 0 | 0.00% | >0.9 |
0.300 | 8 | 0 | 0.00% | ||
0.100 | 8 | 0 | 0.00% | ||
0.033 | 8 | 0 | 0.00% | ||
0.011 | 8 | 8 | 0.00% |
타입 | 용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 0 | 0.00% | >0.9 |
0.300 | 8 | 0 | 0.00% | ||
0.100 | 8 | 0 | 0.00% | ||
0.033 | 8 | 0 | 0.00% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV68 | 0.900 | 8 | 8 | 100.00% | 0.021 |
0.300 | 8 | 8 | 100.00% | ||
0.100 | 8 | 7 | 93.75% | ||
0.033 | 8 | 7 | 80.00% | ||
0.011 | 8 | 1 | 10.00% |
타입 | 용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 6 | 90.48% | 0.091 |
0.300 | 8 | 6 | 76.47% | ||
0.100 | 8 | 6 | 53.85% | ||
0.033 | 8 | 1 | 7.14% | ||
0.11 | 8 | 0 | 0.00% | ||
HPV68 | 0.900 | 8 | 4 | 75.00% | 0.300 |
0.300 | 8 | 4 | 50.00% | ||
0.100 | 8 | 2 | 22.22% | ||
0.033 | 8 | 2 | 9.09% | ||
0.011 | 8 | 0 | 0.00% |
타입 | 용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 7 | 97.06% | 0.017 |
0.300 | 8 | 8 | 96.30% | ||
0.100 | 8 | 8 | 94.74% | ||
0.033 | 8 | 8 | 90.91% | ||
0.011 | 8 | 2 | 22.22% | ||
HPV68 | 0.900 | 8 | 7 | 96.88% | 0.021 |
0.300 | 8 | 8 | 96.00% | ||
0.100 | 8 | 8 | 94.12% | ||
0.033 | 8 | 7 | 80.00% | ||
0.011 | 8 | 1 | 10.00% |
상기 결과는 마우스 백신 접종 5주 후, 마우스에서 HPV39에 대한 항체 생성을 유도하기 위한 H39N15-68T4 VLP의 ED50은 HPV39N15 VLP 단독의 경우에 필적하고, HPV68N0 VLP 단독의 경우보다 현저히 우수하며; 마우스에서 HPV68에 대한 항체 생성을 유도하기 위한 이의 ED50은 HPV68N0 VLP 단독의 경우에 비해 살짝 약하지만, HPV39N15 VLP 단독의 경우보다는 현저히 우수함을 보였다. 이는 H39N15-68T4 VLP가 HPV68 및 HPV39에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
실시예 5: 바이러스-유사 입자로 면역화된 마우스 혈청의 중화 항체 역가 평가 2
이 실험에서, 사용된 바이러스-유사 입자는 H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP이다.
이 실험에서, 백신 접종 스케쥴은 표 9에 나타내었다. 모든 마우스 (6주령의 BalB/c 암컷 마우스)를 3개 그룹으로 나누었다: 알루미늄 어쥬번트 그룹 1 (면역화 용량 5 μg, 알루미늄 어쥬번트 사용), 알루미늄 어쥬번트 그룹 2 (면역화 용량 1 μg, 알루미늄 어쥬번트 사용), 및 알루미늄 어쥬번트 그룹 3 (면역화 용량 0.2 μg, 알루미늄 어쥬번트 사용). 각 그룹은 8개의 하위 그룹으로 더 나누어졌다. 대조군 하위그룹 1, 2 및 3은 각각 HPV39N15 VLP 단독, HPV68N0 VLP 단독 및 HPV70N10 VLP 단독으로 면역화되었고, 대조군 하위그룹 4는 혼합된 HPV39/HPV68/HPV70 VLP (즉 HPV39N15 VLP, HPV68N0 VLP 및 HPV70N10 VLP의 혼합물, 각 VLP에 대해 주어진 면역화 용량으로 혼합됨)로 면역화되었다. 실험군 하위그룹 1, 2, 3 및 4는 각각 H39N15-68T4-70S1 VLP, H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP 로 면역화되었다.
알루미늄 어쥬번트 그룹 1-3에서, 5마리의 마우스/하위그룹을 각각 5 μg, 1 μg, 및 0.2 μg의 면역화 용량 및 1 mL의 주사 부피로 복강내 주사하였다. 모든 마우스들은 0주차에 첫번째 백신 접종을 받은 다음, 각각 2주차, 4주차에 부스터 백신 접종을 받았다. 6주차에, 안와 출혈을 통해 혈액 샘플을 수집하고, 혈청 내 HPV39, HPV68 및 HPV70에 대한 항체 역가를 분석하였다. 상기 분석 결과를 도 8A-8C에 나타내었다. 상기 결과는 H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP 가 마우스에서 HPV39에 대한 고-역가 중화 항체의 생성을 유도할 수 있음을 나타내며, 이들의 보호 효과는 동일한 용량에서 HPV39N15 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우보다 살짝 약했으나, 동일한 용량에서 HPV68N0 VLP 단독 및 HPV70N10 VLP 단독의 경우보다 현저히 우수하였고; 마우스에서 HPV68에 대한 고-역가 중화 항체의 생성을 유도할 수 있었으며, 이들의 보호 효과는 동일한 용량에서 HPV68N0 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우에 필적하였고, 동일한 용량에서 HPV39N15 VLP 단독 및 HPV70N10 VLP 보다 현저히 우수하였고; 마우스에서 HPV70에 대한 고-역가 중화 항체의 생성을 유도할 수 있었으며, 이들의 보호 효과는 동일한 용량에서 HPV70N10 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우에 필적하였고, 동일한 용량에서 HPV39N15 VLP 단독 및 HPV68N0 VLP 단독보다 현저히 우수함을 보였다. 이는 H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP가 HPV39, HPV68 및 HPV70에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
그룹 | 백신접종 항원 | 어쥬번트 | 면역화 용량 | 수 | 백신접종 절차(주) |
알루미늄 어쥬번트 그룹 1 | HPV39N15 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 |
HPV68N0 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
HPV70N10 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
혼합된 HPV39/HPV68/HPV70 VLP | 알루미늄 어쥬번트 | 각 VLP에 대해 5μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S1 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S2 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S3 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S5 VLP | 알루미늄 어쥬번트 | 5μg | 5 | 0, 2, 4 | |
알루미늄 어쥬번트 그룹 2 | HPV39N15 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 |
HPV68N0 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
HPV70N10 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
혼합된 HPV39/HPV68/HPV70 VLP | 알루미늄 어쥬번트 | 각 VLP에 대해 1μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S1 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S2 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S3 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S5 VLP | 알루미늄 어쥬번트 | 1μg | 5 | 0, 2, 4 | |
알루미늄 어쥬번트 그룹 3 | HPV39N15 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 |
HPV68N0 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
HPV70N10 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
혼합된 HPV39/HPV68/HPV70 VLP | 알루미늄 어쥬번트 | 각 VLP에 대해 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S1 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S2 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S3 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 | |
H39N15-68T4-70S5 VLP | 알루미늄 어쥬번트 | 0.2μg | 5 | 0, 2, 4 |
실시예 6: 혈청전환 유도에 대한 바이러스-유사 입자의 ED
50
평가 2
이 실험에서, 사용된 바이러스-유사 입자는 H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP이다.
6주령의 BalB/c 암컷 마우스 (8마리 마우스)를 단일 복강내 주사로 알루미늄 어쥬번트로 백신 접종했으며, 여기에서 H39N15-68T4-70S2 VLP, H39N15-68T4-70S3 VLP 및 H39N15-68T4-70S5 VLP (면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg) 는 실험군에서 사용하였고, HPV39N15 VLP 단독, HPV68N0 VLP 단독, HPV70N10 VLP 단독 (면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg) 또는 혼합된 HPV39/HPV68/HPV70 VLP (즉 HPV39N15 VLP, HPV68N0 VLP 및 HPV70N10 VLP의 혼합물, 각 VLP에 대해 면역화 용량 0.900μg, 0.300μg, 0.100μg, 0.033μg 또는 0.011μg); 면역화 부피는 1mL였다. 또한, 백신 희석에 사용된 희석제를 블랭크 대조군으로 사용하였다. 각 그룹에서 8마리의 마우스가 백신 접종 되었고, 백신 접종 후 5주차에 안구에서 정맥혈을 수집하였다. 혈청에서 HPV에 대한 항체를 검출하고, Reed-Muench 방법 (Reed LJ MH. A simple method of estimating fifty percent endpoints. Am J Hyg. 1938; 27:493-7)으로, 혈청전환 유도에 대한 ED50 (즉 마우스에서 항체 생성을 유도)을 각 샘플에서 계산하였다. 상기 결과를 표 10-16에 나타내었다.
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 8 | 100.00% | 0.019 |
0.300 | 8 | 8 | 100.00% | ||
0.100 | 8 | 8 | 100.00% | ||
0.033 | 8 | 7 | 88.89% | ||
0.011 | 8 | 1 | 11.11% | ||
HPV68 | 0.900 | 8 | 0 | 11.11% | >0.9 |
0.300 | 8 | 0 | 5.88% | ||
0.100 | 8 | 0 | 4.00% | ||
0.033 | 8 | 1 | 3.13% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV70 | 0.900 | 8 | 0 | 11.11% | >0.9 |
0.300 | 8 | 1 | 6.25% | ||
0.100 | 8 | 0 | 0.00% | ||
0.033 | 8 | 0 | 0.00% | ||
0.011 | 8 | 0 | 0.00% |
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 0 | 20.00% | >0.9 |
0.300 | 8 | 0 | 11.11% | ||
0.100 | 8 | 1 | 8.00% | ||
0.033 | 8 | 1 | 3.23% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV68 | 0.900 | 8 | 8 | 100.00% | 0.021 |
0.300 | 8 | 8 | 100.00% | ||
0.100 | 8 | 8 | 100.00% | ||
0.033 | 8 | 6 | 77.78% | ||
0.011 | 8 | 1 | 10.00% | ||
HPV70 | 0.900 | 8 | 2 | 50.00% | >0.9 |
0.300 | 8 | 2 | 25.00% | ||
0.100 | 8 | 0 | 9.09% | ||
0.033 | 8 | 2 | 7.14% | ||
0.011 | 8 | 0 | 0.00% |
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 | 양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 2 | 40.00% | >0.9 |
0.300 | 8 | 0 | 12.50% | ||
0.100 | 8 | 1 | 8.70% | ||
0.033 | 8 | 1 | 3.45% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV68 | 0.900 | 8 | 0 | 0.00% | >0.9 |
0.300 | 8 | 0 | 0.00% | ||
0.100 | 8 | 0 | 0.00% | ||
0.033 | 8 | 0 | 0.00% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV70 | 0.900 | 8 | 8 | 100.00% | 0.017 |
0.300 | 8 | 8 | 100.00% | ||
0.100 | 8 | 8 | 100.00% | ||
0.033 | 8 | 7 | 90.00% | ||
0.011 | 8 | 2 | 22.22% |
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 각 VLP에 대해 0.900μg | 8 | 8 | 100.00% | 0.021 |
각 VLP에 대해 0.300μg | 8 | 8 | 100.00% | ||
각 VLP에 대해 0.100μg | 8 | 7 | 93.75% | ||
각 VLP에 대해 0.033μg | 8 | 7 | 80.00% | ||
각 VLP에 대해 0.011μg | 8 | 1 | 10.00% | ||
HPV68 | 각 VLP에 대해 0.900μg | 8 | 8 | 100.00% | 0.019 |
각 VLP에 대해 0.300μg | 8 | 8 | 100.00% | ||
각 VLP에 대해 0.100μg | 8 | 7 | 94.12% | ||
각 VLP에 대해 0.033μg | 8 | 7 | 81.82% | ||
각 VLP에 대해 0.011μg | 2 | 20.00% | |||
HPV70 | 각 VLP에 대해 0.900μg | 8 | 8 | 100.00% | 0.021 |
각 VLP에 대해 0.300μg | 8 | 8 | 100.00% | ||
각 VLP에 대해 0.100μg | 8 | 7 | 93.75% | ||
각 VLP에 대해 0.033μg | 8 | 7 | 80.00% | ||
각 VLP에 대해 0.011μg | 8 | 1 | 10.00% |
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 |
양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 8 | 100.00% | 0.017 |
0.300 | 8 | 7 | 96.15% | ||
0.100 | 8 | 8 | 94.74% | ||
0.033 | 8 | 8 | 90.91% | ||
0.011 | 8 | 2 | 22.22% | ||
HPV68 | 0.900 | 8 | 6 | 100.00% | 0.028 |
0.300 | 8 | 8 | 91.67% | ||
0.100 | 8 | 7 | 82.35% | ||
0.033 | 8 | 6 | 58.33% | ||
0.011 | 8 | 1 | 7.69% | ||
HPV70 | 0.900 | 8 | 7 | 96.30% | 0.033 |
0.300 | 8 | 7 | 90.48% | ||
0.100 | 8 | 5 | 70.59% | ||
0.033 | 8 | 6 | 50.00% | ||
0.011 | 8 | 1 | 6.67% |
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 | 양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 3 | 50.00% | 0.9 |
0.300 | 8 | 1 | 14.29% | ||
0.100 | 8 | 0 | 4.76% | ||
0.033 | 8 | 1 | 3.57% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV68 | 0.900 | 8 | 7 | 96.88% | 0.020 |
0.300 | 8 | 7 | 92.31% | ||
0.100 | 8 | 7 | 85.00% | ||
0.033 | 8 | 8 | 76.92% | ||
0.011 | 8 | 2 | 18.18% | ||
HPV70 | 0.900 | 8 | 4 | 63.64% | 0.611 |
0.300 | 8 | 3 | 25.00% | ||
0.100 | 8 | 0 | 0.00% | ||
0.033 | 8 | 0 | 0.00% | ||
0.011 | 8 | 0 | 0.00% |
타입 | 백신접종용량 (μg) | 마우스의 총 수 | 양의 전환을 갖는 마우스의 수 | 양의 전환율 | ED50(μg) |
HPV39 | 0.900 | 8 | 7 | 96.97% | 0.019 |
0.300 | 8 | 7 | 92.59% | ||
0.100 | 8 | 8 | 90.00% | ||
0.033 | 8 | 8 | 83.33% | ||
0.011 | 8 | 2 | 20.00% | ||
HPV68 | 0.900 | 8 | 8 | 100.00% | 0.148 |
0.300 | 8 | 8 | 100.00% | ||
0.100 | 8 | 1 | 22.22% | ||
0.033 | 8 | 1 | 6.67% | ||
0.011 | 8 | 0 | 0.00% | ||
HPV70 | 0.900 | 8 | 7 | 96.30% | 0.042 |
0.300 | 8 | 6 | 86.36% | ||
0.100 | 8 | 8 | 81.25% | ||
0.033 | 8 | 4 | 41.67% | ||
0.011 | 8 | 1 | 6.67% |
상기 결과는 마우스 백신 접종 5주 후, 마우스에서 HPV39에 대한 항체 생성을 유도하기 위한 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 ED50은 HPV39N15 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우에 필적하고, HPV68N0 VLP 단독 및 HPV70N10 VLP 단독의 경우보다 현저히 우수하며; 마우스에서 HPV68에 대한 항체 생성을 유도하기 위한 이의 ED50은 HPV68N0 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP의 경우에 필적하고, HPV39N15 VLP 단독 및 HPV70N10 VLP 단독의 경우보다 현저히 우수하며; 마우스에서 HPV70에 대한 항체 생성을 유도하기 위한 이의 ED50은 HPV70N10 VLP 단독 및 혼합된 HPV39/HPV68/HPV70 VLP 의 경우에 필적하고, HPV39N15 VLP 단독 및 HPV68N0 VLP 단독의 경우보다 현저히 우수함을 보였다. 이는 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP가 HPV68, HPV39 및 HPV70에 대해 우수한 교차-면역원성 및 교차-보호를 가짐을 나타낸다.
실시예 7: 바이러스-유사 입자의 열안정성 평가
GE Company (즉 the original MicroCal Co.)로부터 구입한 시차주사열량계 VP 캐필러리 DSC를 사용하여 HPV39N15 단백질, HPV68N0 단백질, HPV70N10 단백질, H39N15-68T4 단백질, H39N15-68T4-70S2 단백질 및 H39N15-68T4-70S5 단백질에 의해 형성된 VLP의 열안정성에 대해 평가하였으며, 여기에서 상기 단백질용 저장 버퍼가 대조군으로 사용되었고, 상기 단백질들은 10℃-90℃의 온도 범위 내에서 1.5℃/분의 가열속도로 스캐닝되었다. 검측 결과를 도 9에 나타내었다. 상기 결과는 상기 단백질들에 의해 형성된 이들 VLP가 모두 매우 높은 열안정성을 가짐을 보였다.
실시예 8: H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 3차원 구조의 복원
초저온-전자 현미경법(cryo-EM)을 사용한 3차원 구조 복원 실험을 통해 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 3차원 구조를 복원하였다 (Wolf M, Garcea RL, Grigorieff N. et al. Proc Natl Acad Sci U S A. (2010), 107(14): 6298-303). 간단히 말해서, H39N15-68T4-70S2 VLP의 초저온-전자 현미경법(cryo-EM) 사진 (도 10의 A), 균일한 크기 및 50 nm 초과의 직경을 갖는 6410개 입자를 선택하여 컴퓨터 오버래핑(computer overlapping) 및 구조적 복원(structural reconstruction)을 수행하였고, H39N15-68T4-70S2 VLP의 3차원 구조를 얻었다. 상기 얻어진 3차원 구조를 도 10의 B에 나타내었다 (14.51Å의 해상도). 또한, H39N15-68T4-70S5 VLP의 초저온-전자 현미경법(cryo-EM) 사진 (도 10의 C), 균일한 크기 및 50 nm 초과의 직경을 갖는 617개 입자를 선택하여 컴퓨터 오버래핑 및 구조적 복원을 수행하였고, H39N15-68T4-70S5 VLP의 3차원 구조를 얻었다. 상기 얻어진 3차원 구조를 도 10의 D에 나타내었다 (17.64Å의 해상도). 상기 결과는 H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP 둘 다 72개 캡소머(capsomers)(형태학적 서브유닛, 펜타머)로 이루어진 T=7 정이십면체 구조 (h=1, k=2)를 가짐을 보였다. 준평형 원리 (quasi-equivalence)와 일치하는 전통적인 정이십면체 바이러스 캡시드와 달리, H39N15-68T4-70S2 VLP 및 H39N15-68T4-70S5 VLP의 구조에서 모든 구성요소 서브유닛은 헥사머가 없는 펜타머였다. 더욱이, 상기 2개 VLP들은 약 60 nm의 외부 직경을 가졌다. 이는 이전에 보고된 천연 HPV 바이러스 입자 및 진핵 발현 시스템 (예를 들어 폭스바이러스 발현 시스템)에서 제조된 HPV VLP의 3차원 구조와 유사했다 (Baker TS, Newcomb WW, Olson NH. et al. Biophys J. (1991), 60(6): 1445-1456. Hagensee ME, Olson NH, Baker TS, et al. J Virol. (1994), 68(7):4503-4505. Buck CB, Cheng N, Thompson CD. et al. J Virol. (2008), 82(11): 5190-7).
본 발명의 구체적인 실시예를 상세히 기재하였지만, 당업자라면 본 명세서에 개시된 교시에 따라 다양한 수정 및 변경이 가능하며, 이러한 수정 및 변경은 본 발명의 범위 내에 있음을 이해할 것이다. 본 발명의 범위는 첨부된 특허청구의 범위 및 그의 임의의 균등물에 의해 제공된다.
<110> Xiamen University
Xiamen Innovax Biotech Co., Ltd.
<120> Mutant of L1 protein of Human Papillomavirus Type 39
<130> PM038277KR
<150> CN201810563378.0
<151> 2018-06-04
<160> 71
<170> PatentIn version 3.5
<210> 1
<211> 505
<212> PRT
<213> Human papillomavirus type 39
<400> 1
Met Ala Leu Trp Arg Ser Ser Asp Ser Met Val Tyr Leu Pro Pro Pro
1 5 10 15
Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg Thr Gly
20 25 30
Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro
35 40 45
Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile Pro Lys
50 55 60
Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro Asp Pro
65 70 75 80
Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu Thr Gln
85 90 95
Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly Gln Pro
100 105 110
Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln Asp Asp
115 120 125
Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser Arg Asp
130 135 140
Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys
145 150 155 160
Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys Lys Pro
165 170 175
Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val Asn Thr
180 185 190
Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala Met Asp
195 200 205
Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp Ile Cys
210 215 220
Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala Asp Val
225 230 235 240
Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Ala Ile Pro Ala
260 265 270
Gln Leu Tyr Ile Lys Gly Thr Asp Ile Arg Ala Asn Pro Gly Ser Ser
275 280 285
Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp Ser Gln
290 295 300
Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His Asn Asn
305 310 315 320
Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp Thr Thr
325 330 335
Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser Ile Pro
340 345 350
Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His Val Glu
355 360 365
Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr Leu Thr
370 375 380
Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile Leu Asp
385 390 395 400
Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu Val Asp
405 410 415
Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys Asp Ala
420 425 430
Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe Trp Asn
435 440 445
Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe Pro Leu
450 455 460
Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro Thr Ile
465 470 475 480
Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser Ala Thr
485 490 495
Lys His Lys Arg Lys Arg Val Ser Lys
500 505
<210> 2
<211> 505
<212> PRT
<213> Human papillomavirus type 68
<400> 2
Met Ala Leu Trp Arg Ala Ser Asp Asn Met Val Tyr Leu Pro Pro Pro
1 5 10 15
Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg Thr Gly
20 25 30
Met Tyr Tyr Tyr Ala Gly Thr Ser Arg Leu Leu Thr Val Gly His Pro
35 40 45
Tyr Phe Lys Val Pro Met Ser Gly Gly Arg Lys Gln Gly Ile Pro Lys
50 55 60
Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro Asp Pro
65 70 75 80
Asn Lys Phe Ser Val Pro Glu Ser Thr Leu Tyr Asn Pro Asp Thr Gln
85 90 95
Arg Met Val Trp Ala Cys Val Gly Val Glu Ile Gly Arg Gly Gln Pro
100 105 110
Leu Gly Val Gly Leu Ser Gly His Pro Leu Tyr Asn Arg Leu Asp Asp
115 120 125
Thr Glu Asn Ser Pro Phe Ser Ser Asn Lys Asn Pro Lys Asp Ser Arg
130 135 140
Asp Asn Val Ala Val Asp Cys Lys Gln Thr Gln Leu Cys Ile Ile Gly
145 150 155 160
Cys Val Pro Ala Ile Gly Glu His Trp Ala Lys Gly Lys Ser Cys Lys
165 170 175
Pro Thr Asn Val Gln Gln Gly Asp Cys Pro Pro Leu Glu Leu Val Asn
180 185 190
Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala Met
195 200 205
Asp Phe Gly Thr Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp Ile
210 215 220
Cys Gln Ser Val Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala Asp
225 230 235 240
Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu Phe
245 250 255
Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr Ile Pro
260 265 270
Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr Pro Ser Ser
275 280 285
Tyr Val Tyr Ala Pro Ser Pro Ser Gly Ser Met Val Ser Ser Asp Ser
290 295 300
Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His Asn
305 310 315 320
Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp Thr
325 330 335
Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Thr Thr Asp Ser Thr Val
340 345 350
Pro Ala Val Tyr Asp Ser Asn Lys Phe Lys Glu Tyr Val Arg His Val
355 360 365
Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Ile Thr Leu
370 375 380
Ser Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Pro Ala Ile Leu
385 390 395 400
Asp Asp Trp Asn Phe Gly Val Ala Pro Pro Pro Ser Ala Ser Leu Val
405 410 415
Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys Asp
420 425 430
Ala Pro Ala Pro Val Lys Lys Asp Pro Tyr Asp Gly Leu Asn Phe Trp
435 440 445
Asn Val Asp Leu Lys Glu Lys Phe Ser Ser Glu Leu Asp Gln Phe Pro
450 455 460
Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Val Arg Arg Arg Pro Thr
465 470 475 480
Ile Gly Pro Arg Lys Arg Thr Ala Thr Ala Ala Thr Thr Ser Thr Ser
485 490 495
Lys His Lys Arg Lys Arg Val Ser Lys
500 505
<210> 3
<211> 506
<212> PRT
<213> Human papillomavirus type 70
<400> 3
Met Ala Leu Trp Arg Ser Ser Asp Asn Thr Val Tyr Leu Pro Pro Pro
1 5 10 15
Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg Thr Gly
20 25 30
Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly His Pro
35 40 45
Tyr Phe Lys Val Pro Val Asn Gly Gly Arg Lys Gln Glu Ile Pro Lys
50 55 60
Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Ser Leu Pro Asp Pro
65 70 75 80
Asn Lys Phe Gly Leu Pro Asp Pro Ser Leu Tyr Asn Pro Asp Thr Gln
85 90 95
Arg Leu Val Trp Ala Cys Ile Gly Val Glu Ile Gly Arg Gly Gln Pro
100 105 110
Leu Gly Val Gly Val Ser Gly His Pro Leu Tyr Asn Arg Leu Asp Asp
115 120 125
Thr Glu Asn Ser His Phe Ser Ser Ala Val Asn Thr Gln Asp Ser Arg
130 135 140
Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile Gly
145 150 155 160
Cys Val Pro Ala Met Gly Glu His Trp Ala Lys Gly Lys Ala Cys Lys
165 170 175
Ser Thr Thr Val Gln Gln Gly Asp Cys Pro Pro Leu Glu Leu Val Asn
180 185 190
Thr Ala Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala Met
195 200 205
Asp Phe Arg Thr Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp Ile
210 215 220
Cys Gln Ser Val Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala Asp
225 230 235 240
Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Lys Glu Gln Leu Phe
245 250 255
Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr Ile Pro
260 265 270
Ser Glu Leu Tyr Ile Lys Gly Thr Asp Ile Arg Asp Arg Pro Gly Thr
275 280 285
His Val Tyr Ser Pro Ser Pro Ser Gly Ser Met Val Ser Ser Asp Ser
290 295 300
Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His Asn
305 310 315 320
Asn Gly Ile Cys Trp His Asn Gln Leu Phe Ile Thr Val Val Asp Thr
325 330 335
Thr Arg Ser Thr Asn Phe Thr Leu Ser Ala Cys Thr Glu Thr Ala Ile
340 345 350
Pro Ala Val Tyr Ser Pro Thr Lys Phe Lys Glu Tyr Thr Arg His Val
355 360 365
Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Ile Thr Leu
370 375 380
Thr Ala Asp Val Met Ala Tyr Ile His Thr Met Asn Pro Ala Ile Leu
385 390 395 400
Asp Asn Trp Asn Ile Gly Val Thr Pro Pro Pro Ser Ala Ser Leu Val
405 410 415
Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Ala Cys Gln Lys Asp
420 425 430
Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Asp Leu Lys Phe Trp
435 440 445
Asn Val Asp Leu Lys Glu Lys Phe Ser Thr Glu Leu Asp Gln Phe Pro
450 455 460
Leu Gly Arg Lys Phe Leu Leu Gln Val Gly Ala Arg Arg Arg Pro Thr
465 470 475 480
Ile Gly Pro Arg Lys Arg Pro Ala Ser Ala Lys Ser Ser Ser Ser Ala
485 490 495
Ser Lys His Lys Arg Lys Arg Val Ser Lys
500 505
<210> 4
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T1
<400> 4
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Pro Met Ser Gly Gly Arg Lys Gln Gly Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys
145 150 155 160
Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Ala Ile
245 250 255
Pro Ala Gln Leu Tyr Ile Lys Gly Thr Asp Ile Arg Ala Asn Pro Gly
260 265 270
Ser Ser Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser
325 330 335
Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 5
<211> 492
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T2
<400> 5
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro Leu Tyr Asn Arg Leu
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Asn Lys Asn Pro Lys Asp
115 120 125
Ser Arg Asp Asn Val Ala Val Asp Cys Lys Gln Thr Gln Leu Cys Ile
130 135 140
Ile Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala
145 150 155 160
Cys Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu
165 170 175
Val Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly
180 185 190
Ala Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu
195 200 205
Asp Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser
210 215 220
Ala Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln
225 230 235 240
Leu Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Ala
245 250 255
Ile Pro Ala Gln Leu Tyr Ile Lys Gly Thr Asp Ile Arg Ala Asn Pro
260 265 270
Gly Ser Ser Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser
275 280 285
Asp Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly
290 295 300
His Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val
305 310 315 320
Asp Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser
325 330 335
Ser Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg
340 345 350
His Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val
355 360 365
Thr Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser
370 375 380
Ile Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser
385 390 395 400
Leu Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln
405 410 415
Lys Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys
420 425 430
Phe Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln
435 440 445
Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg
450 455 460
Pro Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser
465 470 475 480
Ser Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 6
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T3
<400> 6
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Ala Lys Gly Lys Ser Cys
145 150 155 160
Lys Pro Thr Asn Val Gln Gln Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Ala Ile
245 250 255
Pro Ala Gln Leu Tyr Ile Lys Gly Thr Asp Ile Arg Ala Asn Pro Gly
260 265 270
Ser Ser Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser
325 330 335
Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 7
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T4
<400> 7
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys
145 150 155 160
Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr Ile
245 250 255
Pro Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr Pro Ser
260 265 270
Ser Tyr Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser
325 330 335
Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 8
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T5
<400> 8
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys
145 150 155 160
Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Ala Ile
245 250 255
Pro Ala Gln Leu Tyr Ile Lys Gly Thr Asp Ile Arg Ala Asn Pro Gly
260 265 270
Ser Ser Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Thr Asp Ser Thr
325 330 335
Val Pro Ala Val Tyr Asp Ser Asn Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 9
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T4-70S1
<400> 9
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Pro Val Asn Gly Gly Arg Lys Gln Glu Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys
145 150 155 160
Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr Ile
245 250 255
Pro Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr Pro Ser
260 265 270
Ser Tyr Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser
325 330 335
Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 10
<211> 492
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T4-70S2
<400> 10
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Val Ser Gly His Pro Leu Tyr Asn Arg Leu
100 105 110
Asp Asp Thr Glu Asn Ser His Phe Ser Ser Ala Val Asn Thr Gln Asp
115 120 125
Ser Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile
130 135 140
Ile Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala
145 150 155 160
Cys Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu
165 170 175
Val Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly
180 185 190
Ala Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu
195 200 205
Asp Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser
210 215 220
Ala Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln
225 230 235 240
Leu Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr
245 250 255
Ile Pro Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr Pro
260 265 270
Ser Ser Tyr Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser
275 280 285
Asp Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly
290 295 300
His Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val
305 310 315 320
Asp Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser
325 330 335
Ser Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg
340 345 350
His Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val
355 360 365
Thr Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser
370 375 380
Ile Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser
385 390 395 400
Leu Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln
405 410 415
Lys Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys
420 425 430
Phe Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln
435 440 445
Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg
450 455 460
Pro Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser
465 470 475 480
Ser Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 11
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T4-70S3
<400> 11
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Ala Lys Gly Lys Ala Cys
145 150 155 160
Lys Ser Thr Thr Val Gln Gln Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr Ile
245 250 255
Pro Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr Pro Ser
260 265 270
Ser Tyr Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser
325 330 335
Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 12
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> H39N15-68T4-70S5
<400> 12
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys
145 150 155 160
Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Thr Ile
245 250 255
Pro Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr Pro Ser
260 265 270
Ser Tyr Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Thr Glu Thr Ala
325 330 335
Ile Pro Ala Val Tyr Ser Pro Thr Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 13
<211> 1518
<212> DNA
<213> Human papillomavirus type 39
<400> 13
atggccctct ggcgcagctc cgattccatg gtctacctcc ccccccccag cgtcgccaag 60
gtcgtgaaca ccgacgacta cgtcacccgc accgggatct actactacgc cgggtccagc 120
cgcctgctga ccgtgggcca cccctacttc aaggtcggca tgaacggcgg gcgcaagcag 180
gatatcccca aggtcagcgc ctaccagtac cgcgtgttcc gcgtcaccct cccagacccc 240
aacaagttct ccatccccga cgccagcctg tacaaccccg agacccagcg cctggtgtgg 300
gcctgcgtgg gcgtcgaagt cgggcgcggg cagcccctcg gcgtcggcat ctccggccac 360
cccctgtaca accgccagga cgacaccgag aatagcccct tcagcagcac aacaaacaag 420
gattcccgcg acaacgtcag cgtcgactac aagcagaccc agctctgtat catcgggtgc 480
gtcccagcaa tcggcgaaca ctggggcaag ggcaaggcct gtaagccaaa caacgtgagc 540
accggcgatt gcccccccct ggagctggtg aatacaccca tcgaagacgg cgacatgatc 600
gacaccgggt acggcgccat ggatttcggc gccctccagg agacaaagtc cgaagtcccc 660
ctggacatct gccagagcat ctgcaagtac cccgactacc tccagatgag cgccgacgtc 720
tacggcgatt ccatgttctt ctgcctgcgc cgcgagcagc tcttcgcccg ccacttctgg 780
aaccgcggcg gcatggtcgg cgatgcaatc cccgcacagc tctacatcaa ggggaccgac 840
atccgcgcca atccaggctc cagcgtgtat tgtccaagcc catccggcag catggtgaca 900
agcgacagcc agctgttcaa caagccctac tggctgcaca aggcacaggg gcataataac 960
ggcatctgct ggcacaacca gctgttcctg accgtcgtcg ataccacacg ctccacaaat 1020
ttcaccctga gcacaagcat cgaaagcagc atccccagca cctacgaccc cagcaagttc 1080
aaggagtaca cacgccacgt cgaagaatac gacctgcagt tcatcttcca gctctgcacc 1140
gtgaccctga ccaccgacgt catgagctac atccacacca tgaacagcag catcctcgat 1200
aactggaact tcgccgtggc cccccccccc agcgcatccc tcgtggatac ctatcgctat 1260
ctgcagagcg ccgcaatcac ctgccagaag gacgcccccg cccccgagaa gaaggacccc 1320
tacgatggcc tgaagttctg gaacgtcgat ctgcgcgaga agttctccct ggagctggac 1380
cagttccccc tcggccgcaa gttcctcctc caggcacgcg tgcgccgccg ccccaccatc 1440
ggcccacgca agcgccccgc cgccagcacc agcagcagca gcgccaccaa gcacaagcgc 1500
aagcgcgtca gcaagtga 1518
<210> 14
<211> 1518
<212> DNA
<213> Human papillomavirus type 68
<400> 14
atggcactgt ggagagccag cgacaacatg gtgtacctgc cccctcccag cgtggccaag 60
gtggtcaaca ccgacgacta cgtgacccgg accggcatgt actactacgc cggcacctct 120
cggctcctga ccgtgggcca cccctacttc aaggtgccca tgagcggcgg cagaaagcag 180
ggcatcccca aggtgtccgc ctaccagtac cgggtgttca gagtgaccct gcccgacccc 240
aacaagttca gcgtgcccga gagcaccctg tacaaccccg acacccagcg gatggtctgg 300
gcctgcgtgg gcgtggagat cggcagaggc cagcccctgg gcgtgggcct gagcggccac 360
cccctgtaca atcggctgga cgacaccgag aacagcccct tcagcagcaa caagaacccc 420
aaggacagcc gggacaacgt ggccgtggac tgcaagcaga cccagctgtg catcatcggc 480
tgcgtgcctg ccattggcga gcactgggcc aagggcaaga gctgcaagcc caccaacgtg 540
cagcagggcg actgcccccc tctggaactg gtcaacacac ccatcgagga cggcgacatg 600
atcgacaccg gctacggcgc catggacttc ggcaccctgc aggaaaccaa gagcgaggtc 660
cccctggaca tctgccagag cgtgtgcaag taccccgact acctgcagat gagcgccgac 720
gtgtacggcg acagcatgtt cttttgcctg cggcgggagc agctgttcgc ccggcacttc 780
tggaacagag gcggcatggt cggcgacacc atccccaccg acatgtacat caagggcacc 840
gacatcagag agacacccag cagctacgtg tacgccccca gccccagcgg cagcatggtg 900
tccagcgaca gccagctgtt caacaagccc tactggctgc acaaggccca gggccacaac 960
aacggcatct gctggcacaa ccagctgttt ctgaccgtgg tggacaccac cagaagcacc 1020
aacttcaccc tgagcaccac caccgacagc accgtgcccg ccgtgtacga cagcaataag 1080
ttcaaagaat acgtgcggca cgtggaggaa tacgacctgc agttcatctt ccagctgtgt 1140
accatcaccc tgtccaccga cgtgatgagc tacatccaca ccatgaaccc cgccatcctg 1200
gacgactgga acttcggcgt ggcccctccc cctagcgcca gcctggtgga tacctacaga 1260
tacctgcaga gcgccgccat cacctgccag aaggacgccc ctgcccccgt gaagaaggac 1320
ccctacgacg gcctgaactt ctggaatgtg gacctgaaag agaagttcag cagcgagctg 1380
gaccagttcc ccctgggccg gaagttcctg ctgcaagccg gcgtgcggag aaggcccacc 1440
atcggcccca gaaagcggac cgccaccgca gccacaacct ccacctccaa gcacaagcgg 1500
aagcgggtgt ccaagtga 1518
<210> 15
<211> 1521
<212> DNA
<213> Human papillomavirus type 70
<400> 15
atggctttgt ggcggtctag tgacaacacg gtgtatttgc cacccccttc tgtggcgaag 60
gttgtcaata cagatgatta tgtaacacgt acaggcatat attattatgc tggaagctct 120
cgcttattaa cagtagggca tccttatttt aaggtacctg taaatggtgg ccgcaagcag 180
gaaataccta aggtgtctgc atatcagtat agggtattta gggtatccct acctgatcct 240
aataagtttg gccttccgga tccttccctt tataatcctg acacacaacg cctggtatgg 300
gcctgtatag gtgtggaaat tggtagaggc cagccattgg gcgttggtgt tagtggacat 360
cctttatata atagattgga tgatactgaa aattcacatt tttcctctgc tgttaataca 420
caggacagta gggacaatgt gtctgtggac tataagcaga cacagttatg tattataggc 480
tgtgttcctg ctatgggaga gcactgggca aagggcaagg cctgtaagtc cactactgta 540
caacagggcg attgtccacc attagaatta gttaatactg caattgagga tggcgatatg 600
atagatacag gctatggagc catggacttt cgtacattgc aggaaaccaa aagtgaggta 660
ccactagata tttgccaatc cgtgtgtaaa tatcctgatt atttgcagat gtctgctgat 720
gtatatgggg acagtatgtt tttttgtttg cgcaaggaac agttatttgc cagacacttt 780
tggaatagag gtggcatggt gggcgacaca ataccttcag agttatatat taaaggcacg 840
gatatacgtg atcgtcctgg tactcatgta tattcccctt ccccaagtgg ctctatggtt 900
tcttctgatt cccagttgtt taataagccc tattggttgc ataaggccca gggacacaat 960
aatggcattt gttggcataa ccagttgttt attactgtgg tggacactac acgtagtact 1020
aattttacat tgtctgcctg caccgaaaca gccatacctg ctgtatatag ccctacaaag 1080
tttaaggaat atactaggca tgtggaggaa tatgatttac aatttatatt tcagttgtgt 1140
actatcacat taactgcaga cgttatggcc tacatccata ctatgaatcc tgcaattttg 1200
gacaattgga atataggcgt tacccctcca ccatctgcaa gcttggtgga cacgtatagg 1260
tatttacaat cagcagctat agcatgtcag aaggatgctc ctgcacctga aaaaaaggat 1320
ccctatgacg atttaaaatt ttggaatgtt gatttaaagg aaaagtttag tacagaacta 1380
gatcagtttc ctttggggcg caaattttta ctacaggtag gggctcgcag acgtcctact 1440
ataggccctc gcaaacgccc tgcatcagct aaatcgtctt cctcagcctc taaacacaaa 1500
cggaaacgtg tgtccaagta a 1521
<210> 16
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T1
<400> 16
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtgcccatg 120
agcggcggca gaaagcaggg catccccaag gtgtccgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact ggggcaaggg caaggcctgt 480
aagccaaaca acgtgagcac cggcgattgc ccccccctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa ccgcggcggc atggtcggcg atgcaatccc cgcacagctc 780
tacatcaagg ggaccgacat ccgcgccaat ccaggctcca gcgtgtattg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcatcg aaagcagcat ccccagcacc 1020
tacgacccca gcaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 17
<211> 1479
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T2
<400> 17
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg gcagaggcca gcccctgggc 300
gtgggcctga gcggccaccc cctgtacaat cggctggacg acaccgagaa cagccccttc 360
agcagcaaca agaaccccaa ggacagccgg gacaacgtgg ccgtggactg caagcagacc 420
cagctctgta tcatcgggtg cgtcccagca atcggcgaac actggggcaa gggcaaggcc 480
tgtaagccaa acaacgtgag caccggcgat tgcccccccc tggagctggt gaatacaccc 540
atcgaagacg gcgacatgat cgacaccggg tacggcgcca tggatttcgg cgccctccag 600
gagacaaagt ccgaagtccc cctggacatc tgccagagca tctgcaagta ccccgactac 660
ctccagatga gcgccgacgt ctacggcgat tccatgttct tctgcctgcg ccgcgagcag 720
ctcttcgccc gccacttctg gaaccgcggc ggcatggtcg gcgatgcaat ccccgcacag 780
ctctacatca aggggaccga catccgcgcc aatccaggct ccagcgtgta ttgtccaagc 840
ccatccggca gcatggtgac aagcgacagc cagctgttca acaagcccta ctggctgcac 900
aaggcacagg ggcataataa cggcatctgc tggcacaacc agctgttcct gaccgtcgtc 960
gataccacac gctccacaaa tttcaccctg agcacaagca tcgaaagcag catccccagc 1020
acctacgacc ccagcaagtt caaggagtac acacgccacg tcgaagaata cgacctgcag 1080
ttcatcttcc agctctgcac cgtgaccctg accaccgacg tcatgagcta catccacacc 1140
atgaacagca gcatcctcga taactggaac ttcgccgtgg cccccccccc cagcgcatcc 1200
ctcgtggata cctatcgcta tctgcagagc gccgcaatca cctgccagaa ggacgccccc 1260
gcccccgaga agaaggaccc ctacgatggc ctgaagttct ggaacgtcga tctgcgcgag 1320
aagttctccc tggagctgga ccagttcccc ctcggccgca agttcctcct ccaggcacgc 1380
gtgcgccgcc gccccaccat cggcccacgc aagcgccccg ccgccagcac cagcagcagc 1440
agcgccacca agcacaagcg caagcgcgtc agcaagtga 1479
<210> 18
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T3
<400> 18
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact gggccaaggg caagagctgc 480
aagcccacca acgtgcagca gggcgactgc ccccctctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa ccgcggcggc atggtcggcg atgcaatccc cgcacagctc 780
tacatcaagg ggaccgacat ccgcgccaat ccaggctcca gcgtgtattg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcatcg aaagcagcat ccccagcacc 1020
tacgacccca gcaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 19
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T4
<400> 19
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact ggggcaaggg caaggcctgt 480
aagccaaaca acgtgagcac cggcgattgc ccccccctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa cagaggcggc atggtcggcg acaccatccc caccgacatg 780
tacatcaagg gcaccgacat cagagagaca cccagcagct acgtgtactg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcatcg aaagcagcat ccccagcacc 1020
tacgacccca gcaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 20
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T5
<400> 20
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact ggggcaaggg caaggcctgt 480
aagccaaaca acgtgagcac cggcgattgc ccccccctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa ccgcggcggc atggtcggcg atgcaatccc cgcacagctc 780
tacatcaagg ggaccgacat ccgcgccaat ccaggctcca gcgtgtattg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcaccg acagcaccgt gcccgccgtg 1020
tacgacagca ataagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 21
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T4-70S1
<400> 21
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctactttaa ggtacctgta 120
aatggtggcc gcaagcagga aatacctaag gtgtctgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact ggggcaaggg caaggcctgt 480
aagccaaaca acgtgagcac cggcgattgc ccccccctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa cagaggcggc atggtcggcg acaccatccc caccgacatg 780
tacatcaagg gcaccgacat cagagagaca cccagcagct acgtgtactg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcatcg aaagcagcat ccccagcacc 1020
tacgacccca gcaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 22
<211> 1479
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T4-70S2
<400> 22
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg gtagaggcca gccattgggc 300
gttggtgtta gtggacatcc tttatataat agattggatg atactgaaaa ttcacatttt 360
tcctctgctg ttaatacaca ggacagtagg gacaatgtgt ctgtggacta taagcagacc 420
cagctctgta tcatcgggtg cgtcccagca atcggcgaac actggggcaa gggcaaggcc 480
tgtaagccaa acaacgtgag caccggcgat tgcccccccc tggagctggt gaatacaccc 540
atcgaagacg gcgacatgat cgacaccggg tacggcgcca tggatttcgg cgccctccag 600
gagacaaagt ccgaagtccc cctggacatc tgccagagca tctgcaagta ccccgactac 660
ctccagatga gcgccgacgt ctacggcgat tccatgttct tctgcctgcg ccgcgagcag 720
ctcttcgccc gccacttctg gaacagaggc ggcatggtcg gcgacaccat ccccaccgac 780
atgtacatca agggcaccga catcagagag acacccagca gctacgtgta ctgtccaagc 840
ccatccggca gcatggtgac aagcgacagc cagctgttca acaagcccta ctggctgcac 900
aaggcacagg ggcataataa cggcatctgc tggcacaacc agctgttcct gaccgtcgtc 960
gataccacac gctccacaaa tttcaccctg agcacaagca tcgaaagcag catccccagc 1020
acctacgacc ccagcaagtt caaggagtac acacgccacg tcgaagaata cgacctgcag 1080
ttcatcttcc agctctgcac cgtgaccctg accaccgacg tcatgagcta catccacacc 1140
atgaacagca gcatcctcga taactggaac ttcgccgtgg cccccccccc cagcgcatcc 1200
ctcgtggata cctatcgcta tctgcagagc gccgcaatca cctgccagaa ggacgccccc 1260
gcccccgaga agaaggaccc ctacgatggc ctgaagttct ggaacgtcga tctgcgcgag 1320
aagttctccc tggagctgga ccagttcccc ctcggccgca agttcctcct ccaggcacgc 1380
gtgcgccgcc gccccaccat cggcccacgc aagcgccccg ccgccagcac cagcagcagc 1440
agcgccacca agcacaagcg caagcgcgtc agcaagtga 1479
<210> 23
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T4-70S3
<400> 23
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact gggcaaaggg caaggcctgt 480
aagtccacta ctgtacaaca gggcgattgt ccaccactgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa cagaggcggc atggtcggcg acaccatccc caccgacatg 780
tacatcaagg gcaccgacat cagagagaca cccagcagct acgtgtactg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcatcg aaagcagcat ccccagcacc 1020
tacgacccca gcaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 24
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H39N15-68T4-70S5
<400> 24
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact ggggcaaggg caaggcctgt 480
aagccaaaca acgtgagcac cggcgattgc ccccccctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa cagaggcggc atggtcggcg acaccatccc caccgacatg 780
tacatcaagg gcaccgacat cagagagaca cccagcagct acgtgtactg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcaccg aaacagccat acctgctgta 1020
tatagcccta caaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 25
<211> 20
<212> PRT
<213> Human papillomavirus type 68
<400> 25
Thr Ile Pro Thr Asp Met Tyr Ile Lys Gly Thr Asp Ile Arg Glu Thr
1 5 10 15
Pro Ser Ser Tyr
20
<210> 26
<211> 25
<212> PRT
<213> Human papillomavirus type 70
<400> 26
Val Ser Gly His Pro Leu Tyr Asn Arg Leu Asp Asp Thr Glu Asn Ser
1 5 10 15
His Phe Ser Ser Ala Val Asn Thr Gln
20 25
<210> 27
<211> 13
<212> PRT
<213> Human papillomavirus type 70
<400> 27
Ala Lys Gly Lys Ala Cys Lys Ser Thr Thr Val Gln Gln
1 5 10
<210> 28
<211> 12
<212> PRT
<213> Human papillomavirus type 70
<400> 28
Thr Glu Thr Ala Ile Pro Ala Val Tyr Ser Pro Thr
1 5 10
<210> 29
<211> 491
<212> PRT
<213> Human papillomavirus type 39
<400> 29
Met Pro Ser Val Ala Lys Val Val Asn Thr Asp Asp Tyr Val Thr Arg
1 5 10 15
Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Val Gly
20 25 30
His Pro Tyr Phe Lys Val Gly Met Asn Gly Gly Arg Lys Gln Asp Ile
35 40 45
Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Thr Leu Pro
50 55 60
Asp Pro Asn Lys Phe Ser Ile Pro Asp Ala Ser Leu Tyr Asn Pro Glu
65 70 75 80
Thr Gln Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly
85 90 95
Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu Tyr Asn Arg Gln
100 105 110
Asp Asp Thr Glu Asn Ser Pro Phe Ser Ser Thr Thr Asn Lys Asp Ser
115 120 125
Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Ile
130 135 140
Gly Cys Val Pro Ala Ile Gly Glu His Trp Gly Lys Gly Lys Ala Cys
145 150 155 160
Lys Pro Asn Asn Val Ser Thr Gly Asp Cys Pro Pro Leu Glu Leu Val
165 170 175
Asn Thr Pro Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Tyr Gly Ala
180 185 190
Met Asp Phe Gly Ala Leu Gln Glu Thr Lys Ser Glu Val Pro Leu Asp
195 200 205
Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala
210 215 220
Asp Val Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu
225 230 235 240
Phe Ala Arg His Phe Trp Asn Arg Gly Gly Met Val Gly Asp Ala Ile
245 250 255
Pro Ala Gln Leu Tyr Ile Lys Gly Thr Asp Ile Arg Ala Asn Pro Gly
260 265 270
Ser Ser Val Tyr Cys Pro Ser Pro Ser Gly Ser Met Val Thr Ser Asp
275 280 285
Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His
290 295 300
Asn Asn Gly Ile Cys Trp His Asn Gln Leu Phe Leu Thr Val Val Asp
305 310 315 320
Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser Thr Ser Ile Glu Ser Ser
325 330 335
Ile Pro Ser Thr Tyr Asp Pro Ser Lys Phe Lys Glu Tyr Thr Arg His
340 345 350
Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Val Thr
355 360 365
Leu Thr Thr Asp Val Met Ser Tyr Ile His Thr Met Asn Ser Ser Ile
370 375 380
Leu Asp Asn Trp Asn Phe Ala Val Ala Pro Pro Pro Ser Ala Ser Leu
385 390 395 400
Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala Ala Ile Thr Cys Gln Lys
405 410 415
Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro Tyr Asp Gly Leu Lys Phe
420 425 430
Trp Asn Val Asp Leu Arg Glu Lys Phe Ser Leu Glu Leu Asp Gln Phe
435 440 445
Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Arg Val Arg Arg Arg Pro
450 455 460
Thr Ile Gly Pro Arg Lys Arg Pro Ala Ala Ser Thr Ser Ser Ser Ser
465 470 475 480
Ala Thr Lys His Lys Arg Lys Arg Val Ser Lys
485 490
<210> 30
<211> 1476
<212> DNA
<213> Human papillomavirus type 39
<400> 30
atgcccagcg tcgccaaggt cgtgaacacc gacgactacg tcacccgcac cgggatctac 60
tactacgccg ggtccagccg cctgctgacc gtgggccacc cctacttcaa ggtcggcatg 120
aacggcgggc gcaagcagga tatccccaag gtcagcgcct accagtaccg cgtgttccgc 180
gtcaccctcc cagaccccaa caagttctcc atccccgacg ccagcctgta caaccccgag 240
acccagcgcc tggtgtgggc ctgcgtgggc gtcgaagtcg ggcgcgggca gcccctcggc 300
gtcggcatct ccggccaccc cctgtacaac cgccaggacg acaccgagaa tagccccttc 360
agcagcacaa caaacaagga ttcccgcgac aacgtcagcg tcgactacaa gcagacccag 420
ctctgtatca tcgggtgcgt cccagcaatc ggcgaacact ggggcaaggg caaggcctgt 480
aagccaaaca acgtgagcac cggcgattgc ccccccctgg agctggtgaa tacacccatc 540
gaagacggcg acatgatcga caccgggtac ggcgccatgg atttcggcgc cctccaggag 600
acaaagtccg aagtccccct ggacatctgc cagagcatct gcaagtaccc cgactacctc 660
cagatgagcg ccgacgtcta cggcgattcc atgttcttct gcctgcgccg cgagcagctc 720
ttcgcccgcc acttctggaa ccgcggcggc atggtcggcg atgcaatccc cgcacagctc 780
tacatcaagg ggaccgacat ccgcgccaat ccaggctcca gcgtgtattg tccaagccca 840
tccggcagca tggtgacaag cgacagccag ctgttcaaca agccctactg gctgcacaag 900
gcacaggggc ataataacgg catctgctgg cacaaccagc tgttcctgac cgtcgtcgat 960
accacacgct ccacaaattt caccctgagc acaagcatcg aaagcagcat ccccagcacc 1020
tacgacccca gcaagttcaa ggagtacaca cgccacgtcg aagaatacga cctgcagttc 1080
atcttccagc tctgcaccgt gaccctgacc accgacgtca tgagctacat ccacaccatg 1140
aacagcagca tcctcgataa ctggaacttc gccgtggccc ccccccccag cgcatccctc 1200
gtggatacct atcgctatct gcagagcgcc gcaatcacct gccagaagga cgcccccgcc 1260
cccgagaaga aggaccccta cgatggcctg aagttctgga acgtcgatct gcgcgagaag 1320
ttctccctgg agctggacca gttccccctc ggccgcaagt tcctcctcca ggcacgcgtg 1380
cgccgccgcc ccaccatcgg cccacgcaag cgccccgccg ccagcaccag cagcagcagc 1440
gccaccaagc acaagcgcaa gcgcgtcagc aagtga 1476
<210> 31
<211> 497
<212> PRT
<213> Human papillomavirus type 70
<400> 31
Met Val Tyr Leu Pro Pro Pro Ser Val Ala Lys Val Val Asn Thr Asp
1 5 10 15
Asp Tyr Val Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg
20 25 30
Leu Leu Thr Val Gly His Pro Tyr Phe Lys Val Pro Val Asn Gly Gly
35 40 45
Arg Lys Gln Glu Ile Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe
50 55 60
Arg Val Ser Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Ser
65 70 75 80
Leu Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Ile Gly Val
85 90 95
Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Val Ser Gly His Pro
100 105 110
Leu Tyr Asn Arg Leu Asp Asp Thr Glu Asn Ser His Phe Ser Ser Ala
115 120 125
Val Asn Thr Gln Asp Ser Arg Asp Asn Val Ser Val Asp Tyr Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Val Pro Ala Met Gly Glu His Trp
145 150 155 160
Ala Lys Gly Lys Ala Cys Lys Ser Thr Thr Val Gln Gln Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Asn Thr Ala Ile Glu Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Tyr Gly Ala Met Asp Phe Arg Thr Leu Gln Glu Thr Lys
195 200 205
Ser Glu Val Pro Leu Asp Ile Cys Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Gln Met Ser Ala Asp Val Tyr Gly Asp Ser Met Phe Phe Cys
225 230 235 240
Leu Arg Lys Glu Gln Leu Phe Ala Arg His Phe Trp Asn Arg Gly Gly
245 250 255
Met Val Gly Asp Thr Ile Pro Ser Glu Leu Tyr Ile Lys Gly Thr Asp
260 265 270
Ile Arg Asp Arg Pro Gly Thr His Val Tyr Ser Pro Ser Pro Ser Gly
275 280 285
Ser Met Val Ser Ser Asp Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu
290 295 300
His Lys Ala Gln Gly His Asn Asn Gly Ile Cys Trp His Asn Gln Leu
305 310 315 320
Phe Ile Thr Val Val Asp Thr Thr Arg Ser Thr Asn Phe Thr Leu Ser
325 330 335
Ala Cys Thr Glu Thr Ala Ile Pro Ala Val Tyr Ser Pro Thr Lys Phe
340 345 350
Lys Glu Tyr Thr Arg His Val Glu Glu Tyr Asp Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Thr Ile Thr Leu Thr Ala Asp Val Met Ala Tyr Ile His
370 375 380
Thr Met Asn Pro Ala Ile Leu Asp Asn Trp Asn Ile Gly Val Thr Pro
385 390 395 400
Pro Pro Ser Ala Ser Leu Val Asp Thr Tyr Arg Tyr Leu Gln Ser Ala
405 410 415
Ala Ile Ala Cys Gln Lys Asp Ala Pro Ala Pro Glu Lys Lys Asp Pro
420 425 430
Tyr Asp Asp Leu Lys Phe Trp Asn Val Asp Leu Lys Glu Lys Phe Ser
435 440 445
Thr Glu Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Ala Arg Arg Arg Pro Thr Ile Gly Pro Arg Lys Arg Pro Ala Ser
465 470 475 480
Ala Lys Ser Ser Ser Ser Ala Ser Lys His Lys Arg Lys Arg Val Ser
485 490 495
Lys
<210> 32
<211> 1494
<212> DNA
<213> Human papillomavirus type 70
<400> 32
atggtgtatt tgccaccccc ttctgtggcg aaggttgtca atacagatga ttatgtaaca 60
cgtacaggca tatattatta tgctggaagc tctcgcttat taacagtagg gcatccttat 120
tttaaggtac ctgtaaatgg tggccgcaag caggaaatac ctaaggtgtc tgcatatcag 180
tatagggtat ttagggtatc cctacctgat cctaataagt ttggccttcc ggatccttcc 240
ctttataatc ctgacacaca acgcctggta tgggcctgta taggtgtgga aattggtaga 300
ggccagccat tgggcgttgg tgttagtgga catcctttat ataatagatt ggatgatact 360
gaaaattcac atttttcctc tgctgttaat acacaggaca gtagggacaa tgtgtctgtg 420
gactataagc agacacagtt atgtattata ggctgtgttc ctgctatggg agagcactgg 480
gcaaagggca aggcctgtaa gtccactact gtacaacagg gcgattgtcc accattagaa 540
ttagttaata ctgcaattga ggatggcgat atgatagata caggctatgg agccatggac 600
tttcgtacat tgcaggaaac caaaagtgag gtaccactag atatttgcca atccgtgtgt 660
aaatatcctg attatttgca gatgtctgct gatgtatatg gggacagtat gtttttttgt 720
ttgcgcaagg aacagttatt tgccagacac ttttggaata gaggtggcat ggtgggcgac 780
acaatacctt cagagttata tattaaaggc acggatatac gtgatcgtcc tggtactcat 840
gtatattccc cttccccaag tggctctatg gtttcttctg attcccagtt gtttaataag 900
ccctattggt tgcataaggc ccagggacac aataatggca tttgttggca taaccagttg 960
tttattactg tggtggacac tacacgtagt actaatttta cattgtctgc ctgcaccgaa 1020
acagccatac ctgctgtata tagccctaca aagtttaagg aatatactag gcatgtggag 1080
gaatatgatt tacaatttat atttcagttg tgtactatca cattaactgc agacgttatg 1140
gcctacatcc atactatgaa tcctgcaatt ttggacaatt ggaatatagg cgttacccct 1200
ccaccatctg caagcttggt ggacacgtat aggtatttac aatcagcagc tatagcatgt 1260
cagaaggatg ctcctgcacc tgaaaaaaag gatccctatg acgatttaaa attttggaat 1320
gttgatttaa aggaaaagtt tagtacagaa ctagatcagt ttcctttggg gcgcaaattt 1380
ttactacagg taggggctcg cagacgtcct actataggcc ctcgcaaacg ccctgcatca 1440
gctaaatcgt cttcctcagc ctctaaacac aaacggaaac gtgtgtccaa gtaa 1494
<210> 33
<211> 9
<212> PRT
<213> Human papillomavirus type 68
<400> 33
Pro Met Ser Gly Gly Arg Lys Gln Gly
1 5
<210> 34
<211> 35
<212> PRT
<213> Human papillomavirus type 68
<400> 34
Leu Ser Gly His Pro Leu Tyr Asn Arg Leu Asp Asp Thr Glu Asn Ser
1 5 10 15
Pro Phe Ser Ser Asn Lys Asn Pro Lys Asp Ser Arg Asp Asn Val Ala
20 25 30
Val Asp Cys
35
<210> 35
<211> 13
<212> PRT
<213> Human papillomavirus type 68
<400> 35
Ala Lys Gly Lys Ser Cys Lys Pro Thr Asn Val Gln Gln
1 5 10
<210> 36
<211> 12
<212> PRT
<213> Human papillomavirus type 68
<400> 36
Thr Asp Ser Thr Val Pro Ala Val Tyr Asp Ser Asn
1 5 10
<210> 37
<211> 9
<212> PRT
<213> Human papillomavirus type 70
<400> 37
Pro Val Asn Gly Gly Arg Lys Gln Glu
1 5
<210> 38
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 38
ttcaaggtcc ccatgagcgg cgggcgcaag caggatatcc ccaaggtc 48
<210> 39
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 39
cccgccgctc atggggacct tgaagtaggg gtggcccacg gtcagcag 48
<210> 40
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 40
gacttcgacg cccacgcagg ccca 24
<210> 41
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 41
aagcagaccc agctctgtat catc 24
<210> 42
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 42
ttcgccgatt gctgggacgc accc 24
<210> 43
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 43
ctggagctgg tgaatacacc catc 24
<210> 44
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 44
gtggcgggcg aagagctgct cgcg 24
<210> 45
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 45
tgtccaagcc catccggcag catg 24
<210> 46
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 46
gcttgtgctc agggtgaaat ttgtggagcg 30
<210> 47
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 47
ttcaaggagt acacacgcca cgtcgaagaa 30
<210> 48
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 48
tgggcctgcg tgggcgtcga agtcggcaga ggccagcccc tgggc 45
<210> 49
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 49
gatgatacag agctgggtct gcttgcagtc cacggccacg ttgtc 45
<210> 50
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 50
gggtgcgtcc cagcaatcgg cgaacactgg gccaagggca agagc 45
<210> 51
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 51
gatgggtgta ttcaccagct ccagaggggg gcagtcgccc tgctg 45
<210> 52
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 52
cgcgagcagc tcttcgcccg ccacttctgg aacagaggcg gcatg 45
<210> 53
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 53
catgctgccg gatgggcttg gacagtacac gtagctgctg ggtgt 45
<210> 54
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 54
cgctccacaa atttcaccct gagcacaagc accgacagca ccgtgcccgc c 51
<210> 55
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 55
ttcttcgacg tggcgtgtgt actccttgaa cttattgctg tcgtacacgg c 51
<210> 56
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 56
gtaggggtgg cccacggtca g 21
<210> 57
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 57
gcctaccagt accgcgtgtt c 21
<210> 58
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 58
gacttcgacg cccacgcagg c 21
<210> 59
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 59
aagcagaccc agctctgtat c 21
<210> 60
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 60
ttcgccgatt gctgggacgc a 21
<210> 61
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 61
ctggagctgg tgaatacacc c 21
<210> 62
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 62
gcttgtgctc agggtgaaat t 21
<210> 63
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 63
ttcaaggagt acacacgcca c 21
<210> 64
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 64
ctgaccgtgg gccaccccta ctttaaggta cctgtaaatg gt 42
<210> 65
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 65
gaacacgcgg tactggtagg cagacacctt aggtatttcc tg 42
<210> 66
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 66
gcctgcgtgg gcgtcgaagt cggtagaggc cagccattgg gc 42
<210> 67
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 67
gatacagagc tgggtctgct tatagtccac agacacattg tc 42
<210> 68
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 68
tgcgtcccag caatcggcga acactgggca aagggcaagg cc 42
<210> 69
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 69
gggtgtattc accagctcca gtggtggaca atcgccctgt tgtac 45
<210> 70
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 70
aatttcaccc tgagcacaag caccgaaaca gccatacctg ct 42
<210> 71
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 71
gtggcgtgtg tactccttga actttgtagg gctatataca gc 42
Claims (12)
- 돌연변이된 HPV39 L1 단백질 또는 이의 변이체로서, 야생형 HPV39 L1 단백질과 비교하여, 상기 돌연변이된 HPV39 L1 단백질은 하기 돌연변이를 갖고:
(1) 1-25개 아미노산, 예를 들어, 1-5, 1-10, 1-15, 1-20, 5-15, 10-15, 10-20, 또는 15-20개 아미노산의 N-말단 절단; 및
(2) 상기 야생형 HPV39 L1 단백질의 269-288번 위치의 아미노산 잔기의, 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환;
상기 변이체는 상기 돌연변이된 HPV39 L1 단백질과 오직 하나 또는 그 이상 (예를 들어 1, 2, 3, 4, 5, 6, 7, 8 또는 9개) 아미노산의 치환 (바람직하게는 보존적 치환), 부가 또는 결실만이 상이하고, 상기 돌연변이된 HPV39 L1 단백질의 기능, 즉 적어도 2개 타입타입의 HPV (예를 들어 HPV39 및 HPV68, 또는 HPV39, HPV68 및 HPV70)에 대한 중화 항체의 생성을 유도하는 능력을 유지하며;
바람직하게는, 상기 돌연변이된 HPV39 L1 단백질은 선택적으로, 추가로 하기 돌연변이를 갖고:
(3)(a) 상기 야생형 HPV39 L1 단백질의 117-140번 위치의 아미노산 잔기의, 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환; 또는
(b) 상기 야생형 HPV39 L1 단백질의 169-181번 위치의 아미노산 잔기의, 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환; 또는
(c) 상기 야생형 HPV39 L1 단백질의 347-358번 위치의 아미노산 잔기의, 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치의 아미노산 잔기에 의한 치환;
바람직하게는, 상기 돌연변이된 HPV39 L1 단백질은 야생형 HPV39 L1 단백질과 비교하여, N-말단에서 절단된 3, 5, 8, 10, 12, 15, 18, 20 또는 22개의 아미노산을 갖고;
바람직하게는, 상기 돌연변이된 HPV39 L1 단백질은 야생형 HPV39 L1 단백질과 비교하여, N-말단에서 절단된 15개의 아미노산을 갖고;
바람직하게는, 상기 제2 타입의 야생형 HPV는 HPV68이고; 바람직하게는, 상기 (2)에 기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV68 L1 단백질의 270-289번 위치의 아미노산 잔기이고;
바람직하게는, 상기 제3 타입의 야생형 HPV는 HPV70이고; 바람직하게는, 상기 (3)(a)에 기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV70 L1 단백질의 117-141번 위치의 아미노산 잔기이고; 바람직하게는, 상기 (3)(b)에 기재된기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV70 L1 단백질의 170-182번 위치의 아미노산 잔기이고; 바람직하게는, 상기 (3)(c)에 기재된기재된 상응하는 위치의 아미노산 잔기는 야생형 HPV70 L1 단백질의 348-359번 위치의 아미노산 잔기이고;
바람직하게는, 상기 야생형 HPV39 L1 단백질은 서열번호 1에 제시된 아미노산 서열을 갖고;
바람직하게는, 상기 야생형 HPV68 L1 단백질은 서열번호 2에 제시된 아미노산 서열을 갖고;
바람직하게는, 상기 야생형 HPV70 L1 단백질은 서열번호 3에 제시된 아미노산 서열을 갖고;
바람직하게는, 상기 돌연변이된 HPV39 L1 단백질은 서열번호 7, 10, 11 및 12로 이루어진 군으로부터 선택된 아미노산 서열을 갖는
돌연변이된 HPV39 L1 단백질 또는 이의 변이체. - 청구항 1에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 암호화하는 단리된 핵산으로서;
바람직하게는, 본 발명에 따른 상기 단리된 핵산은 서열번호 19, 22, 23 및 24로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 갖는 것인 단리된 핵산. - 청구항 2에 따른 단리된 핵산을 포함하는 벡터.
- 청구항 2에 따른 단리된 핵산 및/또는 청구항 3에 따른 벡터를 포함하는 숙주 세포.
- 청구항 1에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 포함하거나 이들로 이루어지는 HPV 바이러스-유사 입자.
- 청구항 1에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체, 또는 청구항 2에 따른 단리된 핵산, 또는 청구항 3에 따른 벡터, 또는 청구항 4에 따른 숙주 세포, 또는 청구항 5에 따른 HPV 바이러스-유사 입자를 포함하는 조성물.
- 청구항 5에 따른 HPV 바이러스-유사 입자, 및 선택적으로 약학적으로 허용가능한 담체 및/또는 부형제를 포함하는 약학적 조성물 또는 백신으로,
바람직하게는, 상기 HPV 바이러스-유사 입자는 HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방에 유효한 양으로 존재하고;
바람직하게는, 상기 HPV 감염은 하나 이상의 HPV 타입 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)에 의한 감염이고;
바람직하게는, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암 및 뾰족콘딜로마로 이루어진 군으로부터 선택되는 것인 약학적 조성물 또는 백신. - 청구항 1에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체의 제조방법으로서, 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 숙주 세포에서 발현시키는 단계, 및 그런 다음 상기 숙주 세포의 배양물로부터 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 회수하는 단계를 포함하며;
바람직하게는, 상기 숙주 세포는 E.coli이고;
바람직하게는, 상기 방법은 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 E.coli에서 발현시키는 단계, 그런 다음 E.coli의 용해물 상층액을 정제함으로써 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 수득하는 단계; 바람직하게는, 크로마토그래피 (예를 들어 양이온-교환 크로마토그래피, 하이드록시아파타이트 크로마토그래피 및/또는 소수성 상호작용 크로마토그래피)에 의해 상기 E.coli의 용해물 상층액으로부터 상기 돌연변이된 HPV39 L1 단백질 또는 이의 변이체를 회수하는 단계를 포함하는 것인 제조방법. - 청구항 5에 따른 HPV 바이러스-유사 입자를 약학적으로 허용가능한 담체 및/또는 부형제와 혼합하는 단계를 포함하는 것인 백신의 제조방법.
- HPV 감염 또는 HPV 감염에 의해 유발된 질환을 예방하는 방법으로, 대상체에 예방학적 유효량의 청구항 5에 따른 HPV 바이러스-유사 입자 또는 청구항 7에 따른 약학적 조성물 또는 백신을 투여하는 것을 포함하고,
바람직하게는, 상기 HPV 감염은 하나 이상의 HPV 타입 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)에 의한 감염이고;
바람직하게는, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마로 이루어진 군으로부터 선택되는 것인 방법. - HPV 감염 또는 HPV 감염에 의해 유발된 질환을 예방하기 위한 약학적 조성물 또는 백신의 제조에 있어서 청구항 1에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체 또는 청구항 5에 따른 HPV 바이러스-유사 입자의 용도로서,
바람직하게는, 상기 HPV 감염은 하나 이상의 HPV 타입 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)에 의한 감염이고;
바람직하게는, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마로 이루어진 군으로부터 선택되는 것인 용도. - HPV 감염 또는 HPV 감염에 의해 유발된 질환을 예방하기 위한 청구항 1에 따른 돌연변이된 HPV39 L1 단백질 또는 이의 변이체 또는 청구항 5에 따른 HPV 바이러스-유사 입자로서;
바람직하게는, 상기 HPV 감염은 하나 이상의 HPV 타입 (예를 들어 HPV39 감염, HPV68 감염 및/또는 HPV70 감염)에 의한 감염이고;
바람직하게는, 상기 HPV 감염에 의해 유발된 질환은 자궁경부암 및 뾰족콘딜로마로 이루어진 군으로부터 선택되는 것인, 돌연변이된 HPV39 L1 단백질 또는 이의 변이체 또는 HPV 바이러스-유사 입자.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810563378.0 | 2018-06-04 | ||
CN201810563378 | 2018-06-04 | ||
PCT/CN2019/089988 WO2019233415A1 (zh) | 2018-06-04 | 2019-06-04 | 一种人乳头瘤病毒39型l1蛋白的突变体 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210018351A true KR20210018351A (ko) | 2021-02-17 |
Family
ID=68736443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207038070A KR20210018351A (ko) | 2018-06-04 | 2019-06-04 | 타입 39 인유두종 바이러스 l1 단백질의 돌연변이체 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11427618B2 (ko) |
EP (1) | EP3805253A4 (ko) |
JP (2) | JP2021526851A (ko) |
KR (1) | KR20210018351A (ko) |
CN (1) | CN110551183A (ko) |
BR (1) | BR112020024694A2 (ko) |
WO (1) | WO2019233415A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113667683B (zh) * | 2021-08-25 | 2023-02-10 | 上海博唯生物科技有限公司 | 一种表达hpv 39l1的多核苷酸及其表达载体、宿主细胞和应用 |
CN114195886B (zh) * | 2021-11-12 | 2023-05-23 | 郑州大学 | 抗hpv39 l1蛋白单克隆抗体及其制备与应用 |
CN116023446A (zh) * | 2022-10-28 | 2023-04-28 | 北京康乐卫士生物技术股份有限公司 | 人乳头瘤病毒hpv68 l1蛋白的表达和类病毒样颗粒及其制备方法 |
CN116041444B (zh) * | 2022-12-28 | 2023-10-10 | 北京康乐卫士生物技术股份有限公司 | 人乳头瘤病毒hpv39 l1蛋白的表达和类病毒样颗粒及其制备方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5981173A (en) * | 1996-02-14 | 1999-11-09 | Institut Pasteur | Genital human papillomavirus type 68a (HPV-68a), related to the potentially oncogenic HPV-39 |
WO2008134934A1 (en) * | 2007-04-29 | 2008-11-13 | Beijing Wantai Biological Pharmacy Enterprise Co., Ltd. | A truncated l1 protein of human papillomavirus 16 |
CN101481407A (zh) * | 2008-01-07 | 2009-07-15 | 马润林 | 重组人乳头瘤病毒l1衣壳蛋白的修饰序列 |
NZ589755A (en) * | 2008-06-09 | 2013-04-26 | Bharat Biotech Int Ltd | Vaccine composition useful for hpv and hepatitis b infections and a method for preparing the same |
ES2668836T3 (es) * | 2008-08-08 | 2018-05-22 | Takeda Vaccines, Inc. | Partículas similivíricas que comprenden secuencias de aminoácidos de la cápside compuestas para reactividad cruzada potenciada |
CN101914139B (zh) * | 2010-07-16 | 2012-11-21 | 四川大学 | 人类乳头瘤病毒(hpv)衣壳蛋白l1多肽及其制备与应用 |
CN103667319B (zh) * | 2012-09-10 | 2017-09-26 | 同济大学 | 抗人乳头瘤病毒的三价疫苗及其制法和用途 |
CN104164373B (zh) * | 2013-05-17 | 2019-04-02 | 北京安百胜生物科技有限公司 | 用汉逊酵母表达系统产生hpv68l1蛋白的方法 |
US10413603B2 (en) * | 2014-06-19 | 2019-09-17 | The Regents Of The University Of Colorado, A Body Corporate | Compositions, methods and uses for improved human papilloma virus constructs |
-
2019
- 2019-06-04 WO PCT/CN2019/089988 patent/WO2019233415A1/zh unknown
- 2019-06-04 KR KR1020207038070A patent/KR20210018351A/ko not_active Application Discontinuation
- 2019-06-04 CN CN201910481225.6A patent/CN110551183A/zh active Pending
- 2019-06-04 US US15/734,715 patent/US11427618B2/en active Active
- 2019-06-04 JP JP2021517892A patent/JP2021526851A/ja active Pending
- 2019-06-04 BR BR112020024694-8A patent/BR112020024694A2/pt unknown
- 2019-06-04 EP EP19815471.8A patent/EP3805253A4/en active Pending
-
2023
- 2023-09-08 JP JP2023146255A patent/JP2023182596A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2021526851A (ja) | 2021-10-11 |
US11427618B2 (en) | 2022-08-30 |
EP3805253A4 (en) | 2022-04-06 |
CN110551183A (zh) | 2019-12-10 |
EP3805253A1 (en) | 2021-04-14 |
US20210198322A1 (en) | 2021-07-01 |
BR112020024694A2 (pt) | 2021-03-09 |
JP2023182596A (ja) | 2023-12-26 |
WO2019233415A1 (zh) | 2019-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10940194B2 (en) | Mutant of L1 protein of human papillomavirus type 58 | |
US10513541B2 (en) | Mutant of L1 protein of human papillomavirus type 11 | |
US11427618B2 (en) | Mutant of L1 protein of human papillomavirus type 39 | |
JP7290258B2 (ja) | ヒトパピローマウイルス51型のl1タンパク質の変異型 | |
US11213580B2 (en) | Mutant of L1 protein of human papillomavirus type 16 | |
CN110551185A (zh) | 一种人乳头瘤病毒68型l1蛋白的突变体 | |
US11771754B2 (en) | Mutant of L1 protein of human papillomavirus type 18 | |
US11464846B2 (en) | Mutant of L1 protein of human papillomavirus type 66 | |
CN110950936B (zh) | 一种人乳头瘤病毒69型l1蛋白的突变体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |