KR20210064318A - Hpv 타입 51의 l1 단백질의 돌연변이체 - Google Patents
Hpv 타입 51의 l1 단백질의 돌연변이체 Download PDFInfo
- Publication number
- KR20210064318A KR20210064318A KR1020217012147A KR20217012147A KR20210064318A KR 20210064318 A KR20210064318 A KR 20210064318A KR 1020217012147 A KR1020217012147 A KR 1020217012147A KR 20217012147 A KR20217012147 A KR 20217012147A KR 20210064318 A KR20210064318 A KR 20210064318A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- hpv51
- type
- wild
- amino acid
- Prior art date
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 530
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 530
- 239000002245 particle Substances 0.000 claims abstract description 65
- 208000015181 infectious disease Diseases 0.000 claims abstract description 49
- 238000004519 manufacturing process Methods 0.000 claims abstract description 37
- 230000003472 neutralizing effect Effects 0.000 claims abstract description 32
- 208000022361 Human papillomavirus infectious disease Diseases 0.000 claims abstract description 30
- 230000008696 hypoxemic pulmonary vasoconstriction Effects 0.000 claims abstract description 30
- 201000010099 disease Diseases 0.000 claims abstract description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 23
- 229960005486 vaccine Drugs 0.000 claims abstract description 18
- 206010008342 Cervix carcinoma Diseases 0.000 claims abstract description 15
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims abstract description 15
- 201000010881 cervical cancer Diseases 0.000 claims abstract description 15
- 206010059313 Anogenital warts Diseases 0.000 claims abstract description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 13
- 125000000539 amino acid group Chemical group 0.000 claims description 217
- 238000006467 substitution reaction Methods 0.000 claims description 94
- 150000001413 amino acids Chemical class 0.000 claims description 83
- 208000009608 Papillomavirus Infections Diseases 0.000 claims description 37
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 27
- 230000035772 mutation Effects 0.000 claims description 24
- 241000588724 Escherichia coli Species 0.000 claims description 20
- 238000004587 chromatography analysis Methods 0.000 claims description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 15
- 150000007523 nucleic acids Chemical class 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- 239000000203 mixture Substances 0.000 claims description 13
- 239000006228 supernatant Substances 0.000 claims description 9
- 239000002773 nucleotide Substances 0.000 claims description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 6
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 6
- 239000003937 drug carrier Substances 0.000 claims description 5
- 238000004191 hydrophobic interaction chromatography Methods 0.000 claims description 5
- 239000006166 lysate Substances 0.000 claims description 5
- 230000002265 prevention Effects 0.000 claims description 5
- 229910052588 hydroxylapatite Inorganic materials 0.000 claims description 4
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 claims description 4
- 238000005277 cation exchange chromatography Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000011321 prophylaxis Methods 0.000 claims description 3
- 210000001072 colon Anatomy 0.000 claims 1
- 239000012530 fluid Substances 0.000 claims 1
- 230000001939 inductive effect Effects 0.000 abstract description 5
- 108091026890 Coding region Proteins 0.000 abstract 2
- 210000004291 uterus Anatomy 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 473
- 241000701788 Human papillomavirus type 51 Species 0.000 description 279
- 241001502564 Human papillomavirus type 69 Species 0.000 description 178
- 241000341648 Human papillomavirus type 26 Species 0.000 description 131
- 108020004414 DNA Proteins 0.000 description 111
- 241000701806 Human papillomavirus Species 0.000 description 99
- 235000001014 amino acid Nutrition 0.000 description 81
- 239000002671 adjuvant Substances 0.000 description 79
- 229940024606 amino acid Drugs 0.000 description 79
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 73
- 229910052782 aluminium Inorganic materials 0.000 description 73
- 239000012634 fragment Substances 0.000 description 66
- 108091028043 Nucleic acid sequence Proteins 0.000 description 65
- 108010093581 aspartyl-proline Proteins 0.000 description 57
- 241000699670 Mus sp. Species 0.000 description 40
- 230000000694 effects Effects 0.000 description 38
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 36
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 32
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 31
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 29
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 28
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 28
- 108010037850 glycylvaline Proteins 0.000 description 27
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 26
- 108010071207 serylmethionine Proteins 0.000 description 26
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 25
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 25
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 25
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 25
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 25
- 108010085325 histidylproline Proteins 0.000 description 25
- 230000003053 immunization Effects 0.000 description 25
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 24
- 239000000872 buffer Substances 0.000 description 24
- 108010054813 diprotin B Proteins 0.000 description 24
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 24
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 23
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 23
- 108010087924 alanylproline Proteins 0.000 description 23
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 23
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 23
- 108010038320 lysylphenylalanine Proteins 0.000 description 23
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 23
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 22
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 22
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 22
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 22
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 22
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 22
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 22
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 22
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 22
- CUXIOFHFFXNUGG-HTFCKZLJSA-N Cys-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CS)N CUXIOFHFFXNUGG-HTFCKZLJSA-N 0.000 description 22
- AZDQAZRURQMSQD-XPUUQOCRSA-N Cys-Val-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AZDQAZRURQMSQD-XPUUQOCRSA-N 0.000 description 22
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 22
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 22
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 22
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 22
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 22
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 22
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 22
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 22
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 22
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 22
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 22
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 22
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 22
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 22
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 22
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 22
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 22
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 22
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 22
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 22
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 22
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 22
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 22
- 108010077245 asparaginyl-proline Proteins 0.000 description 22
- 238000003776 cleavage reaction Methods 0.000 description 22
- 108010089804 glycyl-threonine Proteins 0.000 description 22
- 238000002649 immunization Methods 0.000 description 22
- 230000007017 scission Effects 0.000 description 22
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 21
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 21
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 21
- 108010020688 glycylhistidine Proteins 0.000 description 20
- 230000001681 protective effect Effects 0.000 description 20
- 238000002255 vaccination Methods 0.000 description 20
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 19
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 19
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 19
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 18
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 18
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 18
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 18
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 18
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 18
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 18
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 18
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 18
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 18
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 18
- AVQOSMRPITVTRB-CIUDSAMLSA-N His-Asn-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AVQOSMRPITVTRB-CIUDSAMLSA-N 0.000 description 18
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 18
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 18
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 18
- WNJXJJSGUXAIQU-UFYCRDLUSA-N Met-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 WNJXJJSGUXAIQU-UFYCRDLUSA-N 0.000 description 18
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 18
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 18
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 18
- 210000004027 cell Anatomy 0.000 description 18
- 108010024607 phenylalanylalanine Proteins 0.000 description 18
- 108010029020 prolylglycine Proteins 0.000 description 18
- 239000011780 sodium chloride Substances 0.000 description 18
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 17
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 17
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 17
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 17
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 17
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 17
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 17
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 17
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 17
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 17
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 17
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 17
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 17
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 17
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 17
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 17
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 17
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 17
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 17
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 17
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 17
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 17
- YEGMNOHLZNGOCG-UBHSHLNASA-N Trp-Asn-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YEGMNOHLZNGOCG-UBHSHLNASA-N 0.000 description 17
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 17
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 17
- 108010047857 aspartylglycine Proteins 0.000 description 17
- 108010073101 phenylalanylleucine Proteins 0.000 description 17
- 108010051242 phenylalanylserine Proteins 0.000 description 17
- 108010050848 glycylleucine Proteins 0.000 description 16
- 108010044087 AS-I toxin Proteins 0.000 description 15
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 15
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 15
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 15
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 15
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 15
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 15
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 15
- 108010077112 prolyl-proline Proteins 0.000 description 15
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 14
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 14
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 14
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 14
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 14
- VKAWJBQTFCBHQY-GUBZILKMSA-N Cys-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N VKAWJBQTFCBHQY-GUBZILKMSA-N 0.000 description 14
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 14
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 14
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 14
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 14
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 14
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 14
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 14
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 14
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 14
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 14
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 14
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 14
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 14
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 14
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 14
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 14
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 14
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 14
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 14
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 14
- UTQBQJNSNXJNIH-IHPCNDPISA-N Trp-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N UTQBQJNSNXJNIH-IHPCNDPISA-N 0.000 description 14
- RERIQEJUYCLJQI-QRTARXTBSA-N Trp-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERIQEJUYCLJQI-QRTARXTBSA-N 0.000 description 14
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 14
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 14
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 14
- 108010060035 arginylproline Proteins 0.000 description 14
- 108010003700 lysyl aspartic acid Proteins 0.000 description 14
- 108010031719 prolyl-serine Proteins 0.000 description 14
- 108010004914 prolylarginine Proteins 0.000 description 14
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 14
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 13
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 13
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 13
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 13
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 13
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 13
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 13
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 13
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 13
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 13
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 13
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 13
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 13
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 13
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 13
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 13
- 108010044940 alanylglutamine Proteins 0.000 description 13
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 12
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 12
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 108010062796 arginyllysine Proteins 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 108010005233 alanylglutamic acid Proteins 0.000 description 11
- 108010034529 leucyl-lysine Proteins 0.000 description 11
- 210000002966 serum Anatomy 0.000 description 11
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 10
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 10
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 10
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 10
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 10
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 10
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 10
- 108010047562 NGR peptide Proteins 0.000 description 10
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 10
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 10
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 10
- 238000004062 sedimentation Methods 0.000 description 10
- PCDUALPXEOKZPE-DXCABUDRSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoic acid Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O PCDUALPXEOKZPE-DXCABUDRSA-N 0.000 description 9
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 9
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 9
- WXONSNSSBYQGNN-AVGNSLFASA-N Glu-Ser-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WXONSNSSBYQGNN-AVGNSLFASA-N 0.000 description 9
- 108010065920 Insulin Lispro Proteins 0.000 description 9
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 9
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 9
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 9
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 9
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 9
- 108010083946 Asp-Tyr-Leu-Lys Proteins 0.000 description 8
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 8
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 8
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 8
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- 108010013835 arginine glutamate Proteins 0.000 description 8
- 108010092114 histidylphenylalanine Proteins 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 7
- KVPHTGVUMJGMCX-BIIVOSGPSA-N Asp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)C(=O)O KVPHTGVUMJGMCX-BIIVOSGPSA-N 0.000 description 7
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 7
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 7
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 7
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 7
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 7
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 7
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 7
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 7
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 7
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 7
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 7
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 7
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 7
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 7
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 7
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 7
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 7
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 7
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 7
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 7
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 229960002566 papillomavirus vaccine Drugs 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 6
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 6
- CMBDUPIBCOEWNE-BJDJZHNGSA-N Asp-Leu-Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CMBDUPIBCOEWNE-BJDJZHNGSA-N 0.000 description 6
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 6
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 6
- RXJFSLQVMGYQEL-IHRRRGAJSA-N Glu-Tyr-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 RXJFSLQVMGYQEL-IHRRRGAJSA-N 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 6
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 6
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 6
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 6
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 6
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 6
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 6
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 6
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 6
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 6
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 6
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 6
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 6
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 6
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 5
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 5
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 5
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 5
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 5
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 5
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 5
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 5
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 5
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 5
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 5
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 5
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 5
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 5
- RNPGPFAVRLERPP-QEJZJMRPSA-N Gln-Trp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RNPGPFAVRLERPP-QEJZJMRPSA-N 0.000 description 5
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 5
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 5
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 5
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 5
- ZIPOVLBRVPXWJQ-SPOWBLRKSA-N Ile-Cys-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N ZIPOVLBRVPXWJQ-SPOWBLRKSA-N 0.000 description 5
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 5
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 5
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 5
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 5
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 5
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 5
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 5
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 5
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 5
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 5
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 5
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 5
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 5
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 5
- NQSFIPWBPXNJII-PMVMPFDFSA-N Lys-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 NQSFIPWBPXNJII-PMVMPFDFSA-N 0.000 description 5
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 5
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 5
- 101710135729 Major capsid protein L1 Proteins 0.000 description 5
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 5
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 5
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 5
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 5
- JLDZQPPLTJTJLE-IHPCNDPISA-N Phe-Trp-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JLDZQPPLTJTJLE-IHPCNDPISA-N 0.000 description 5
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 5
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 5
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 5
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 5
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 5
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 5
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 5
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 5
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 5
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 5
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 5
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 5
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 5
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 5
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 5
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 5
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 5
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 5
- XJFXZQKJQGYFMM-GUBZILKMSA-N Val-Cys-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N XJFXZQKJQGYFMM-GUBZILKMSA-N 0.000 description 5
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 5
- 108010006195 arginyl-glycyl-aspartyl-cysteine Proteins 0.000 description 5
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 239000002808 molecular sieve Substances 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- AEGSIYIIMVBZQU-CIUDSAMLSA-N (3s)-3-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-4-[[(1r)-1-carboxy-2-sulfanylethyl]amino]-4-oxobutanoic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O AEGSIYIIMVBZQU-CIUDSAMLSA-N 0.000 description 4
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 4
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 4
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 4
- YXPNKXFOBHRUBL-BJDJZHNGSA-N Cys-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N YXPNKXFOBHRUBL-BJDJZHNGSA-N 0.000 description 4
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 4
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 4
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 4
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 4
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 4
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 4
- MIQCYAJSDGNCNK-BPUTZDHNSA-N Glu-Gln-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MIQCYAJSDGNCNK-BPUTZDHNSA-N 0.000 description 4
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 4
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 4
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 4
- AHEBIAHEZWQVHB-QTKMDUPCSA-N His-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O AHEBIAHEZWQVHB-QTKMDUPCSA-N 0.000 description 4
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 4
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 4
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 4
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 4
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 4
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 4
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 4
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 4
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 4
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 4
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 4
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 4
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 4
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 4
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 4
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 4
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 4
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 4
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 4
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 4
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 4
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000007928 intraperitoneal injection Substances 0.000 description 4
- 239000008363 phosphate buffer Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 3
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 3
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 3
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 3
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 3
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 3
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 3
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 3
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 3
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 3
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 3
- JVEKQAYXFGIISZ-HOCLYGCPSA-N His-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JVEKQAYXFGIISZ-HOCLYGCPSA-N 0.000 description 3
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 3
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 3
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 3
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 3
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 3
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 3
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 3
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 3
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 3
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 3
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 3
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 3
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 3
- PNHABSVRPFBUJY-UMPQAUOISA-N Trp-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PNHABSVRPFBUJY-UMPQAUOISA-N 0.000 description 3
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 3
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 3
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 3
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 3
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 3
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 238000011097 chromatography purification Methods 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 2
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 2
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 2
- 229940124897 Gardasil Drugs 0.000 description 2
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- 241000341655 Human papillomavirus type 16 Species 0.000 description 2
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 2
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 2
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 2
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000001493 electron microscopy Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- NIELFHOLFTUZME-HJWJTTGWSA-N Arg-Phe-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NIELFHOLFTUZME-HJWJTTGWSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- QTKYFZCMSQLYHI-UBHSHLNASA-N Asn-Trp-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O QTKYFZCMSQLYHI-UBHSHLNASA-N 0.000 description 1
- AECPDLSSUMDUAA-ZKWXMUAHSA-N Asn-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N AECPDLSSUMDUAA-ZKWXMUAHSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 239000012617 Butyl Sepharose™ 4 Fast Flow Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 229940124957 Cervarix Drugs 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- ZVNFONSZVUBRAV-CIUDSAMLSA-N Cys-Gln-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)CN=C(N)N ZVNFONSZVUBRAV-CIUDSAMLSA-N 0.000 description 1
- DXSBGVKEPHDOTD-UBHSHLNASA-N Cys-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N DXSBGVKEPHDOTD-UBHSHLNASA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- RDIILCRAWOSDOQ-CIUDSAMLSA-N Lys-Cys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RDIILCRAWOSDOQ-CIUDSAMLSA-N 0.000 description 1
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 1
- CENKQZWVYMLRAX-ULQDDVLXSA-N Lys-Phe-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CENKQZWVYMLRAX-ULQDDVLXSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 1
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 231100000645 Reed–Muench method Toxicity 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- FNOQJVHFVLVMOS-AAEUAGOBSA-N Trp-Gly-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N FNOQJVHFVLVMOS-AAEUAGOBSA-N 0.000 description 1
- YVXIAOOYAKBAAI-SZMVWBNQSA-N Trp-Leu-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 YVXIAOOYAKBAAI-SZMVWBNQSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002250 absorbent Substances 0.000 description 1
- 230000002745 absorbent Effects 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003945 anionic surfactant Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229940031416 bivalent vaccine Drugs 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 239000003093 cationic surfactant Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002270 exclusion chromatography Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000003801 milling Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000004400 mucous membrane Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003002 pH adjusting agent Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- IYDGMDWEHDFVQI-UHFFFAOYSA-N phosphoric acid;trioxotungsten Chemical compound O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.O=[W](=O)=O.OP(O)(O)=O IYDGMDWEHDFVQI-UHFFFAOYSA-N 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000004262 preparative liquid chromatography Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940031351 tetravalent vaccine Drugs 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/015—Parvoviridae, e.g. feline panleukopenia virus, human parvovirus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55505—Inorganic adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/58—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation
- A61K2039/585—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation wherein the target is cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20023—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Zoology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Communicable Diseases (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Oncology (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
돌연변이된 HPV51 L1 단백질 또는 그의 변이체, 그의 코딩 서열, 그의 제조방법, 및 그를 포함하는 바이러스-유사 입자로서, 상기 단백질 또는 그의 변이체 및 상기 바이러스-유사 입자는 2종 이상의 HPV(예를 들면, HPV51과 HPV69, 또는 HPV51, HPV69 및 HPV26)에 대한 중화 항체를 유도할 수 있는 것인 돌연변이된 HPV51 L1 단백질 또는 그의 변이체, 그의 코딩 서열, 그의 제조방법, 및 그를 포함하는 바이러스-유사 입자가 제공된다. 또한, 백신 또는 약학적 조성물의 제조를 위한 전술된 단백질 및 바이러스-유사 입자의 용도로서, 상기 약학적 조성물 또는 백신은 2종 이상의 HPV의 감염 또는 상기 감염에 의해 유발되는 질환, 예를 들면, 자궁경부암 및 첨형 콘딜로마를 예방하기 위해 사용될 수 있는 것인 용도가 제공된다.
Description
본 출원은 그 개시가 참조에 의해 전체로 본 명세서에 포함된, 2018년 9월 26일에 제출된 중국 출원 제201811122822.1호에 근거하고, 그로부터의 우선권의 이익을 주장한다.
본 출원은 분자 바이러스학 및 면역학 분야에 관한 것이다. 구체적으로, 본 발명은 돌연변이된 HPV51 L1 단백질(또는 그의 변이체), 그를 코딩하는 서열, 그의 제조 방법 및 이를 포함하는 바이러스-유사 입자에 관한 것으로, 상기 단백질(또는 그의 변이체) 및 바이러스-유사 입자는 2종 이상의 HPV(예를 들어 HPV51 및 HPV69, 또는 HPV51, HPV69 및 HPV26)에 대한 중화 항체의 생성을 유도할 수 있고, 따라서 상기 2종 이상의 HPV에 의한 감염, 상기 감염에 의해 유발되는 질환, 예를 들어 자궁경부암 및 첨형 콘딜로마(condyloma acuminatum)의 예방에 사용할 수 있다. 본 발명은 또한 상기 2종 이상의 HPV에 의한 감염 및 상기 감염에 의해 유발되는 질환, 예를 들어 자궁경부암 및 첨형 콘딜로마를 예방하기 위한 약학적 조성물 또는 백신의 제조에서 상기 단백질 및 상기 바이러스-유사 입자의 용도에 관한 것이다.
인유두종 바이러스(Human Papillomavirus: HPV)는 주로 피부 및 점막에 사마귀를 유발한다. HPV 타입은 종양형성과의 관련성에 따라 고위험 타입 및 저위험 타입으로 분류된다. 이 중에서, 고위험 HPV 타입에 의한 감염은 여성에서 자궁경부암을 포함한 생식기 암의 주요 원인인 것으로 입증되었으며; 저위험 HPV 타입은 주로 첨형 콘딜로마를 유발한다. HPV 감염을 예방하고 통제하는 가장 효과적인 방법은 HPV 백신, 특히 자궁경부암을 일으키는 고위험 HPV 타입에 대한 백신을 접종하는 것이다.
HPV의 주요 캡시드 단백질 L1은 중공의 바이러스-유사 입자(hollow Virus-Like Particle: VLP)로 자가조립하는 특징을 갖는다. HPV VLP는 주요 캡시드 단백질 L1의 72개 오량체로 구성된 대칭적인 정이십면체 구조를 갖는다(Doorbar, J. and P.H. Gallimore. 1987. J Virol, 61(9): 2793-9). HPV VLP는 구조 면에서 천연 HPV와 매우 유사하고, 천연 바이러스의 중화 에피토프 대부분을 유지하며, 고역가 중화 항체의 생성을 유도할 수 있다(Kirnbauer, R., F. Booy, et al. 1992 Proc Natl Acad Sci U S A 89(24): 12180-4).
기존 연구들은 HPV VLP가 주로 동일한 HPV 타입에 대한 중화 항체 생성을 유도하고, 동일한 HPV 타입에 대한 보호 면역을 생성하며, 일부 매우 상동성이 높은 HPV 타입들 간에 낮은 교차-보호 효과만을 갖는다는 것을 보여준다 (Sara L. Bissett, Giada Mattiuzzo, et al. 2014 Vaccine. 32:6548-6555). 따라서, 기존의 HPV 백신들은 매우 제한적인 보호 범위를 갖는다. 일반적으로, 하나의 HPV 타입의 VLP는 동일한 HPV 타입에 의한 감염의 예방에만 사용될 수 있다. 이 경우에, HPV 백신의 보호 범위를 확대해야 하는 경우, 유일한 방법은 백신에 보다 많은 타입의 HPV의 VLP를 추가하는 것이다. 현재, 머크의 가다실(Gardasil)®(HPV16, 18, 6 및 11에 대한 4가 백신) 및 가다실®9(HPV6, 11, 16, 18, 31, 33, 45, 52 및 58에 대한 9가 백신), 및 GSK의 서바릭스(Cervarix)®(HPV16 및 18에 대한 2가 백신)를 포함하는 상업적으로 입수가능한 HPV 백신들은 다수의 HPV 타입의 VLP들을 혼합하여 제조된다. 그러나, 이와 같은 방법은 HPV 백신의 생산 비용을 크게 증가시키고, 면역화 용량(immunizaing dose)의 증가로 인해 안전성 문제를 야기할 수 있다.
따라서, 다수의 HPV 타입에 의한 감염, 및 상기 감염에 의해 유발되는 질환, 예를 들어 자궁경부암 및 첨형 콘딜로마를 보다 경제적이고 효과적으로 예방하기 위해, 다수의 HPV 타입에 대한 보호 중화 항체의 생성을 유도할 수 있는 HPV 바이러스-유사 입자를 개발하는 것이 당해 기술 분야에서 시급하다.
본 출원은 적어도 부분적으로 본 발명자들의 놀라운 발견에 기초한다: 인유두종 바이러스(HPV) 타입 51의 L1 단백질의 특정 세그먼트를 제2 HPV 타입 (예를 들어 HPV69)의 L1 단백질의 상응하는 세그먼트에 의해 치환한 후에, 이에 따라 수득된 돌연변이된 HPV51 L1 단백질이 개체에서 HPV51 및 제2 HPV 타입(예를 들어 HPV69)에 대한 고-역가 중화 항체의 생성을 유도할 수 있으며, 그의 보호 효과는 HPV51 VLP 및 제2 HPV 타입의 VLP의 혼합물의 효과에 필적하고, HPV51에 대한 그의 보호 효과는 HPV51 VLP 단독의 경우에 필적하며, 제2 HPV 타입(예를 들어 HPV69)에 대한 그의 보호 효과는 제2 HPV 타입 단독의 VLP의 경우에 필적한다.
또한, 상기 치환에 기초하여, HPV51 L1 단백질의 또 다른 특정 세그먼트가 제3 HPV 타입(예를 들어 HPV26)의 L1 단백질의 상응하는 세그먼트로 추가적으로 치환될 수 있고, 이에 따라 수득된 이중 치환을 갖는 돌연변이된 HPV51 L1 단백질은 HPV51, 제2 HPV 타입(예를 들어 HPV69) 및 제3 HPV 타입(예를 들어 HPV26)에 대한 고-역가 중화 항체의 생성을 유도할 수 있다.
따라서, 일 양태에서, 본 출원은 돌연변이된 HPV51 L1 단백질 또는 그의 변이체로서, 야생형 HPV51 L1 단백질 대비, 상기 돌연변이된 HPV51 L1 단백질은 하기 돌연변이를 갖고:
(1) 야생형 HPV51 L1 단백질의 N-말단에서, 0 내지 15개의 아미노산, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단(truncation); 및
하기 (2)(a), (2)(b), (2)(c) 또는 (2)(d)에 정의된 돌연변이:
(2)(a) 야생형 HPV51 L1 단백질의 52-60번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(2)(b) 야생형 HPV51 L1 단백질의 125-147번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(2)(c) 야생형 HPV51 L1 단백질의 170-181번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(2)(d) 야생형 HPV51 L1 단백질의 259-289번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환, 및
상기 변이체는 상기 돌연변이된 HPV51 L1 단백질과 1개 이상 (예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 17개)의 아미노산의 치환(바람직하게는 보존적 치환), 부가 또는 결실에 의해서만 다르고, 상기 돌연변이된 HPV51 L1 단백질의 기능, 즉, 2종 이상의 HPV(예를 들면, HPV51 및 HPV69)에 대한 중화 항체의 생성을 유도하는 능력을 보유하는 것인 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 제공한다.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(a)에 정의된 돌연변이를 갖고, 선택적으로, (3)(b)에 정의된 돌연변이를 더 갖는다.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(b)에 정의된 돌연변이를 갖고, 선택적으로, (3)(c)에 정의된 돌연변이를 더 갖는다.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(c)에 정의된 돌연변이를 갖고, 선택적으로, (3)(a) 또는 (3)(b)에 정의된 돌연변이를 더 갖는다.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(d)에 정의된 돌연변이를 갖고, 선택적으로, (3)(b)에 정의된 돌연변이를 더 갖는다.
상기 (3)(a), (3)(b) 또는 (3)(c)에 정의된 돌연변이는 하기와 같다:
(3)(a) 야생형 HPV51 L1 단백질의 51-60번 위치에 있는 아미노산 잔기의 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(3)(b) 야생형 HPV51 L1 단백질의 114-146번 위치에 있는 아미노산 잔기의 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(3)(c) 야생형 HPV51 L1 단백질의 173-181번 위치에 있는 아미노산 잔기의 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 야생형 HPV51 L1 단백질 대비, N-말단에서 절단된 9개의 아미노산을 갖는다.
일부 구체예에서, 상기 제2 타입의 야생형 HPV는 HPV69이다. 일부 구체예에서, (2)(a)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기이다. 일부 구체예에서, (2)(b)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기이다. 일부 구체예에서, (2)(c)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기이다. 일부 구체예에서, (2)(d)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기이다.
일부 구체예에서, 상기 제3 타입의 야생형 HPV는 HPV26이다. 일부 구체예에서, (3)(a)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV26 L1 단백질의 51-60번 위치에 있는 아미노산 잔기이다. 일부 구체예에서, (3)(b)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기이다. 일부 구체예에서, (3)(c)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기이다.
일부 구체예에서, 상기 야생형 HPV51 L1 단백질은 서열번호 1로 기재된 아미노산 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질은 서열번호 2로 기재된 아미노산 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV26 L1 단백질은 서열번호 22로 기재된 아미노산 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들은 서열번호 17에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들은 서열번호 18에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들은 서열번호 19에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들은 서열번호 20에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 350-362번 아미노산 잔기들은 서열번호 21에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 51-60번 아미노산 잔기들은 서열번호 56에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 114-146번 아미노산 잔기들은 서열번호 57에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 173-181번 아미노산 잔기들은 서열번호 58에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 259-289번 아미노산 잔기들은 서열번호 59에 기재된 서열을 갖는다.
일부 구체예에서, 상기 야생형 HPV69 L1 단백질의 348-360번 아미노산 잔기들은 서열번호 60에 기재된 서열을 갖는다.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 서열번호 4, 5, 6, 또는 7로 기재된 아미노산 서열을 갖는다.
일부 구체예에서, 상기 돌연변이된 HPV51 L1 단백질은 서열번호 23, 27, 28, 41 또는 45로 기재된 아미노산 서열을 갖는다.
또 다른 양태에서, 본 출원은 전술된 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 코딩하는 단리된 핵산을 제공한다.
또 다른 양태에서, 본 출원은 상기 단리된 핵산을 포함하는 벡터를 제공한다. 일부 구체예에서, 상기 단리된 핵산은 서열번호 12, 13, 14 또는 15에 기재된 뉴클레오티드 서열을 갖는다.
일부 구체예에서, 본 출원에 따른 단리된 핵산은 서열번호 32, 36, 37, 49 또는 53에 기재된 뉴클레오티드 서열을 갖는다.
클로닝 벡터 및 발현 벡터를 포함하나, 이에 한정되지 않는, 목적 폴리뉴클레오티드(polynucleotide of interest)의 삽입을 위해 유용한 벡터들이 당해 기술 분야에서 잘 알려져 있다. 일 구체예에서, 상기 벡터는 예를 들면, 플라스미드, 코스미드, 파아지, 등이다.
또 다른 양태에서, 본 출원은 또한 전술된 바와 같은 단리된 핵산 또는 벡터를 포함하는 숙주 세포에 관한 것이다. 숙주 세포는 대장균 세포와 같은 원핵 세포, 및 효모 세포, 곤충 세포, 식물 세포, 및 동물 세포(예를 들면, 마우스 세포, 인간 세포 등과 같은 포유동물 세포)와 같은 진핵 세포를 포함하나, 이에 한정되지 않는다. 본 출원에 따른 숙주 세포는 또한, 세포주, 예를 들면, 293T 세포일 수 있다.
또 다른 양태에서, 본 출원은 본 출원에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 포함하거나, 그로 구성된 HPV 바이러스-유사 입자(virus-like particle, VLP)에 관한 것이다.
일부 바람직한 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단을 갖고, 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 173-181번 아미노산 잔기의 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 170-181번 아미노산의 야생형 HPV69 L1 단백질의 170-183번 아미노산에 의한 치환, 및 야생형 HPV51 L1 단백질의 51-60번 아미노산의 야생형 HPV26 L1 단백질의 51-60번 아미노산에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 0 내지 15개 아미노산의 절단, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단을 갖고, 야생형 HPV51 L1 단백질의 170-181번 아미노산의 야생형 HPV69 L1 단백질의 170-183번 아미노산에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 바람직한 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 125-147번 아미노산의 야생형 HPV69 L1 단백질의 125-147번 아미노산에 의한 치환, 및 야생형 HPV51 L1 단백질의 173-181번 아미노산의 야생형 HPV26 L1 단백질의 173-181번 아미노산에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 51-60번 아미노산 잔기의 야생형 HPV26 L1 단백질의 51-60번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 야생형 HPV51 L1 단백질 대비, 야생형 HPV51 L1 단백질의 N-말단에 9개 아미노산의 절단, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기에 의한 치환을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 서열번호 4, 5, 6 또는 7에 기재된 서열을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
일부 구체예에서, 본 출원에 따른 HPV 바이러스-유사 입자는 서열번호 23, 27, 28, 41 또는 45에 기재된 서열을 갖는, 돌연변이된 HPV51 L1 단백질을 포함한다.
또 다른 양태에서, 본 출원은 또한 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체, 상기 단리된 핵산, 상기 벡터, 상기 숙주 세포, 또는 상기 HPV 바이러스-유사 입자를 포함하는 조성물에 관한 것이다. 일부 바람직한 구체예에서, 상기 조성물은 본 출원에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 포함한다. 일부 바람직한 구체예에서, 상기 조성물은 본 출원에 따른 HPV 바이러스-유사 입자를 포함한다.
또 다른 양태에서, 본 출원은 또한 본 출원에 따른 HPV 바이러스-유사 입자 및 선택적으로, 약학적으로 허용 가능한 담체 및/또는 부형제를 포함하는 약학적 조성물 또는 백신에 관한 것이다. 본 출원에 따른 약학적 조성물 또는 백신은 HPV 감염, 또는 HPV 감염에 의해 유발되는 질환, 예를 들어 자궁경부암 및 첨형 콘딜로마의 예방에 사용될 수 있다.
일부 구체예에서, 상기 HPV 바이러스-유사 입자는 HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방에 유효한 양으로 존재한다. 일부 구체예에서, 상기 HPV 감염은 1종 이상의 HPV에 의한 감염 (예를 들면, HPV51 감염, HPV69 감염 및 HPV26 감염으로 구성된 군으로부터 선택된 하나 이상의 감염)이다. 일부 구체예에서, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암, 첨형 콘딜로마 및 이들의 조합으로 이루어지는 군으로부터 선택된다.
본 출원에 따른 약학적 조성물 또는 백신은 당해 분야에서 잘 알려진 방법, 예를 들어 경구 또는 주사에 의해 투여될 수 있지만 이에 제한되지 않는다. 본 출원에서, 특히 바람직한 투여 경로는 주사이다.
일부 바람직한 구체예에서, 본 출원에 따른 약학적 조성물 또는 백신을 단위 투여 제형(unit dosage form)으로 투여한다. 예를 들어, 본 출원을 제한하는 것은 아니지만, 각각의 단위 투여량은 5 ㎍ 내지 80 ㎍, 바람직하게는 20 ㎍ 내지 40 ㎍의 HPV 바이러스-유사 입자를 함유한다.
또 다른 양태에서, 본 출원은 전술된 바와 같은 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 제조하는 방법으로서, 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 숙주 세포에서 발현시키는 단계, 및 그 후, 상기 숙주 세포의 배양물로부터 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 회수하는 단계를 포함하는 것인 방법에 관한 것이다.
일부 바람직한 구체예에서, 상기 숙주 세포는 대장균(E. coli)이다.
일부 바람직한 구체예에서, 상기 방법은 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 E. coli에서 발현시키는 단계, 그런 다음 E. coli의 용해물 상층액을 정제함으로써 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 수득하는 단계를 포함한다. 일부 바람직한 구체예에서, 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체는 상기 E.coli의 용해물 상층액으로부터 크로마토그래피(예를 들어 양이온-교환 크로마토그래피, 하이드록시아파타이트 크로마토그래피 및/또는 소수성 상호작용 크로마토그래피)에 의해 회수된다.
또 다른 양태에서, 본 출원은 본 출원에 따른 HPV 바이러스-유사 입자를 약학적으로 허용 가능한 담체 및/또는 부형제와 조합하는 단계를 포함하는, 백신의 제조방법에 관한 것이다.
또 다른 양태에서, 본 출원은 예방적 유효량(prophylactically effective amount)의 본 출원에 따른 HPV 바이러스-유사 입자 또는 약학적 조성물 또는 백신을 개체에게 투여하는 단계를 포함하는, HPV 감염 또는 HPV 감염에 의해 유발되는 질환을 예방하는 방법에 관한 것이다. 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV51 감염, HPV69 감염 및/또는 HPV26 감염)이다. 또 다른 바람직한 구체예에서, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암 및 첨형 콘딜로마를 포함하나 이에 제한되지 않는다. 또 다른 바람직한 구체예에서, 상기 개체는 포유동물, 예를 들어 인간이다.
또 다른 양태에서, 본 출원은 또한 HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방을 위한 약학적 조성물 또는 백신의 제조에서 본 출원에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체 또는 HPV 바이러스-유사 입자의 용도에 관한 것이다. 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV51 감염, HPV69 감염 및/또는 HPV26 감염)이다. 또 다른 바람직한 구체예에서, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암 및 첨형 콘딜로마를 포함하나 이에 제한되지 않는다.
또 다른 양태에서, 본 출원은 또한 HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방을 위한 본 출원에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체 또는 HPV 바이러스-유사 입자에 관한 것이다. 바람직한 구체예에서, 상기 HPV 감염은 하나 이상의 HPV 타입에 의한 감염 (예를 들어 HPV51 감염, HPV69 감염 및/또는 HPV26 감염)이다. 또 다른 바람직한 구체예에서, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암 및 첨형 콘딜로마를 포함하나 이에 제한되지 않는다.
본 출원 중 용어의 정의
본 출원에서, 달리 명시되지 않는 한, 본 명세서에서 사용되는 과학 및 기술 용어들은 당업자에 의해 일반적으로 이해되는 의미를 갖는다. 또한, 본원에서 사용되는 세포 배양, 분자 유전학, 핵산 화학 및 면역학의 실험 작업들은 해당 분야에서 널리 사용되는 통상적인 작업들이다. 한편, 본 출원의 이해를 돕기 위해, 관련 용어의 정의 및 설명을 하기와 같이 제공한다.
본 출원에 따르면, 용어 "제2 타입의 야생형 HPV(a second type of wild type HPV)"는 HPV51 이외의 야생형 HPV 타입을 의미한다. 본 출원에서, 제2 타입의 야생형 HPV는 바람직하게는 야생형 HPV69이다.
본 출원에 따르면, 용어 "제3 타입의 야생형 HPV(a third type of wild type HPV)"는 HPV51 및 제2 타입의 야생형 HPV 이외의 야생형 HPV 타입을 의미한다. 본 출원에서, 제3 타입의 야생형 HPV는 바람직하게는 야생형 HPV26이다.
본 출원에 따르면, 표현 "상응하는 위치(corresponding positions)"는 서열들을 최적으로 정렬시킬 때, 즉 서열들을 최고의 동일성 비율을 수득하도록 정렬시킬 때, 비교되는 서열들의 상당하는(equivalent) 위치를 의미한다.
본 출원에 따르면, 용어 "야생형 HPV51 L1 단백질(wild type HPV51 L1 prot)"은 인유두종 바이러스 타입 51(HPV51)의 천연 주요 캡시드 단백질 L1을 의미한다. 야생형 HPV51 L1 단백질의 서열은 당업계에 주지되어 있으며, 공개된 데이터베이스에서 찾을 수 있다 (예를 들어 NCBI 데이터베이스의 등록번호 ACV88631.1, ALJ32930.1, CRH69903.1, 및 AJS10540.1).
본 출원에서, 야생형 HPV51 L1 단백질의 아미노산 서열을 언급하는 경우, 이는 서열번호 1에 제시된 바와 같은 서열을 참조하여 설명된다. 예를 들어, 표현 "야생형 HPV51 L1 단백질의 52-60번 위치의 아미노산 잔기(amino acid residues at positions 52-60 of a wild type HPV51 L1 protein)"는 서열번호 1에 제시된 바와 같은 폴리펩티드의 52-60번 위치의 아미노산 잔기를 의미한다. 그러나, 당업자는 야생형 HPV51이 다양한 단리물(isolate)을 포함할 수 있고, 다양한 단리물 간에 L1 단백질의 아미노산 서열의 차이가 있을 수 있다는 것을 이해할 것이다. 또한, 당업자는 서열에 차이가 있을 수 있으나, L1 단백질의 아미노산 서열은 상이한 HPV51 단리물 간에 매우 높은 동일성 (일반적으로 95% 초과, 예를 들면, 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과)을 갖고, 실질적으로 동일한 생물학적 기능을 갖는다는 것을 이해한다. 따라서, 본 출원에서, 용어 "야생형 HPV51 L1 단백질(wild type HPV51 L1 protein)"은 서열번호 1로 기재된 단백질 및 다양한 HPV51 단리물의 L1 단백질(예를 들면, ACV88631.1, ALJ32930.1, CRH69903.1 및 AJS10540.1에 기재된 HPV51 L1 단백질)을 포함한다. 또한, 야생형 HPV51 L1 단백질의 서열 단편이 기재되는 경우, 이는 서열번호 1의 서열 단편 뿐 아니라, 다양한 HPV51 단리물의 L1 단백질의 상응하는 서열 단편을 포함한다. 예를 들면, 표현 "야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기(amino acid residues at positions 52-60 of a wild type HPV51 L1 protein)"는 서열번호 1의 52-60번 위치에 있는 아미노산 잔기 및 다양한 HPV51 단리물의 L1 단백질의 상응하는 단편을 포함한다.
본 출원에 따르면, 용어 "야생형 HPV69 L1 단백질(wild type HPV69 L1 protein)"은 인간 유두종바이러스 타입 69(HPV69)의 천연 주요 캡시드 단백질 L1을 의미한다. 야생형 HPV69 L1 단백질의 서열은 당해 분야에서 잘 알려져 있고, 공개 데이터베이스에서 찾을 수 있다(예를 들면, NCBI 데이터베이스의 등록번호(Accession No.) AHV83654.1, ALJ32844.1, 및 ALJ32828.1).
본 출원에서, 야생형 HPV69 L1 단백질의 아미노산 서열이 언급될 때, 서열번호 2에 기재된 서열에 대한 참조에 의해 기재된다. 예를 들면, 표현 "야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기(amino acid residues at positions 52-60 of a wild type HPV69 L1 protein)"는 서열번호 2에 기재된 폴리펩티드의 52-60번 아미노산 잔기들을 의미하고; 표현 "야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기(amino acid residues at positions 170-183 of a wild type HPV69 L1 protein)"는 서열번호 2에 기재된 폴리펩티드의 170-183번 아미노산 잔기들을 의미한다. 그러나, 당업자는 야생형 HPV69가 다양한 단리물을 포함할 수 있고, 다양한 단리물 간에 L1 단백질의 아미노산 서열에 차이가 있을 수 있다는 것을 이해한다. 또한, 당업자는 서열에 차이가 있을 수 있으나, L1 단백질의 아미노산 서열은 상이한 HPV69 단리물 간에 매우 높은 동일성 (일반적으로 95% 초과, 예를 들면, 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과)을 갖고, 실질적으로 동일한 생물학적 기능을 갖는다는 것을 이해한다. 따라서, 본 출원에서, 용어 "야생형 HPV69 L1 단백질(wild type HPV69 L1 protein)"은 서열번호 2로 기재된 단백질 및 다양한 HPV69 단리물의 L1 단백질(예를 들면, AHV83654.1, ALJ32844.1 및 ALJ32828.1에 기재된 HPV51 L1 단백질)을 포함한다. 또한, 야생형 HPV69 L1 단백질의 서열 단편이 기재되는 경우, 이는 서열번호 2의 서열 단편 뿐 아니라, 다양한 HPV69 단리물의 L1 단백질의 상응하는 서열 단편을 포함한다. 예를 들면, 표현 "야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기(amino acid residues at positions 52-60 of a wild type HPV69 L1 protein)"는 서열번호 2의 52-60번 위치에 있는 아미노산 잔기 및 다양한 HPV69 단리물의 L1 단백질의 상응하는 단편을 포함한다.
본 출원에 따르면, 용어 "야생형 HPV26 L1 단백질(wild type HPV26 L1 protein)"은 인간 유두종바이러스 타입 26 (HPV26)의 천연 주요 캡시드 단백질 L1을 의미한다. 야생형 HPV26 L1 단백질의 서열은 당해 분야에서 잘 알려져 있고, 공개 데이터베이스에서 찾을 수 있다(예를 들면, NCBI 데이터베이스의 등록번 NP041787.1, AHY96046.1, 및 AHY96053.1).
본 출원에서, 야생형 HPV26 L1 단백질의 아미노산 서열을 언급하는 경우, 이는 서열번호 22에 제시된 서열을 참조하여 설명된다. 예를 들어, 표현 "야생형 HPV26 L1 단백질의 51-60번 위치의 아미노산 잔기(amino acid residues at positions 51-60 of a wild type HPV26 L1 protein)"는 서열번호 22에 제시된 폴리펩티드의 51-60번 위치의 아미노산 잔기를 의미하고; 표현 "야생형 HPV26 L1 단백질의 173-181번 위치의 아미노산 잔기(amino acid residues at positions 173-181 of a wild type HPV26 L1 protein)"는 서열번호 22에 제시된 폴리펩티드의 173-181번 위치의 아미노산 잔기를 의미한다. 그러나, 당업자는 야생형 HPV26이 다양한 단리물을 포함할 수 있으며 다양한 단리물들 간에 L1 단백질의 아미노산 서열의 차이가 있을 수도 있다는 것을 이해한다. 더욱이, 당업자는 서열의 차이가 있을 수도 있지만, L1 단백질의 아미노산 서열은 상이한 HPV26 단리물들간에 매우 높은 동일성 (일반적으로 95% 초과, 예를 들어 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과)을 가지며, 실질적으로 동일한 생물학적 기능을 갖는다는 것을 이해한다. 따라서, 본 발명에서, 용어 "야생형 HPV26 L1 단백질(wild type HPV26 L1 protein)"이란 용어는 서열번호 22에 제시된 바와 같은 단백질뿐만 아니라 다양한 HPV26 단리물의 L1 단백질 (예를 들면, NP041787.1, AHY96046.1 및 AHY96053.1에 기재된 HPV26 L1 단백질)을 포함한다. 더욱이, 야생형 HPV26 L1 단백질의 서열 단편이 기술될 때, 이는 서열번호 2의 서열 단편뿐만 아니라, 다양한 HPV26 단리물의 L1 단백질의 상응하는 서열 단편도 포함한다. 예를 들어, 표현 "야생형 HPV26 L1 단백질의 51-60번 위치의 아미노산 잔기"는 서열번호 22의 51-60번 위치의 아미노산 잔기 및 다양한 HPV26 단리물의 L1 단백질의 상응하는 단편을 포함한다.
본 출원에 따르면, 표현 "상응하는 서열 단편(corresponding sequence fragments)" 또는 "상응하는 단편(corresponding fragments)"은 서열들을 최적으로 정렬시킬 때, 즉 서열들을 가장 높은 백분율의 동일성이 획득되도록 정렬시킬 때 비교되는 상기 서열들의 동등한(equivalent) 위치에 위치하는 단편을 의미한다.
본 출원에 따르면, 표현 "N-말단에서 X개 아미노산의 절단(truncation of amino acids at N-terminal)" 또는 "N-말단에 X개 아미노산의 절단을 갖는(having X amino acids truncated at N-terminal)"은 단백질의 N-말단의 1 내지 X번 위치의 아미노산 잔기의 (단백질 번역을 개시하기 위한) 개시 코돈에 의해 코딩된 메티오닌 잔기에 의한 치환을 의미한다. 예를 들어 N-말단에서 9개 아미노산의 절단을 갖는 HPV51 L1 단백질은 야생형 HPV51 L1 단백질의 N-말단의 1 내지 9번 위치의 아미노산 잔기를 개시 코돈에 의해 암호화된 메티오닌 잔기로 치환하여 얻어지는 단백질을 의미한다.
본 출원에 따르면, 용어 "변이체(variant)"는 단백질의 아미노산 서열이 1개 이상(예를 들어 1, 2, 3, 4, 5, 또는 6개)의 아미노산의 치환 (바람직하게는 보존적 치환), 부가 또는 결실을 갖거나, 또는 본 출원에 따른 돌연변이된 HPV51 L1 단백질 (예를 들어 서열번호 5 또는 6에 제시된 바와 같은 단백질)과 비교하여 적어도 90%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 가지며, 본 출원에 따른 돌연변이된 HPV51 L1 단백질의 기능을 유지하는 단백질을 의미한다. 본 출원에서, 용어 "돌연변이된 HPV51 L1 단백질의 기능(function of the mutated HPV51 L1 protein)"은 2종 이상의 HPV(예를 들어 HPV51 및 HPV69)에 대한 중화 항체의 생성을 유도하는 능력을 의미한다. 용어 "동일성(identity)"은 뉴클레오티드 서열들 또는 아미노산 서열들 간의 유사성의 척도를 의미한다. 일반적으로, 서열들은 최대 일치가 획득되도록 정렬되었다. "동일성"은 당업계에서 잘 알려진 의미를 가지며 공개된 알고리즘 (예를 들어 BLAST)에 의해 계산될 수 있다.
본 출원에 따르면, 용어 "동일성(identity)"은 2개의 폴리펩티드 또는 2개의 핵산 간의 일치 정도를 의미한다. 비교를 위한 2개의 서열이 특정 위치에서 염기 또는 아미노산의 동일한 단량체 서브유닛을 갖는 경우 (예를 들어 2개의 DNA 분자가 각각 특정한 위치에서 아데닌을 갖거나, 또는 2개의 폴리펩티드가 각각 특정한 위치에서 리신을 갖는 경우), 그 2개의 분자는 해당 부위에서 동일하다. 2개 서열 간의 동일성 백분율(percent identity)은 비교를 위한 부위의 총 수에 걸쳐 상기 2개 서열에 의해 공유된 일치하는 부위 수 x 100의 함수이다. 예를 들어 2개 서열의 10개 부위 중 6개가 일치하는 경우, 이들 2개 서열은 60%의 동일성을 갖는다. 예를 들어, DNA 서열: CTGACT 및 CAGGTT는 50%의 동일성을 공유한다 (6개 부위 중 3개가 일치한다). 일반적으로 2개 서열의 비교는 최대 일치를 생성시키는 방식으로 수행된다. 그러한 정렬은 예를 들어 컴퓨터 프로그램, 예를 들어 Needleman, et al의 방법(J. Mol. Biol. 48:443-453, 1970)에 기초한 Align 프로그램 (DNAstar, Inc)을 사용하여 수행할 수 있다. 2개 아미노산 서열 간의 동일성 백분율은 또한, PAM120 가중치 잔기 표(weight residue table)를 사용하고, 12의 갭 길이 페널티 (gap length penalty) 및 4의 갭 페널티 (gap penalty)로, ALIGN 프로그램에 통합된 E. Meyers 및 W. Miller의 알고리즘 (Comput. Appl. Biosci., 4:11-17 (1988))을 사용하여 결정될 수 있다. 또한, 2개 아미노산 서열 간의 동일성 백분율은 Blossum 62 매트릭스 또는 PAM250 매트릭스를 사용하여, 16, 14, 12, 10, 8, 6, 또는 4의 갭 가중치 (gap weight) 및 1, 2, 3, 4, 5, 또는 6의 길이 가중치 (length weight)로, GCG 소프트웨어 패키지 (http://www.gcg.com에서 사용가능) 중 GAP 프로그램에 통합된 Needleman 및 Wunsch의 알고리즘 (J. Mol. Biol. 48:443-453, 1970)을 사용하여 결정될 수 있다.
본 명세서에서 사용된, 용어 "보존적 치환(conservative substitution)"은 아미노산 서열을 포함하는 단백질/폴리펩티드의 필수적인 성질에 불리하게 영향을 미치거나 또는 변화시키지 않는 아미노산 치환을 의미한다. 예를 들어, 보존적 치환은 당업계에 공지된 표준 기법, 예를 들어 부위-지정 돌연변이 유발(site-directed mutagenesis) 및 PCR-매개 돌연변이 유발에 의해 도입시킬 수 있다. 보존적 아미노산 치환은 아미노산 잔기가 상응하는 아미노산 잔기와 유사한 곁사슬을 갖는 또 다른 아미노산 잔기, 예를 들어 상응하는 아미노산 잔기와 물리적으로 또는 기능적으로 유사한(예를 들어 유사한 크기, 모양, 전하, 공유 결합 또는 수소 결합을 형성시키는 능력을 포함한 화학적 성질 등을 갖는) 잔기로 치환되는 치환을 포함한다. 유사한 곁사슬을 갖는 아미노산 잔기의 패밀리(families)가 당업계에서 정의되어 있다. 이들 패밀리는 염기성 곁사슬을 갖는 아미노산 (예를 들어 리신, 아르기닌 및 히스티딘), 산성 곁사슬을 갖는 아미노산 (예를 들어 아스파트트산 및 글루탐산), 비하전 극성 곁사슬을 갖는 아미노산(예를 들어 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인, 트립토판), 비극성 곁사슬을 갖는 아미노산 (예를 들어 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌), β-분지된 곁사슬을 갖는 아미노산 (예를 들어 트레오닌, 발린, 이소류신) 및 방향족 곁사슬을 갖는 아미노산(예를 들어 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다. 따라서, 일반적으로 보존적 치환은 상응하는 아미노산 잔기의 동일한 곁사슬 패밀리로부터의 또 다른 아미노산 잔기에 의한 치환을 의미한다. 아미노산 보존적 치환의 확인 방법은 당해 기술분야에 잘 알려져 있다 (예를 들어, 참조에 의해 본 명세서에 포함된, Brummell et al., Biochem. 32: 1180-1187 (1993); Kobayashi et al., Protein Eng. 12(10): 879-884 (1999); 및 Burks et al., Proc. Natl. Acad. Sci. USA 94: 412-417 (1997) 참조).
본 출원에 따르면, 용어 "대장균 발현 시스템(E. coli expression system)"은 E.coli(균주) 및 벡터로 이루어지는 발현 시스템을 의미하며, 상기 E.coli (균주)는 상업적으로 입수할 수 있는 균주로부터 유래하고, ER2551, BL21 (DE3), B834 (DE3), 및 BLR (DE3)을 포함하나 이에 제한되지 않는다.
본 출원에 따르면, 용어 "벡터(vector)"는 그에 삽입된 폴리뉴클레오티드를 가질 수 있는 핵산 운반체 도구를 의미한다. 벡터가 삽입된 폴리뉴클레오티드에 의해 코딩된 단백질의 발현을 가능하게 하는 경우, 상기 벡터를 발현 벡터라 한다. 벡터는 숙주 세포 내로의 형질전환, 형질도입 또는 형질감염에 의해 운반되는 유전물질 요소가 숙주 세포에서 발현되게 할 수 있다. 벡터는 당업자에게 잘 알려져 있으며, 플라스미드, 파지, 코스미드 등을 포함하나 이에 제한되지 않는다.
본 출원에 따르면, 용어 "약학적으로 허용가능한 담체 및/또는 부형제(a pharmaceutically acceptable carrier and/or excipient)"는 개체 및 활성 성분에 약리학적으로 및/또는 생리학적으로 적합한 담체 및/또는 부형제를 의미하며, 이들은 당업계에 주지되어 있고 (예를 들어, Remington's Pharmaceutical Sciences. Edited by Gennaro AR, 19th ed. Pennsylvania: Mack Publishing Company, 1995), pH 조절제, 계면활성제, 아쥬반트, 및 이온 강도 증강제를 포함하나 이에 제한되지 않는다. 예를 들어, pH 조절제는 인산염 완충액(phosphate buffer)을 포함하나 이에 제한되지 않고; 계면활성제는 양이온 계면활성제, 음이온 계면활성제, 또는 비-이온성 계면활성제, 예를 들어 트윈-80을 포함하나 이에 제한되지 않고; 아쥬반트는 알루미늄 아쥬반트(예를 들어 수산화 알루미늄), 및 프로인트 아쥬반트(예를 들어 프로인트 완전 아쥬반트)를 포함하나 이에 제한되지 않고; 이온 강도 증강제는 NaCl을 포함하나 이에 제한되지 않는다.
본 출원에 따르면, 용어 "유효량(an effective amount)"은 의도하는 목적을 유효하게 달성할 수 있는 양을 의미한다. 예를 들어, 질환 (예를 들어 HPV 감염)의 예방을 위한 유효량은 질환 (예를 들어 HPV 감염)의 발생을 예방하거나, 억제하거나 또는 지연시키기에 유효한 양을 의미한다. 그러한 유효량의 결정은 당업자의 능력 내에 있다.
본 출원에 따르면, 용어 "크로마토그래피(chromatography)"는 이온 교환 크로마토그래피 (예를 들어 양이온 교환 크로마토그래피), 소수성 상호작용 크로마토그래피, 흡수성(absorbent) 크로마토그래피 (예를 들어 하이드록시아파타이트 크로마토그래피), 겔 여과 크로마토그래피 (겔 배제 크로마토그래피), 및 친화성 크로마토그래피를 포함하나 이에 제한되지 않는다.
본 출원에 따르면, 용어 "용해물 상층액(lysate supernatant)"은 하기 단계에 의해 생성된 용액을 의미한다: 숙주 세포 (예를 들어, 대장균)를 용해 버퍼에서 파쇄시키고, 이어서 상기 파쇄된 숙주 세포를 함유하는 용해된 용액으로부터 불용성 물질을 제거한다. 다양한 용해 버퍼가 당업계에 주지되어 있으며, 트리스 버퍼, 포스페이트 버퍼, HEPES 버퍼, MOPS 버퍼 등을 포함하나 이에 한정되지 않는다. 또한, 숙주 세포의 파쇄는 당업자에 의해 균질화 파쇄, 초음파 처리, 분쇄, 고압 압출, 리소자임 처리 등을 포함하나 이에 제한되지 않는 주지된 방법에 의해 달성될 수 있다. 불용성 물질의 제거 방법도 당업자에게 잘 알려져 있고 여과 및 원심분리를 포함하나 이에 제한되지 않는다.
연구는 HPV51 및 다른 HPV 타입(들)(예를 들어 HVP69 및/또는 HPV26) 간에 어느 정도의 교차-보호가 존재하지만, 그러한 교차-보호는 매우 낮으며, 일반적으로 동일한 HPV 타입의 VLP의 보호 수준의 1% 미만, 심지어는 1000 분의 1에 불과하다는 것을 보여준다. 따라서, HPV51 백신을 접종 받은 개체는 여전히 다른 HPV 타입(들)(예를 들어 HVP69 및/또는 HPV26)에 의해 감염될 위험이 높다.
본 출원은 돌연변이된 HPV51 L1 단백질 및 그에 의해 형성된 HPV 바이러스-유사 입자를 제공한다. 본 출원에 따른 HPV 바이러스-유사 입자는 HPV51 및 다른 HPV 타입(들)(예를 들어 HVP69 및/또는 HPV26)에 대해 유의성 있는 교차-보호를 제공할 수 있다. 특히, 동일한 면역화 용량에서, 본 출원에 따른 HPV 바이러스-유사 입자는 개체에서 2종 이상의 HPV(예를 들어 HPV51 및 HPV69, 또는 HPV51, HPV69 및 HPV26)에 대해 고-역가 중화 항체의 생성을 유도할 수 있으며, 그 효과는 복수 HPV 타입의 VLP의 혼합물(예를 들어 HPV51 VLP 및 HPV69 VLP의 혼합물, 또는 HPV51 VLP, HPV69 VLP 및 HPV26 VLP의 혼합물)의 효과와 비슷하다. 따라서, 본 출원에 따른 HPV 바이러스-유사 입자는 동시에 적어도 2개 타입의 HPV(예를 들어 HPV51 및 HPV69, 또는 HPV51, HPV69 및 HPV26)에 의한 감염뿐만 아니라 상기 감염과 관련된 질환을 예방하기 위해 사용될 수 있으며, 현저하게 유용한 기술적 효과를 갖는다. 이는 HPV 백신의 보호 범위의 확대 및 HPV 백신의 생산 비용을 줄이는 측면에서 특히 상당한 이점을 갖는다.
본 출원의 구체예는 도면 및 실시예를 참조하여 더욱 상세하게 설명된다. 그러나, 당업자는 하기 도면 및 실시예가 본 출원의 범위를 한정하기 보다는 단지 본 출원을 설명하기 위한 것으로 의도된다는 것을 이해할 것이다. 하기 도면 및 바람직한 구체예의 상세한 설명에 따르면, 본 출원의 다양한 목적 및 장점들은 당업자에게 자명하다.
도 1a는 실시예 1에서 정제된 돌연변이된 단백질의 SDS-PAGE 결과를 보여준다. 래인 1: 단백질 분자량 마커; 래인 2: HPV51N9 (N-말단에서 9개의 아미노산 절단을 갖는 HPV51 L1);래인 3: HPV69N0 (전장 야생형 HPV69 L1 단백질);래인 4: H51N9-69T1 (서열번호 4로 기재된 돌연변이된 단백질);래인 5: H51N9-69T2 (서열번호 5로 기재된 돌연변이된 단백질);래인 6: H51N9-69T3 (서열번호 6으로 기재된 돌연변이된 단백질);래인 7: H51N9-69T4 (서열번호 7로 기재된 돌연변이된 단백질);래인 8: H51N9-69T5 (서열번호 8로 기재된 돌연변이된 단백질). 결과는 크로마토그래피에 의한 정제 후에, 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 및 H51N9-69T5가 약 90%의 순도에 도달했다는 것을 보여주었다.
도 1b 내지 1d는 실시예 1에서 정제된 돌연변이된 단백질 H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5의 SD-PAGE 결과를 보여준다. SDS-PAGE 결과는 크로마토그래피에 의한 정제 후에, 돌연변이된 단백질이 약 80-90%의 비교적 높은 순도에 도달했다는 것을 보여주었다.
도 2a는 HPV L1 단백질에 대한 광범위 항체(broad-spectrum antibody) 4B3을 이용하여 측정된, 실시예 1에서 제조된 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 and H51N9-69T5의 웨스턴 블롯 결과를 보여준다. 래인 1: 단백질 분자량 마커; 래인 2: HPV51N9 (N-말단에서 9개의 아미노산 절단을 갖는 HPV51 L1); 래인 3: HPV69N0 (전장 야생형 HPV69 L1 단백질); 래인 4: H51N9-69T1; 래인 5: H51N9-69T2; 래인 6: H51N9-69T3; 래인 7: H51N9-69T4; 래인 8: H51N9-69T5. 결과는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 및 H51N9-69T5가 광범위 항체 4B3에 의해 특이적으로 인식될 수 있다는 것을 보여주었다.
도 2b 내지 2d는 HPV L1 단백질에 대한 광범위 항체 4B3을 이용하여 측정된, 실시예 1에서 제조된 돌연변이된 단백질 H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5의 웨스턴 블롯 결과를 보여준다. 결과는 크로마토그래피에 의한 정제 후에, 돌연변이된 단백질이 광범위 항체 4B3에 의해 특이적으로 인식될 수 있다는 것을 보여주었다.
도 3은 분자 시브 크로마토그래피(molecular sieve chromatography)에 의해 분석된, 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 또는 H51N9-69T5를 포함하는 시료의 결과를 보여준다. 결과는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 또는 H51N9-69T5를 포함하는 시료의 제1 단백질 피크가 약 13-14분에 나타났고, 이는 HPV51N9 VLP의 것과 유사했다는 것을 보여주었다. 이는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 및 H51N9-69T5가 모두 균일한 크기를 갖는 VLP로 조립될 수 있다는 것을 보여주었다.
도 4는 분자 시브 크로마토그래피에 의해 분석된, 돌연변이된 단백질 H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 또는 H51N9-69T4-26S5를 포함하는 시료의 결과를 보여준다. 결과는 이들 돌연변이된 VLP의 제1 단백질 피크가 HPV51N9 VLP의 것과 유사하게, 약 13-14분에 나타났다는 것을 보여주었다. 이는 이들 돌연변이된 단백질 H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5가 모두 균일한 크기를 갖는 VLP로 조립될 수 있다는 것을 보여주었다. 돌연변이된 단백질 H51N9-69T1-26S4 또는 H51N9-69T1-26S5에 의해 형성된 VLP는 균일하지 않은 크기를 가졌다.
도 5는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP의 침강 속도 분석(sedimentation velocity analysis)의 결과를 보여준다. 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP의 침강 계수(sedimentation coefficient)가 각각 148S, 135S, 117S 및 131S라는 것을 보여주었다. 이는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3 및 H51N9-69T4가 모두 크기 및 형태 면에서 야생형 VLP(HPV51N9 VLP, 123S)와 유사한 바이러스-유사 입자로 조립될 수 있다는 것을 보여주었다.
도 6은 돌연변이된 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 침강 속도 분석의 결과를 보여준다. 결과는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 침강 계수가 각각 148S, 130S, 131S, 130S, 135S, 140S, 135S, 144S, 133S, 131S, 161S, 140S, 137S, 132S, 126S 및 48S였고, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5 VLP, H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S5 VLP는 불량한 균일성을 가졌고, 2개의 상이한 크기를 가졌다는 것을 보여주었다.
도 7은 다양한 VLP 시료의 전사 전자 현미경(TEM) 사진 (100,000 Х 확대로 촬영됨, 막대(Bar)=0.1 ㎛)을 보여주며, A는 HPV51N9 VLP의 TEM 사진을 보여주고; B는 H51N9-69T1 VLP의 TEM 사진을 보여주며; C는 H51N9-69T2 VLP의 TEM 사진을 보여주고; D는 H51N9-69T3 VLP의 TEM 사진을 보여주며; E는 H51N9-69T4 VLP의 TEM 사진을 보여주고; F는 H51N9-69T5 VLP의 TEM 사진을 보여주며; G는 HPV69N0 VLP의 TEM 사진을 보여준다. 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP 및 H51N9-69T5 VLP가 HPV51N9 VLP와 유사하고, 이들 돌연변이된 단백질은 약 25 nm의 반경을 갖는 VLP로 조립될 수 있다는 것을 보여주었다.
도 8은 다양한 VLP 시료의 전사 전자 현미경(TEM) 사진 (100,000 Х 확대로 촬영됨, 막대=0.1 ㎛)을 보여주며, A는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP 및 H51N9-69T1-26S5VLP의 TEM 사진을 보여주고; B는 H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP 및 H51N9-69T2-26S5 VLP의 TEM 사진을 보여주며; C는 H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP 및 H51N9-69T3-26S5 VLP의 TEM 사진을 보여주고; D는 H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 TEM 사진을 보여준다. 결과는 돌연변이된 단백질 H51N9-69T1-26S4를 제외하고, 나머지 돌연변이된 단백질들은 약 25 nm의 반경을 갖는 VLP로 조립될 수 있다는 것을 보여주었다.
도 9는 HPV26N0 VLP의 확인 결과를 보여주고, A는 분자 시브 크로마토그래피에 의해 분석된 HPV26N0 VLP의 결과를 보여주고; B는 HPV26N0 VLP의 침강 속도 분석의 결과를 보여주며; C는 HPV26N0 VLP의 TEM 사진을 보여준다.
도 10a 및 10b는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP 및 H51N9-69T5 VLP에 의한 마우스의 백신 접종(vaccination) 후에 마우스 혈청 중 중화항체 역가의 결과를 보여준다. 도 10a: 알루미늄 아쥬반트 그룹 1(알루미늄 아쥬반트를 이용한, 5.0 ㎍의 면역화 용량(immunizing dose)); 도 10b: 알루미늄 아쥬반트 그룹 2 (알루미늄 아쥬반트를 이용한, 1 ㎍의 면역화 용량). 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP가 각각 마우스에서 HPV51에 대한 고-역가(high-titer) 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69 VLP의 효과와 유사했고, 동일한 용량의 HPV69N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. 이는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP가 HPV51 및 HPV69에 대한 우수한 교차-면역원성 및 교차-보호(cross-protection)를 갖는다는 것을 보여주었다.
도 11a 및 11b는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP 및 H51N9-69T3-26S5 VLP에 의한 마우스의 백신 접종 후에 마우스 혈청 중 중화 항체 역가의 결과를 보여준다. 도 11a: 알루미늄 아쥬반트 그룹 1(알루미늄 아쥬반트를 이용한, 5.0 ㎍의 면역화 용량); 도 11b: 알루미늄 아쥬반트 그룹 2 (알루미늄 아쥬반트를 이용한, 1 ㎍의 면역화 용량). 결과는 H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV69N0 VLP 단독의 효과 및 HPV26N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP는 각각 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP는 각각 마우스에서 HPV26에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV26N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. 이는 H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
도 12a 및 12b는 H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP에 의한 마우스의 백신 접종 후에 마우스 혈청 중 중화 항체 역가의 결과를 보여준다. 도 12a: 알루미늄 아쥬반트 그룹 1(알루미늄 아쥬반트를 이용한, 5.0 ㎍의 면역화 용량); 도 12b: 알루미늄 아쥬반트 그룹 2 (알루미늄 아쥬반트를 이용한, 1 ㎍의 면역화 용량). 결과는 H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV69N0 VLP 단독의 효과 및 HPV26N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP도 각각 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP도 각각 마우스에서 HPV26에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV26N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. 이는 H51N9-69T2-26S3 VLP and H51N9-69T4-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
도 1b 내지 1d는 실시예 1에서 정제된 돌연변이된 단백질 H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5의 SD-PAGE 결과를 보여준다. SDS-PAGE 결과는 크로마토그래피에 의한 정제 후에, 돌연변이된 단백질이 약 80-90%의 비교적 높은 순도에 도달했다는 것을 보여주었다.
도 2a는 HPV L1 단백질에 대한 광범위 항체(broad-spectrum antibody) 4B3을 이용하여 측정된, 실시예 1에서 제조된 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 and H51N9-69T5의 웨스턴 블롯 결과를 보여준다. 래인 1: 단백질 분자량 마커; 래인 2: HPV51N9 (N-말단에서 9개의 아미노산 절단을 갖는 HPV51 L1); 래인 3: HPV69N0 (전장 야생형 HPV69 L1 단백질); 래인 4: H51N9-69T1; 래인 5: H51N9-69T2; 래인 6: H51N9-69T3; 래인 7: H51N9-69T4; 래인 8: H51N9-69T5. 결과는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 및 H51N9-69T5가 광범위 항체 4B3에 의해 특이적으로 인식될 수 있다는 것을 보여주었다.
도 2b 내지 2d는 HPV L1 단백질에 대한 광범위 항체 4B3을 이용하여 측정된, 실시예 1에서 제조된 돌연변이된 단백질 H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5의 웨스턴 블롯 결과를 보여준다. 결과는 크로마토그래피에 의한 정제 후에, 돌연변이된 단백질이 광범위 항체 4B3에 의해 특이적으로 인식될 수 있다는 것을 보여주었다.
도 3은 분자 시브 크로마토그래피(molecular sieve chromatography)에 의해 분석된, 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 또는 H51N9-69T5를 포함하는 시료의 결과를 보여준다. 결과는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 또는 H51N9-69T5를 포함하는 시료의 제1 단백질 피크가 약 13-14분에 나타났고, 이는 HPV51N9 VLP의 것과 유사했다는 것을 보여주었다. 이는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4 및 H51N9-69T5가 모두 균일한 크기를 갖는 VLP로 조립될 수 있다는 것을 보여주었다.
도 4는 분자 시브 크로마토그래피에 의해 분석된, 돌연변이된 단백질 H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 또는 H51N9-69T4-26S5를 포함하는 시료의 결과를 보여준다. 결과는 이들 돌연변이된 VLP의 제1 단백질 피크가 HPV51N9 VLP의 것과 유사하게, 약 13-14분에 나타났다는 것을 보여주었다. 이는 이들 돌연변이된 단백질 H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5가 모두 균일한 크기를 갖는 VLP로 조립될 수 있다는 것을 보여주었다. 돌연변이된 단백질 H51N9-69T1-26S4 또는 H51N9-69T1-26S5에 의해 형성된 VLP는 균일하지 않은 크기를 가졌다.
도 5는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP의 침강 속도 분석(sedimentation velocity analysis)의 결과를 보여준다. 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP의 침강 계수(sedimentation coefficient)가 각각 148S, 135S, 117S 및 131S라는 것을 보여주었다. 이는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3 및 H51N9-69T4가 모두 크기 및 형태 면에서 야생형 VLP(HPV51N9 VLP, 123S)와 유사한 바이러스-유사 입자로 조립될 수 있다는 것을 보여주었다.
도 6은 돌연변이된 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 침강 속도 분석의 결과를 보여준다. 결과는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 침강 계수가 각각 148S, 130S, 131S, 130S, 135S, 140S, 135S, 144S, 133S, 131S, 161S, 140S, 137S, 132S, 126S 및 48S였고, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5 VLP, H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S5 VLP는 불량한 균일성을 가졌고, 2개의 상이한 크기를 가졌다는 것을 보여주었다.
도 7은 다양한 VLP 시료의 전사 전자 현미경(TEM) 사진 (100,000 Х 확대로 촬영됨, 막대(Bar)=0.1 ㎛)을 보여주며, A는 HPV51N9 VLP의 TEM 사진을 보여주고; B는 H51N9-69T1 VLP의 TEM 사진을 보여주며; C는 H51N9-69T2 VLP의 TEM 사진을 보여주고; D는 H51N9-69T3 VLP의 TEM 사진을 보여주며; E는 H51N9-69T4 VLP의 TEM 사진을 보여주고; F는 H51N9-69T5 VLP의 TEM 사진을 보여주며; G는 HPV69N0 VLP의 TEM 사진을 보여준다. 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP 및 H51N9-69T5 VLP가 HPV51N9 VLP와 유사하고, 이들 돌연변이된 단백질은 약 25 nm의 반경을 갖는 VLP로 조립될 수 있다는 것을 보여주었다.
도 8은 다양한 VLP 시료의 전사 전자 현미경(TEM) 사진 (100,000 Х 확대로 촬영됨, 막대=0.1 ㎛)을 보여주며, A는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP 및 H51N9-69T1-26S5VLP의 TEM 사진을 보여주고; B는 H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP 및 H51N9-69T2-26S5 VLP의 TEM 사진을 보여주며; C는 H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP 및 H51N9-69T3-26S5 VLP의 TEM 사진을 보여주고; D는 H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 TEM 사진을 보여준다. 결과는 돌연변이된 단백질 H51N9-69T1-26S4를 제외하고, 나머지 돌연변이된 단백질들은 약 25 nm의 반경을 갖는 VLP로 조립될 수 있다는 것을 보여주었다.
도 9는 HPV26N0 VLP의 확인 결과를 보여주고, A는 분자 시브 크로마토그래피에 의해 분석된 HPV26N0 VLP의 결과를 보여주고; B는 HPV26N0 VLP의 침강 속도 분석의 결과를 보여주며; C는 HPV26N0 VLP의 TEM 사진을 보여준다.
도 10a 및 10b는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP 및 H51N9-69T5 VLP에 의한 마우스의 백신 접종(vaccination) 후에 마우스 혈청 중 중화항체 역가의 결과를 보여준다. 도 10a: 알루미늄 아쥬반트 그룹 1(알루미늄 아쥬반트를 이용한, 5.0 ㎍의 면역화 용량(immunizing dose)); 도 10b: 알루미늄 아쥬반트 그룹 2 (알루미늄 아쥬반트를 이용한, 1 ㎍의 면역화 용량). 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP가 각각 마우스에서 HPV51에 대한 고-역가(high-titer) 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69 VLP의 효과와 유사했고, 동일한 용량의 HPV69N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. 이는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP가 HPV51 및 HPV69에 대한 우수한 교차-면역원성 및 교차-보호(cross-protection)를 갖는다는 것을 보여주었다.
도 11a 및 11b는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP 및 H51N9-69T3-26S5 VLP에 의한 마우스의 백신 접종 후에 마우스 혈청 중 중화 항체 역가의 결과를 보여준다. 도 11a: 알루미늄 아쥬반트 그룹 1(알루미늄 아쥬반트를 이용한, 5.0 ㎍의 면역화 용량); 도 11b: 알루미늄 아쥬반트 그룹 2 (알루미늄 아쥬반트를 이용한, 1 ㎍의 면역화 용량). 결과는 H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV69N0 VLP 단독의 효과 및 HPV26N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP는 각각 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP는 각각 마우스에서 HPV26에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV26N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. 이는 H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
도 12a 및 12b는 H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP에 의한 마우스의 백신 접종 후에 마우스 혈청 중 중화 항체 역가의 결과를 보여준다. 도 12a: 알루미늄 아쥬반트 그룹 1(알루미늄 아쥬반트를 이용한, 5.0 ㎍의 면역화 용량); 도 12b: 알루미늄 아쥬반트 그룹 2 (알루미늄 아쥬반트를 이용한, 1 ㎍의 면역화 용량). 결과는 H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV69N0 VLP 단독의 효과 및 HPV26N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP도 각각 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP도 각각 마우스에서 HPV26에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과는 동일한 용량의 HPV26N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량의 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. 이는 H51N9-69T2-26S3 VLP and H51N9-69T4-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
서열 정보
본 출원에 관련된 서열의 일부가 하기 표 1에 제공된다.
서열번호 | 설명 |
1 | 야생형 HPV51 L1 단백질, HPV51 L1 |
2 | 야생형 HPV69 L1 단백질, HPV69 L1, 즉, HPV69 N0 |
3 | N-말단에서 9개의 아미노산이 절단된 HPV51 L1 단백질, HPV51N9 |
4 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 1을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T1 |
5 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 2를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T2 |
6 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 3을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T3 |
7 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 4를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T4 |
8 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 5를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T5 |
9 | 서열번호 1을 코딩하는 DNA 서열 |
10 | 서열번호 2를 코딩하는 DNA 서열 |
11 | 서열번호 3을 코딩하는 DNA 서열 |
12 | 서열번호 4를 코딩하는 DNA 서열 |
13 | 서열번호 5를 코딩하는 DNA 서열 |
14 | 서열번호 6을 코딩하는 DNA 서열 |
15 | 서열번호 7을 코딩하는 DNA 서열 |
16 | 서열번호 8을 코딩하는 DNA 서열 |
17 | 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들, 즉, HPV69 L1 단백질의 세그먼트 1의 서열 |
18 | 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들, 즉, HPV69 L1 단백질의 세그먼트 2의 서열 |
19 | 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들, 즉, HPV69 L1 단백질의 세그먼트 3의 서열 |
20 | 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들, 즉, HPV69 L1 단백질의 세그먼트 4의 서열 |
21 | 야생형 HPV69 L1 단백질의 350-362번 아미노산 잔기들, 즉, HPV69 L1 단백질의 세그먼트 5의 서열 |
22 | 야생형 HPV26 L1 단백질, HPV26 L1 |
23 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 1, 및 HPV26 L1 단백질의 세그먼트 2를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T1-26S2 |
24 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 1, 및 HPV26 L1 단백질의 세그먼트 3을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T1-26S3 |
25 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 1, 및 HPV26 L1 단백질의 세그먼트 4를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T1-26S4 |
26 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 1, 및 HPV26 L1 단백질의 세그먼트 5를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T1-26S5 |
27 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 3, 및 HPV26 L1 단백질의 세그먼트 1을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T3-26S1 |
28 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 3, 및 HPV26 L1 단백질의 세그먼트 2를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T3-26S2 |
29 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 3, 및 HPV26 L1 단백질의 세그먼트 4를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T3-26S4 |
30 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 3, 및 HPV26 L1 단백질의 세그먼트 5를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T3-26S5 |
31 | 서열번호 22를 코딩하는 DNA 서열 |
32 | 서열번호 23을 코딩하는 DNA 서열 |
33 | 서열번호 24를 코딩하는 DNA 서열 |
34 | 서열번호 25를 코딩하는 DNA 서열 |
35 | 서열번호 26을 코딩하는 DNA 서열 |
36 | 서열번호 27을 코딩하는 DNA 서열 |
37 | 서열번호 28을 코딩하는 DNA 서열 |
38 | 서열번호 29를 코딩하는 DNA 서열 |
39 | 서열번호 30을 코딩하는 DNA 서열 |
40 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 2, 및 HPV26 L1 단백질의 세그먼트 1을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T2-26S1 |
41 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 2, 및 HPV26 L1 단백질의 세그먼트 3을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T2-26S3 |
42 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 2, 및 HPV26 L1 단백질의 세그먼트 4를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T2-26S4 |
43 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 2, 및 HPV26 L1 단백질의 세그먼트 5를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T2-26S5 |
44 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 4, 및 HPV26 L1 단백질의 세그먼트 1을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T4-26S1 |
45 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 4, 및 HPV26 L1 단백질의 세그먼트 2를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T4-26S2 |
46 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 4, 및 HPV26 L1 단백질의 세그먼트 3을 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T4-26S3 |
47 | N-말단에서 9개의 아미노산이 절단되고, HPV69 L1 단백질의 세그먼트 4, 및 HPV26 L1 단백질의 세그먼트 5를 포함하는 돌연변이된 HPV51 L1 단백질, H51N9-69T4-26S5 |
48 | 서열번호 40을 코딩하는 DNA 서열 |
49 | 서열번호 41을 코딩하는 DNA 서열 |
50 | 서열번호 42를 코딩하는 DNA 서열 |
51 | 서열번호 43을 코딩하는 DNA 서열 |
52 | 서열번호 44를 코딩하는 DNA 서열 |
53 | 서열번호 45를 코딩하는 DNA 서열 |
54 | 서열번호 46을 코딩하는 DNA 서열 |
55 | 서열번호 47을 코딩하는 DNA 서열 |
56 | 야생형 HPV26 L1 단백질의 51-60번 아미노산 잔기들, 즉, HPV26 L1 단백질의 세그먼트 1의 서열 |
57 | 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기들, 즉, HPV26 L1 단백질의 세그먼트 2의 서열 |
58 | 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기들, 즉, HPV26 L1 단백질의 세그먼트 3의 서열 |
59 | 야생형 HPV26 L1 단백질의 259-289번 아미노산 잔기들, 즉, HPV26 L1 단백질의 세그먼트 4의 서열 |
60 | 야생형 HPV26 L1 단백질의 348-360번 아미노산 잔기들, 즉, HPV26 L1 단백질의 세그먼트 5의 서열 |
서열 1(서열번호 1):
MALWRTNDSKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK.
서열 2(서열번호 2):
MALWRTSDSKVYLPPTPVSRVVSTDEYVTRTGIYYYAGSSRLLTLGHPYFPIPKSGSTAEIPKVSAYQYRVFRVHLPDPNKFGLPDPQLYNPETERLVWACVGVEVGRGQPLGVGLSGHPLFNKLDDTENSHLATANADTDNRDNVCVDNKQTQLCIIGCTPPLGEHWGVGTVCKNAQSQVQRGDCPPLELISSVIEDGDMIDTGFGAMDFTALQATKCDVPLDINQSICKYPDYLKMSADTYGNSMFFFLRREQLFARHFFNKAGTIGDPVPVSMYIKGAGQGREPPTTSIYSATPSGSMVTSDAQLFNKPYWLQRAQGHNNGICWGNQLFVTCVDTTRSTNLTISTVSAQSASATFKPSDYKQFIRHGEEYELQFIFQLCKITLTTDVMAYIHTMNSTILENWNFGLTLPPTASLEDAYRFIKNSATTCQRDAPAQPKEDPFSKLKFWDVDLKEKFSIDLDQFPLGRKFMLQAGIQRRPKLGTKRPASSLSASSSSTTRKKRKLTK.
서열 3(서열번호 3):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 4(서열번호 4):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPIPKSGSTAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 5(서열번호 5):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKLDDTENSHLATANADTDNRDNVCVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 6(서열번호 6):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGVGTVCKNAQSQVQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK.
서열 7(서열번호 7):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFFNKAGTIGDPVPVSMYIKGAGQGREPPTTSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 8(서열번호 8):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTASAQSASATFKPSDFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK.
서열 9(서열번호 9):
ATGGCCCTGTGGAGGACCAACGACAGCAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 10(서열번호 10):
ATGGCTCTGTGGCGTACCTCTGACTCTAAAGTTTACCTGCCGCCGACCCCGGTTTCTCGTGTTGTTTCTACCGACGAATACGTTACCCGTACCGGTATCTACTACTACGCTGGTTCTTCTCGTCTGCTGACCCTGGGTCACCCGTACTTCCCGATCCCGAAATCTGGTTCTACCGCTGAAATCCCGAAGGTCTCTGCTTACCAGTACCGGGTATTCCGTGTCCACCTGCCGGACCCGAACAAATTCGGTCTGCCGGACCCGCAGCTGTACAATCCAGAAACCGAACGTCTGGTTTGGGCTTGCGTTGGTGTCGAGGTCGGTCGTGGTCAGCCGCTGGGTGTCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGCTAACGCTGACACCGACAACCGTGACAACGTTTGCGTTGACAACAAACAGACCCAGCTGTGCATCATCGGTTGCACCCCGCCGCTGGGTGAACACTGGGGTGTCGGTACCGTTTGCAAAAACGCTCAGTCTCAGGTTCAGCGTGGTGACTGCCCGCCGCTGGAACTGATCTCTTCTGTTATCGAAGACGGTGACATGATCGACACCGGTTTCGGTGCTATGGACTTCACCGCTCTGCAGGCTACCAAATGCGACGTTCCGCTGGACATCAACCAGTCTATCTGCAAATACCCCGACTACCTGAAAATGTCTGCTGACACCTACGGTAACTCTATGTTCTTCTTCCTGCGTCGTGAACAGCTGTTCGCTCGTCACTTCTTCAACAAAGCTGGTACCATCGGTGACCCTGTTCCGGTTTCTATGTACATCAAAGGTGCTGGTCAGGGTCGTGAACCGCCGACCACATCCATCTACTCTGCTACCCCGTCTGGTTCTATGGTTACATCCGACGCTCAGCTGTTCAACAAACCGTACTGGCTGCAGCGTGCTCAGGGTCACAACAACGGTATCTGCTGGGGTAACCAGCTGTTCGTTACCTGCGTTGACACCACCCGTTCTACCAACCTGACCATCTCTACCGTTTCTGCTCAGTCTGCTTCTGCTACCTTCAAACCGTCTGACTACAAACAATTTATCCGTCACGGTGAAGAATACGAACTGCAGTTCATCTTCCAGCTGTGCAAAATCACCCTGACCACCGACGTTATGGCTTACATCCACACCATGAACTCTACCATCCTGGAAAACTGGAACTTCGGTCTGACCCTGCCGCCGACCGCTTCTCTGGAAGACGCTTACCGTTTCATCAAAAACTCTGCTACCACCTGCCAGCGTGACGCTCCGGCTCAGCCGAAAGAAGACCCGTTCTCTAAACTGAAATTCTGGGACGTTGACCTGAAAGAAAAATTCTCTATCGACCTGGACCAGTTCCCGCTGGGTCGTAAATTCATGCTGCAGGCTGGTATCCAGCGTCGTCCGAAACTGGGTACCAAACGTCCGGCTTCTTCTCTGTCTGCTTCTTCTTCTTCTACCACCCGTAAAAAACGTAAACTGACCAAATAA
서열 11(서열번호 11):
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 12(서열번호 12):
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCGATCCCGAAATCTGGTTCTACCGCTGAAATCCCGAAGGTCTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 13(서열번호 13):
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTGTCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGCTAACGCTGACACCGACAACCGTGACAACGTTTGCGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 14(서열번호 14):
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTGTCGGTACCGTTTGCAAAAACGCTCAGTCTCAGGTTCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 15(서열번호 15):
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTTCAACAAAGCTGGTACCATCGGTGACCCTGTTCCGGTTTCTATGTACATCAAAGGTGCTGGTCAGGGTCGTGAACCGCCGACCACATCCATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 16(서열번호 16):
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCTCTGCTCAGTCTGCTTCTGCTACCTTCAAACCGTCTGACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 17(서열번호 17):
IPKSGSTAE
서열 18(서열번호 18):
LDDTENSHLATANADTDNRDNVC
서열 19(서열번호 19):
VGTVCKNAQSQVQR
서열 20(서열번호 20):
FFNKAGTIGDPVPVSMYIKGAGQGREPPTTS
서열 21(서열번호 21):
SAQSASATFKPSD
서열 22(서열번호 22):
MALWRTSDSKVYLPPTPVSRVVNTDEYVTRTGIYYYAGSSRLLTLGHPYFSIPKTGQKAEIPKVSAYQYRVFRVHLPDPNKFGLPDPQLYNPDTERLVWACVGVEVGRGQPLGIGLSGHPLFNKLDDTENSHLATVNADTDNRDNVSVDNKQTQLCIIGCTPPLGEHWGIGTICKNTQTQRGDCPPLELISSIIEDGDMIDTGFGAMDFTALQATKSDVPIDISQSTCKYPDYLKMSADTYGNSMFFFLRREQLFARHFYNKAGAVGDAIPTTLYIKGAESGREPPTSSIYSATPSGSMVTSDAQLFNKPYWLQRAQGHNNGICWGNQLFVTCVDTTRSTNLTISTLSAASASTPFKPSDYKQFIRHGEEYELQFIFQLCKITLTTDVMAYIHLMNASILEDWNFGLTLPPTASLEDAYRFIKNSATTCQRNAPPVPKEDPFQKFKFWDVDLKEKFSIDLDQFPLGRKFMLQAGIQRRPKLGTKRPLSSTSSSTKRKKRKLTK.
서열 23(서열번호 23):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPIPKSGSTAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGIGLSGHPLFNKLDDTENSHLATVNADTDNRDNVSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 24(서열번호 24):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPIPKSGSTAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTICKNTQTQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 25(서열번호 25):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPIPKSGSTAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFYNKAGAVGDAIPTTLYIKGAESGREPPTSSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 26(서열번호 26):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPIPKSGSTAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTASAASASTPFKPSDFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 27(서열번호 27):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFSIPKTGQKAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGVGTVCKNAQSQVQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 28(서열번호 28):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGIGLSGHPLFNKLDDTENSHLATVNADTDNRDNVSVDNKQTQLCIIGCAPPIGEHWGVGTVCKNAQSQVQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 29(서열번호 29):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGVGTVCKNAQSQVQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFYNKAGAVGDAIPTTLYIKGAESGREPPTSSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 30(서열번호 30):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGVGTVCKNAQSQVQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTASAASASTPFKPSDFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 31(서열번호 31):
서열번호 22를 코딩하는 DNA 서열
ATGGCTCTGTGGCGTACCTCTGACTCTAAAGTTTACCTGCCGCCGACCCCGGTTTCTCGTGTTGTTAACACCGACGAATACGTTACCCGTACCGGTATCTACTACTACGCTGGTTCTTCTCGTCTGCTGACCCTGGGTCACCCGTACTTCTCTATCCCGAAAACCGGTCAGAAAGCTGAAATCCCGAAAGTTTCTGCTTACCAGTACCGTGTTTTCCGTGTTCACCTGCCGGACCCGAACAAATTCGGTCTGCCGGACCCGCAGCTGTACAACCCGGACACCGAACGTCTGGTTTGGGCTTGCGTTGGTGTTGAAGTTGGTCGTGGTCAGCCGCTGGGTATCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGTTAACGCTGACACCGACAACCGTGACAACGTTTCTGTTGACAACAAACAGACCCAGCTGTGCATCATCGGTTGCACCCCGCCGCTGGGTGAACACTGGGGTATCGGTACCATCTGCAAAAACACCCAGACCCAGCGTGGTGACTGCCCGCCGCTGGAACTGATCTCTTCTATCATCGAAGACGGTGACATGATCGACACCGGTTTCGGTGCTATGGACTTCACCGCTCTGCAGGCTACCAAATCTGACGTTCCGATCGACATCTCTCAGTCTACCTGCAAATACCCGGACTACCTGAAAATGTCTGCTGACACCTACGGTAACTCTATGTTCTTCTTCCTGCGTCGTGAACAGCTGTTCGCTCGTCACTTCTACAACAAAGCTGGTGCTGTTGGTGACGCTATCCCGACCACCCTGTACATCAAAGGTGCTGAATCTGGTCGTGAACCGCCGACCTCTTCTATCTACTCTGCTACCCCGTCTGGTTCTATGGTTACCTCTGACGCTCAGCTGTTCAACAAACCGTACTGGCTGCAGCGTGCTCAGGGTCACAACAACGGTATCTGCTGGGGTAACCAGCTGTTCGTTACCTGCGTTGACACCACCCGTTCTACCAACCTGACCATCTCTACCCTGTCTGCTGCTTCTGCTTCTACCCCGTTCAAACCGTCTGACTACAAACAGTTCATCCGTCACGGTGAAGAATACGAACTGCAGTTCATCTTCCAGCTGTGCAAAATCACCCTGACCACCGACGTTATGGCTTACATCCACCTGATGAACGCTTCTATCCTGGAAGACTGGAACTTCGGTCTGACCCTGCCGCCGACCGCTTCTCTGGAAGACGCTTACCGTTTCATCAAAAACTCTGCTACCACCTGCCAGCGTAACGCTCCGCCGGTTCCGAAAGAAGACCCGTTCCAGAAATTCAAATTCTGGGACGTTGACCTGAAAGAAAAATTCTCTATCGACCTGGACCAGTTCCCGCTGGGTCGTAAATTCATGCTGCAGGCTGGTATCCAGCGTCGTCCGAAACTGGGTACCAAACGTCCGCTGTCTTCTACCTCTTCTTCTACCAAACGTAAAAAACGTAAACTGACCAAATAA
서열 32(서열번호 32):
서열번호 23을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCGATCCCGAAATCTGGTTCTACCGCTGAAATCCCGAAGGTCTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTATCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGTTAACGCTGACACCGACAACCGTGACAACGTTTCTGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 33(서열번호 33):
서열번호 24를 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCGATCCCGAAATCTGGTTCTACCGCTGAAATCCCGAAGGTCTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTATCGGTACCATCTGCAAAAACACCCAGACCCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 34(서열번호 34):
서열번호 25를 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCGATCCCGAAATCTGGTTCTACCGCTGAAATCCCGAAGGTCTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTACAACAAAGCTGGTGCTGTTGGTGACGCTATCCCGACCACCCTGTACATCAAAGGTGCTGAATCTGGTCGTGAACCGCCGACCTCTTCTATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 35(서열번호 35):
서열번호 26을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCGATCCCGAAATCTGGTTCTACCGCTGAAATCCCGAAGGTCTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCTCTGCTGCTTCTGCTTCTACCCCGTTCAAACCGTCTGACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 36(서열번호 36):
서열번호 27을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCTCTATCCCGAAAACCGGTCAGAAAGCTGAAATCCCGAAAGTTTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTGTCGGTACCGTTTGCAAAAACGCTCAGTCTCAGGTTCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 37(서열번호 37):
서열번호 28을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTATCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGTTAACGCTGACACCGACAACCGTGACAACGTTTCTGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTGTCGGTACCGTTTGCAAAAACGCTCAGTCTCAGGTTCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 38(서열번호 38):
서열번호 29를 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTGTCGGTACCGTTTGCAAAAACGCTCAGTCTCAGGTTCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTACAACAAAGCTGGTGCTGTTGGTGACGCTATCCCGACCACCCTGTACATCAAAGGTGCTGAATCTGGTCGTGAACCGCCGACCTCTTCTATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 39(서열번호 39):
서열번호 30을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTGTCGGTACCGTTTGCAAAAACGCTCAGTCTCAGGTTCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCTCTGCTGCTTCTGCTTCTACCCCGTTCAAACCGTCTGACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 40(서열번호 40):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFSIPKTGQKAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKLDDTENSHLATANADTDNRDNVCVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 41(서열번호 41):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKLDDTENSHLATANADTDNRDNVCVDNKQTQLCIIGCAPPIGEHWGIGTICKNTQTQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 42(서열번호 42):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKLDDTENSHLATANADTDNRDNVCVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFYNKAGAVGDAIPTTLYIKGAESGREPPTSSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 43(서열번호 43):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKLDDTENSHLATANADTDNRDNVCVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHYYNKLGSVGEDIPTDYYIKGSGNGRDPIESYIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTASAASASTPFKPSDFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 44(서열번호 44):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFSIPKTGQKAEIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFFNKAGTIGDPVPVSMYIKGAGQGREPPTTSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 45(서열번호 45):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGIGLSGHPLFNKLDDTENSHLATVNADTDNRDNVSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFFNKAGTIGDPVPVSMYIKGAGQGREPPTTSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 46(서열번호 46):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTICKNTQTQRGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFFNKAGTIGDPVPVSMYIKGAGQGREPPTTSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTATAAVSPTFTPSNFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 47(서열번호 47):
MKVYLPPAPVSRIVNTEEYITRTGIYYYAGSSRLITLGHPYFPLPKTSTRAAIPKVSAFQYRVFRVQLPDPNKFGLPDPNLYNPDTDRLVWGCVGVEVGRGQPLGVGLSGHPLFNKYDDTENSRIANGNAQQDVRDNTSVDNKQTQLCIIGCAPPIGEHWGIGTTCKNTPVPPGDCPPLELVSSVIQDGDMIDTGFGAMDFAALQATKSDVPLDISQSVCKYPDYLKMSADTYGNSMFFHLRREQIFARHFFNKAGTIGDPVPVSMYIKGAGQGREPPTTSIYSATPSGSMITSDSQIFNKPYWLHRAQGHNNGICWNNQLFITCVDTTRSTNLTISTASAASASTPFKPSDFKQYIRHGEEYELQFIFQLCKITLTTEVMAYLHTMDPTILEQWNFGLTLPPSASLEDAYRFVRNAATSCQKDTPPQAKPDPLAKYKFWDVDLKERFSLDLDQFALGRKFLLQVGVQRKPRPGLKRPASSASSSSSSSAKRKRVKK
서열 48(서열번호 48):
서열번호 40을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCTCTATCCCGAAAACCGGTCAGAAAGCTGAAATCCCGAAAGTTTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTGTCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGCTAACGCTGACACCGACAACCGTGACAACGTTTGCGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 49(서열번호 49):
서열번호 41을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTGTCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGCTAACGCTGACACCGACAACCGTGACAACGTTTGCGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTATCGGTACCATCTGCAAAAACACCCAGACCCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 50(서열번호 50):
서열번호 42를 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTGTCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGCTAACGCTGACACCGACAACCGTGACAACGTTTGCGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTACAACAAAGCTGGTGCTGTTGGTGACGCTATCCCGACCACCCTGTACATCAAAGGTGCTGAATCTGGTCGTGAACCGCCGACCTCTTCTATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 51(서열번호 51):
서열번호 43을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTGTCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGCTAACGCTGACACCGACAACCGTGACAACGTTTGCGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTACTACAACAAGCTGGGCAGCGTGGGCGAGGACATCCCCACCGACTACTACATCAAGGGCAGCGGCAACGGCAGGGACCCCATCGAGAGCTACATCTACAGCGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCTCTGCTGCTTCTGCTTCTACCCCGTTCAAACCGTCTGACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 52(서열번호 52):
서열번호 44를 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCTCTATCCCGAAAACCGGTCAGAAAGCTGAAATCCCGAAAGTTTCTGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTTCAACAAAGCTGGTACCATCGGTGACCCTGTTCCGGTTTCTATGTACATCAAAGGTGCTGGTCAGGGTCGTGAACCGCCGACCACATCCATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 53(서열번호 53):
서열번호 45를 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGTATCGGTCTGTCTGGTCACCCGCTGTTCAACAAACTGGACGACACCGAAAACTCTCACCTGGCTACCGTTAACGCTGACACCGACAACCGTGACAACGTTTCTGTTGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTTCAACAAAGCTGGTACCATCGGTGACCCTGTTCCGGTTTCTATGTACATCAAAGGTGCTGGTCAGGGTCGTGAACCGCCGACCACATCCATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 54(서열번호 54):
서열번호 46을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTATCGGTACCATCTGCAAAAACACCCAGACCCAGCGTGGTGACTGCCCGCCGCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTTCAACAAAGCTGGTACCATCGGTGACCCTGTTCCGGTTTCTATGTACATCAAAGGTGCTGGTCAGGGTCGTGAACCGCCGACCACATCCATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCACCGCCGCCGTGAGCCCCACCTTCACCCCCAGCAACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 55(서열번호 55):
서열번호 47을 코딩하는 DNA 서열
ATGAAGGTGTACCTGCCCCCCGCCCCCGTGAGCAGGATCGTGAACACCGAGGAGTACATCACCAGGACCGGCATCTACTACTACGCCGGCAGCAGCAGGCTGATCACCCTGGGCCACCCCTACTTCCCCCTGCCCAAGACCAGCACCAGGGCCGCCATCCCCAAGGTGAGCGCCTTCCAGTACAGGGTGTTCAGGGTGCAGCTCCCCGACCCCAACAAGTTCGGCCTGCCCGACCCCAACCTGTACAACCCCGACACCGACAGGCTGGTGTGGGGCTGCGTGGGCGTGGAGGTGGGCAGGGGCCAGCCCCTGGGCGTGGGCCTGAGCGGCCACCCCCTGTTCAACAAGTACGACGACACCGAGAACAGCAGGATCGCCAACGGCAACGCCCAGCAGGACGTGAGGGACAACACCAGCGTGGACAACAAGCAGACCCAGCTGTGCATCATCGGCTGCGCCCCCCCCATCGGCGAGCACTGGGGCATCGGCACCACCTGCAAGAACACCCCCGTGCCCCCCGGCGACTGCCCCCCCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACATGATCGACACCGGCTTCGGCGCCATGGACTTCGCCGCCCTGCAGGCCACCAAGAGCGACGTGCCCCTGGACATCAGCCAGAGCGTGTGCAAGTACCCCGACTACCTGAAGATGAGCGCCGACACCTACGGCAACAGCATGTTCTTCCACCTGAGGAGGGAGCAGATCTTCGCCAGGCACTTCTTCAACAAAGCTGGTACCATCGGTGACCCTGTTCCGGTTTCTATGTACATCAAAGGTGCTGGTCAGGGTCGTGAACCGCCGACCACATCCATCTACTCTGCCACCCCCAGCGGCAGCATGATCACCAGCGACAGCCAGATCTTCAACAAGCCCTACTGGCTGCACAGGGCCCAGGGCCACAACAACGGCATCTGCTGGAACAACCAGCTGTTCATCACCTGCGTGGACACCACCAGGAGCACCAACCTGACCATCAGCACCGCCTCTGCTGCTTCTGCTTCTACCCCGTTCAAACCGTCTGACTTCAAGCAGTACATCAGGCACGGCGAGGAGTACGAGCTGCAGTTCATCTTCCAGCTGTGCAAGATCACCCTGACCACCGAGGTGATGGCCTACCTGCACACCATGGACCCCACCATCCTGGAGCAGTGGAACTTCGGCCTGACCCTGCCCCCCAGCGCCAGCCTGGAGGACGCCTACAGGTTCGTGAGGAACGCCGCCACCAGCTGCCAGAAGGACACCCCCCCCCAGGCCAAGCCCGACCCCCTGGCCAAGTACAAGTTCTGGGACGTGGACCTGAAGGAGAGGTTCAGCCTGGACCTGGACCAGTTCGCCCTGGGCAGGAAGTTCCTGCTGCAGGTGGGCGTGCAGAGGAAGCCCAGGCCCGGCCTGAAGAGGCCCGCTAGCAGCGCCAGCTCCAGCAGCTCCAGCAGCGCCAAGAGGAAGAGGGTGAAGAAGTAA
서열 56(서열번호 56):
SIPKTGQKAE
서열 57(서열번호 57):
IGLSGHPLFNKLDDTENSHLATVNADTDNRDNV
서열 58(서열번호 58):
ICKNTQTQR
서열 59(서열번호 59):
FYNKAGAVGDAIPTTLYIKGAESGREPPTSS
서열 60(서열번호 60):
SAASASTPFKPSD
본 출원은 하기 실시예를 참조하여 더 설명되며, 실시예는 본 출원을 한정하기 보다는, 본 출원을 설명하기 위한 목적으로만 사용된다.
달리 명시되지 않는 한, 본 출원에 사용된 분자생물학적 실험 방법 및 면역학적 분석들은 실질적으로 Sambrook J et al., Molecular Cloning: A Laboratory Manual (Second Edition), Cold Spring Harbor Laboratory Press, 1989, 및 F. M. Ausubel et al., Short Protocols in Molecular Biology, 3rd Edition, John Wiley & Sons, Inc., 1995에 기재된 바와 같은 방법에 따라 수행되며; 제한 효소는 제조사가 권장하는 조건하에서 사용된다. 당업자는 실시예가 본 출원을 설명하기 위해 사용되지만, 본 출원의 보호 범위를 제한하는 것으로 의도되지 않는다는 것을 이해한다.
실시예 1. 돌연변이된 HPV51 L1 단백질의 발현 및 정제
발현 벡터의 구축
깁슨(Gibson) 조립 (Gibson DG, Young L, Chuang RY, Venter JC, Hutchison CA, Smith HO. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods. 2009; 6:343-5. doi: 10.1038/nmeth.1318)을 HPV69 L1로부터의 특정 세그먼트 및/또는 HPV26 L1 단백질로부터의 특정 세그먼트를 포함하는 돌연변이된 HPV51 L1 단백질을 코딩하는 발현 벡터를 구축하였다. 요약하면, 돌연변이를 포함하는 짧은 단편 및 돌연변이를 포함하지 않는 긴 단편을 PCR에 의해 먼저 수득하고, 깁슨 조립 시스템을 이용하여 두 단편을 라이게이션시켜서 고리를 형성하였다.
사용된 초기 주형은 플라스미드 pTO-T7-HPV51N9C (N-말단에 9개의 아미노산 절단을 갖는 HPV51 L1 단백질을 코딩함, 표 2에 51L1N9로 약칭됨), 플라스미드 pTO-T7-HPV69N0C (전장 HPV69 L1 단백질을 코딩함; 표 2에 69L1N0로 약칭됨), 및 플라스미드 pTO-T7-HPV26N0C (전장 HPV26 L1 단백질을 코딩함; 표 2에 26L1N0로 약칭됨)를 포함하였다. 각각의 PCR에 대한 주형 및 프라이머가 표 2에 표시되며, 짧은 단편을 증폭하기 위한 PCR의 증폭 조건은 다음과 같았다: 94℃에서 10분간 변성; 25회 사이클 (94℃에서 50초간 변성, 일정 기간 동안 주어진 온도에서 어닐링, 및 72℃에서 1분간 연장); 및 최종적으로 72℃에서 10분간 연장. 긴 단편을 증폭하기 위한 PCR의 증폭 조건은 다음과 같았다: 94℃에서 10분간 변성; 25회 사이클 (94℃에서 50초간 변성, 일정 기간 동안 주어진 온도에서 어닐링, 및 72℃에서 7.5분간 연장); 및 최종적으로 72℃에서 10분간 연장. 어닐링의 온도 및 시간은 표 2에 기재되었다. 사용된 PCR 프라이머의 서열을 표 3에 나타내었다. 증폭 산물을 전기영동한 후, DNA 추출 키트 (BEYOTIME, Cat.No.D0033)를 사용하여 목적 단편을 회수하고, 농도를 측정하였다. 증폭에 의해 얻은 짧은 단편 및 긴 단편을 2:1의 몰비 (총 부피 3 ㎕)로 혼합하고, 이어서 3㎕의 2 X 깁슨 조립 Master Mix (NEB로부터 구입, T5 엑소뉴클레아제, Phusion DNA 폴리머라제, Taq DNA 리가아제를 포함)를 첨가하고, 50℃에서 1시간 동안 반응시켰다.
조립된 생성물 (6㎕)을 사용하여 염화 칼슘 방법에 의해 준비된 40 ㎕의 적격(competent) E. coli ER2566 (New England Biolabs로부터 구입)을 형질전환시켰다. 형질전환된 E. coli를 카나마이신(25㎍/mL의 최종 농도, 이하 동일함)을 함유하는 고형 LB 배지(LB 배지의 성분: 10 g/L 펩톤, 5 g/L 효모 분말, 10 g/L NaCl, 이하 동일함) 상에 도말하고, 단일 콜로니가 명확하게 관찰될 때까지 37℃에서 10 내지 12시간 동안 정적 배양하였다. 단일 콜로니를 수집하여 4 ㎖ 액체 LB 배지(카나마이신 함유)를 함유하는 튜브에 접종하고, 37℃에서 10시간 동안 220 rpm으로 진탕 배양한 다음, 이어서 1 ㎖ 박테리아 용액을 취하고 -70℃에서 보관하였다. 플라스미드를 E. coli로부터 추출하고, T7 프라이머를 사용하여 상기 플라스미드에 삽입된 목적 단편의 뉴클레오티드 서열을 시퀀싱하였다. 시퀀싱 결과, 구축된 플라스미드(발현 벡터)에 삽입된 목적 단편의 뉴클레오티드 서열은 각각 서열번호 12, 13, 14, 15, 16, 32, 33, 34, 35, 36, 37, 38, 39, 48, 49, 50, 51, 52, 53, 54 및 55이고, 그에 의해 코딩된 아미노산 서열은 각각 서열번호 4, 5, 6, 7, 8, 23, 24, 25, 26, 27, 28, 29, 30, 40, 41, 42, 43, 44, 45, 46 및 47이었다(상응하는 단백질은 각각 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5로 표기되었다).
돌연변이된 단백질 H51N9-69T1은 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다. 돌연변이된 단백질 H51N9-69T2는 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다. 돌연변이된 단백질 H51N9-69T3은 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다. 돌연변이된 단백질 H51N9-69T4는 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다. 돌연변이된 단백질 H51N9-69T5는 야생형 HPV51 L1 단백질의 348-359번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 350-362번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T1-26S2는 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T1-26S3은 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 173-181번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T1-26S4는 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 259-289번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T1-26S5는 야생형 HPV51 L1 단백질의 52-60번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 348-359번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 348-360번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T3-26S1은 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 51-60번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 51-60번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T3-26S2는 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T3-26S4는 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 259-289번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T3-26S5는 야생형 HPV51 L1 단백질의 170-181번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 348-359번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 348-360번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T2-26S1은 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 51-60번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 51-60번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T2-26S3은 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 173-181번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T2-26S4는 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 259-289번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T2-26S5는 야생형 HPV51 L1 단백질의 125-147번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 348-359번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 348-360번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T4-26S1은 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 51-60번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 51-60번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T4-26S2는 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 114-146번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T4-26S3은 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 173-181번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
돌연변이된 단백질 H51N9-69T4-26S5는 야생형 HPV51 L1 단백질의 259-289번 아미노산 잔기들의 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기들에 의한 치환, 및 야생형 HPV51 L1 단백질의 348-359번 아미노산 잔기들의 야생형 HPV26 L1 단백질의 348-360번 아미노산 잔기들에 의한 치환에 의해 HPV51N9와 다르다.
표 2. 발현 벡터의 구축을 위한 PCR 주형 및 프라이머
주형 | 상류 프라이머 | 하류 프라이머 | 생성물 | 어닐링 온도/시간 |
51L1N9 | G-V-H51N9-69T1-F | G-V-H51N9-69T1-R | H51N9-69T1 긴 단편 | 56℃/50s |
51L1N9 | G-V-H51N9-69T2-F | G-V-H51N9-69T2-R | H51N9-69T2 긴 단편 | 56℃/50s |
51L1N9 | G-V-H51N9-69T3-F | G-V-H51N9-69T3-R | H51N9-69T3 긴 단편 | 56℃/50s |
51L1N9 | G-V-H51N9-69T4-F | G-V-H51N9-69T4-R | H51N9-69T4 긴 단편 | 56℃/50s |
51L1N9 | G-V-H51N9-69T5-F | G-V-H51N9-69T5-R | H51N9-69T5 긴 단편 | 56℃/50s |
69L1N0 | G-H51N9-69T1-F | G-H51N9-69T1-R | H51N9-69T1 짧은 단편 | 56℃/30s |
69L1N0 | G-H51N9-69T2-F | G-H51N9-69T3-R | H51N9-69T3 짧은 단편 | 56℃30s |
69L1N0 | G-H51N9-69T3-F | G-H51N9-69T3-R | H51N9-69T3 짧은 단편 | 56℃/30s |
69L1N0 | G-H51N9-69T4-F | G-H51N9-69T4-R | H51N9-69T4 짧은 단편 | 56℃/30s |
69L1N0 | G-H51N9-69T5-F | G-H51N9-69T5-R | H51N9-69T5 짧은 단편 | 56℃/30s |
26L1N0 | Frag-H51-69T1-26S2-F | Frag-H51-69T1-26S2-R | H51-69T1-26S2 짧은 단편 | 56℃/30s |
H51-69T1 | Vector-H51-69T1-26S2-R | Vector-H51-69T1-26S2-F | H51-69T1-26S2 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T1-26S3-F | Frag-H51-69T1-26S3-R | H51-69T1-26S3 짧은 단편 | 56℃/30s |
H51-69T1 | Vector-H51-69T1-26S3-R | Vector-H51-69T1-26S3-F | H51-69T1-26S3 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T1-26S4-F | Frag-H51-69T1-26S4-R | H51-69T1-26S4 짧은 단편 | 56℃/30s |
H51-69T1 | Vector-H51-69T1-26S4-R | Vector-H51-69T1-26S4-F | H51-69T1-26S4 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T1-26S5-F | Frag-H51-69T1-26S5-R | H51-69T1-26S5 짧은 단편 | 56℃/30s |
H51-69T1 | Vector-H51-69T1-26S5-R | Vector-H51-69T1-26S5-F | H51-69T1-26S5 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T3-26S1-F | Frag-H51-69T3-26S1-R | H51-69T3-26S1 짧은 단편 | 56℃/30s |
H51-69T3 | Vector-H51-69T3-26S1-R | Vector-H51-69T3-26S1-F | H51-69T3-26S1 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T3-26S2-F | Frag-H51-69T3-26S2-R | H51-69T3-26S2 짧은 단편 | 56℃/30s |
H51-69T3 | Vector-H51-69T3-26S2-R | Vector-H51-69T3-26S2-F | H51-69T3-26S2 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T3-26S4-F | Frag-H51-69T3-26S4-R | H51-69T3-26S4 짧은 단편 | 56℃/30s |
H51-69T3 | Vector-H51-69T3-26S4-R | Vector-H51-69T3-26S4-F | H51-69T3-26S4 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T3-26S5-F | Frag-H51-69T3-26S5-R | H51-69T3-26S5 짧은 단편 | 56℃/30s |
H51-69T3 | Vector-H51-69T3-26S5-R | Vector-H51-69T3-26S5-F | H51-69T3-26S5 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T2-26S1-F | Frag-H51-69T2-26S1-R | H51-69T2-26S1 짧은 단편 | 56℃/30s |
H51-69T2 | Vector-H51-69T2-26S1-R | Vector-H51-69T2-26S1-F | H51-69T2-26S1 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T2-26S3-F | Frag-H51-69T2-26S3-R | H51-69T2-26S3 짧은 단편 | 56℃/30s |
H51-69T2 | Vector-H51-69T2-26S3-R | Vector-H51-69T2-26S3-F | H51-69T2-26S3 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T2-26S4-F | Frag-H51-69T2-26S4-R | H51-69T2-26S4 짧은 단편 | 56℃/30s |
H51-69T2 | Vector-H51-69T2-26S4-R | Vector-H51-69T2-26S4-F | H51-69T2-26S4 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T2-26S5-F | Frag-H51-69T2-26S5-R | H51-69T2-26S5 짧은 단편 | 56℃/30s |
H51-69T2 | Vector-H51-69T2-26S5-R | Vector-H51-69T2-26S5-F | H51-69T2-26S5 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T4-26S1-F | Frag-H51-69T4-26S1-R | H51-69T4-26S1 짧은 단편 | 56℃/30s |
H51-69T4 | Vector-H51-69T4-26S1-R | Vector-H51-69T4-26S1-F | H51-69T4-26S1 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T4-26S2-F | Frag-H51-69T4-26S2-R | H51-69T4-26S2 짧은 단편 | 56℃/30s |
H51-69T4 | Vector-H51-69T4-26S2-R | Vector-H51-69T4-26S2-F | H51-69T4-26S2 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T4-26S3-F | Frag-H51-69T4-26S3-R | H51-69T4-26S3 짧은 단편 | 56℃/30s |
H51-69T4 | Vector-H51-69T4-26S3-R | Vector-H51-69T4-26S3-F | H51-69T4-26S3 긴 단편 | 56℃/50s |
26L1N0 | Frag-H51-69T4-26S5-F | Frag-H51-69T4-26S5-R | H51-69T4-26S5 짧은 단편 | 56℃/30s |
H51-69T4 | Vector-H51-69T4-26S5-R | Vector-H51-69T4-26S5-F | H51-69T4-26S5 긴 단편 | 56℃/50s |
표 3: 사용된 프라이머의 서열 (서열번호 61-144)
서열번호 | 프라이머 명칭 | 프라이머 서열 (5'-3') |
61 | G-V- H51N9-69T1-F | GTAGGGGTGGCCCAGGGTGATCAG |
62 | G-V- H51N9-69T1-R | GCCTTCCAGTACAGGGTGTTCAGG |
63 | G-V- H51N9-69T2-F | CACCTCCACGCCCACGCAGCCCCA |
64 | G-V- H51N9-69T2-R | ACAAGCAGACCCAGCTGTGCATCA |
65 | G-V- H51N9-69T3-F | CTCGCCGATGGGGGGGGCGCAGCCGATGATGCACAGCTG |
66 | G-V- H51N9-69T3-R | CCCTGGAGCTGGTGAGCAGCGTGATCCAGGACGGCGACA |
67 | G-V- H51N9-69T4-F | GTGCCTGGCGAAGATCTGCTCCCT |
68 | G-V- H51N9-69T4-R | GCCACCCCCAGCGGCAGCATGATC |
69 | G-V- H51N9-69T5-F | GGCGGTGCTGATGGTCAGGTTGGT |
70 | G-V- H51N9-69T5-R | ACTTCAAGCAGTACATCAGGCACG |
71 | G- H51N9-69T1-F | CTGATCACCCTGGGCCACCCCTACTTCCCGATCCCGAAATCTGGT |
72 | G- H51N9-69T1-R | CCTGAACACCCTGTACTGGAAGGCAGAGACCTTCGGGATTTCAGC |
73 | G- H51N9-69T2-F | TGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTG |
74 | G- H51N9-69T2-R | TGATGCACAGCTGGGTCTGCTTGTTGTCAACGCAAACGTTGTCAC |
75 | G- H51N9-69T3-F | GGCTGCGCCCCCCCCATCGGCGAGCACTGGGGTGTCGGTACCGTT |
76 | G- H51N9-69T3-R | TCACGCTGCTCACCAGCTCCAGGGGCGGGCAGTCACCACGCTGAA |
77 | G- H51N9-69T4-F | AGGGAGCAGATCTTCGCCAGGCACTTCTTCAACAAAGCTGGTACC |
78 | G- H51N9-69T4-R | GATCATGCTGCCGCTGGGGGTGGCAGAGTAGATGGATGTGGTCGG |
79 | G- H51N9-69T5-F | ACCAACCTGACCATCAGCACCGCCTCTGCTCAGTCTGCTTCTGCT |
80 | G- H51N9-69T5-R | CGTGCCTGATGTACTGCTTGAAGTCAGACGGTTTGAAGGTAGCAG |
81 | Frag-H51-69T1-26S2-F | TGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGT |
82 | Frag-H51-69T1-26S2-R | GGGGGCGCAGCCGATGATGCACAGCTGGGTCTGTTTGTTGTCAAC |
83 | Vector-H51-69T1-26S2-R | CACCTCCACGCCCACGCAGCCCCA |
84 | Vector-H51-69T1-26S2-F | CTGTGCATCATCGGCTGCGCTCCCCCCATCG |
85 | Frag-H51-69T1-26S3-F | ATCATCGGCTGCGCCCCCCCCATCGGTGAACACTGGGGTATCGGT |
86 | Frag-H51-69T1-26S3-R | GCCGTCCTGGATCACGCTGCTCACCAGTTCCAGCGGCGGGCA |
87 | Vector-H51-69T1-26S3-R | GATGGGGGGGGCGCAGCCGATGAT |
88 | Vector-H51-69T1-26S3-F | GTGAGCAGCGTGATCCAGGACGGC |
89 | Frag-H51-69T1-26S4-F | TACGGCAACAGCATGTTCTTCCACCTGCGTCGTGAACAGATCTTCGCTCGTCAC |
90 | Frag-H51-69T1-26S4-R | GCTGTCGCTGGTGATCATGCTGCCAGACGGGGTAGCAGAGTAGAT |
91 | Vector-H51-69T1-26S4-R | GTGGAAGAACATGCTGTTGCCGTA |
92 | Vector-H51-69T1-26S4-F | GGCAGCATGATCACCAGCGACAGC |
93 | Frag-H51-69T1-26S5-F | TTCATCACCTGCGTGGACACCACCCGTTCTACCAACCTGACCATCTCTACCGCG |
94 | Frag-H51-69T1-26S5-R | CAGCTGGAAGATGAACTGCAGCTCGTATTCTTCACCGTGACGGATGTACTGTTTGAA |
95 | Vector-H51-69T1-26S5-R | GGTGGTGTCCACGCAGGTGATGAACAG |
96 | Vector-H51-69T1-26S5-F | GAGCTGCAGTTCATCTTCCAGCTG |
97 | Frag-H51-69T3-26S1-F | TACGCCGGCAGCAGCAGGCTGATCACCCTGGGTCACCCGTAC |
98 | Frag-H51-69T3-26S1-R | CACCCTGAACACCCTGTACTGGAAAGCAGAAACTTTCGGGAT |
99 | Vector-H51-69T3-26S1-R | GATCAGCCTGCTGCTGCCGGCGTA |
100 | Vector-H51-69T3-26S1-F | TTCCAGTACAGGGTGTTCAGGGTG |
101 | Frag-H51-69T3-26S2-F | TGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGT |
102 | Frag-H51-69T3-26S2-R | GGGGGCGCAGCCGATGATGCACAGCTGGGTCTGTTTGTTGTCAAC |
103 | Vector-H51-69T3-26S2-R | CACCTCCACGCCCACGCAGCCCCA |
104 | Vector-H51-69T3-26S2-F | CTGTGCATCATCGGCTGCGCTCCCCCCATCG |
105 | Frag-H51-69T3-26S4-F | TACGGCAACAGCATGTTCTTCCACCTGCGTCGTGAACAGATCTTCGCTCGTCAC |
106 | Frag-H51-69T3-26S4-R | GCTGTCGCTGGTGATCATGCTGCCAGACGGGGTAGCAGAGTAGAT |
107 | Vector-H51-69T3-26S4-R | GTGGAAGAACATGCTGTTGCCGTA |
108 | Vector-H51-69T3-26S4-F | GGCAGCATGATCACCAGCGACAGC |
109 | Frag-H51-69T3-26S5-F | TTCATCACCTGCGTGGACACCACCCGTTCTACCAACCTGACCATCTCTACC |
110 | Frag-H51-69T3-26S5-R | CAGCTGGAAGATGAACTGCAGCTCGTATTCTTCACCGTGACGGATGTACTGTTTGAA |
111 | Vector-H51-69T3-26S5-R | GGTGGTGTCCACGCAGGTGATGAACAG |
112 | Vector-H51-69T3-26S5-F | GAGCTGCAGTTCATCTTCCAGCTG |
113 | Frag-H51-69T2-26S1-F | TACGCCGGCAGCAGCAGGCTGATCACCCTGGGTCACCCGTAC |
114 | Frag-H51-69T2-26S1-R | CACCCTGAACACCCTGTACTGGAAAGCAGAAACTTTCGGGAT |
115 | Vector-H51-69T2-26S1-R | GATCAGCCTGCTGCTGCCGGCGTA |
116 | Vector-H51-69T2-26S1-F | TTCCAGTACAGGGTGTTCAGGGTG |
117 | Frag-H51-69T2-26S3-F | ATCATCGGCTGCGCCCCCCCCATCGGTGAACACTGGGGTATCGGT |
118 | Frag-H51-69T2-26S3-R | GCCGTCCTGGATCACGCTGCTCACCAGTTCCAGCGGCGGGCA |
119 | Vector-H51-69T2-26S3-R | GATGGGGGGGGCGCAGCCGATGAT |
120 | Vector-H51-69T2-26S3-F | GTGAGCAGCGTGATCCAGGACGGC |
121 | Frag-H51-69T2-26S4-F | TACGGCAACAGCATGTTCTTCCACCTGCGTCGTGAACAGATCTTCGCTCGTCAC |
122 | Frag-H51-69T2-26S4-R | GCTGTCGCTGGTGATCATGCTGCCAGACGGGGTAGCAGAGTAGAT |
123 | Vector-H51-69T2-26S4-R | GTGGAAGAACATGCTGTTGCCGTA |
124 | Vector-H51-69T2-26S4-F | GGCAGCATGATCACCAGCGACAGC |
125 | Frag-H51-69T2-26S5-F | TTCATCACCTGCGTGGACACCACCCGTTCTACCAACCTGACCATCTCTACC |
126 | Frag-H51-69T2-26S5-R | CAGCTGGAAGATGAACTGCAGCTCGTATTCTTCACCGTGACGGATGTACTGTTTGAA |
127 | Vector-H51-69T2-26S5-R | GGTGGTGTCCACGCAGGTGATGAACAG |
128 | Vector-H51-69T2-26S5-F | GAGCTGCAGTTCATCTTCCAGCTG |
129 | Frag-H51-69T4-26S1-F | TACGCCGGCAGCAGCAGGCTGATCACCCTGGGTCACCCGTAC |
130 | Frag-H51-69T4-26S1-R | CACCCTGAACACCCTGTACTGGAAAGCAGAAACTTTCGGGAT |
131 | Vector-H51-69T4-26S1-R | GATCAGCCTGCTGCTGCCGGCGTA |
132 | Vector-H51-69T4-26S1-F | TTCCAGTACAGGGTGTTCAGGGTG |
133 | Frag-H51-69T4-26S2-F | TGGGGCTGCGTGGGCGTGGAGGTGGGTCGTGGTCAGCCGCTGGGT |
135 | Frag-H51-69T4-26S2-R | GGGGGCGCAGCCGATGATGCACAGCTGGGTCTGTTTGTTGTCAAC |
135 | Vector-H51-69T4-26S2-R | CACCTCCACGCCCACGCAGCCCCA |
136 | Vector-H51-69T4-26S2-F | CTGTGCATCATCGGCTGCGCTCCCCCCATCG |
137 | Frag-H51-69T4-26S3-F | ATCATCGGCTGCGCCCCCCCCATCGGTGAACACTGGGGTATCGGT |
138 | Frag-H51-69T4-26S3-R | GCCGTCCTGGATCACGCTGCTCACCAGTTCCAGCGGCGGGCA |
139 | Vector-H51-69T4-26S3-R | GATGGGGGGGGCGCAGCCGATGAT |
140 | Vector-H51-69T4-26S3-F | GTGAGCAGCGTGATCCAGGACGGC |
141 | Frag-H51-69T4-26S5-F | TTCATCACCTGCGTGGACACCACCCGTTCTACCAACCTGACCATCTCTACC |
142 | Frag-H51-69T4-26S5-R | CAGCTGGAAGATGAACTGCAGCTCGTATTCTTCACCGTGACGGATGTACTGTTTGAA |
143 | Vector-H51-69T4-26S5-R | GGTGGTGTCCACGCAGGTGATGAACAG |
144 | Vector-H51-69T4-26S5-F | GAGCTGCAGTTCATCTTCCAGCTG |
돌연변이된 단백질의 대량 발현
각각 재조합 플라스미드 pTO-T7-H51N9-69T1, pTO-T7-H51N9-69T2, pTO-T7-H51N9-69T3, pTO-T7-H51N9-69T4, pTO-T7-H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5를 포함하는 대장균 용액을 -70℃ 냉장고로부터 꺼내고, 카나마이신을 함유한 100 mL LB 액체 배지에 접종하고, 200 rpm 및 37℃에서 약 8시간 동안 인큐베이션시켰다. 그 후, 배양물을 카나마이을 함유한 500 mL LB 배지로 옮기고 (1 ml 박테리아 용액을 옮김), 더 인큐베이션하였다. 박테리아 농도가 약 0.6의 OD600에 도달했을 때, 배양 온도를 25℃로 낮추고, 각 배양 용기(culture bottle)에 500 ㎕ IPTG를 첨가했다. 인큐베이션을 8시간 동안 더 수행했다. 인큐베이션을 완료한 후, 박테리아를 원심분리에 의해 회수하였다. 각각 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5 단백질을 발현하는 박테리아를 수득했다.
돌연변이된 단백질을 발현하는 박테리아의 파쇄(Disruption)
앞서 수득된 박테리아를 1g 박테리아 대 10 mL 용해 완충액 (20 mM Tris 완충액, pH7.2, 300 mM NaCl)의 비율로 재현탁시켰다. 박테리아를 초음파 장치를 이용하여 30분 동안 파쇄시켰다. 파쇄된 박테리아를 포함하는 용해 용액을 13500 rpm (30000 g)에서 15분 동안 원심분리시키고, 상층액(즉, 파쇄된 박테리아의 상층액)을 수득했다.
돌연변이된 단백질의 크로마토그래피 정제
장비: GE Healthcare (즉, 원조 Amershan Pharmacia Co.)에 의해 제조된 AKTA Explorer 100 분취용(preparative) 액체 크로마토그래피 시스템
크로마토그래피 매질(Chromatographic media): SP Sepharose 4 Fast Flow (GE Healthcare Co.), CHT-II (Bio-RAD로부터 구매함) 및 Butyl Sepharose 4 Fast Flow (GE Healthcare Co.)
하기 용리(elution) 프로토콜에서 사용된 상이한 농도의 NaCl을 포함하는 완충액은 완충액 A와 완충액 B를 특정 비율로 혼합하는 것에 의해 제조했다.
완충액: 완충액 A (20 mM 인산염 완충액, pH8.0, 20 mM DTT); 및 완충액 B (20 mM 인산염 완충액, pH8.0, 20 mM DTT, 2M NaCl).
시료: 전술된 바와 같이 수득된, 각각 H51N9-69T1 및 H51N9-69T3을 포함하는 파쇄된 박테리아의 상층액.
용리 프로토콜:
(1) SP Sepharose 4 Fast Flow에 의한 파쇄된 박테리아의 상층액의 양이온 교환 정제: 시료를 컬럼에 로딩하고, 그 후, 원치 않는 단백질을 400 mM NaCl을 함유한 완충액(80% 완충액 A + 20% 완충액 B)으로 용리시키고, 뒤이어, 800 mM NaCl을 함유한 완충액 (60% 완충액 A + 40% 완충액 B)으로 목적 단백질을 용리시키며, 800 mM NaCl을 함유한 완충액으로 용리된 분획을 수집했다;
(2) 단계 (1)에서 수득된 용리 분획의 CHTII(hydroxyapatite chromatography)에 의한 크로마토그래피 정제: NaCl 농도가 0.5 M까지 감소되도록단계 (1)에서 수득된 용리 분획을 희석하였다; 시료를 컬럼에 로딩하고, 그 후, 원치 않는 단백질을 500 mM NaCl을 함유한 완충액(75% 완충액 A + 25% 완충액 B)으로 용리시키고, 뒤이어, 1000 mM NaCl을 함유한 완충액 (50% 완충액 A + 50% 완충액 B)으로 목적 단백질을 용리시키며, 1000 mM NaCl을 함유한 완충액으로 용리된 분획을 수집했다;
(3) 단계 (3)에서 수득된 용리 분획의 HIC(hydrophobic interaction chromatography)에 의한 크로마토그래피 정제: 시료를 컬럼에 로딩하고, 그 후, 원치 않는 단백질을 1000 mM NaCl을 함유한 완충액으로 용리시키고, 뒤이어, 200 mM NaCl을 함유한 완충액 (90% 완충액 A + 10% 완충액 B)으로 목적 단백질을 용리시키며, 200 mM NaCl을 함유한 완충액으로 용리된 분획을 수집했다.
단계 (3)에서 수득된 용리 분획 150 ㎕를 30 ㎕의 6Х 로딩 완충액(Loading Buffer) (1L에 300ml의 1M TB 6.8, 600ml의 100% 글리세롤, 120g의 SDS, 6g의 브로모페놀 블루, 및 50ml의 β-머캅토에탄올을 포함함)에 첨가했다. 결과적으로 수득된 용액을 잘 혼합하고 80℃ 수조에서 10분 동안 인큐베이션시켰다. 그 후, 결과적으로 수득된 시료의 10 ㎕를 120V에서 10% SDS-PAGE에 120분 동안 적용하고, 전기영동 밴드를 쿠마시 브릴리언트 블루(Coomassie brilliant blue)로 염색했다. 전기영동 결과가 도 1a, 1b, 1c, 및 1d에 도시되었다. 결과는 전술된 정제 단계 후에, H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5 단백질이 약 90%의 순도를 가졌다는 것을 보여주었다.
유사한 방법에 의해, 대장균 및 플라스미드 pTO-T7-HPV51N9C를 이용하여 HPV51N9 단백질을 제조하고 정제하고; 대장균 및 플라스미드 pTO-T7-HPV69L1N0C를 이용하여 HPV69N0 단백질을 제조하고 정제하며; 대장균 및 플라스미드 pTO-T7-HPV26L1N0C를 이용하여 HPV26N0 단백질을 제조하고 정제했다.
돌연변이된 단백질의 웨스턴 블롯 분석
전술된 방법에 의해 정제된 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5 단백질을 전기영동에 적용했다. 전기영동 후에, HPV L1 단백질에 대한 광범위 항체 4B3을 이용하여 웨스턴 블롯 분석을 수행하였고, 결과가 도 2a, 2b, 2c, 및 2d에 도시되었다. 결과는 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5가 광범위 항체 4B3에 의해 특이적으로 인식될 수 있었다는 것을 보여주었다.
실시예 2: HPV 바이러스-유사 입자의 조립 및 입자의 형태 검출
HPV 바이러스-유사 입자의 조립
주어진 부피(약 2ml)의 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5을 연속적으로, (1) 2L 보관 완충액(storage buffer) (20 mM 인산 나트륨 완충액 pH 6.5, 0.5 M NaCl); (2) 2L 복원 완충액(renaturation buffer) (50 mM 인산 나트륨 완충액 pH 6.0, 2 mM CaCl2, 2mM MgCl2, 0.5 M NaCl); 및 (3) 20 mM 인산 나트륨 완충액 pH 7.0, 0.5 M NaCl로 투석시켰다. 투석은 3종의 완충액 각각에서 12시간 동안 수행했다.
유사한 방법에 의해, HPV51N9, HPV69N0 및 HPV26N0 단백질을 각각 HPV51N9 VLP, HPV69N0 VLP 및 HPV26N0 VLP로 조립시켰다.
분자 시브 크로마토그래피 분석
투석된 시료를 1120 Compact LC High Performance Liquid Chromatographic System (Agilent Technologies)에 의한 분자 시브 크로마토그래피 분석에 적용했고, 사용된 분석 컬럼은 TSK Gel PW5000Хl 7.8Х300 mm이었다. HPV26N0 VLP의 분석 결과가 도 9에 도시되고, 다른 시료들의 분석 결과가 도 3 및 4에 도시되었다. 결과는 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T1-26S4, H51N9-69T1-26S5, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5를 포함하는 시료의 제1 단백질 피크가 약 13-14분에서 나타나고, 이는 HPV51N9 VLP의 것에 유사했다는 것을 보여주었다. 이는 돌연변이된 단백질 H51N9-69T1-26S4 및 H51N9-69T1-26S5를 제외하고, 나머지 돌연변이된 단백질 H51N9-69T1, H51N9-69T2, H51N9-69T3, H51N9-69T4, H51N9-69T5, H51N9-69T1-26S2, H51N9-69T1-26S3, H51N9-69T2-26S1, H51N9-69T2-26S3, H51N9-69T2-26S4, H51N9-69T2-26S5, H51N9-69T3-26S1, H51N9-69T3-26S2, H51N9-69T3-26S4, H51N9-69T3-26S5, H51N9-69T4-26S1, H51N9-69T4-26S2, H51N9-69T4-26S3 및 H51N9-69T4-26S5는 모두 균일한 크기를 갖는 VLP로 조립될 수 있었다는 것을 보여주었다. 돌연변이된 단백질 H51N9-69T1-26S4 또는 H51N9-69T1-26S5에 의해 형성된 VLP는 균일하지 않은 크기를 가졌다.
침강 속도 분석
침강 속도 분석을 위한 장치는 광학 검사 시스템 및 An-50Ti와 An-60Ti 로터를 구비한, Beckman XL-A Analytical Ultracentrifuge였다. HPV51N9 VLP, HPV69N0 VLP, H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP, H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 침강 계수는 침강 속도 방법에 의해 분석했다. HPV26N0 VLP의 분석 결과가 도 9에 도시되었고, 다른 시료들의 분석 결과는 도 5 및 6에 도시되었다. 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP, H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP의 침강 계수는 각각 148S, 135S, 117S, 131S, 148S, 130S, 131S, 130S, 135S, 140S, 135S, 144S, 133S, 131S, 161S, 140S, 137S, 132S, 126S 및 48S였고, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5 VLP, H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S5 VLP는 불량한 균일성을 가졌고, 2개의 상이한 크기를 가졌다는 것을 보여주었다.
바이러스-유사 입자의 형태학적 테스트
VLP를 포함하는 100 ㎕ 시료를 전사 전자 현미경(TEM)으로 관찰했다. 사용된 장치는 JEOL Ltd.에 의해 공급된 100kV 전사 전자 현미경이었다(100,000Х 확대). 요약하면, 13.5 ㎕의 시료를 2% 인텅스텐산(phosphotungstic acid) (pH 7.0)으로 염색하고, 탄소-코팅 구리 그리드 상에 고정하고, TEM으로 관찰했다. HPV26N0 VLP의 TEM 사진이 도 9에 표시되고, 다른 시료들의 TEM 사진이 도 7 및 8에 표시되었다. 결과는, H51N9-69T1-26S4 VLP를 제외하고, 나머지 VLP, H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP, H51N9-69T5 VLP, H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S5VLP, H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP, H51N9-69T3-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP는 HPV51N9 VLP와 유사했고, 약 25 nm의 반경을 가졌다는 것을 보여주었다.
실시예 3: 바이러스-유사 입자에 의해 백신 접종된 마우스의 혈청 중 중화항체의 평가 1
본 실험에서, 사용된 바이러스-유사 입자는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP 및 H51N9-69T5 VLP이었다.
본 실험에서, 백신 접종 일정은 표 4에 표시되었다. 전체 마우스(6-주령 BalB/c 암컷 마우스)를 2개의 그룹으로 나누었다: 알루미늄 아쥬반트 그룹 1 (5 ㎍의 면역화 용량, 알루미늄 아쥬반트 이용), 알루미늄 아쥬반트 그룹 2 (1 ㎍의 면역화 용량, 알루미늄 아쥬반트 이용). 각 그룹을 8개의 서브그룹(subgroup)으로 더 나누었다. 대조군 서브그룹 1 및 2는 각각 HPV51N9 VLP 단독 및 HPV69N0 VLP 단독으로 백신접종시키고, 대조군 서브그룹 3은 혼합된 HPV51/HPV69 VLP (즉, 각 VLP에 대한 주어진 면역화 용량의 HPV51N9 VLP와 HPV69N0 VLP의 혼합물)로 백신접종시켰다. 실험 서브그룹 1, 2, 3, 4 및 5는 각각 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, H51N9-69T4 VLP 및 H51N9-69T5 VLP로 백신접종시켰다.
알루미늄 아쥬반트 그룹 1-2에서, 5 마리 마우스/서브그룹을 복막내 주사에 의해 각각 면역화 용량 5 ㎍ 및 1 ㎍, 및 1 mL의 주사 용량으로 백신접종시켰다. 전체 마우스에 0주차에 1차 백신 접종을 적용하고, 각각 2주차 및 4주차에 부스터 백신 접종(booster vaccination)을 적용했다. 8주차에, 안와 채혈(orbital bleeding)을 통해 혈액 시료를 채취하고, 혈청 중 HPV51 및 HPV69에 대한 항체의 역가를 분석했다. 분석 결과가 도 10a 및 10b에 도시되었다. 결과는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69 VLP의 효과와 유사했고, 동일한 용량에서 HPV69N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP 및 H51N9-69T4 VLP 각각은 또한, 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69 VLP의 효과와 유사했고, 동일한 용량에서 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다.
이는 H51N9-69T1 VLP, H51N9-69T2 VLP, H51N9-69T3 VLP, 및 H51N9-69T4 VLP 가 HPV51 및 HPV69에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
표 4. 백신접종 일정
그룹 | 백신 접종용 항원 | 아쥬반트 | 면역화 용량 | 개체 수 | 백신 접종 절차(주) |
알루미늄 아쥬반트 그룹 1 | HPV51N9 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 |
HPV69N0 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
HPV51/HPV69 VLP | 알루미늄 아쥬반트 | 각 VLP 당 5㎍ |
5 | 0, 2, 4 | |
H51N9-69T1 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T2 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T3 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T4 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T5 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
알루미늄 아쥬반트 그룹 2 | HPV51N9 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 |
HPV69N0 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
HPV51/HPV69 VLP | 알루미늄 아쥬반트 | 각 VLP 당 1㎍ |
5 | 0, 2, 4 | |
H51N9-69T1 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T2 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T3 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T4 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T5 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 |
실시예 4: 바이러스-유사 입자에 의해 백신 접종된 마우스의 혈청 중 중화항체의 평가 2
본 실험에서, 사용된 바이러스-유사 입자는 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5 VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP 및 H51N9-69T3-26S5 VLP이었다.
본 실험에서, 백신 접종 일정은 표 5에 표시되었다. 전체 마우스(6-주령 BalB/c 암컷 마우스)를 2개의 그룹으로 나누었다: 알루미늄 아쥬반트 그룹 1 (5 ㎍의 면역화 용량, 알루미늄 아쥬반트 이용), 알루미늄 아쥬반트 그룹 2 (1 ㎍의 면역화 용량, 알루미늄 아쥬반트 이용). 각 그룹을 12개의 서브그룹으로 더 나누었다. 대조군 서브그룹 1, 2 및 3은 각각 HPV51N9 VLP 단독, HPV69N0 VLP 단독, 및 HPV26N0 VLP 단독으로 백신접종시키고, 대조군 서브그룹 4는 혼합된 HPV51/HPV69/HPV26 VLP (즉, 각 VLP에 대한 주어진 면역화 용량의 HPV51N9 VLP, HPV69N0 VLP 및 HPV26N0 VLP의 혼합물)로 백신접종시켰다. 실험 서브그룹 1, 2, 3, 4, 5, 6, 7 및 8은 각각 H51N9-69T1-26S2 VLP, H51N9-69T1-26S3 VLP, H51N9-69T1-26S4 VLP, H51N9-69T1-26S5VLP, H51N9-69T3-26S1 VLP, H51N9-69T3-26S2 VLP, H51N9-69T3-26S4 VLP 및 H51N9-69T3-26S5 VLP로 백신접종시켰다.
알루미늄 아쥬반트 그룹 1-2에서, 5 마리 마우스/서브그룹을 복막내 주사에 의해 각각 면역화 용량 5 ㎍ 및 1 ㎍, 및 1 mL의 주사 용량으로 백신접종시켰다. 전체 마우스에 0주차에 1차 백신 접종을 적용하고, 각각 2주차 및 4주차에 부스터 백신 접종을 적용했다. 8주차에, 안와 채혈을 통해 혈액 시료를 채취하고, 혈청 중 HPV51, HPV69 및 HPV26에 대한 항체의 역가를 분석했다. 분석 결과가 도 11a 및 11b에 도시되었다. 결과는 H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량에서 HPV69N0 VLP 단독의 효과 및 HPV26N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP 각각은 또한, 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량에서 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP 각각은 또한, 마우스에서 HPV26에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV26N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량에서 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. 이는 H51N9-69T1-26S2 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T3-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
표 5. 백신 접종 일정
실시예 5: 바이러스-유사 입자에 의해 백신 접종된 마우스의 혈청 중 중화
항체 역가의 평가 3
본 실험에서, 사용된 바이러스-유사 입자들은 H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP이었다.
본 실험에서, 백신 접종 일정은 표 6에 표시되었다. 전체 마우스(6-주령 BalB/c 암컷 마우스)를 2개의 그룹으로 나누었다: 알루미늄 아쥬반트 그룹 1 (5 ㎍의 면역화 용량, 알루미늄 아쥬반트 이용), 알루미늄 아쥬반트 그룹 2 (1 ㎍의 면역화 용량, 알루미늄 아쥬반트 이용). 각 그룹을 12개의 서브그룹으로 더 나누었다. 대조군 서브그룹 1, 2 및 3은 각각 HPV51N9 VLP 단독, HPV69N0 VLP 단독, 및 HPV26N0 VLP 단독으로 백신접종시키고, 대조군 서브그룹 4는 혼합된 HPV51/HPV69/HPV26 VLP (즉, 각 VLP에 대한 주어진 면역화 용량의 HPV51N9 VLP, HPV69N0 VLP 및 HPV26N0 VLP의 혼합물)로 백신접종시켰다. 실험 서브그룹 1, 2, 3, 4, 5, 6, 7 및 8은 각각 H51N9-69T2-26S1 VLP, H51N9-69T2-26S3 VLP, H51N9-69T2-26S4 VLP, H51N9-69T2-26S5 VLP, H51N9-69T4-26S1 VLP, H51N9-69T4-26S2 VLP, H51N9-69T4-26S3 VLP 및 H51N9-69T4-26S5 VLP로 백신접종시켰다.
알루미늄 아쥬반트 그룹 1-2에서, 5 마리 마우스/서브그룹을 복막내 주사에 의해 각각 면역화 용량 5 ㎍ 및 1 ㎍, 및 1 mL의 주사 용량으로 백신접종시켰다. 전체 마우스에 0주차에 1차 백신 접종을 적용하고, 각각 2주차 및 4주차에 부스터 백신 접종을 적용했다. 8주차에, 안와 채혈을 통해 혈액 시료를 채취하고, 혈청 중 HPV51, HPV69 및 HPV26에 대한 항체의 역가를 분석했다. 분석 결과가 도 12a 및 12b에 도시되었다. 결과는 H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP가 각각 마우스에서 HPV51에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV51N9 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량에서 HPV69N0 VLP 단독의 효과 및 HPV26N0 VLP 단독의 효과에 비해 유의성 있게 더 높았다는 것을 보여주었다. H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP 각각은 또한, 마우스에서 HPV69에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV69N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량에서 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP 각각은 또한, 마우스에서 HPV26에 대한 고-역가 중화 항체의 생성을 유도할 수 있었고, 그들의 보호 효과가 동일한 용량에서 HPV26N0 VLP 단독의 효과 및 혼합된 HPV51/HPV69/HPV26 VLP의 효과와 유사했고, 동일한 용량에서 HPV51N9 VLP 단독의 효과에 비해 유의성 있게 더 높았다. 이는 H51N9-69T2-26S3 VLP 및 H51N9-69T4-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
표 6. 백신 접종 일정
그룹 | 백신 접종용 항원 | 아쥬반트 | 면역화 용량 | 개체 수 | 백신화 절차(주) |
알루미늄 아쥬반트 그룹 1 | HPV51N9 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 |
HPV69N0 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
HPV26N0 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
HPV51/HPV69/HPV26 VLP | 알루미늄 아쥬반트 | 각 VLP당 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-6S1 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-6S3 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-6S4 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-6S5 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S1 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S2 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S4 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S5 VLP | 알루미늄 아쥬반트 | 5㎍ | 5 | 0, 2, 4 | |
알루미늄 아쥬반트 그룹 2 | HPV51N9 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 |
HPV69N0 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
HPV26N0 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
HPV51/HPV69/HPV26 VLP | 알루미늄 아쥬반트 | 각 VLP당 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-26S1 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-26S3 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-26S4 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T2-26S5 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S1 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S2 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S3 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 | |
H51N9-69T4-26S5 VLP | 알루미늄 아쥬반트 | 1㎍ | 5 | 0, 2, 4 |
실시예 6: 혈청 전환(seroconversion) 유도에 대한 바이러스-유사 입자의 ED
50
평가
본 실험에서, 사용된 바이러스-유사 입자들은 H51N9-69T1-26S2 VLP, H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T4-26S2 VLP이었다.
6-주령 BalB/c 암컷 마우스(8 마리)를 단일 복막내 주사에 의해 알루미늄 아쥬반트와 함께 백신접종시켰고, 이 때, H51N9-69T1-26S2 VLP, H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 또는 H51N9-69T4-26S2 VLP (0.900㎍, 0.300㎍, 0.100㎍, 0.033㎍ 및 0.011㎍의 면역화 용량)을 실험군에서 사용했고, HPV51N9 VLP 단독, HPV69N0 VLP 단독, HPV26N0 VLP 단독 (0.900㎍, 0.300㎍, 0.100㎍, 0.033㎍ 및 0.011㎍의 면역화 용량), 또는 혼합된 HPV51/HPV69/HPV26 VLP (즉, HPV51N9 VLP, HPV69N0 VLP 및 HPV26N10 VLP의 혼합물, 각 VLP에 대한 면역화 용량 0.900㎍, 0.300㎍, 0.100㎍, 0.033㎍ 및 0.011㎍)를 사용했고; 면역화 부피는 1 mL였다. 또한, 백신을 희석하기 위해 사용된 희석제를 블랭크 대조군(blank control)로 사용하였다. 각 그룹당 8마리의 마우스를 백신접종시켰고, 백신접종 후 5주차에, 정맥혈을 안구로부터 수집했다. 혈청 중 HPV에 대한 항체를 검출하고, Reed-Muench 방법 (Reed LJ MH. A simple method of estimating fifty percent endpoints. Am J Hyg. 1938; 27:493-7)에 의해, 각 시료에 대해 혈청 전환을 유도하기 위한(즉, 마우스에서 항체의 생성을 유도하기 위한) ED50을 계산하였다. 결과가 표 7에 표시되었다.
표 7. 마우스에서 HPV51, HPV69 및 HPV26에 대한 항체의 생성(혈청 전환)을 유도하기 위한 H51N9-69T1-26S2 VLP, H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T4-26S2 VLP의 ED50
HPV VLP (㎍) | HPV51PsV에 대한 ED50 (㎍) | HPV69PsV에 대한 ED50 (㎍) | HPV26PsV에 대한 ED50 (㎍) |
HPV51N9 | 0.058 | >0.9 | >0.9 |
HPV69N0 | >0.9 | 0.029 | 0.019 |
HPV26N0 | >0.9 | 0.008 | 0.057 |
HPV51N9-69T1-26S2 | >0.9 | 0.178 | >0.9 |
HPV51N9-69T3-26S1 | 0.066 | 0.048 | 0.176 |
HPV51N9-69T2-26S3 | 0.170 | 0.180 | 0.120 |
HPV51N9-69T4-26S2 | 0.010 | 0.007 | 0.058 |
HPV51/69/26 | 0.066 | 0.010 | 0.007 |
결과는 마우스의 백신 접종 후 5주차에, 마우스에서 HPV51에 대한 항체의 생성을 유도하기 위한 H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T4-26S2 VLP의 ED50이 HPV51N9 VLP 단독의 경우 및 혼합된 HPV51/HPV69/HPV26 VLP의 경우와 유사했고, HPV69N0 VLP 단독 및 HPV26N0 VLP 단독의 경우에 의해 훨씬 더 탁월했고; HPV69에 대한 항체의 생성을 유도하기 위한 ED50은 HPV69N0 VLP 단독의 경우 및 혼합된 HPV51/HPV69/HPV26 VLP의 경우와 유사했고, HPV51N9 VLP 단독의 경우에 비해 훨씬 더 탁월했고; HPV26에 대한 항체의 생성을 유도하기 위한 ED50은 HPV26N0 VLP 단독의 경우 및 혼합된 HPV51/HPV69/HPV26 VLP의 경우와 유사했고, HPV51N9 VLP 단독의 경우에 비해 훨씬 더 탁월했다는 것을 보여주었다. 이는 H51N9-69T2-26S3 VLP, H51N9-69T3-26S1 VLP 및 H51N9-69T4-26S2 VLP가 HPV51, HPV69 및 HPV26에 대한 우수한 교차-면역원성 및 교차-보호를 갖는다는 것을 보여주었다.
본 출원의 구체적인 실시예를 상세히 기재하였지만, 당업자는 본 명세서에 개시된 교시에 따라 그에 대한 다양한 수정 및 변경이 가능하며, 이러한 수정 및 변경은 본 출원의 범위 내에 있음을 이해할 것이다. 본 출원의 범위는 첨부된 특허청구의 범위 및 그의 균등물에 의해 주어진다.
SEQUENCE LISTING
<110> Xiamen University
Xiamen Innovax Biotech Co., Ltd.
<120> Mutant of L1 protein of Human Papillomavirus Type 51
<130> IEC180094PCT
<150> CN201811122822.1
<151> 2018-09-26
<160> 144
<170> PatentIn version 3.5
<210> 1
<211> 504
<212> PRT
<213> Human papillomavirus type 51
<400> 1
Met Ala Leu Trp Arg Thr Asn Asp Ser Lys Val Tyr Leu Pro Pro Ala
1 5 10 15
Pro Val Ser Arg Ile Val Asn Thr Glu Glu Tyr Ile Thr Arg Thr Gly
20 25 30
Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Ile Thr Leu Gly His Pro
35 40 45
Tyr Phe Pro Leu Pro Lys Thr Ser Thr Arg Ala Ala Ile Pro Lys Val
50 55 60
Ser Ala Phe Gln Tyr Arg Val Phe Arg Val Gln Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Pro Asn Leu Tyr Asn Pro Asp Thr Asp Arg
85 90 95
Leu Val Trp Gly Cys Val Gly Val Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Val Gly Leu Ser Gly His Pro Leu Phe Asn Lys Tyr Asp Asp Thr
115 120 125
Glu Asn Ser Arg Ile Ala Asn Gly Asn Ala Gln Gln Asp Val Arg Asp
130 135 140
Asn Thr Ser Val Asp Asn Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys
145 150 155 160
Ala Pro Pro Ile Gly Glu His Trp Gly Ile Gly Thr Thr Cys Lys Asn
165 170 175
Thr Pro Val Pro Pro Gly Asp Cys Pro Pro Leu Glu Leu Val Ser Ser
180 185 190
Val Ile Gln Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Ala Ala Leu Gln Ala Thr Lys Ser Asp Val Pro Leu Asp Ile Ser
210 215 220
Gln Ser Val Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr
225 230 235 240
Tyr Gly Asn Ser Met Phe Phe His Leu Arg Arg Glu Gln Ile Phe Ala
245 250 255
Arg His Tyr Tyr Asn Lys Leu Gly Ser Val Gly Glu Asp Ile Pro Thr
260 265 270
Asp Tyr Tyr Ile Lys Gly Ser Gly Asn Gly Arg Asp Pro Ile Glu Ser
275 280 285
Tyr Ile Tyr Ser Ala Thr Pro Ser Gly Ser Met Ile Thr Ser Asp Ser
290 295 300
Gln Ile Phe Asn Lys Pro Tyr Trp Leu His Arg Ala Gln Gly His Asn
305 310 315 320
Asn Gly Ile Cys Trp Asn Asn Gln Leu Phe Ile Thr Cys Val Asp Thr
325 330 335
Thr Arg Ser Thr Asn Leu Thr Ile Ser Thr Ala Thr Ala Ala Val Ser
340 345 350
Pro Thr Phe Thr Pro Ser Asn Phe Lys Gln Tyr Ile Arg His Gly Glu
355 360 365
Glu Tyr Glu Leu Gln Phe Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr
370 375 380
Thr Glu Val Met Ala Tyr Leu His Thr Met Asp Pro Thr Ile Leu Glu
385 390 395 400
Gln Trp Asn Phe Gly Leu Thr Leu Pro Pro Ser Ala Ser Leu Glu Asp
405 410 415
Ala Tyr Arg Phe Val Arg Asn Ala Ala Thr Ser Cys Gln Lys Asp Thr
420 425 430
Pro Pro Gln Ala Lys Pro Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp
435 440 445
Val Asp Leu Lys Glu Arg Phe Ser Leu Asp Leu Asp Gln Phe Ala Leu
450 455 460
Gly Arg Lys Phe Leu Leu Gln Val Gly Val Gln Arg Lys Pro Arg Pro
465 470 475 480
Gly Leu Lys Arg Pro Ala Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser
485 490 495
Ala Lys Arg Lys Arg Val Lys Lys
500
<210> 2
<211> 508
<212> PRT
<213> Human papillomavirus type 69
<400> 2
Met Ala Leu Trp Arg Thr Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Arg Val Val Ser Thr Asp Glu Tyr Val Thr Arg Thr Gly
20 25 30
Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Leu Gly His Pro
35 40 45
Tyr Phe Pro Ile Pro Lys Ser Gly Ser Thr Ala Glu Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val His Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Pro Gln Leu Tyr Asn Pro Glu Thr Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Val Gly Leu Ser Gly His Pro Leu Phe Asn Lys Leu Asp Asp Thr
115 120 125
Glu Asn Ser His Leu Ala Thr Ala Asn Ala Asp Thr Asp Asn Arg Asp
130 135 140
Asn Val Cys Val Asp Asn Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys
145 150 155 160
Thr Pro Pro Leu Gly Glu His Trp Gly Val Gly Thr Val Cys Lys Asn
165 170 175
Ala Gln Ser Gln Val Gln Arg Gly Asp Cys Pro Pro Leu Glu Leu Ile
180 185 190
Ser Ser Val Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala
195 200 205
Met Asp Phe Thr Ala Leu Gln Ala Thr Lys Cys Asp Val Pro Leu Asp
210 215 220
Ile Asn Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala
225 230 235 240
Asp Thr Tyr Gly Asn Ser Met Phe Phe Phe Leu Arg Arg Glu Gln Leu
245 250 255
Phe Ala Arg His Phe Phe Asn Lys Ala Gly Thr Ile Gly Asp Pro Val
260 265 270
Pro Val Ser Met Tyr Ile Lys Gly Ala Gly Gln Gly Arg Glu Pro Pro
275 280 285
Thr Thr Ser Ile Tyr Ser Ala Thr Pro Ser Gly Ser Met Val Thr Ser
290 295 300
Asp Ala Gln Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly
305 310 315 320
His Asn Asn Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Cys Val
325 330 335
Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile Ser Thr Val Ser Ala Gln
340 345 350
Ser Ala Ser Ala Thr Phe Lys Pro Ser Asp Tyr Lys Gln Phe Ile Arg
355 360 365
His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe Gln Leu Cys Lys Ile
370 375 380
Thr Leu Thr Thr Asp Val Met Ala Tyr Ile His Thr Met Asn Ser Thr
385 390 395 400
Ile Leu Glu Asn Trp Asn Phe Gly Leu Thr Leu Pro Pro Thr Ala Ser
405 410 415
Leu Glu Asp Ala Tyr Arg Phe Ile Lys Asn Ser Ala Thr Thr Cys Gln
420 425 430
Arg Asp Ala Pro Ala Gln Pro Lys Glu Asp Pro Phe Ser Lys Leu Lys
435 440 445
Phe Trp Asp Val Asp Leu Lys Glu Lys Phe Ser Ile Asp Leu Asp Gln
450 455 460
Phe Pro Leu Gly Arg Lys Phe Met Leu Gln Ala Gly Ile Gln Arg Arg
465 470 475 480
Pro Lys Leu Gly Thr Lys Arg Pro Ala Ser Ser Leu Ser Ala Ser Ser
485 490 495
Ser Ser Thr Thr Arg Lys Lys Arg Lys Leu Thr Lys
500 505
<210> 3
<211> 496
<212> PRT
<213> Human papillomavirus type 51
<400> 3
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 4
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T1
<400> 4
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Ile Pro Lys Ser Gly
35 40 45
Ser Thr Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 5
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T2
<400> 5
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Ala
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Cys Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 6
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T3
<400> 6
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Val Gly Thr Val Cys Lys Asn Ala Gln Ser Gln Val Gln Arg Gly
165 170 175
Asp Cys Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp
180 185 190
Met Ile Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala
195 200 205
Thr Lys Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr
210 215 220
Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe
225 230 235 240
Phe His Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys
245 250 255
Leu Gly Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly
260 265 270
Ser Gly Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr
275 280 285
Pro Ser Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro
290 295 300
Tyr Trp Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn
305 310 315 320
Asn Gln Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu
325 330 335
Thr Ile Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser
340 345 350
Asn Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe
355 360 365
Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr
370 375 380
Leu His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu
385 390 395 400
Thr Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg
405 410 415
Asn Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro
420 425 430
Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg
435 440 445
Phe Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu
450 455 460
Gln Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala
465 470 475 480
Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val
485 490 495
Lys Lys
<210> 7
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T4
<400> 7
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Phe Asn Lys Ala Gly
245 250 255
Thr Ile Gly Asp Pro Val Pro Val Ser Met Tyr Ile Lys Gly Ala Gly
260 265 270
Gln Gly Arg Glu Pro Pro Thr Thr Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 8
<211> 497
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T5
<400> 8
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Ser Ala Gln Ser Ala Ser Ala Thr Phe Lys Pro Ser Asp
340 345 350
Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile
355 360 365
Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu
370 375 380
His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr
385 390 395 400
Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn
405 410 415
Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp
420 425 430
Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe
435 440 445
Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln
450 455 460
Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser
465 470 475 480
Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys
485 490 495
Lys
<210> 9
<211> 1515
<212> DNA
<213> Human papillomavirus type 51
<400> 9
atggccctgt ggaggaccaa cgacagcaag gtgtacctgc cccccgcccc cgtgagcagg 60
atcgtgaaca ccgaggagta catcaccagg accggcatct actactacgc cggcagcagc 120
aggctgatca ccctgggcca cccctacttc cccctgccca agaccagcac cagggccgcc 180
atccccaagg tgagcgcctt ccagtacagg gtgttcaggg tgcagctccc cgaccccaac 240
aagttcggcc tgcccgaccc caacctgtac aaccccgaca ccgacaggct ggtgtggggc 300
tgcgtgggcg tggaggtggg caggggccag cccctgggcg tgggcctgag cggccacccc 360
ctgttcaaca agtacgacga caccgagaac agcaggatcg ccaacggcaa cgcccagcag 420
gacgtgaggg acaacaccag cgtggacaac aagcagaccc agctgtgcat catcggctgc 480
gcccccccca tcggcgagca ctggggcatc ggcaccacct gcaagaacac ccccgtgccc 540
cccggcgact gcccccccct ggagctggtg agcagcgtga tccaggacgg cgacatgatc 600
gacaccggct tcggcgccat ggacttcgcc gccctgcagg ccaccaagag cgacgtgccc 660
ctggacatca gccagagcgt gtgcaagtac cccgactacc tgaagatgag cgccgacacc 720
tacggcaaca gcatgttctt ccacctgagg agggagcaga tcttcgccag gcactactac 780
aacaagctgg gcagcgtggg cgaggacatc cccaccgact actacatcaa gggcagcggc 840
aacggcaggg accccatcga gagctacatc tacagcgcca cccccagcgg cagcatgatc 900
accagcgaca gccagatctt caacaagccc tactggctgc acagggccca gggccacaac 960
aacggcatct gctggaacaa ccagctgttc atcacctgcg tggacaccac caggagcacc 1020
aacctgacca tcagcaccgc caccgccgcc gtgagcccca ccttcacccc cagcaacttc 1080
aagcagtaca tcaggcacgg cgaggagtac gagctgcagt tcatcttcca gctgtgcaag 1140
atcaccctga ccaccgaggt gatggcctac ctgcacacca tggaccccac catcctggag 1200
cagtggaact tcggcctgac cctgcccccc agcgccagcc tggaggacgc ctacaggttc 1260
gtgaggaacg ccgccaccag ctgccagaag gacacccccc cccaggccaa gcccgacccc 1320
ctggccaagt acaagttctg ggacgtggac ctgaaggaga ggttcagcct ggacctggac 1380
cagttcgccc tgggcaggaa gttcctgctg caggtgggcg tgcagaggaa gcccaggccc 1440
ggcctgaaga ggcccgctag cagcgccagc tccagcagct ccagcagcgc caagaggaag 1500
agggtgaaga agtaa 1515
<210> 10
<211> 1527
<212> DNA
<213> Human papillomavirus type 69
<400> 10
atggctctgt ggcgtacctc tgactctaaa gtttacctgc cgccgacccc ggtttctcgt 60
gttgtttcta ccgacgaata cgttacccgt accggtatct actactacgc tggttcttct 120
cgtctgctga ccctgggtca cccgtacttc ccgatcccga aatctggttc taccgctgaa 180
atcccgaagg tctctgctta ccagtaccgg gtattccgtg tccacctgcc ggacccgaac 240
aaattcggtc tgccggaccc gcagctgtac aatccagaaa ccgaacgtct ggtttgggct 300
tgcgttggtg tcgaggtcgg tcgtggtcag ccgctgggtg tcggtctgtc tggtcacccg 360
ctgttcaaca aactggacga caccgaaaac tctcacctgg ctaccgctaa cgctgacacc 420
gacaaccgtg acaacgtttg cgttgacaac aaacagaccc agctgtgcat catcggttgc 480
accccgccgc tgggtgaaca ctggggtgtc ggtaccgttt gcaaaaacgc tcagtctcag 540
gttcagcgtg gtgactgccc gccgctggaa ctgatctctt ctgttatcga agacggtgac 600
atgatcgaca ccggtttcgg tgctatggac ttcaccgctc tgcaggctac caaatgcgac 660
gttccgctgg acatcaacca gtctatctgc aaataccccg actacctgaa aatgtctgct 720
gacacctacg gtaactctat gttcttcttc ctgcgtcgtg aacagctgtt cgctcgtcac 780
ttcttcaaca aagctggtac catcggtgac cctgttccgg tttctatgta catcaaaggt 840
gctggtcagg gtcgtgaacc gccgaccaca tccatctact ctgctacccc gtctggttct 900
atggttacat ccgacgctca gctgttcaac aaaccgtact ggctgcagcg tgctcagggt 960
cacaacaacg gtatctgctg gggtaaccag ctgttcgtta cctgcgttga caccacccgt 1020
tctaccaacc tgaccatctc taccgtttct gctcagtctg cttctgctac cttcaaaccg 1080
tctgactaca aacaatttat ccgtcacggt gaagaatacg aactgcagtt catcttccag 1140
ctgtgcaaaa tcaccctgac caccgacgtt atggcttaca tccacaccat gaactctacc 1200
atcctggaaa actggaactt cggtctgacc ctgccgccga ccgcttctct ggaagacgct 1260
taccgtttca tcaaaaactc tgctaccacc tgccagcgtg acgctccggc tcagccgaaa 1320
gaagacccgt tctctaaact gaaattctgg gacgttgacc tgaaagaaaa attctctatc 1380
gacctggacc agttcccgct gggtcgtaaa ttcatgctgc aggctggtat ccagcgtcgt 1440
ccgaaactgg gtaccaaacg tccggcttct tctctgtctg cttcttcttc ttctaccacc 1500
cgtaaaaaac gtaaactgac caaataa 1527
<210> 11
<211> 1491
<212> DNA
<213> Human papillomavirus type 51
<400> 11
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 12
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T1
<400> 12
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttcccga tcccgaaatc tggttctacc gctgaaatcc cgaaggtctc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 13
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T2
<400> 13
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtgtcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgctaacgct gacaccgaca accgtgacaa cgtttgcgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 14
<211> 1497
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T3
<400> 14
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtgtcggta ccgtttgcaa aaacgctcag tctcaggttc agcgtggtga ctgcccgccg 540
ctggagctgg tgagcagcgt gatccaggac ggcgacatga tcgacaccgg cttcggcgcc 600
atggacttcg ccgccctgca ggccaccaag agcgacgtgc ccctggacat cagccagagc 660
gtgtgcaagt accccgacta cctgaagatg agcgccgaca cctacggcaa cagcatgttc 720
ttccacctga ggagggagca gatcttcgcc aggcactact acaacaagct gggcagcgtg 780
ggcgaggaca tccccaccga ctactacatc aagggcagcg gcaacggcag ggaccccatc 840
gagagctaca tctacagcgc cacccccagc ggcagcatga tcaccagcga cagccagatc 900
ttcaacaagc cctactggct gcacagggcc cagggccaca acaacggcat ctgctggaac 960
aaccagctgt tcatcacctg cgtggacacc accaggagca ccaacctgac catcagcacc 1020
gccaccgccg ccgtgagccc caccttcacc cccagcaact tcaagcagta catcaggcac 1080
ggcgaggagt acgagctgca gttcatcttc cagctgtgca agatcaccct gaccaccgag 1140
gtgatggcct acctgcacac catggacccc accatcctgg agcagtggaa cttcggcctg 1200
accctgcccc ccagcgccag cctggaggac gcctacaggt tcgtgaggaa cgccgccacc 1260
agctgccaga aggacacccc cccccaggcc aagcccgacc ccctggccaa gtacaagttc 1320
tgggacgtgg acctgaagga gaggttcagc ctggacctgg accagttcgc cctgggcagg 1380
aagttcctgc tgcaggtggg cgtgcagagg aagcccaggc ccggcctgaa gaggcccgct 1440
agcagcgcca gctccagcag ctccagcagc gccaagagga agagggtgaa gaagtaa 1497
<210> 15
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T4
<400> 15
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttcttcaaca aagctggtac catcggtgac 780
cctgttccgg tttctatgta catcaaaggt gctggtcagg gtcgtgaacc gccgaccaca 840
tccatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 16
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T5
<400> 16
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgcctct 1020
gctcagtctg cttctgctac cttcaaaccg tctgacttca agcagtacat caggcacggc 1080
gaggagtacg agctgcagtt catcttccag ctgtgcaaga tcaccctgac caccgaggtg 1140
atggcctacc tgcacaccat ggaccccacc atcctggagc agtggaactt cggcctgacc 1200
ctgcccccca gcgccagcct ggaggacgcc tacaggttcg tgaggaacgc cgccaccagc 1260
tgccagaagg acaccccccc ccaggccaag cccgaccccc tggccaagta caagttctgg 1320
gacgtggacc tgaaggagag gttcagcctg gacctggacc agttcgccct gggcaggaag 1380
ttcctgctgc aggtgggcgt gcagaggaag cccaggcccg gcctgaagag gcccgctagc 1440
agcgccagct ccagcagctc cagcagcgcc aagaggaaga gggtgaagaa gtaa 1494
<210> 17
<211> 9
<212> PRT
<213> Human papillomavirus type 69
<400> 17
Ile Pro Lys Ser Gly Ser Thr Ala Glu
1 5
<210> 18
<211> 23
<212> PRT
<213> Human papillomavirus type 69
<400> 18
Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Ala Asn Ala Asp Thr
1 5 10 15
Asp Asn Arg Asp Asn Val Cys
20
<210> 19
<211> 14
<212> PRT
<213> Human papillomavirus type 69
<400> 19
Val Gly Thr Val Cys Lys Asn Ala Gln Ser Gln Val Gln Arg
1 5 10
<210> 20
<211> 31
<212> PRT
<213> Human papillomavirus type 69
<400> 20
Phe Phe Asn Lys Ala Gly Thr Ile Gly Asp Pro Val Pro Val Ser Met
1 5 10 15
Tyr Ile Lys Gly Ala Gly Gln Gly Arg Glu Pro Pro Thr Thr Ser
20 25 30
<210> 21
<211> 13
<212> PRT
<213> Human papillomavirus type 69
<400> 21
Ser Ala Gln Ser Ala Ser Ala Thr Phe Lys Pro Ser Asp
1 5 10
<210> 22
<211> 503
<212> PRT
<213> Human papillomavirus type 26
<400> 22
Met Ala Leu Trp Arg Thr Ser Asp Ser Lys Val Tyr Leu Pro Pro Thr
1 5 10 15
Pro Val Ser Arg Val Val Asn Thr Asp Glu Tyr Val Thr Arg Thr Gly
20 25 30
Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu Thr Leu Gly His Pro
35 40 45
Tyr Phe Ser Ile Pro Lys Thr Gly Gln Lys Ala Glu Ile Pro Lys Val
50 55 60
Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val His Leu Pro Asp Pro Asn
65 70 75 80
Lys Phe Gly Leu Pro Asp Pro Gln Leu Tyr Asn Pro Asp Thr Glu Arg
85 90 95
Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly Gln Pro Leu
100 105 110
Gly Ile Gly Leu Ser Gly His Pro Leu Phe Asn Lys Leu Asp Asp Thr
115 120 125
Glu Asn Ser His Leu Ala Thr Val Asn Ala Asp Thr Asp Asn Arg Asp
130 135 140
Asn Val Ser Val Asp Asn Lys Gln Thr Gln Leu Cys Ile Ile Gly Cys
145 150 155 160
Thr Pro Pro Leu Gly Glu His Trp Gly Ile Gly Thr Ile Cys Lys Asn
165 170 175
Thr Gln Thr Gln Arg Gly Asp Cys Pro Pro Leu Glu Leu Ile Ser Ser
180 185 190
Ile Ile Glu Asp Gly Asp Met Ile Asp Thr Gly Phe Gly Ala Met Asp
195 200 205
Phe Thr Ala Leu Gln Ala Thr Lys Ser Asp Val Pro Ile Asp Ile Ser
210 215 220
Gln Ser Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr
225 230 235 240
Tyr Gly Asn Ser Met Phe Phe Phe Leu Arg Arg Glu Gln Leu Phe Ala
245 250 255
Arg His Phe Tyr Asn Lys Ala Gly Ala Val Gly Asp Ala Ile Pro Thr
260 265 270
Thr Leu Tyr Ile Lys Gly Ala Glu Ser Gly Arg Glu Pro Pro Thr Ser
275 280 285
Ser Ile Tyr Ser Ala Thr Pro Ser Gly Ser Met Val Thr Ser Asp Ala
290 295 300
Gln Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn
305 310 315 320
Asn Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Cys Val Asp Thr
325 330 335
Thr Arg Ser Thr Asn Leu Thr Ile Ser Thr Leu Ser Ala Ala Ser Ala
340 345 350
Ser Thr Pro Phe Lys Pro Ser Asp Tyr Lys Gln Phe Ile Arg His Gly
355 360 365
Glu Glu Tyr Glu Leu Gln Phe Ile Phe Gln Leu Cys Lys Ile Thr Leu
370 375 380
Thr Thr Asp Val Met Ala Tyr Ile His Leu Met Asn Ala Ser Ile Leu
385 390 395 400
Glu Asp Trp Asn Phe Gly Leu Thr Leu Pro Pro Thr Ala Ser Leu Glu
405 410 415
Asp Ala Tyr Arg Phe Ile Lys Asn Ser Ala Thr Thr Cys Gln Arg Asn
420 425 430
Ala Pro Pro Val Pro Lys Glu Asp Pro Phe Gln Lys Phe Lys Phe Trp
435 440 445
Asp Val Asp Leu Lys Glu Lys Phe Ser Ile Asp Leu Asp Gln Phe Pro
450 455 460
Leu Gly Arg Lys Phe Met Leu Gln Ala Gly Ile Gln Arg Arg Pro Lys
465 470 475 480
Leu Gly Thr Lys Arg Pro Leu Ser Ser Thr Ser Ser Ser Thr Lys Arg
485 490 495
Lys Lys Arg Lys Leu Thr Lys
500
<210> 23
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T1-26S2
<400> 23
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Ile Pro Lys Ser Gly
35 40 45
Ser Thr Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Ile Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Val
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 24
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T1-26S3
<400> 24
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Ile Pro Lys Ser Gly
35 40 45
Ser Thr Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Ile Cys Lys Asn Thr Gln Thr Gln Arg Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 25
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T1-26S4
<400> 25
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Ile Pro Lys Ser Gly
35 40 45
Ser Thr Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Tyr Asn Lys Ala Gly
245 250 255
Ala Val Gly Asp Ala Ile Pro Thr Thr Leu Tyr Ile Lys Gly Ala Glu
260 265 270
Ser Gly Arg Glu Pro Pro Thr Ser Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 26
<211> 497
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T1-26S5
<400> 26
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Ile Pro Lys Ser Gly
35 40 45
Ser Thr Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Ser Ala Ala Ser Ala Ser Thr Pro Phe Lys Pro Ser Asp
340 345 350
Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile
355 360 365
Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu
370 375 380
His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr
385 390 395 400
Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn
405 410 415
Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp
420 425 430
Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe
435 440 445
Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln
450 455 460
Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser
465 470 475 480
Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys
485 490 495
Lys
<210> 27
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T3-26S1
<400> 27
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Ser Ile Pro Lys Thr Gly
35 40 45
Gln Lys Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Val Gly Thr Val Cys Lys Asn Ala Gln Ser Gln Val Gln Arg Gly
165 170 175
Asp Cys Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp
180 185 190
Met Ile Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala
195 200 205
Thr Lys Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr
210 215 220
Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe
225 230 235 240
Phe His Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys
245 250 255
Leu Gly Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly
260 265 270
Ser Gly Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr
275 280 285
Pro Ser Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro
290 295 300
Tyr Trp Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn
305 310 315 320
Asn Gln Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu
325 330 335
Thr Ile Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser
340 345 350
Asn Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe
355 360 365
Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr
370 375 380
Leu His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu
385 390 395 400
Thr Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg
405 410 415
Asn Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro
420 425 430
Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg
435 440 445
Phe Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu
450 455 460
Gln Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala
465 470 475 480
Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val
485 490 495
Lys Lys
<210> 28
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T3-26S2
<400> 28
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Ile Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Val
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Val Gly Thr Val Cys Lys Asn Ala Gln Ser Gln Val Gln Arg Gly
165 170 175
Asp Cys Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp
180 185 190
Met Ile Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala
195 200 205
Thr Lys Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr
210 215 220
Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe
225 230 235 240
Phe His Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys
245 250 255
Leu Gly Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly
260 265 270
Ser Gly Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr
275 280 285
Pro Ser Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro
290 295 300
Tyr Trp Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn
305 310 315 320
Asn Gln Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu
325 330 335
Thr Ile Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser
340 345 350
Asn Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe
355 360 365
Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr
370 375 380
Leu His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu
385 390 395 400
Thr Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg
405 410 415
Asn Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro
420 425 430
Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg
435 440 445
Phe Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu
450 455 460
Gln Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala
465 470 475 480
Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val
485 490 495
Lys Lys
<210> 29
<211> 498
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T3-26S4
<400> 29
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Val Gly Thr Val Cys Lys Asn Ala Gln Ser Gln Val Gln Arg Gly
165 170 175
Asp Cys Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp
180 185 190
Met Ile Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala
195 200 205
Thr Lys Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr
210 215 220
Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe
225 230 235 240
Phe His Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Tyr Asn Lys
245 250 255
Ala Gly Ala Val Gly Asp Ala Ile Pro Thr Thr Leu Tyr Ile Lys Gly
260 265 270
Ala Glu Ser Gly Arg Glu Pro Pro Thr Ser Ser Ile Tyr Ser Ala Thr
275 280 285
Pro Ser Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro
290 295 300
Tyr Trp Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn
305 310 315 320
Asn Gln Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu
325 330 335
Thr Ile Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser
340 345 350
Asn Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe
355 360 365
Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr
370 375 380
Leu His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu
385 390 395 400
Thr Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg
405 410 415
Asn Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro
420 425 430
Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg
435 440 445
Phe Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu
450 455 460
Gln Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala
465 470 475 480
Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val
485 490 495
Lys Lys
<210> 30
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T3-26S5
<400> 30
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Val Gly Thr Val Cys Lys Asn Ala Gln Ser Gln Val Gln Arg Gly
165 170 175
Asp Cys Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp
180 185 190
Met Ile Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala
195 200 205
Thr Lys Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr
210 215 220
Pro Asp Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe
225 230 235 240
Phe His Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys
245 250 255
Leu Gly Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly
260 265 270
Ser Gly Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr
275 280 285
Pro Ser Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro
290 295 300
Tyr Trp Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn
305 310 315 320
Asn Gln Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu
325 330 335
Thr Ile Ser Thr Ala Ser Ala Ala Ser Ala Ser Thr Pro Phe Lys Pro
340 345 350
Ser Asp Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln
355 360 365
Phe Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala
370 375 380
Tyr Leu His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly
385 390 395 400
Leu Thr Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val
405 410 415
Arg Asn Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys
420 425 430
Pro Asp Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu
435 440 445
Arg Phe Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu
450 455 460
Leu Gln Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro
465 470 475 480
Ala Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg
485 490 495
Val Lys Lys
<210> 31
<211> 1512
<212> DNA
<213> Human papillomavirus type 26
<400> 31
atggctctgt ggcgtacctc tgactctaaa gtttacctgc cgccgacccc ggtttctcgt 60
gttgttaaca ccgacgaata cgttacccgt accggtatct actactacgc tggttcttct 120
cgtctgctga ccctgggtca cccgtacttc tctatcccga aaaccggtca gaaagctgaa 180
atcccgaaag tttctgctta ccagtaccgt gttttccgtg ttcacctgcc ggacccgaac 240
aaattcggtc tgccggaccc gcagctgtac aacccggaca ccgaacgtct ggtttgggct 300
tgcgttggtg ttgaagttgg tcgtggtcag ccgctgggta tcggtctgtc tggtcacccg 360
ctgttcaaca aactggacga caccgaaaac tctcacctgg ctaccgttaa cgctgacacc 420
gacaaccgtg acaacgtttc tgttgacaac aaacagaccc agctgtgcat catcggttgc 480
accccgccgc tgggtgaaca ctggggtatc ggtaccatct gcaaaaacac ccagacccag 540
cgtggtgact gcccgccgct ggaactgatc tcttctatca tcgaagacgg tgacatgatc 600
gacaccggtt tcggtgctat ggacttcacc gctctgcagg ctaccaaatc tgacgttccg 660
atcgacatct ctcagtctac ctgcaaatac ccggactacc tgaaaatgtc tgctgacacc 720
tacggtaact ctatgttctt cttcctgcgt cgtgaacagc tgttcgctcg tcacttctac 780
aacaaagctg gtgctgttgg tgacgctatc ccgaccaccc tgtacatcaa aggtgctgaa 840
tctggtcgtg aaccgccgac ctcttctatc tactctgcta ccccgtctgg ttctatggtt 900
acctctgacg ctcagctgtt caacaaaccg tactggctgc agcgtgctca gggtcacaac 960
aacggtatct gctggggtaa ccagctgttc gttacctgcg ttgacaccac ccgttctacc 1020
aacctgacca tctctaccct gtctgctgct tctgcttcta ccccgttcaa accgtctgac 1080
tacaaacagt tcatccgtca cggtgaagaa tacgaactgc agttcatctt ccagctgtgc 1140
aaaatcaccc tgaccaccga cgttatggct tacatccacc tgatgaacgc ttctatcctg 1200
gaagactgga acttcggtct gaccctgccg ccgaccgctt ctctggaaga cgcttaccgt 1260
ttcatcaaaa actctgctac cacctgccag cgtaacgctc cgccggttcc gaaagaagac 1320
ccgttccaga aattcaaatt ctgggacgtt gacctgaaag aaaaattctc tatcgacctg 1380
gaccagttcc cgctgggtcg taaattcatg ctgcaggctg gtatccagcg tcgtccgaaa 1440
ctgggtacca aacgtccgct gtcttctacc tcttcttcta ccaaacgtaa aaaacgtaaa 1500
ctgaccaaat aa 1512
<210> 32
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T1-26S2
<400> 32
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttcccga tcccgaaatc tggttctacc gctgaaatcc cgaaggtctc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtatcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgttaacgct gacaccgaca accgtgacaa cgtttctgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 33
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T1-26S3
<400> 33
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttcccga tcccgaaatc tggttctacc gctgaaatcc cgaaggtctc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtatcggta ccatctgcaa aaacacccag acccagcgtg gtgactgccc gccgctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 34
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T1-26S4
<400> 34
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttcccga tcccgaaatc tggttctacc gctgaaatcc cgaaggtctc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttctacaaca aagctggtgc tgttggtgac 780
gctatcccga ccaccctgta catcaaaggt gctgaatctg gtcgtgaacc gccgacctct 840
tctatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 35
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T1-26S5
<400> 35
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttcccga tcccgaaatc tggttctacc gctgaaatcc cgaaggtctc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgcctct 1020
gctgcttctg cttctacccc gttcaaaccg tctgacttca agcagtacat caggcacggc 1080
gaggagtacg agctgcagtt catcttccag ctgtgcaaga tcaccctgac caccgaggtg 1140
atggcctacc tgcacaccat ggaccccacc atcctggagc agtggaactt cggcctgacc 1200
ctgcccccca gcgccagcct ggaggacgcc tacaggttcg tgaggaacgc cgccaccagc 1260
tgccagaagg acaccccccc ccaggccaag cccgaccccc tggccaagta caagttctgg 1320
gacgtggacc tgaaggagag gttcagcctg gacctggacc agttcgccct gggcaggaag 1380
ttcctgctgc aggtgggcgt gcagaggaag cccaggcccg gcctgaagag gcccgctagc 1440
agcgccagct ccagcagctc cagcagcgcc aagaggaaga gggtgaagaa gtaa 1494
<210> 36
<211> 1497
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T3-26S1
<400> 36
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttctcta tcccgaaaac cggtcagaaa gctgaaatcc cgaaagtttc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtgtcggta ccgtttgcaa aaacgctcag tctcaggttc agcgtggtga ctgcccgccg 540
ctggagctgg tgagcagcgt gatccaggac ggcgacatga tcgacaccgg cttcggcgcc 600
atggacttcg ccgccctgca ggccaccaag agcgacgtgc ccctggacat cagccagagc 660
gtgtgcaagt accccgacta cctgaagatg agcgccgaca cctacggcaa cagcatgttc 720
ttccacctga ggagggagca gatcttcgcc aggcactact acaacaagct gggcagcgtg 780
ggcgaggaca tccccaccga ctactacatc aagggcagcg gcaacggcag ggaccccatc 840
gagagctaca tctacagcgc cacccccagc ggcagcatga tcaccagcga cagccagatc 900
ttcaacaagc cctactggct gcacagggcc cagggccaca acaacggcat ctgctggaac 960
aaccagctgt tcatcacctg cgtggacacc accaggagca ccaacctgac catcagcacc 1020
gccaccgccg ccgtgagccc caccttcacc cccagcaact tcaagcagta catcaggcac 1080
ggcgaggagt acgagctgca gttcatcttc cagctgtgca agatcaccct gaccaccgag 1140
gtgatggcct acctgcacac catggacccc accatcctgg agcagtggaa cttcggcctg 1200
accctgcccc ccagcgccag cctggaggac gcctacaggt tcgtgaggaa cgccgccacc 1260
agctgccaga aggacacccc cccccaggcc aagcccgacc ccctggccaa gtacaagttc 1320
tgggacgtgg acctgaagga gaggttcagc ctggacctgg accagttcgc cctgggcagg 1380
aagttcctgc tgcaggtggg cgtgcagagg aagcccaggc ccggcctgaa gaggcccgct 1440
agcagcgcca gctccagcag ctccagcagc gccaagagga agagggtgaa gaagtaa 1497
<210> 37
<211> 1497
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T3-26S2
<400> 37
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtatcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgttaacgct gacaccgaca accgtgacaa cgtttctgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtgtcggta ccgtttgcaa aaacgctcag tctcaggttc agcgtggtga ctgcccgccg 540
ctggagctgg tgagcagcgt gatccaggac ggcgacatga tcgacaccgg cttcggcgcc 600
atggacttcg ccgccctgca ggccaccaag agcgacgtgc ccctggacat cagccagagc 660
gtgtgcaagt accccgacta cctgaagatg agcgccgaca cctacggcaa cagcatgttc 720
ttccacctga ggagggagca gatcttcgcc aggcactact acaacaagct gggcagcgtg 780
ggcgaggaca tccccaccga ctactacatc aagggcagcg gcaacggcag ggaccccatc 840
gagagctaca tctacagcgc cacccccagc ggcagcatga tcaccagcga cagccagatc 900
ttcaacaagc cctactggct gcacagggcc cagggccaca acaacggcat ctgctggaac 960
aaccagctgt tcatcacctg cgtggacacc accaggagca ccaacctgac catcagcacc 1020
gccaccgccg ccgtgagccc caccttcacc cccagcaact tcaagcagta catcaggcac 1080
ggcgaggagt acgagctgca gttcatcttc cagctgtgca agatcaccct gaccaccgag 1140
gtgatggcct acctgcacac catggacccc accatcctgg agcagtggaa cttcggcctg 1200
accctgcccc ccagcgccag cctggaggac gcctacaggt tcgtgaggaa cgccgccacc 1260
agctgccaga aggacacccc cccccaggcc aagcccgacc ccctggccaa gtacaagttc 1320
tgggacgtgg acctgaagga gaggttcagc ctggacctgg accagttcgc cctgggcagg 1380
aagttcctgc tgcaggtggg cgtgcagagg aagcccaggc ccggcctgaa gaggcccgct 1440
agcagcgcca gctccagcag ctccagcagc gccaagagga agagggtgaa gaagtaa 1497
<210> 38
<211> 1497
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T3-26S4
<400> 38
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtgtcggta ccgtttgcaa aaacgctcag tctcaggttc agcgtggtga ctgcccgccg 540
ctggagctgg tgagcagcgt gatccaggac ggcgacatga tcgacaccgg cttcggcgcc 600
atggacttcg ccgccctgca ggccaccaag agcgacgtgc ccctggacat cagccagagc 660
gtgtgcaagt accccgacta cctgaagatg agcgccgaca cctacggcaa cagcatgttc 720
ttccacctga ggagggagca gatcttcgcc aggcacttct acaacaaagc tggtgctgtt 780
ggtgacgcta tcccgaccac cctgtacatc aaaggtgctg aatctggtcg tgaaccgccg 840
acctcttcta tctactctgc cacccccagc ggcagcatga tcaccagcga cagccagatc 900
ttcaacaagc cctactggct gcacagggcc cagggccaca acaacggcat ctgctggaac 960
aaccagctgt tcatcacctg cgtggacacc accaggagca ccaacctgac catcagcacc 1020
gccaccgccg ccgtgagccc caccttcacc cccagcaact tcaagcagta catcaggcac 1080
ggcgaggagt acgagctgca gttcatcttc cagctgtgca agatcaccct gaccaccgag 1140
gtgatggcct acctgcacac catggacccc accatcctgg agcagtggaa cttcggcctg 1200
accctgcccc ccagcgccag cctggaggac gcctacaggt tcgtgaggaa cgccgccacc 1260
agctgccaga aggacacccc cccccaggcc aagcccgacc ccctggccaa gtacaagttc 1320
tgggacgtgg acctgaagga gaggttcagc ctggacctgg accagttcgc cctgggcagg 1380
aagttcctgc tgcaggtggg cgtgcagagg aagcccaggc ccggcctgaa gaggcccgct 1440
agcagcgcca gctccagcag ctccagcagc gccaagagga agagggtgaa gaagtaa 1497
<210> 39
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T3-26S5
<400> 39
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtgtcggta ccgtttgcaa aaacgctcag tctcaggttc agcgtggtga ctgcccgccg 540
ctggagctgg tgagcagcgt gatccaggac ggcgacatga tcgacaccgg cttcggcgcc 600
atggacttcg ccgccctgca ggccaccaag agcgacgtgc ccctggacat cagccagagc 660
gtgtgcaagt accccgacta cctgaagatg agcgccgaca cctacggcaa cagcatgttc 720
ttccacctga ggagggagca gatcttcgcc aggcactact acaacaagct gggcagcgtg 780
ggcgaggaca tccccaccga ctactacatc aagggcagcg gcaacggcag ggaccccatc 840
gagagctaca tctacagcgc cacccccagc ggcagcatga tcaccagcga cagccagatc 900
ttcaacaagc cctactggct gcacagggcc cagggccaca acaacggcat ctgctggaac 960
aaccagctgt tcatcacctg cgtggacacc accaggagca ccaacctgac catcagcacc 1020
gcctctgctg cttctgcttc taccccgttc aaaccgtctg acttcaagca gtacatcagg 1080
cacggcgagg agtacgagct gcagttcatc ttccagctgt gcaagatcac cctgaccacc 1140
gaggtgatgg cctacctgca caccatggac cccaccatcc tggagcagtg gaacttcggc 1200
ctgaccctgc cccccagcgc cagcctggag gacgcctaca ggttcgtgag gaacgccgcc 1260
accagctgcc agaaggacac ccccccccag gccaagcccg accccctggc caagtacaag 1320
ttctgggacg tggacctgaa ggagaggttc agcctggacc tggaccagtt cgccctgggc 1380
aggaagttcc tgctgcaggt gggcgtgcag aggaagccca ggcccggcct gaagaggccc 1440
gctagcagcg ccagctccag cagctccagc agcgccaaga ggaagagggt gaagaagtaa 1500
<210> 40
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T2-26S1
<400> 40
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Ser Ile Pro Lys Thr Gly
35 40 45
Gln Lys Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Ala
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Cys Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 41
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T2-26S3
<400> 41
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Ala
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Cys Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Ile Cys Lys Asn Thr Gln Thr Gln Arg Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 42
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T2-26S4
<400> 42
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Ala
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Cys Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Tyr Asn Lys Ala Gly
245 250 255
Ala Val Gly Asp Ala Ile Pro Thr Thr Leu Tyr Ile Lys Gly Ala Glu
260 265 270
Ser Gly Arg Glu Pro Pro Thr Ser Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 43
<211> 497
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T2-26S5
<400> 43
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Ala
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Cys Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Tyr Tyr Asn Lys Leu Gly
245 250 255
Ser Val Gly Glu Asp Ile Pro Thr Asp Tyr Tyr Ile Lys Gly Ser Gly
260 265 270
Asn Gly Arg Asp Pro Ile Glu Ser Tyr Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Ser Ala Ala Ser Ala Ser Thr Pro Phe Lys Pro Ser Asp
340 345 350
Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile
355 360 365
Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu
370 375 380
His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr
385 390 395 400
Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn
405 410 415
Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp
420 425 430
Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe
435 440 445
Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln
450 455 460
Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser
465 470 475 480
Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys
485 490 495
Lys
<210> 44
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T4-26S1
<400> 44
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Ser Ile Pro Lys Thr Gly
35 40 45
Gln Lys Ala Glu Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Phe Asn Lys Ala Gly
245 250 255
Thr Ile Gly Asp Pro Val Pro Val Ser Met Tyr Ile Lys Gly Ala Gly
260 265 270
Gln Gly Arg Glu Pro Pro Thr Thr Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 45
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T4-26S2
<400> 45
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Ile Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Leu Asp Asp Thr Glu Asn Ser His Leu Ala Thr Val
115 120 125
Asn Ala Asp Thr Asp Asn Arg Asp Asn Val Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Phe Asn Lys Ala Gly
245 250 255
Thr Ile Gly Asp Pro Val Pro Val Ser Met Tyr Ile Lys Gly Ala Gly
260 265 270
Gln Gly Arg Glu Pro Pro Thr Thr Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 46
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T4-26S3
<400> 46
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Ile Cys Lys Asn Thr Gln Thr Gln Arg Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Phe Asn Lys Ala Gly
245 250 255
Thr Ile Gly Asp Pro Val Pro Val Ser Met Tyr Ile Lys Gly Ala Gly
260 265 270
Gln Gly Arg Glu Pro Pro Thr Thr Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Thr Ala Ala Val Ser Pro Thr Phe Thr Pro Ser Asn Phe
340 345 350
Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile Phe
355 360 365
Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu His
370 375 380
Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr Leu
385 390 395 400
Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn Ala
405 410 415
Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp Pro
420 425 430
Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe Ser
435 440 445
Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln Val
450 455 460
Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser Ser
465 470 475 480
Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys Lys
485 490 495
<210> 47
<211> 497
<212> PRT
<213> Artificial Sequence
<220>
<223> H51N9-69T4-26S5
<400> 47
Met Lys Val Tyr Leu Pro Pro Ala Pro Val Ser Arg Ile Val Asn Thr
1 5 10 15
Glu Glu Tyr Ile Thr Arg Thr Gly Ile Tyr Tyr Tyr Ala Gly Ser Ser
20 25 30
Arg Leu Ile Thr Leu Gly His Pro Tyr Phe Pro Leu Pro Lys Thr Ser
35 40 45
Thr Arg Ala Ala Ile Pro Lys Val Ser Ala Phe Gln Tyr Arg Val Phe
50 55 60
Arg Val Gln Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Pro Asn
65 70 75 80
Leu Tyr Asn Pro Asp Thr Asp Arg Leu Val Trp Gly Cys Val Gly Val
85 90 95
Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Leu Ser Gly His Pro
100 105 110
Leu Phe Asn Lys Tyr Asp Asp Thr Glu Asn Ser Arg Ile Ala Asn Gly
115 120 125
Asn Ala Gln Gln Asp Val Arg Asp Asn Thr Ser Val Asp Asn Lys Gln
130 135 140
Thr Gln Leu Cys Ile Ile Gly Cys Ala Pro Pro Ile Gly Glu His Trp
145 150 155 160
Gly Ile Gly Thr Thr Cys Lys Asn Thr Pro Val Pro Pro Gly Asp Cys
165 170 175
Pro Pro Leu Glu Leu Val Ser Ser Val Ile Gln Asp Gly Asp Met Ile
180 185 190
Asp Thr Gly Phe Gly Ala Met Asp Phe Ala Ala Leu Gln Ala Thr Lys
195 200 205
Ser Asp Val Pro Leu Asp Ile Ser Gln Ser Val Cys Lys Tyr Pro Asp
210 215 220
Tyr Leu Lys Met Ser Ala Asp Thr Tyr Gly Asn Ser Met Phe Phe His
225 230 235 240
Leu Arg Arg Glu Gln Ile Phe Ala Arg His Phe Phe Asn Lys Ala Gly
245 250 255
Thr Ile Gly Asp Pro Val Pro Val Ser Met Tyr Ile Lys Gly Ala Gly
260 265 270
Gln Gly Arg Glu Pro Pro Thr Thr Ser Ile Tyr Ser Ala Thr Pro Ser
275 280 285
Gly Ser Met Ile Thr Ser Asp Ser Gln Ile Phe Asn Lys Pro Tyr Trp
290 295 300
Leu His Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Asn Asn Gln
305 310 315 320
Leu Phe Ile Thr Cys Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Ile
325 330 335
Ser Thr Ala Ser Ala Ala Ser Ala Ser Thr Pro Phe Lys Pro Ser Asp
340 345 350
Phe Lys Gln Tyr Ile Arg His Gly Glu Glu Tyr Glu Leu Gln Phe Ile
355 360 365
Phe Gln Leu Cys Lys Ile Thr Leu Thr Thr Glu Val Met Ala Tyr Leu
370 375 380
His Thr Met Asp Pro Thr Ile Leu Glu Gln Trp Asn Phe Gly Leu Thr
385 390 395 400
Leu Pro Pro Ser Ala Ser Leu Glu Asp Ala Tyr Arg Phe Val Arg Asn
405 410 415
Ala Ala Thr Ser Cys Gln Lys Asp Thr Pro Pro Gln Ala Lys Pro Asp
420 425 430
Pro Leu Ala Lys Tyr Lys Phe Trp Asp Val Asp Leu Lys Glu Arg Phe
435 440 445
Ser Leu Asp Leu Asp Gln Phe Ala Leu Gly Arg Lys Phe Leu Leu Gln
450 455 460
Val Gly Val Gln Arg Lys Pro Arg Pro Gly Leu Lys Arg Pro Ala Ser
465 470 475 480
Ser Ala Ser Ser Ser Ser Ser Ser Ser Ala Lys Arg Lys Arg Val Lys
485 490 495
Lys
<210> 48
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T2-26S1
<400> 48
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttctcta tcccgaaaac cggtcagaaa gctgaaatcc cgaaagtttc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtgtcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgctaacgct gacaccgaca accgtgacaa cgtttgcgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 49
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T2-26S3
<400> 49
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtgtcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgctaacgct gacaccgaca accgtgacaa cgtttgcgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtatcggta ccatctgcaa aaacacccag acccagcgtg gtgactgccc gccgctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 50
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T2-26S4
<400> 50
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtgtcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgctaacgct gacaccgaca accgtgacaa cgtttgcgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttctacaaca aagctggtgc tgttggtgac 780
gctatcccga ccaccctgta catcaaaggt gctgaatctg gtcgtgaacc gccgacctct 840
tctatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 51
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T2-26S5
<400> 51
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtgtcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgctaacgct gacaccgaca accgtgacaa cgtttgcgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac tactacaaca agctgggcag cgtgggcgag 780
gacatcccca ccgactacta catcaagggc agcggcaacg gcagggaccc catcgagagc 840
tacatctaca gcgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgcctct 1020
gctgcttctg cttctacccc gttcaaaccg tctgacttca agcagtacat caggcacggc 1080
gaggagtacg agctgcagtt catcttccag ctgtgcaaga tcaccctgac caccgaggtg 1140
atggcctacc tgcacaccat ggaccccacc atcctggagc agtggaactt cggcctgacc 1200
ctgcccccca gcgccagcct ggaggacgcc tacaggttcg tgaggaacgc cgccaccagc 1260
tgccagaagg acaccccccc ccaggccaag cccgaccccc tggccaagta caagttctgg 1320
gacgtggacc tgaaggagag gttcagcctg gacctggacc agttcgccct gggcaggaag 1380
ttcctgctgc aggtgggcgt gcagaggaag cccaggcccg gcctgaagag gcccgctagc 1440
agcgccagct ccagcagctc cagcagcgcc aagaggaaga gggtgaagaa gtaa 1494
<210> 52
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T4-26S1
<400> 52
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttctcta tcccgaaaac cggtcagaaa gctgaaatcc cgaaagtttc tgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttcttcaaca aagctggtac catcggtgac 780
cctgttccgg tttctatgta catcaaaggt gctggtcagg gtcgtgaacc gccgaccaca 840
tccatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 53
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T4-26S2
<400> 53
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggtcgt 300
ggtcagccgc tgggtatcgg tctgtctggt cacccgctgt tcaacaaact ggacgacacc 360
gaaaactctc acctggctac cgttaacgct gacaccgaca accgtgacaa cgtttctgtt 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttcttcaaca aagctggtac catcggtgac 780
cctgttccgg tttctatgta catcaaaggt gctggtcagg gtcgtgaacc gccgaccaca 840
tccatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 54
<211> 1491
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T4-26S3
<400> 54
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggtatcggta ccatctgcaa aaacacccag acccagcgtg gtgactgccc gccgctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttcttcaaca aagctggtac catcggtgac 780
cctgttccgg tttctatgta catcaaaggt gctggtcagg gtcgtgaacc gccgaccaca 840
tccatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgccacc 1020
gccgccgtga gccccacctt cacccccagc aacttcaagc agtacatcag gcacggcgag 1080
gagtacgagc tgcagttcat cttccagctg tgcaagatca ccctgaccac cgaggtgatg 1140
gcctacctgc acaccatgga ccccaccatc ctggagcagt ggaacttcgg cctgaccctg 1200
ccccccagcg ccagcctgga ggacgcctac aggttcgtga ggaacgccgc caccagctgc 1260
cagaaggaca ccccccccca ggccaagccc gaccccctgg ccaagtacaa gttctgggac 1320
gtggacctga aggagaggtt cagcctggac ctggaccagt tcgccctggg caggaagttc 1380
ctgctgcagg tgggcgtgca gaggaagccc aggcccggcc tgaagaggcc cgctagcagc 1440
gccagctcca gcagctccag cagcgccaag aggaagaggg tgaagaagta a 1491
<210> 55
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> The DNA sequence encoding H51N9-69T4-26S5
<400> 55
atgaaggtgt acctgccccc cgcccccgtg agcaggatcg tgaacaccga ggagtacatc 60
accaggaccg gcatctacta ctacgccggc agcagcaggc tgatcaccct gggccacccc 120
tacttccccc tgcccaagac cagcaccagg gccgccatcc ccaaggtgag cgccttccag 180
tacagggtgt tcagggtgca gctccccgac cccaacaagt tcggcctgcc cgaccccaac 240
ctgtacaacc ccgacaccga caggctggtg tggggctgcg tgggcgtgga ggtgggcagg 300
ggccagcccc tgggcgtggg cctgagcggc caccccctgt tcaacaagta cgacgacacc 360
gagaacagca ggatcgccaa cggcaacgcc cagcaggacg tgagggacaa caccagcgtg 420
gacaacaagc agacccagct gtgcatcatc ggctgcgccc cccccatcgg cgagcactgg 480
ggcatcggca ccacctgcaa gaacaccccc gtgccccccg gcgactgccc ccccctggag 540
ctggtgagca gcgtgatcca ggacggcgac atgatcgaca ccggcttcgg cgccatggac 600
ttcgccgccc tgcaggccac caagagcgac gtgcccctgg acatcagcca gagcgtgtgc 660
aagtaccccg actacctgaa gatgagcgcc gacacctacg gcaacagcat gttcttccac 720
ctgaggaggg agcagatctt cgccaggcac ttcttcaaca aagctggtac catcggtgac 780
cctgttccgg tttctatgta catcaaaggt gctggtcagg gtcgtgaacc gccgaccaca 840
tccatctact ctgccacccc cagcggcagc atgatcacca gcgacagcca gatcttcaac 900
aagccctact ggctgcacag ggcccagggc cacaacaacg gcatctgctg gaacaaccag 960
ctgttcatca cctgcgtgga caccaccagg agcaccaacc tgaccatcag caccgcctct 1020
gctgcttctg cttctacccc gttcaaaccg tctgacttca agcagtacat caggcacggc 1080
gaggagtacg agctgcagtt catcttccag ctgtgcaaga tcaccctgac caccgaggtg 1140
atggcctacc tgcacaccat ggaccccacc atcctggagc agtggaactt cggcctgacc 1200
ctgcccccca gcgccagcct ggaggacgcc tacaggttcg tgaggaacgc cgccaccagc 1260
tgccagaagg acaccccccc ccaggccaag cccgaccccc tggccaagta caagttctgg 1320
gacgtggacc tgaaggagag gttcagcctg gacctggacc agttcgccct gggcaggaag 1380
ttcctgctgc aggtgggcgt gcagaggaag cccaggcccg gcctgaagag gcccgctagc 1440
agcgccagct ccagcagctc cagcagcgcc aagaggaaga gggtgaagaa gtaa 1494
<210> 56
<211> 10
<212> PRT
<213> Human papillomavirus type 26
<400> 56
Ser Ile Pro Lys Thr Gly Gln Lys Ala Glu
1 5 10
<210> 57
<211> 33
<212> PRT
<213> Human papillomavirus type 26
<400> 57
Ile Gly Leu Ser Gly His Pro Leu Phe Asn Lys Leu Asp Asp Thr Glu
1 5 10 15
Asn Ser His Leu Ala Thr Val Asn Ala Asp Thr Asp Asn Arg Asp Asn
20 25 30
Val
<210> 58
<211> 9
<212> PRT
<213> Human papillomavirus type 26
<400> 58
Ile Cys Lys Asn Thr Gln Thr Gln Arg
1 5
<210> 59
<211> 31
<212> PRT
<213> Human papillomavirus type 26
<400> 59
Phe Tyr Asn Lys Ala Gly Ala Val Gly Asp Ala Ile Pro Thr Thr Leu
1 5 10 15
Tyr Ile Lys Gly Ala Glu Ser Gly Arg Glu Pro Pro Thr Ser Ser
20 25 30
<210> 60
<211> 13
<212> PRT
<213> Human papillomavirus type 26
<400> 60
Ser Ala Ala Ser Ala Ser Thr Pro Phe Lys Pro Ser Asp
1 5 10
<210> 61
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 61
gtaggggtgg cccagggtga tcag 24
<210> 62
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 62
gccttccagt acagggtgtt cagg 24
<210> 63
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 63
cacctccacg cccacgcagc ccca 24
<210> 64
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 64
acaagcagac ccagctgtgc atca 24
<210> 65
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 65
ctcgccgatg gggggggcgc agccgatgat gcacagctg 39
<210> 66
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 66
ccctggagct ggtgagcagc gtgatccagg acggcgaca 39
<210> 67
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 67
gtgcctggcg aagatctgct ccct 24
<210> 68
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 68
gccaccccca gcggcagcat gatc 24
<210> 69
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 69
ggcggtgctg atggtcaggt tggt 24
<210> 70
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 70
acttcaagca gtacatcagg cacg 24
<210> 71
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 71
ctgatcaccc tgggccaccc ctacttcccg atcccgaaat ctggt 45
<210> 72
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 72
cctgaacacc ctgtactgga aggcagagac cttcgggatt tcagc 45
<210> 73
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 73
tggggctgcg tgggcgtgga ggtgggtcgt ggtcagccgc tg 42
<210> 74
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 74
tgatgcacag ctgggtctgc ttgttgtcaa cgcaaacgtt gtcac 45
<210> 75
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 75
ggctgcgccc cccccatcgg cgagcactgg ggtgtcggta ccgtt 45
<210> 76
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 76
tcacgctgct caccagctcc aggggcgggc agtcaccacg ctgaa 45
<210> 77
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 77
agggagcaga tcttcgccag gcacttcttc aacaaagctg gtacc 45
<210> 78
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 78
gatcatgctg ccgctggggg tggcagagta gatggatgtg gtcgg 45
<210> 79
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 79
accaacctga ccatcagcac cgcctctgct cagtctgctt ctgct 45
<210> 80
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 80
cgtgcctgat gtactgcttg aagtcagacg gtttgaaggt agcag 45
<210> 81
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 81
tggggctgcg tgggcgtgga ggtgggtcgt ggtcagccgc tgggt 45
<210> 82
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 82
gggggcgcag ccgatgatgc acagctgggt ctgtttgttg tcaac 45
<210> 83
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 83
cacctccacg cccacgcagc ccca 24
<210> 84
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 84
ctgtgcatca tcggctgcgc tccccccatc g 31
<210> 85
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 85
atcatcggct gcgccccccc catcggtgaa cactggggta tcggt 45
<210> 86
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 86
gccgtcctgg atcacgctgc tcaccagttc cagcggcggg ca 42
<210> 87
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 87
gatggggggg gcgcagccga tgat 24
<210> 88
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 88
gtgagcagcg tgatccagga cggc 24
<210> 89
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 89
tacggcaaca gcatgttctt ccacctgcgt cgtgaacaga tcttcgctcg tcac 54
<210> 90
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 90
gctgtcgctg gtgatcatgc tgccagacgg ggtagcagag tagat 45
<210> 91
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 91
gtggaagaac atgctgttgc cgta 24
<210> 92
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 92
ggcagcatga tcaccagcga cagc 24
<210> 93
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 93
ttcatcacct gcgtggacac cacccgttct accaacctga ccatctctac cgcg 54
<210> 94
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 94
cagctggaag atgaactgca gctcgtattc ttcaccgtga cggatgtact gtttgaa 57
<210> 95
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 95
ggtggtgtcc acgcaggtga tgaacag 27
<210> 96
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 96
gagctgcagt tcatcttcca gctg 24
<210> 97
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 97
tacgccggca gcagcaggct gatcaccctg ggtcacccgt ac 42
<210> 98
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 98
caccctgaac accctgtact ggaaagcaga aactttcggg at 42
<210> 99
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 99
gatcagcctg ctgctgccgg cgta 24
<210> 100
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 100
ttccagtaca gggtgttcag ggtg 24
<210> 101
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 101
tggggctgcg tgggcgtgga ggtgggtcgt ggtcagccgc tgggt 45
<210> 102
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 102
gggggcgcag ccgatgatgc acagctgggt ctgtttgttg tcaac 45
<210> 103
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 103
cacctccacg cccacgcagc ccca 24
<210> 104
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 104
ctgtgcatca tcggctgcgc tccccccatc g 31
<210> 105
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 105
tacggcaaca gcatgttctt ccacctgcgt cgtgaacaga tcttcgctcg tcac 54
<210> 106
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 106
gctgtcgctg gtgatcatgc tgccagacgg ggtagcagag tagat 45
<210> 107
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 107
gtggaagaac atgctgttgc cgta 24
<210> 108
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 108
ggcagcatga tcaccagcga cagc 24
<210> 109
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 109
ttcatcacct gcgtggacac cacccgttct accaacctga ccatctctac c 51
<210> 110
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 110
cagctggaag atgaactgca gctcgtattc ttcaccgtga cggatgtact gtttgaa 57
<210> 111
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 111
ggtggtgtcc acgcaggtga tgaacag 27
<210> 112
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 112
gagctgcagt tcatcttcca gctg 24
<210> 113
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 113
tacgccggca gcagcaggct gatcaccctg ggtcacccgt ac 42
<210> 114
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 114
caccctgaac accctgtact ggaaagcaga aactttcggg at 42
<210> 115
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 115
gatcagcctg ctgctgccgg cgta 24
<210> 116
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 116
ttccagtaca gggtgttcag ggtg 24
<210> 117
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 117
atcatcggct gcgccccccc catcggtgaa cactggggta tcggt 45
<210> 118
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 118
gccgtcctgg atcacgctgc tcaccagttc cagcggcggg ca 42
<210> 119
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 119
gatggggggg gcgcagccga tgat 24
<210> 120
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 120
gtgagcagcg tgatccagga cggc 24
<210> 121
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 121
tacggcaaca gcatgttctt ccacctgcgt cgtgaacaga tcttcgctcg tcac 54
<210> 122
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 122
gctgtcgctg gtgatcatgc tgccagacgg ggtagcagag tagat 45
<210> 123
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 123
gtggaagaac atgctgttgc cgta 24
<210> 124
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 124
ggcagcatga tcaccagcga cagc 24
<210> 125
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 125
ttcatcacct gcgtggacac cacccgttct accaacctga ccatctctac c 51
<210> 126
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 126
cagctggaag atgaactgca gctcgtattc ttcaccgtga cggatgtact gtttgaa 57
<210> 127
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 127
ggtggtgtcc acgcaggtga tgaacag 27
<210> 128
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 128
gagctgcagt tcatcttcca gctg 24
<210> 129
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 129
tacgccggca gcagcaggct gatcaccctg ggtcacccgt ac 42
<210> 130
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 130
caccctgaac accctgtact ggaaagcaga aactttcggg at 42
<210> 131
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 131
gatcagcctg ctgctgccgg cgta 24
<210> 132
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 132
ttccagtaca gggtgttcag ggtg 24
<210> 133
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 133
tggggctgcg tgggcgtgga ggtgggtcgt ggtcagccgc tgggt 45
<210> 134
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 134
gggggcgcag ccgatgatgc acagctgggt ctgtttgttg tcaac 45
<210> 135
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 135
cacctccacg cccacgcagc ccca 24
<210> 136
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 136
ctgtgcatca tcggctgcgc tccccccatc g 31
<210> 137
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 137
atcatcggct gcgccccccc catcggtgaa cactggggta tcggt 45
<210> 138
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 138
gccgtcctgg atcacgctgc tcaccagttc cagcggcggg ca 42
<210> 139
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 139
gatggggggg gcgcagccga tgat 24
<210> 140
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 140
gtgagcagcg tgatccagga cggc 24
<210> 141
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 141
ttcatcacct gcgtggacac cacccgttct accaacctga ccatctctac c 51
<210> 142
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 142
cagctggaag atgaactgca gctcgtattc ttcaccgtga cggatgtact gtttgaa 57
<210> 143
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 143
ggtggtgtcc acgcaggtga tgaacag 27
<210> 144
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 144
gagctgcagt tcatcttcca gctg 24
Claims (12)
- 돌연변이된 HPV51 L1 단백질 또는 그의 변이체로서, 야생형 HPV51 L1 단백질 대비, 상기 돌연변이된 HPV51 L1 단백질은:
(1) 야생형 HPV51 L1 단백질의 N-말단에서, 0 내지 15개의 아미노산, 예를 들면, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 아미노산의 절단(truncation); 및
하기 (2)(a), (2)(b), (2)(c) 또는 (2)(d)에 정의된 돌연변이:
(2)(a) 야생형 HPV51 L1 단백질의 52-60번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(2)(b) 야생형 HPV51 L1 단백질의 125-147번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(2)(c) 야생형 HPV51 L1 단백질의 170-181번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(2)(d) 야생형 HPV51 L1 단백질의 259-289번 위치에 있는 아미노산 잔기의 제2 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;을 갖고, 및
상기 변이체는 상기 돌연변이된 HPV51 L1 단백질과 1개 이상 (예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 17개)의 아미노산의 치환(바람직하게는 보존적 치환), 부가 또는 결실에 의해서만 다르고, 상기 돌연변이된 HPV51 L1 단백질의 기능, 즉, 2종 이상의 HPV(예를 들면, HPV51 및 HPV69)에 대한 중화 항체의 생성을 유도하는 능력을 보유하고;
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(a)에 정의된 돌연변이를 갖고, 선택적으로, (3)(b)에 정의된 돌연변이를 더 갖고;
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(b)에 정의된 돌연변이를 갖고, 선택적으로, (3)(c)에 정의된 돌연변이를 더 갖고;
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(c)에 정의된 돌연변이를 갖고, 선택적으로, (3)(a) 또는 (3)(b)에 정의된 돌연변이를 더 갖고;
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질은 (1) 및 (2)(d)에 정의된 돌연변이를 갖고, 선택적으로, (3)(b)에 정의된 돌연변이를 더 갖고;
상기 (3)(a), (3)(b) 또는 (3)(c)에 정의된 돌연변이는:
(3)(a) 야생형 HPV51 L1 단백질의 51-60번 위치에 있는 아미노산 잔기의 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(3)(b) 야생형 HPV51 L1 단백질의 114-146번 위치에 있는 아미노산 잔기의 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;
(3)(c) 야생형 HPV51 L1 단백질의 173-181번 위치에 있는 아미노산 잔기의 제3 타입의 야생형 HPV의 L1 단백질의 상응하는 위치에 있는 아미노산 잔기에 의한 치환;이고,
바람직하게는, 상기 제2 타입의 야생형 HPV는 HPV69이며; 바람직하게는, (2)(a)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 52-60번 아미노산 잔기이고; 바람직하게는, (2)(b)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 125-147번 아미노산 잔기이며; 바람직하게는, (2)(c)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 170-183번 아미노산 잔기이고; 바람직하게는, (2)(d)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV69 L1 단백질의 261-291번 아미노산 잔기이며;
바람직하게는, 상기 제3 타입의 야생형 HPV는 HPV26이고; 바람직하게는, (3)(a)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV26 L1 단백질의 51-60번 아미노산 잔기이고; 바람직하게는, (3)(b)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV26 L1 단백질의 114-146번 아미노산 잔기이고; 바람직하게는, (3)(c)에 기재된 상응하는 위치에 있는 아미노산 잔기들은 야생형 HPV26 L1 단백질의 173-181번 아미노산 잔기이며; 예를 들면, 상기 돌연변이된 HPV51 L1 단백질은 야생형 HPV51 L1 단백질 대비, N-말단에서 절단된 9개의 아미노산을 갖고;
바람직하게는, 상기 야생형 HPV51 L1 단백질은 서열번호 1로 기재된 아미노산 서열을 갖고;
바람직하게는, 상기 야생형 HPV69 L1 단백질은 서열번호 2로 기재된 아미노산 서열을 가지며;
바람직하게는, 상기 야생형 HPV26 L1 단백질은 서열번호 22로 기재된 아미노산 서열을 갖고;
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질은 서열번호 4, 5, 6, 또는 7로 기재된 아미노산 서열을 가지며;
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질은 서열번호 23, 27, 28, 41 또는 45로 기재된 아미노산 서열을 갖는 것인 돌연변이된 HPV51 L1 단백질 또는 그의 변이체. - 청구항 1에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 코딩하는 단리된 핵산으로서,
바람직하게는, 상기 단리된 핵산은 서열번호 12, 13, 14 또는 15에 기재된 뉴클레오티드 서열을 갖고;
바람직하게는, 상기 단리된 핵산은 서열번호 32, 36, 37, 49 또는 53에 기재된 뉴클레오티드 서열을 갖는 것인 단리된 핵산. - 청구항 2에 따른 단리된 핵산을 포함하는 벡터.
- 청구항 2에 따른 단리된 핵산 및/또는 청구항 3에 따른 벡터를 포함하는 숙주 세포.
- 청구항 1에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 포함하거나, 또는 그로 구성된 HPV 바이러스-유사 입자(virus-like particle).
- 청구항 1에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체, 또는 청구항 2에 따른 단리된 핵산, 또는 청구항 3에 따른 벡터, 또는 청구항 4에 따른 숙주 세포, 또는 청구항 5에 따른 HPV 바이러스-유사 입자를 포함하는 조성물.
- 청구항 5에 따른 HPV 바이러스-유사 입자, 및 선택적으로, 약학적으로 허용가능한 담체 및/또는 부형제를 포함하는 약학적 조성물 또는 백신으로서,
바람직하게는, 상기 HPV 바이러스-유사 입자는 HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방을 위한 유효량으로 존재하고,
바람직하게는, 상기 HPV 감염은 1종 이상의 HPV에 의한 감염(예를 들면, HPV51 감염, HPV69 감염 및 HPV26 감염으로 구성된 군으로부터 선택된 하나 이상의 감염)이고;
바람직하게는, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암, 첨형 콘딜로마(condyloma acuminatum), 및 이들의 조합으로 구성된 군으로부터 선택되는 것인 약학적 조성물 또는 백신. - 청구항 1에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 제조하는 방법으로서, 숙주 세포에서 상기 돌연변이된 HPV5 L1 단백질 또는 그의 변이체를 발현시키는 단계, 및 상기 숙주 세포의 배양물로부터 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 회수하는 단계를 포함하고;
바람직하게는, 상기 숙주 세포는 대장균이고;
바람직하게는, 상기 방법은: 대장균에서 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 발현시키는 단계, 및 대장균의 용해물(lysate) 상층액을 정제시키는 것에 의해 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체를 수득하는 단계를 포함하고,
바람직하게는, 상기 돌연변이된 HPV51 L1 단백질 또는 그의 변이체는 크로마토그래피(예를 들면, 양이온-교환 크로마토그래피, 히드록시아파타이트(hydroxyapatite) 크로마토그래피 및/또는 소수성 상호작용 크로마토그래피)에 의해 상기 대장액의 용해물 상층액으로부터 회수되는 것인 방법. - 청구항 5에 따른 HPV 바이러스-유사 입자를 약학적으로 허용가능한 담체 및/또는 부형제와 조합하는 단계를 포함하는, 백신을 제조하는 방법.
- 청구항 5에 따른 HPV 바이러스-유사 입자 또는 청구항 7에 따른 약학적 조성물 또는 백신의 예방적 유효량을 개체에게 투여하는 단계를 포함하는, HPV 감염 또는 HPV 감염에 의해 유발되는 질환을 예방하는 방법으로서,
바람직하게는, 상기 HPV 감염은 1종 이상의 HPV에 의한 감염(예를 들면, HPV51 감염, HPV69 감염 및 HPV26 감염으로 구성된 군으로부터 선택된 하나 이상의 감염)이고;
바람직하게는, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암, 첨형 콘딜로마, 및 이들의 조합으로 구성된 군으로부터 선택되는 것인 방법. - HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방을 위한 약학적 조성물 또는 백신의 제조에서 청구항 1에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체 또는 청구항 5에 따른 HPV 바이러스-유사 입자의 용도로서,
바람직하게는, 상기 HPV 감염은 1종 이상의 HPV에 의한 감염(예를 들면, HPV51 감염, HPV69 감염 및 HPV26 감염으로 구성된 군으로부터 선택된 하나 이상의 감염)이고;
바람직하게는, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암, 첨형 콘딜로마, 및 이들의 조합으로 구성된 군으로부터 선택되는 것인 용도. - HPV 감염 또는 HPV 감염에 의해 유발되는 질환의 예방을 위한 청구항 1에 따른 돌연변이된 HPV51 L1 단백질 또는 그의 변이체 또는 청구항 5에 따른 HPV 바이러스-유사 입자로서,
바람직하게는, 상기 HPV 감염은 1종 이상의 HPV에 의한 감염(예를 들면, HPV51 감염, HPV69 감염 및 HPV26 감염으로 구성된 군으로부터 선택된 하나 이상의 감염)이고;
바람직하게는, 상기 HPV 감염에 의해 유발되는 질환은 자궁경부암, 첨형 콘딜로마, 및 이들의 조합으로 구성된 군으로부터 선택되는 것인 돌연변이된 HPV51 L1 단백질 또는 그의 변이체 또는 HPV 바이러스-유사 입자.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811122822 | 2018-09-26 | ||
CN201811122822.1 | 2018-09-26 | ||
PCT/CN2019/108063 WO2020063724A1 (zh) | 2018-09-26 | 2019-09-26 | 一种人乳头瘤病毒51型l1蛋白的突变体 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210064318A true KR20210064318A (ko) | 2021-06-02 |
Family
ID=69949986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217012147A KR20210064318A (ko) | 2018-09-26 | 2019-09-26 | Hpv 타입 51의 l1 단백질의 돌연변이체 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220001002A1 (ko) |
EP (1) | EP3858867A4 (ko) |
JP (1) | JP7290258B2 (ko) |
KR (1) | KR20210064318A (ko) |
CN (1) | CN110950935A (ko) |
BR (1) | BR112021005626A2 (ko) |
WO (1) | WO2020063724A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021013060A1 (zh) * | 2019-07-19 | 2021-01-28 | 神州细胞工程有限公司 | 嵌合的人乳头瘤病毒51型l1蛋白 |
CN113201550B (zh) * | 2021-04-23 | 2023-12-26 | 上海博唯生物科技有限公司 | 一种表达hpv 51l1的多核苷酸及其表达载体、宿主细胞和应用 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL117591A0 (en) * | 1995-03-30 | 1996-07-23 | Merck & Co Inc | Synthetic DNA encoding human papillomavirus type 11 L1 protein |
US6551597B1 (en) * | 1999-03-18 | 2003-04-22 | President & Fellows Of Harvard College | Vaccine compositions for human papillomavirus |
CN1388253A (zh) * | 2001-05-24 | 2003-01-01 | 金车股份有限公司 | 同步鉴别多种人类乳突瘤病毒亚型的试剂盒、方法及组合物 |
CN101116745B (zh) * | 2006-08-04 | 2011-05-11 | 长春百克生物科技股份公司 | 人乳头瘤病毒的病毒样颗粒疫苗 |
CN101481407A (zh) * | 2008-01-07 | 2009-07-15 | 马润林 | 重组人乳头瘤病毒l1衣壳蛋白的修饰序列 |
CN101530614A (zh) * | 2008-03-10 | 2009-09-16 | 北京康乐卫士生物技术有限公司 | 五价重组人乳头瘤病毒疫苗 |
CN102497880A (zh) * | 2009-06-25 | 2012-06-13 | 葛兰素史密丝克莱恩生物有限公司 | 新的人乳头状瘤病毒(hpv)蛋白构建体及其在预防hpv疾病中的用途 |
WO2017092710A1 (zh) * | 2015-12-04 | 2017-06-08 | 厦门大学 | 一种人乳头瘤病毒58型l1蛋白的突变体 |
CN106831959B (zh) * | 2015-12-04 | 2019-11-05 | 厦门大学 | 一种人乳头瘤病毒33型l1蛋白的突变体 |
CN106831960B (zh) * | 2015-12-04 | 2019-11-05 | 厦门大学 | 一种人乳头瘤病毒6型l1蛋白的突变体 |
WO2021013060A1 (zh) * | 2019-07-19 | 2021-01-28 | 神州细胞工程有限公司 | 嵌合的人乳头瘤病毒51型l1蛋白 |
-
2019
- 2019-09-26 BR BR112021005626-2A patent/BR112021005626A2/pt unknown
- 2019-09-26 KR KR1020217012147A patent/KR20210064318A/ko not_active Application Discontinuation
- 2019-09-26 US US17/280,805 patent/US20220001002A1/en active Pending
- 2019-09-26 EP EP19867338.6A patent/EP3858867A4/en active Pending
- 2019-09-26 CN CN201910914458.0A patent/CN110950935A/zh active Pending
- 2019-09-26 JP JP2021517391A patent/JP7290258B2/ja active Active
- 2019-09-26 WO PCT/CN2019/108063 patent/WO2020063724A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
JP7290258B2 (ja) | 2023-06-13 |
US20220001002A1 (en) | 2022-01-06 |
JP2022502057A (ja) | 2022-01-11 |
CN110950935A (zh) | 2020-04-03 |
EP3858867A4 (en) | 2022-06-22 |
WO2020063724A1 (zh) | 2020-04-02 |
EP3858867A1 (en) | 2021-08-04 |
BR112021005626A2 (pt) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10940194B2 (en) | Mutant of L1 protein of human papillomavirus type 58 | |
EP3385274B1 (en) | Mutant of human papillomavirus type 11 l1 protein | |
US11427618B2 (en) | Mutant of L1 protein of human papillomavirus type 39 | |
JP7290258B2 (ja) | ヒトパピローマウイルス51型のl1タンパク質の変異型 | |
JP7224332B2 (ja) | ヒトパピローマウイルス16型のl1タンパク質の変異体 | |
CN110551185A (zh) | 一种人乳头瘤病毒68型l1蛋白的突变体 | |
CN110551184A (zh) | 一种人乳头瘤病毒56型l1蛋白的突变体 | |
US11464846B2 (en) | Mutant of L1 protein of human papillomavirus type 66 | |
US11771754B2 (en) | Mutant of L1 protein of human papillomavirus type 18 | |
CN110551186A (zh) | 一种人乳头瘤病毒45型l1蛋白的突变体 | |
CN110950936B (zh) | 一种人乳头瘤病毒69型l1蛋白的突变体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |