KR102148413B1 - 이종 폴리펩티드를 포함하는 CyaA에 기초한 키메라 단백질 및 면역 반응의 유도에 있어서의 그의 용도 - Google Patents
이종 폴리펩티드를 포함하는 CyaA에 기초한 키메라 단백질 및 면역 반응의 유도에 있어서의 그의 용도 Download PDFInfo
- Publication number
- KR102148413B1 KR102148413B1 KR1020157004541A KR20157004541A KR102148413B1 KR 102148413 B1 KR102148413 B1 KR 102148413B1 KR 1020157004541 A KR1020157004541 A KR 1020157004541A KR 20157004541 A KR20157004541 A KR 20157004541A KR 102148413 B1 KR102148413 B1 KR 102148413B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- protein
- fragment
- residues
- polynucleotide
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 327
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 283
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 264
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 179
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 179
- 230000028993 immune response Effects 0.000 title claims description 44
- 230000006698 induction Effects 0.000 title description 19
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 259
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 259
- 239000002157 polynucleotide Substances 0.000 claims abstract description 259
- 239000000203 mixture Substances 0.000 claims abstract description 37
- 230000000069 prophylactic effect Effects 0.000 claims abstract description 9
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 345
- 102000004169 proteins and genes Human genes 0.000 claims description 335
- 239000012634 fragment Substances 0.000 claims description 327
- 239000000427 antigen Substances 0.000 claims description 197
- 108091007433 antigens Proteins 0.000 claims description 196
- 102000036639 antigens Human genes 0.000 claims description 196
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 159
- 125000003729 nucleotide group Chemical group 0.000 claims description 111
- 239000002773 nucleotide Substances 0.000 claims description 110
- 210000004027 cell Anatomy 0.000 claims description 94
- 239000013598 vector Substances 0.000 claims description 57
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 44
- 241000588832 Bordetella pertussis Species 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 33
- 125000000539 amino acid group Chemical group 0.000 claims description 25
- 230000003068 static effect Effects 0.000 claims description 24
- 230000000890 antigenic effect Effects 0.000 claims description 22
- 239000002671 adjuvant Substances 0.000 claims description 19
- 238000011282 treatment Methods 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 230000001939 inductive effect Effects 0.000 claims description 11
- 241000588807 Bordetella Species 0.000 claims description 10
- 150000001413 amino acids Chemical class 0.000 claims description 10
- 230000001575 pathological effect Effects 0.000 claims description 10
- 238000004113 cell culture Methods 0.000 claims description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 9
- 244000052769 pathogen Species 0.000 claims description 9
- 230000001717 pathogenic effect Effects 0.000 claims description 9
- 201000010099 disease Diseases 0.000 claims description 8
- 208000015181 infectious disease Diseases 0.000 claims description 7
- 108091026890 Coding region Proteins 0.000 claims description 6
- 230000002265 prevention Effects 0.000 claims description 5
- 230000000711 cancerogenic effect Effects 0.000 claims description 4
- 231100000315 carcinogenic Toxicity 0.000 claims description 4
- 238000011321 prophylaxis Methods 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 3
- 238000009169 immunotherapy Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 2
- 239000008194 pharmaceutical composition Substances 0.000 claims 4
- 210000004899 c-terminal region Anatomy 0.000 abstract description 41
- 108010083528 Adenylate Cyclase Toxin Proteins 0.000 abstract description 25
- 235000018102 proteins Nutrition 0.000 description 309
- 208000022361 Human papillomavirus infectious disease Diseases 0.000 description 210
- 230000008696 hypoxemic pulmonary vasoconstriction Effects 0.000 description 208
- 241000699670 Mus sp. Species 0.000 description 69
- 206010028980 Neoplasm Diseases 0.000 description 68
- 241000341655 Human papillomavirus type 16 Species 0.000 description 67
- 230000002378 acidificating effect Effects 0.000 description 49
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 43
- 101000767631 Human papillomavirus type 16 Protein E7 Proteins 0.000 description 37
- 241000282326 Felis catus Species 0.000 description 36
- 238000012217 deletion Methods 0.000 description 34
- 230000037430 deletion Effects 0.000 description 33
- 108010079364 N-glycylalanine Proteins 0.000 description 31
- 108010047495 alanylglycine Proteins 0.000 description 30
- 239000012648 POLY-ICLC Substances 0.000 description 29
- 229940115270 poly iclc Drugs 0.000 description 29
- 108700002563 poly ICLC Proteins 0.000 description 28
- 210000004988 splenocyte Anatomy 0.000 description 28
- 229960005486 vaccine Drugs 0.000 description 28
- 241001465754 Metazoa Species 0.000 description 25
- 210000004898 n-terminal fragment Anatomy 0.000 description 25
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 23
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 22
- 210000000612 antigen-presenting cell Anatomy 0.000 description 22
- 210000004900 c-terminal fragment Anatomy 0.000 description 21
- 108010037850 glycylvaline Proteins 0.000 description 20
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 19
- 108010050848 glycylleucine Proteins 0.000 description 19
- 230000004044 response Effects 0.000 description 19
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 18
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 18
- 102100037850 Interferon gamma Human genes 0.000 description 17
- 108010074328 Interferon-gamma Proteins 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 16
- 238000002255 vaccination Methods 0.000 description 16
- 108010061238 threonyl-glycine Proteins 0.000 description 15
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 14
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 14
- 230000005867 T cell response Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 230000005847 immunogenicity Effects 0.000 description 14
- 210000004881 tumor cell Anatomy 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 13
- 101000622278 Human papillomavirus 52 Protein E7 Proteins 0.000 description 13
- 238000002649 immunization Methods 0.000 description 13
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 12
- 238000011740 C57BL/6 mouse Methods 0.000 description 12
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 12
- 241000699666 Mus <mouse, genus> Species 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 238000000338 in vitro Methods 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 12
- 230000002147 killing effect Effects 0.000 description 12
- JVJGCCBAOOWGEO-RUTPOYCXSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-4-amino-2-[[(2s,3s)-2-[[(2s,3s)-2-[[(2s)-2-azaniumyl-3-hydroxypropanoyl]amino]-3-methylpentanoyl]amino]-3-methylpentanoyl]amino]-4-oxobutanoyl]amino]-3-phenylpropanoyl]amino]-4-carboxylatobutanoyl]amino]-6-azaniumy Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 JVJGCCBAOOWGEO-RUTPOYCXSA-N 0.000 description 11
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 11
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 11
- 101000622270 Human papillomavirus 45 Protein E7 Proteins 0.000 description 11
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 11
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 11
- 239000002253 acid Substances 0.000 description 11
- 108060000200 adenylate cyclase Proteins 0.000 description 11
- 102000030621 adenylate cyclase Human genes 0.000 description 11
- 108010070944 alanylhistidine Proteins 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 11
- 230000003053 immunization Effects 0.000 description 11
- 239000000902 placebo Substances 0.000 description 11
- 229940068196 placebo Drugs 0.000 description 11
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 10
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 10
- 101001005719 Homo sapiens Melanoma-associated antigen 3 Proteins 0.000 description 10
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 10
- 102100025082 Melanoma-associated antigen 3 Human genes 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 9
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- 238000002347 injection Methods 0.000 description 9
- 239000007924 injection Substances 0.000 description 9
- 238000013411 master cell bank Methods 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 8
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 8
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 8
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 8
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 8
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 8
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 8
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 8
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 8
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 8
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- 108010067902 Peptide Library Proteins 0.000 description 8
- 102000002689 Toll-like receptor Human genes 0.000 description 8
- 108020000411 Toll-like receptor Proteins 0.000 description 8
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 8
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 8
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- 108010008355 arginyl-glutamine Proteins 0.000 description 8
- 108010077245 asparaginyl-proline Proteins 0.000 description 8
- 230000003197 catalytic effect Effects 0.000 description 8
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 8
- 108010087823 glycyltyrosine Proteins 0.000 description 8
- 108010040030 histidinoalanine Proteins 0.000 description 8
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 7
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 7
- 108010016626 Dipeptides Proteins 0.000 description 7
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 7
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 7
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 7
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 7
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 7
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 7
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 7
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 7
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 7
- 108010038633 aspartylglutamate Proteins 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 6
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 6
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 6
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 6
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 6
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 6
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 6
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 6
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 6
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 6
- 208000006552 Lewis Lung Carcinoma Diseases 0.000 description 6
- 108010029973 Lymphocytic choriomeningitis virus glycoprotein peptide Proteins 0.000 description 6
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 6
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 6
- 210000005221 acidic domain Anatomy 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 235000018417 cysteine Nutrition 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 6
- 108010000761 leucylarginine Proteins 0.000 description 6
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 6
- 230000003248 secreting effect Effects 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 5
- SSOORFWOBGFTHL-OTEJMHTDSA-N (4S)-5-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[2-[(2S)-2-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S,3S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-5-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-5-amino-1-[[(2S)-5-carbamimidamido-1-[[(2S)-5-carbamimidamido-1-[[(1S)-4-carbamimidamido-1-carboxybutyl]amino]-1-oxopentan-2-yl]amino]-1-oxopentan-2-yl]amino]-1,5-dioxopentan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-1-oxohexan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1,5-dioxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-methyl-1-oxopentan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxopropan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]carbamoyl]pyrrolidin-1-yl]-2-oxoethyl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-4-[[(2S)-2-[[(2S)-2-[[(2S)-2,6-diaminohexanoyl]amino]-3-methylbutanoyl]amino]propanoyl]amino]-5-oxopentanoic acid Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(C)C)C(C)C)C(C)C)C(C)C)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SSOORFWOBGFTHL-OTEJMHTDSA-N 0.000 description 5
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 201000005702 Pertussis Diseases 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 231100000135 cytotoxicity Toxicity 0.000 description 5
- 230000003013 cytotoxicity Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 4
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 4
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 4
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 4
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 4
- PJNSIUPOXFBHDM-GUBZILKMSA-N Ala-Arg-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O PJNSIUPOXFBHDM-GUBZILKMSA-N 0.000 description 4
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 4
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 4
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 4
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 4
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 4
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 4
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 4
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 4
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 4
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 4
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 4
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 4
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 4
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 4
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 4
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 4
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 4
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 4
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 4
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 4
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 4
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 4
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 4
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 4
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 4
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 4
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 4
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 4
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 4
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 4
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 4
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 4
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 4
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 4
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 4
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 4
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 4
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 4
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 4
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 4
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 4
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 4
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 4
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 4
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 4
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 4
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 4
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 4
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 4
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 4
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 4
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 4
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 4
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 4
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 4
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 4
- HTOZUYZQPICRAP-BPUTZDHNSA-N Asp-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N HTOZUYZQPICRAP-BPUTZDHNSA-N 0.000 description 4
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 4
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 4
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 4
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 4
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 4
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 4
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 4
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 4
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 4
- LTARLVHGOGBRHN-AAEUAGOBSA-N Asp-Trp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O LTARLVHGOGBRHN-AAEUAGOBSA-N 0.000 description 4
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 4
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 4
- YTMBNLHIDIKJIU-HCXYKTFWSA-N D-Arginyl-L-arginyl-D-glutaminyl-L-phenylalanine Chemical compound NC(=N)NCCC[C@@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](CCC(O)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YTMBNLHIDIKJIU-HCXYKTFWSA-N 0.000 description 4
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 4
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 4
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 4
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 4
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 4
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 4
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 4
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 4
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 4
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 4
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 4
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 4
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 4
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 4
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 4
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 4
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 4
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 4
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 4
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 4
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 4
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 4
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 4
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 4
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 4
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 4
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 4
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 4
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 4
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 4
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 4
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 4
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 4
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 4
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 4
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 4
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 4
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 4
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 4
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 4
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 4
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 4
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 4
- JKSMZVCGQWVTBW-STQMWFEESA-N Gly-Trp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O JKSMZVCGQWVTBW-STQMWFEESA-N 0.000 description 4
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 4
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 4
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 4
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 4
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 4
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 4
- WZOGEMJIZBNFBK-CIUDSAMLSA-N His-Asp-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WZOGEMJIZBNFBK-CIUDSAMLSA-N 0.000 description 4
- VTMLJMNQHKBPON-QWRGUYRKSA-N His-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 VTMLJMNQHKBPON-QWRGUYRKSA-N 0.000 description 4
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 4
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 4
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 4
- WSXNWASHQNSMRX-GVXVVHGQSA-N His-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSXNWASHQNSMRX-GVXVVHGQSA-N 0.000 description 4
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 4
- 101000767629 Human papillomavirus type 18 Protein E7 Proteins 0.000 description 4
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 4
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 4
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 4
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 4
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 4
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 4
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 4
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 4
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 4
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 4
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 4
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 4
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 4
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 4
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 4
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 4
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 4
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 4
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 4
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 4
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 4
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 4
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 4
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 4
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 4
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 4
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 4
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 4
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 4
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 4
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 4
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 4
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 4
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 4
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 4
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 4
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 4
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 4
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 4
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 4
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 4
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 4
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 4
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 4
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 4
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 4
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 4
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 4
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 4
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 4
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 4
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 4
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 4
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 4
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 4
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 4
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 4
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 4
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 4
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 4
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 4
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 4
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 4
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 4
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 4
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 4
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 4
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 4
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 4
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 4
- 230000024932 T cell mediated immunity Effects 0.000 description 4
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 4
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 4
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 4
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 4
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 4
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 4
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 4
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 4
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 4
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 4
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 4
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 4
- SVGAWGVHFIYAEE-JSGCOSHPSA-N Trp-Gly-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 SVGAWGVHFIYAEE-JSGCOSHPSA-N 0.000 description 4
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 4
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 4
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 4
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 4
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 4
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 4
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 4
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 4
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 4
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 4
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 4
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 4
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 4
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 4
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 4
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 4
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 4
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 4
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 4
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 4
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 4
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 4
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 4
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 4
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 4
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 4
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 4
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 4
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 4
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 4
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 4
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 4
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 4
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 4
- 150000001945 cysteines Chemical class 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 229960002751 imiquimod Drugs 0.000 description 4
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 4
- 230000002163 immunogen Effects 0.000 description 4
- 238000011081 inoculation Methods 0.000 description 4
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 4
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 230000001613 neoplastic effect Effects 0.000 description 4
- 108010084572 phenylalanyl-valine Proteins 0.000 description 4
- 108010018625 phenylalanylarginine Proteins 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- VDABVNMGKGUPEY-UHFFFAOYSA-N 6-carboxyfluorescein succinimidyl ester Chemical compound C=1C(O)=CC=C2C=1OC1=CC(O)=CC=C1C2(C1=C2)OC(=O)C1=CC=C2C(=O)ON1C(=O)CCC1=O VDABVNMGKGUPEY-UHFFFAOYSA-N 0.000 description 3
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 3
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 3
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 3
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 3
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 3
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 3
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 3
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 3
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 3
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 3
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 3
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 3
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 3
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 3
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 3
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 3
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 3
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 3
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 3
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 3
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 3
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 3
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 3
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 3
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 3
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 3
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- TZBJAXGYGSIUHQ-XUXIUFHCSA-N Asp-Leu-Leu-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O TZBJAXGYGSIUHQ-XUXIUFHCSA-N 0.000 description 3
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 3
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 3
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 3
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 3
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 3
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 3
- 102000000584 Calmodulin Human genes 0.000 description 3
- 108010041952 Calmodulin Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 3
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 3
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 3
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 3
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 3
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 3
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 3
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 3
- ZJFNRQHUIHKZJF-GUBZILKMSA-N Glu-His-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ZJFNRQHUIHKZJF-GUBZILKMSA-N 0.000 description 3
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 3
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 3
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 3
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 3
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 3
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 3
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 3
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 3
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 3
- 108010050006 Gly-Asp-Gly-Arg Proteins 0.000 description 3
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 3
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 3
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 3
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 3
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 3
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 3
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 3
- 101000767614 Human papillomavirus 31 Protein E7 Proteins 0.000 description 3
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 3
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 3
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 3
- LNJLOZYNZFGJMM-DEQVHRJGSA-N Ile-His-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N LNJLOZYNZFGJMM-DEQVHRJGSA-N 0.000 description 3
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 3
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 3
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 3
- 102100022338 Integrin alpha-M Human genes 0.000 description 3
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 3
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 3
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 3
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 3
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 3
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 3
- 108010019759 OVA 323-339 Proteins 0.000 description 3
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 3
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 3
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 3
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 3
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 3
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 3
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 3
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 3
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 3
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 3
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 3
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 3
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 3
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 3
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 3
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 3
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 3
- UIDJDMVRDUANDL-BVSLBCMMSA-N Trp-Tyr-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UIDJDMVRDUANDL-BVSLBCMMSA-N 0.000 description 3
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 3
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 3
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 3
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 3
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 3
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 3
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 3
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 3
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 3
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 3
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 3
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010036533 arginylvaline Proteins 0.000 description 3
- 108010066988 asparaginyl-alanyl-glycyl-alanine Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000001363 autoimmune Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 210000000170 cell membrane Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000004207 dermis Anatomy 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 3
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 244000045947 parasite Species 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000009117 preventive therapy Methods 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000037432 silent mutation Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 239000003826 tablet Substances 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 230000004614 tumor growth Effects 0.000 description 3
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 3
- 108010078580 tyrosylleucine Proteins 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 241000228254 Aspergillus restrictus Species 0.000 description 2
- 241000588779 Bordetella bronchiseptica Species 0.000 description 2
- 241001477981 Bordetella hinzii Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 241000606161 Chlamydia Species 0.000 description 2
- 101100449641 Chlorobium chlorochromatii (strain CaD3) hemL gene Proteins 0.000 description 2
- 229940046168 CpG oligodeoxynucleotide Drugs 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 101150066002 GFP gene Proteins 0.000 description 2
- 101000975401 Homo sapiens Inositol 1,4,5-trisphosphate receptor type 3 Proteins 0.000 description 2
- 101000831496 Homo sapiens Toll-like receptor 3 Proteins 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 244000007853 Sarothamnus scoparius Species 0.000 description 2
- 102100024324 Toll-like receptor 3 Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000010933 acylation Effects 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 101150096136 cyaC gene Proteins 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 210000004443 dendritic cell Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000002519 immonomodulatory effect Effects 0.000 description 2
- 230000002434 immunopotentiative effect Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 238000005342 ion exchange Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 231100000590 oncogenic Toxicity 0.000 description 2
- 230000002246 oncogenic effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000026792 palmitoylation Effects 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005748 tumor development Effects 0.000 description 2
- 229940126580 vector vaccine Drugs 0.000 description 2
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- QRXMUCSWCMTJGU-UHFFFAOYSA-N 5-bromo-4-chloro-3-indolyl phosphate Chemical compound C1=C(Br)C(Cl)=C2C(OP(O)(=O)O)=CNC2=C1 QRXMUCSWCMTJGU-UHFFFAOYSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- 102000039506 BAGE family Human genes 0.000 description 1
- 108091067183 BAGE family Proteins 0.000 description 1
- 241000588780 Bordetella parapertussis Species 0.000 description 1
- 101001128989 Bos taurus Neurocalcin-delta Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 1
- 101150020019 CLA4 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 238000011510 Elispot assay Methods 0.000 description 1
- 101710128765 Enhancer of filamentation 1 Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241001665959 Etapapillomavirus Species 0.000 description 1
- 102000040452 GAGE family Human genes 0.000 description 1
- 108091072337 GAGE family Proteins 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- -1 HA 512- 520 Proteins 0.000 description 1
- 102000025850 HLA-A2 Antigen Human genes 0.000 description 1
- 108010074032 HLA-A2 Antigen Proteins 0.000 description 1
- 108010006464 Hemolysin Proteins Proteins 0.000 description 1
- 101000935040 Homo sapiens Integrin beta-2 Proteins 0.000 description 1
- 101000669447 Homo sapiens Toll-like receptor 4 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- 101100540311 Human papillomavirus type 16 E6 gene Proteins 0.000 description 1
- 102100024035 Inositol 1,4,5-trisphosphate receptor type 3 Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 102100025390 Integrin beta-2 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 241001082241 Lythrum hyssopifolia Species 0.000 description 1
- 206010026749 Mania Diseases 0.000 description 1
- 102000000440 Melanoma-associated antigen Human genes 0.000 description 1
- 108050008953 Melanoma-associated antigen Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 101000966481 Mus musculus Dihydrofolate reductase Proteins 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 102100023050 Nuclear factor NF-kappa-B p105 subunit Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241000224016 Plasmodium Species 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- 102100039360 Toll-like receptor 4 Human genes 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 101100127670 Zea mays LA1 gene Proteins 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000007503 antigenic stimulation Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 210000000649 b-lymphocyte subset Anatomy 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000007969 cellular immunity Effects 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000007402 cytotoxic response Effects 0.000 description 1
- 238000002784 cytotoxicity assay Methods 0.000 description 1
- 231100000263 cytotoxicity test Toxicity 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000002500 effect on skin Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000009036 growth inhibition Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000003228 hemolysin Substances 0.000 description 1
- 230000002949 hemolytic effect Effects 0.000 description 1
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 1
- 102000054343 human ITPR3 Human genes 0.000 description 1
- 238000011577 humanized mouse model Methods 0.000 description 1
- 230000008348 humoral response Effects 0.000 description 1
- 239000012729 immediate-release (IR) formulation Substances 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012750 in vivo screening Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 235000014413 iron hydroxide Nutrition 0.000 description 1
- NCNCGGDMXMBVIA-UHFFFAOYSA-L iron(ii) hydroxide Chemical compound [OH-].[OH-].[Fe+2] NCNCGGDMXMBVIA-UHFFFAOYSA-L 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000001821 langerhans cell Anatomy 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 230000005960 long-lasting response Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 231100001083 no cytotoxicity Toxicity 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- VQWNELVFHZRFIB-UHFFFAOYSA-N odn 1826 Chemical compound O=C1NC(=O)C(C)=CN1C(O1)CC(O)C1COP(O)(=O)OC1CC(N2C(NC(=O)C(C)=C2)=O)OC1COP(O)(=O)OC1CC(N2C3=C(C(NC(N)=N3)=O)N=C2)OC1COP(O)(=O)OC1CC(N2C(N=C(N)C=C2)=O)OC1COP(O)(=O)OC1CC(N2C3=NC=NC(N)=C3N=C2)OC1COP(O)(=O)OC1CC(N2C3=C(C(NC(N)=N3)=O)N=C2)OC1COP(O)(=O)OC1CC(N2C(NC(=O)C(C)=C2)=O)OC1COP(O)(=O)OC1CC(N2C(N=C(N)C=C2)=O)OC1COP(O)(=O)OC1CC(N2C(N=C(N)C=C2)=O)OC1COP(O)(=O)OC1CC(N2C(NC(=O)C(C)=C2)=O)OC1COP(O)(=O)OC(C(O1)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(O)=O)CC1N1C=C(C)C(=O)NC1=O VQWNELVFHZRFIB-UHFFFAOYSA-N 0.000 description 1
- DHYWDEXXBWTTEH-UHFFFAOYSA-N odn 2007 Chemical compound O=C1NC(=O)C(C)=CN1C1OC(COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=O)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(O)=O)C(O)C1 DHYWDEXXBWTTEH-UHFFFAOYSA-N 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108700033545 romurtide Proteins 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 239000007939 sustained release tablet Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940125575 vaccine candidate Drugs 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 229960001763 zinc sulfate Drugs 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/0005—Vertebrate antigens
- A61K39/0011—Cancer antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/10—Antimycotics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P33/00—Antiparasitic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/235—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bordetella (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y406/00—Phosphorus-oxygen lyases (4.6)
- C12Y406/01—Phosphorus-oxygen lyases (4.6.1)
- C12Y406/01001—Aodenylate cyclase (4.6.1.1)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/572—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/58—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation
- A61K2039/585—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation wherein the target is cancer
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Oncology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Virology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Communicable Diseases (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 N-말단에서 C-말단으로 (a) 보르데텔라(Bordetella) CyaA 단백질의 N-말단 부분, (b) 이종 폴리펩티드, 및 (c) 보르데텔라 CyaA 단백질의 C-말단 부분을 포함하거나, 이들로 이루어지는 키메라 단백질에 관한 것이다. 또한, 본 발명은 상기 키메라 단백질을 코딩하는 폴리뉴클레오티드 및 보르데텔라 CyaA의 결실된 형태를 코딩하는 폴리뉴클레오티드에 관한 것이다. 본 발명의 하나 이상의 키메라 단백질(들)을 포함하는 조성물 및 상기 조성물의 예방 및/또는 치료 용도 또한 본 발명의 일부분이다.
Description
본 발명은 N-말단에서 C-말단으로 (a) 보르데텔라(Bordetella) CyaA 단백질의 N-말단 부분, (b) 이종 폴리펩티드, 및 (c) 보르데텔라 CyaA 단백질의 C-말단 부분을 포함하거나, 이들로 이루어지는 키메라 단백질에 관한 것이다. 또한, 본 발명은 상기 키메라 단백질을 코딩하는 폴리뉴클레오티드 및 보르데텔라 CyaA의 결실된 형태를 코딩하는 폴리뉴클레오티드에 관한 것이다. 본 발명의 하나 이상의 키메라 단백질(들)을 포함하는 조성물 및 상기 조성물의 예방 및/또는 치료 용도 또한 본 발명의 일부분이다.
보르데텔라 형, 특히 보르데텔라 페르투시스(Bordetella pertussis)의 아데닐레이트 사이클라아제(CyaA)는 항원과 같은 폴리펩티드를 항원 제시 세포(APC)의 세포 기질(cytosol)로 효율적으로 전달할 수 있는 재조합 벡터로서 광범위하게 개시되어 왔다([1], [2], [3]). 또한, 재조합 CyaA는 종양을 가진 마우스를 효과적으로 치료하는데 사용되었다([4], [5], [6]).
여러 저자는 CyaA(벡터로 사용된)에 의한 폴리펩티드 전달, 특히 항원 전달 효율이 삽입된 폴리펩티드(항원)의 정전하 및 그의 형태에 따라 양성적으로 음성적으로 영향을 받을 수 있다는 것을 강조하였다. 1998년에, 카리모바 등(Karimova & al)은 CyaA에 삽입된 CD8+ T-세포 폴리펩티드 에피토프의 항원 제시 세포까지 및 세포 안으로의 전달이 삽입된 에피토프의 정전하에 의존적이라는 것[7]; OVA 에피토프를 포함하는 재조합 CyaA는 APC 내로 이동하여 생체 내 CTL 반응을 유도할 수 있었던 반면, 4개의 글루타민 잔기가 융합된 OVA 에피토프를 갖는 동일한 구조물은 이동할 수 없었고, 생체 내 세포독성 T-세포 림프구(CTL) 반응을 검출할 수 있을 정도로 유도하지 않았다는 것을 개시하였다. 2012년에, 홀루보바 등(Holubova et al.)은 CyaA에 기초한의 여러 가지 구조물인 OVA 에피토프 SIINFEKL을 포함하는 N-말단 내 결실된 CyaA 단백질, 또는 N-말단 도메인이 절단되고(truncated) 상이한 부위들에 삽입된 여러 에피토프를 포함하는 CyaA 단백질을 개시하였다[25]. 홀루보바 등은 그들의 실험이 합성의 큰 CTL 폴리에피토프로 대체된 전체 AC 도메인을 갖는 CyaA에 기초한 항원 전달체를 제작하기 위한 개념을 증명한다고 결론내렸다.
2001년에, 그미로 등(Gmira & al.)은 CyaA 촉매 도메인 내에 삽입된 외인성 폴리펩티드 또는 항원을 갖는 재조합 CyaA의 제작을 용이하게 하는 새로운 벡터 CyaA를 개발하였다[8]. 이들 변형은 다음과 같다.
- 새로운 고유 제한 부위를 갖는 다중클로닝 부위 서열을 코돈 224 하류에 삽입;
- 코돈 225 내지 234의 결실; 및
- 코돈 236, 238 및 239의 변경; 이들 변형이 도입되어 국소 정전하(산성 감소)를 증가시켰으며, 이것은 제자리(in situ) APC의 세포막을 가로질러 CyaA 항원 혼성 단백질을 이동시키는 데 중요한 것으로 앞서 밝혀졌다.
변형된 CyaA는 야생형 CyaA와 유사한 침습성을 갖는다.
저자들은 87 내지 206개 잔기 크기를 가지며, -4 내지 +14의 정전하를 갖는 5가지 항원을 시험하여, 산성 값을 갖는 항원들이 이동 효율을 잃는다는 것을 보였으며, 이는 카리모바 등의 앞선 결과를 뒷받침해준다. 또한, 그들은 내부 디설파이드 브리지 또는 복잡한 구조의 항원을 갖는 CyaA를 시험하였다. 이들은 모두 표적 세포로 이동할 수 없었으며, 이는 CyaA의 촉매 도메인에 삽입된 폴리펩티드가 이동되기 위해서는 풀려(unfolding)야만 한다는 이론을 지지해준다.
참고 | rCyaA | 항원 이름/기원 |
항원 크기
(aa) |
항원
정전하 (R/K-D/E) |
활성
(+ 또는 -) |
그미로
등
( Gmira et al., 2001) |
CyaA | 없음 | NA | NA | + |
CyaA-Neuro | 소 뉴로칼신 δ | 192 | -6 | - | |
CyaA-Rest | 아스퍼질러스 레스트릭투스 ( Aspergillus restrictus) 리스트릭토신 |
148 | 5 | + | |
CyaA-DHFR | 마우스 디히드로폴레이트 리덕타아제 |
187 | 7 | + | |
CyaA-Tat | Tat HIV | 87 | 14 | + | |
CyaA-Nef | Nef HIV | 206 | -4 | - | |
카리모바
등
( Karimova et al., 1998) |
CyaA-Ova21 | Ova I형 에피토프 | 8 | 0 | + |
CyaA-Ova21-4E | Ova I형 에피토프 + 4 글루타민산 |
12 | -4 | - |
문헌 [7] 및 [8]에서 발췌. 산성 전하를 갖는 삽입물은 APC의 세포 기질로 이동되지 않는다. 산성 전하는 Lys 및 Arg 잔기 개수에서 Asp 및 Glu 잔기 개수를 빼서 계산한다.
종양 퇴행 분석(tumor regression assay)의 경우에 사용되는 항원은 짧은 크기(OVA는 8개 잔기 길이)이거나[4] 그들의 2차 구조가 항원 세그먼트의 내부 재배열에 의해 파괴되며 최대 크기 103개 잔기를 갖는다[5].
상기 연구들로부터, CyaA 벡터에 의한 벡터 작용 효율을 향상시키기 위한 하기 결론을 내렸다:
- CyaA에 삽입되는 폴리펩티드 내에 산성 영역이 포함되어 것은 피해야 한다; 그리고
- 상기 삽입물에 2차 및 3차 구조가 포함되는 것은 피해야 한다. 왜냐하면, 이러한 구조는 폴리펩티드가 삽입되는 효소 아데닐레이트 사이클라아제(AC) 도메인의 적합한 내재화를 방해하기 때문이다.
상기 결론을 고려하여, 두 가지 재조합 CyaA, 즉 HPV16 E7 항원을 포함하는 것과 HPV18 E7 항원을 포함하는 것을 제작하였다. 또한, HPV16 및 HPV18 E7 항원이 함께 삽입된 2가 재조합 CyaA도 제작하였다(특허 EP1576967; 프레빌 등(Preville et al.)). 그러나, 2개보다 많은 HPV E7 단백질이 동일한 CyaA 벡터에 삽입된 재조합 CyaA를 이용한 분석은 보고되지 않았다.
따라서, 프레빌 등은 HPV16 형의 E7 폴리펩티드 또는 그의 변이체가 삽입되어진 세가지 재조합 CyaA 벡터를 개시한다.
- 전장의 E7 단백질을 포함하는 CyaA-E7full 벡터
- aa 30 내지 42의 산성 도메인이 결실된 E7 단편을 포함하는 CyaA-E7△30-42 벡터,
- E7에 존재하는 마우스 H-2Db-제한된 T 세포 에피토프를 포함하는 CyaA-E749-57 벡터.
상기 재조합 CyaA 벡터는 마우스를 면역화하고 E7-특이적 CTL 반응을 검출하는 데 사용하였다. 마우스 면역화 후 면역 반응을 측정하기 위하여, CTL 크롬 방출 분석법을 실시하였다. 생체 내 동물 실험에서, CyaA-E7△30-42 및 CyaA-E7full는 CyaA-E749-57 와 비교하여 가장 효율적인 CTL 면역 반응을 나타냈다.
또한, 상기 재조합 CyaA 벡터가 종양 퇴행을 유도하는 능력을 평가하였다. CyaA- E749-57 및 CyaA-E7full 에 의해 부여된 종양 퇴행률이 현저하게 구별될 수는 없지만, CyaA-E7△30-42는 종양 퇴행 및 성장 억제 면에서 확실히 우수하였다. 따라서, C57BL/6 마우스에서 인식되는 것으로 밝혀진 단일 CTL 에피토프가 효율적이라는 것이 입증되었으나 가장 최적의 면역 반응을 주지는 못하였다.
이어서, 면역 반응의 지속성을 검사하였다. 3개월 후에 생존한 일부 마우스의 비장세포는 E7 항원을 발현하는 TC-1 세포를 용해시키는 능력에 대해 검사하였고, 생존한 나머지 동물은 백신접종 후 100일에 TC-1 세포로 재접종하였다. CyaA-E7△30-42 로 백신접종된 동물은 높은 수준의 방어를 나타내었다. CyaA-E749- 57 로 백신접종된 동물의 40% 미만이 방어되었지만, CyaA-E7△30- 42 및 CyaA-E7full 로 백신접종된 동물의 90 내지 100%가 생존하였다.
상기 연구로부터 다음 교시를 얻을 수 있다:
- HPV16 및/또는 HPV18 E7 단백질을 운반하는 CyaA 벡터는 C57BL/6 마우스에서 면역 반응을 유도한다;
- CD8+ T 세포 에피토프만을 갖는 E749-57 에피토프와 비교하여, CD8+ 및 CD4+ T 세포 에피토프 모두를 갖는 항원으로 완전한 반응을 얻는다;
- CyaA-E7full 또는 CyaA-E749-57로 처리된 마우스와 비교하여, E7 단백질에서 잔기 30 내지 42의 산성 영역이 결실된 CyaA-E7△30-42 벡터로 처리된 마우스에서 우수한 효율을 얻는다;
- 상기 벡터로 얻어진 면역 반응은 종양 병변의 퇴행을 유도할 수 있다;
- 처리된 무종양 마우스에서 TC-1 세포로 새로운 접종이 거부되었기 때문에 오래 지속적인 반응이 얻어진다; 그리고
- 2가 치료법을 개발하기 위해 두 가지 재조합 CyaA의 동시 주입이 가능하며, 각 항원은 그의 에피토프 각각에 반응을 유지한다.
따라서, 선행 기술에서, 산성 아미노산 스트레치가 포함된 특정 폴리펩티드 또는 항원, 및 전체적으로 음의 정전하를 띠는 폴리펩티드 또는 항원은 백신접종된 동물에서 이들 폴리펩티드를 APC 세포막을 가로질러 이동시키는 CyaA 벡터의 효율을 변화시킨다는 것을 보였다. 이로 인해 상기 항원에 대해 약한 세포 면역 반응을 일으키거나 방어 세포 면역 반응을 일으키지 못한다.
발명자들은 이러한 산성 아미노산 서열이 방어 세포 면역을 위해 요구되는 중요한 CD4+ 에피토프 및/또는 CD8+ 에피토프를 포함할 수 있기 때문에, 이것이 약물 후보 설계를 위한 문제점으로 간주될 수 있다고 생각한다.
따라서, 산성 아미노산 스트레치를 갖는 폴리펩티드 및 항원 및 전체적으로 음의 정전하를 띠는 폴리펩티드 또는 항원에 대하여, 특히 종양 퇴행 및 종양 예방에 있어, 강력하고 오래 지속되는 세포의 방어 면역 반응을 유발하기 위해 사용될 수 있는 면역원성 구조를 갖는 향상된 벡터가 여전히 요구되고 있다.
도 1: (A) CyaA-HPV16E7△30-42에 적절한 제한 부위 및 삽입된 서열이 나타내어진 pKTRACE5-HPV16E7△30-42의 개략적인 지도; (B) CyaA-HPV18E7△32-42에 적절한 제한 부위 및 삽입된 서열이 나타내어진 pKTRACE5-HPV18E7△32-42의 개략적인 지도
도 2: gtCyaA 단백질 및 gtCyaA 변이체의 설계. aa(잔기) 1 내지 400, 촉매 도메인(AC); aa 401 내지 1706, 용혈 도메인. 촉매 도메인 내에 세 개의 투명한 박스는 CyaA 활성에 필수적인 세 개의 영역을 나타낸다([15], [16], [1]): ATP와의 상호작용에 관련된 도메인 I(aa 54-77), Mg2+-ATP와의 상호작용에 관련된 도메인 II(aa 184-198) 및 칼모듈린(CaM)과의 상호작용에 관련된 도메인 III(aa 287-318). gtCyaAd93은 93개 aa(228-320)가 결실된 gtCyaA 서열에 대응한다. gtCyaAd203은 203개 aa(184 내지 386)가 결실된 gtCyaA 서열에 대응한다.
도 3: (A) IPTG 유도성 프로모터 하에 gtCyaAd93-pep216 폴리뉴클레오티드 및 cyaC 최적화 유전자를 포함하는 pGTPc608 벡터의 개략적인 지도; (B) IPTG 유도성 프로모터 하에 gtCyaAd203-pep216 폴리뉴클레오티드 및 cyaC 최적화 유전자를 포함하는 pGTPc608 벡터의 개략적인 지도.
도 4: CyaAd203-pep105 플라스미드 그래픽 지도. Pep105는 EcoRI과 XmaI 제한 부위 사이에 클로닝되었다.
도 5: 플라시보, 프로서빅스(Procervix) 또는 CyaAd203-PEP105로 면역화 후 7일에 측정된 HPV16 E749-57, HPV18 E7AS43 -49 및 OVA257 -264의 빈도 및 특이적 CD8+ T 림프구의 빈도, 및 HPV16 E7(#116-2/3) 및 HPV18 E7(#171-1/2/3) 특이적 T 림프구의 빈도. 전체 비장세포 백 만개 당 사건의 수를 나타낸다. 전체 비장세포는 왼쪽에서 오른쪽으로 배지(대조군), MHC I형 제한된 펩티드 HPV16 E749-57, HPV18 E7AS43 -49, OVA257-264, #116-2/3 펩티드 뱅크 및 #171-1/2/3 펩티드 뱅크로 37℃, 5% CO2에서 20 시간 동안 재자극하였다.
도 6: 플라시보, 프로서빅스 또는 CyaAd203-PEP105로 면역화 후 7일에 측정된 LCMV GP33-41, OVA323 -339, MOG35 -55 및 MAGEA3 특이적 T 림프구의 빈도; 전체 비장세포 백 만개 당 사건의 수를 나타낸다. 전체 비장세포는 왼쪽에서 오른쪽으로 배지(대조군), LCMV GP33-41, OVA323 - 339 , MOG35 -55 펩티드, His태그 MAGE-A3 단백질로 재자극하거나, B16 종양 세포주 B16-GFP 이어서 APC로서 사용된 B16-MAGEA3-GFP로 재자극하였다. 모두 37℃, 5% CO2에서 20시간 동안 재자극하였다.
도 7: (A) HPV16, 18 및 45 E7 단백질 서열의 정렬; 검정 박스: pRB 결합 모티프; 회색 박스: 아연 핑거 루프(finger loop)와 관련된 시스테인; 검정 화살표는 산성 영역을 강조 표시한다 (B) HPV31, 33, 52 및 58 단백질 서열의 정렬; 검정 박스: LXCXE 모티프; 초록 박스: 아연 핑거 루프와 관련된 시스테인; 점선 박스: HPV52 E7 서열의 경우, 자가 면역 에피토프의 위치.
도 8: (A) 3가 후보 백신 항원 (B) 4가 후보 백신의 재배열된(reshuffled) 항원 서열(N-ter: E7 단백질의 N-말단 부분 ; C-ter: E7 단백질의 C-말단 부분).
도 9: IPTG로 3시간 유도 후 단백질 발현 프로파일(I0: 유도 전; I3: 유도 후)
도 10: 면역화 후 7일에 측정된 HPV16 E749-57 및 HPV18 E7AS43 -49 특이적 CD8+ T 림프구의 빈도; 전체 비장세포는 MHC I형-제한된 펩티드로 재자극하였다. 결과는 전체 비장세포 백 만개 당 IFN-γ를 분비한 세포 수로 나타낸다.
도 11: 면역화 후 7일에 측정된 HPV45 E7 특이적 IFN-γ 분비 T 림프구의 빈도; 전체 비장세포는 HPV45 E7 전체 펩티드 서열을 포함시키는 15-mers 오버랩핑 펩티드(서브풀 1: #218-1, 서브풀 2: #218-2, 서브풀 3: #218-3)로 재자극하였다. 결과는 전체 비장세포 백 만개 당 IFN-γ를 분비한 세포 수로 나타낸다.
도 12: 3가 후보를 이용한 생체 내 살해 분석(Btpr_114, Btpr115 & BTpr_117); 왼쪽 패널: HPV18 E7 펩티드 라이브러리 #171-1 및 #171-2로 로딩된(loaded) 비장세포의 생체 내 살해율; 오른쪽 패널: HPV45 E7 펩티드 라이브러리 #218-3로 로딩된 비장세포의 생체 내 살해율.
도 13: HPV16 E7 항원을 포함하는 폴리-ICLC-애쥬번티드(adjuvanted) CyaA-후보 백신에 의한 치료 백신접종은 TC-1 유도된 고형성 종양 제거를 유발하였다; (A) 백신접종 계획: 0일에 모든 마우스 오른쪽 옆구리에 TC-1 종양 세포를 접종하였다; 이들은 11일에 백신 처리하였다. (B) 60일까지 종양 성장의 모니터링.
도 14: TC-1 종양 세포주를 제거한 마우스의 LL2-HPV18 E7 세포주 또는 LL2-GFP 세포주의 성장에 대한 예방적 방어 (A) 백신 접종 계획: 65일에 TC-1 종양을 제거한 마우스를 2개의 서브군으로 나누고 LL2-HPV18 E7 세포주 또는 대조군 LLP-GFP 세포주로 접종하였다. (B) 110일까지 종양 성장의 모니터링.
도 15: 면역화 후 7일에 측정된 HPV16 E7, HPV18 E7 및 HPV52 E7 특이적 T 림프구의 빈도. 전체 비장세포는 HPV16, HPV18 및 HPV52 E7 단백질 서열을 포함시키는 15-mers 오버랩핑 펩티드로 재자극하였다. 펩티드의 서브풀은 정사각형으로 표시하였다. 결과는 전체 비장세포 백 만개 당 IFN-γ 스폿 형성 세포(sfc)의 수로 나타내었다. HPV18 E7 sfc는 너무 많아 셀 수 없었다(TNTC).
도 16 (A, B, C 및 D): 면역화 후 7일에 측정된 IFN-γ 분비 HPV16 E7, HPV18 E7, HPV33 E7 및 HPV52 E7 특이적 T 림프구의 빈도. 전체 비장세포는 HPV16, HPV18, HPV33 및 HPV52 E7 전체 펩티드 서열을 포함시키는 15-mers 오버랩핑 펩티드(각 펩티드 뱅크는 E7 단백질의 N-말단에서 C-말단까지 서브풀로 세분된다(히스토그램 범례에 표시된 바와 같이))로 재자극하였다. 결과는 전체 비장세포 백만 개 당 IFN-γ 스폿 형성 세포(sfc)의 수로 나타내었다.
도 17 (A 및 B): 7가 후보 백신으로 유도된, HPV16 E7 펩티드 라이브러리(도 17-A) 또는 HPV18 E7 펩티드 라이브러리(도 17-B)로 각각 로딩된 세포의 E7 특이적 살해.
도 2: gtCyaA 단백질 및 gtCyaA 변이체의 설계. aa(잔기) 1 내지 400, 촉매 도메인(AC); aa 401 내지 1706, 용혈 도메인. 촉매 도메인 내에 세 개의 투명한 박스는 CyaA 활성에 필수적인 세 개의 영역을 나타낸다([15], [16], [1]): ATP와의 상호작용에 관련된 도메인 I(aa 54-77), Mg2+-ATP와의 상호작용에 관련된 도메인 II(aa 184-198) 및 칼모듈린(CaM)과의 상호작용에 관련된 도메인 III(aa 287-318). gtCyaAd93은 93개 aa(228-320)가 결실된 gtCyaA 서열에 대응한다. gtCyaAd203은 203개 aa(184 내지 386)가 결실된 gtCyaA 서열에 대응한다.
도 3: (A) IPTG 유도성 프로모터 하에 gtCyaAd93-pep216 폴리뉴클레오티드 및 cyaC 최적화 유전자를 포함하는 pGTPc608 벡터의 개략적인 지도; (B) IPTG 유도성 프로모터 하에 gtCyaAd203-pep216 폴리뉴클레오티드 및 cyaC 최적화 유전자를 포함하는 pGTPc608 벡터의 개략적인 지도.
도 4: CyaAd203-pep105 플라스미드 그래픽 지도. Pep105는 EcoRI과 XmaI 제한 부위 사이에 클로닝되었다.
도 5: 플라시보, 프로서빅스(Procervix) 또는 CyaAd203-PEP105로 면역화 후 7일에 측정된 HPV16 E749-57, HPV18 E7AS43 -49 및 OVA257 -264의 빈도 및 특이적 CD8+ T 림프구의 빈도, 및 HPV16 E7(#116-2/3) 및 HPV18 E7(#171-1/2/3) 특이적 T 림프구의 빈도. 전체 비장세포 백 만개 당 사건의 수를 나타낸다. 전체 비장세포는 왼쪽에서 오른쪽으로 배지(대조군), MHC I형 제한된 펩티드 HPV16 E749-57, HPV18 E7AS43 -49, OVA257-264, #116-2/3 펩티드 뱅크 및 #171-1/2/3 펩티드 뱅크로 37℃, 5% CO2에서 20 시간 동안 재자극하였다.
도 6: 플라시보, 프로서빅스 또는 CyaAd203-PEP105로 면역화 후 7일에 측정된 LCMV GP33-41, OVA323 -339, MOG35 -55 및 MAGEA3 특이적 T 림프구의 빈도; 전체 비장세포 백 만개 당 사건의 수를 나타낸다. 전체 비장세포는 왼쪽에서 오른쪽으로 배지(대조군), LCMV GP33-41, OVA323 - 339 , MOG35 -55 펩티드, His태그 MAGE-A3 단백질로 재자극하거나, B16 종양 세포주 B16-GFP 이어서 APC로서 사용된 B16-MAGEA3-GFP로 재자극하였다. 모두 37℃, 5% CO2에서 20시간 동안 재자극하였다.
도 7: (A) HPV16, 18 및 45 E7 단백질 서열의 정렬; 검정 박스: pRB 결합 모티프; 회색 박스: 아연 핑거 루프(finger loop)와 관련된 시스테인; 검정 화살표는 산성 영역을 강조 표시한다 (B) HPV31, 33, 52 및 58 단백질 서열의 정렬; 검정 박스: LXCXE 모티프; 초록 박스: 아연 핑거 루프와 관련된 시스테인; 점선 박스: HPV52 E7 서열의 경우, 자가 면역 에피토프의 위치.
도 8: (A) 3가 후보 백신 항원 (B) 4가 후보 백신의 재배열된(reshuffled) 항원 서열(N-ter: E7 단백질의 N-말단 부분 ; C-ter: E7 단백질의 C-말단 부분).
도 9: IPTG로 3시간 유도 후 단백질 발현 프로파일(I0: 유도 전; I3: 유도 후)
도 10: 면역화 후 7일에 측정된 HPV16 E749-57 및 HPV18 E7AS43 -49 특이적 CD8+ T 림프구의 빈도; 전체 비장세포는 MHC I형-제한된 펩티드로 재자극하였다. 결과는 전체 비장세포 백 만개 당 IFN-γ를 분비한 세포 수로 나타낸다.
도 11: 면역화 후 7일에 측정된 HPV45 E7 특이적 IFN-γ 분비 T 림프구의 빈도; 전체 비장세포는 HPV45 E7 전체 펩티드 서열을 포함시키는 15-mers 오버랩핑 펩티드(서브풀 1: #218-1, 서브풀 2: #218-2, 서브풀 3: #218-3)로 재자극하였다. 결과는 전체 비장세포 백 만개 당 IFN-γ를 분비한 세포 수로 나타낸다.
도 12: 3가 후보를 이용한 생체 내 살해 분석(Btpr_114, Btpr115 & BTpr_117); 왼쪽 패널: HPV18 E7 펩티드 라이브러리 #171-1 및 #171-2로 로딩된(loaded) 비장세포의 생체 내 살해율; 오른쪽 패널: HPV45 E7 펩티드 라이브러리 #218-3로 로딩된 비장세포의 생체 내 살해율.
도 13: HPV16 E7 항원을 포함하는 폴리-ICLC-애쥬번티드(adjuvanted) CyaA-후보 백신에 의한 치료 백신접종은 TC-1 유도된 고형성 종양 제거를 유발하였다; (A) 백신접종 계획: 0일에 모든 마우스 오른쪽 옆구리에 TC-1 종양 세포를 접종하였다; 이들은 11일에 백신 처리하였다. (B) 60일까지 종양 성장의 모니터링.
도 14: TC-1 종양 세포주를 제거한 마우스의 LL2-HPV18 E7 세포주 또는 LL2-GFP 세포주의 성장에 대한 예방적 방어 (A) 백신 접종 계획: 65일에 TC-1 종양을 제거한 마우스를 2개의 서브군으로 나누고 LL2-HPV18 E7 세포주 또는 대조군 LLP-GFP 세포주로 접종하였다. (B) 110일까지 종양 성장의 모니터링.
도 15: 면역화 후 7일에 측정된 HPV16 E7, HPV18 E7 및 HPV52 E7 특이적 T 림프구의 빈도. 전체 비장세포는 HPV16, HPV18 및 HPV52 E7 단백질 서열을 포함시키는 15-mers 오버랩핑 펩티드로 재자극하였다. 펩티드의 서브풀은 정사각형으로 표시하였다. 결과는 전체 비장세포 백 만개 당 IFN-γ 스폿 형성 세포(sfc)의 수로 나타내었다. HPV18 E7 sfc는 너무 많아 셀 수 없었다(TNTC).
도 16 (A, B, C 및 D): 면역화 후 7일에 측정된 IFN-γ 분비 HPV16 E7, HPV18 E7, HPV33 E7 및 HPV52 E7 특이적 T 림프구의 빈도. 전체 비장세포는 HPV16, HPV18, HPV33 및 HPV52 E7 전체 펩티드 서열을 포함시키는 15-mers 오버랩핑 펩티드(각 펩티드 뱅크는 E7 단백질의 N-말단에서 C-말단까지 서브풀로 세분된다(히스토그램 범례에 표시된 바와 같이))로 재자극하였다. 결과는 전체 비장세포 백만 개 당 IFN-γ 스폿 형성 세포(sfc)의 수로 나타내었다.
도 17 (A 및 B): 7가 후보 백신으로 유도된, HPV16 E7 펩티드 라이브러리(도 17-A) 또는 HPV18 E7 펩티드 라이브러리(도 17-B)로 각각 로딩된 세포의 E7 특이적 살해.
본 발명자들은 새로운 CyaA 벡터로서, 야생형 CyaA의 아데닐레이트 사이클라아제(AC) 도메인 내에 결실되고, 거대한 크기(441개까지의 아미노산 잔기로 예시되나 이에 제한되지는 않음) 및/또는 산성 전하(-46까지)를 나타내는 매우 높은 음전하를 띠는 항원이 삽입된 CyaA 벡터를 개발하였다. 상기 구조물의 특이적 CD8+ 및 CD4+ T-세포 반응 및 세포독성을 유도하는 능력뿐 아니라 종양 거부를 유도하는 능력을 시험하였다. 놀랍게도, 상기 새로운 CyaA 벡터는 높은 음전하를 갖는 항원을 표적 세포로 운반을 가능하게 한다는 것을 보여 주었다. 게다가, 산성 도메인을 갖는 항원은 상기 새로운 벡터에 삽입되어 질 때, 엄격한 조건하에서 수행되는 세포독성 분석에서 상기 산성 도메인이 제거된 동일한 항원에 비해 더 효율적이었다.
본 발명은 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드로서, 상기 CyaA 유래 단백질은 1) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질 단편으로서, 상기 단편 서열이 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는(즉, 위치 182 와 228 사이) 것인 단편과 융합된 2) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질 단편으로서, 상기 단편 서열이 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하고(즉, 위치 320과 388 사이) 서열 번호 2의 마지막 잔기로 끝나는 것인 단편을 포함하거나 이들로 이루어지는 것인 폴리뉴클레오티드에 관한 것이다.
서열 번호 2는 보르데텔라 페르투시스의 야생형 CyaA 단백질의 아미노산 서열을 나타낸다. 서열 번호 2에 개시된 CyaA를 코딩하는 폴리뉴클레오티드의 특정 실시양태는 서열 번호 1에 개시되어 있다. 서열 번호 2에 개시된 CyaA를 코딩하는 폴리뉴클레오티드의 또 다른 특정 실시양태는 사일런트 뉴클레오티드 돌연변이에 의해, 즉, 서열 번호 2의 아미노산에 변화를 가져오지 않는 변형에 의해, 서열 번호 1의 변형된 형태이다. 서열 번호 1의 변형된 특정 형태는 서열 번호 69에 개시된 이. 콜라이(E. coli) 발현에 최적화된 서열이다. 서열 번호 69는 본 발명의 일부분이다. 본 발명 내에, 본 발명의 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드는 서열 번호 2를 코딩하는 폴리뉴클레오티드를 코딩하거나 포함하지 않는다. 게다가, 본 발명의 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드는 서열 번호 1을 포함하거나, 이로 이루어지지 않는다.
본 발명의 상기 폴리뉴클레오티드로부터 얻을 수 있는 결과로 생성된 본 발명의 CyaA 유래 단백질은 서로 융합되거나 재조합된 동일한 보르데텔라 CyaA 단백질의 두 개의 단편을 포함하거나 이들로 이루어진다. "단편"은 야생형 보르데텔라 CyaA 단백질의 서열에서 발견되는 연속된 아미노산 잔기의 스트레치 또는 연쇄(concatenation)를 의미한다.
첫 번째 단편(CyaA 유래 폴리펩티드의 N-말단 부분)은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝난다.
상기 첫 번째 단편은 183 내지 227개 잔기 범위의 크기, 즉, 183개 잔기 이상 227개 잔기 이하의 길이이다. 특정 실시양태에서, 상기 단편은 183개 이상, 190개 이상, 200개 이상, 210개 이상, 또는 220개 이상이다. 특정 실시양태에서, 상기 첫 번째 단편의 크기는 183개 잔기 또는 227개 잔기이다.
따라서, 상기 단편은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 잔기 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226 및 227로 이루어지는 군으로부터 선택된 잔기로 끝난다.
다시 말해서, 상기 첫 번째 단편은 서열 번호 2의 잔기 1-183, 1-184, 1-185, 1-186, 1-187, 1-188, 1-189, 1-190, 1-191, 1-192, 1-193, 1-194, 1-195, 1-196, 1-197, 1-198, 1-199, 1-200, 1-201, 1-202, 1-203, 1-204, 1-205, 1-206, 1-207, 1-208, 1-209, 1-210, 1-211, 1-212, 1-213, 1-214, 1-215, 1-216, 1-217, 1-218, 1-219, 1-220, 1-221, 1-222, 1-223, 1-224, 1-225, 1-226 및 1-227로 이루어지는 군으로부터 선택된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 상기 첫 번째 단편은 서열 번호 2의 잔기 1 내지 227 또는 서열 번호 2의 잔기 1 내지 183을 포함하거나 이들로 이루어진다.
특정 실시양태에서, 상기 첫 번째 단편을 코딩하는 폴리뉴클레오티드는, 상기 뉴클레오티드 단편이 3의 배수라서, 서열 번호 1 또는 서열 번호 69의 첫 번째 뉴클레오티드로 시작하고, 서열 번호 1 또는 서열 번호 69의 위치 549에서 위치 681에 위치하는 뉴클레오티드로 끝난다. 따라서, 상기 단편을 코딩하는 폴리뉴클레오티드는 서열 번호 1 또는 서열 번호 69의 잔기 1-549, 1-552, 1-555, 1-558, 1-561, 1-564, 1-567, 1-570, 1-573, 1-576, 1-579, 1-582, 1-585, 1-588, 1-591, 1-594, 1-597, 1-600, 1-603, 1-606, 1-609, 1-612, 1-615, 1-618, 1-621, 1-624, 1-627, 1-630, 1-633, 1-636, 1-639, 1-642, 1-645, 1-648, 1-651, 1-654, 1-657, 1-660, 1-663, 1- 666, 1-669, 1-672, 1-675, 1-678 및 1-681로 이루어지는 군으로부터 선택된 서열을 포함하거나 이로 이루어진다.
두 번째 단편(CyaA 유래 폴리펩티드의 C-말단 부분)은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝난다.
상기 두 번째 단편은 1320 내지 1386개 잔기 범위의 크기, 즉, 1320개 잔기 이상 1386개 잔기 이하의 길이이다. 특정 실시양태에서, 상기 단편은 1320개 이상, 1330개 이상, 1340개 이상, 1350개 이상, 1360개 이상, 1370개 이상, 또는 1380개 이상이다. 특정 실시양태에서, 상기 두 번째 단편의 크기는 1320개 잔기 또는 1386개 잔기이다.
따라서, 상기 두 번째 단편은 서열 번호 2의 잔기 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386 및 387로 이루어지는 군으로부터 선택된 잔기로 시작하여 서열 번호 2의 마지막 잔기(즉, 잔기 1706)로 끝난다.
다시 말해서, 두 번째 단편은 서열 번호 2의 잔기 321-1706, 322-1706, 323-1706, 324-1706, 325-1706, 326-1706, 327-1706, 328-1706, 329-1706, 330-1706, 331-1706, 332-1706, 333-1706, 334-1706, 335-1706, 336-1706, 337-1706, 338-1706, 339-1706, 340-1706, 341-1706, 342-1706, 343-1706, 344-1706, 345-1706, 346-1706, 347-1706, 348-1706, 349-1706, 350-1706, 351-1706, 352-1706, 353-1706, 354-1706, 355-1706, 356-1706, 357-1706, 358-1706, 359-1706, 360-1706, 361-1706, 362-1706, 363-1706, 364-1706, 365-1706, 366-1706, 367-1706, 368-1706, 369-1706, 370-1706, 371-1706, 372-1706, 373-1706, 374-1706, 375-1706, 376-1706, 377-1706, 378-1706, 379-1706, 380-1706, 381-1706, 382-1706, 383-1706, 384-1706, 385-1706, 386-1706 및 387-1706으로 이루어지는 군으로부터 선택된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 상기 두 번째 단편은 서열 번호 2의 잔기 321 내지 1706 또는 서열 번호 2의 잔기 387 내지 1076을 포함하거나 이들로 이루어진다.
특정 실시양태에서, 상기 두 번째 단편을 코딩하는 폴리뉴클레오티드는, 상기 단편의 길이가 3의 배수라서, 서열 번호 1 또는 서열 번호 69의 위치 961 내지 위치 1159에 위치하는 뉴클레오티드로 시작하고, 서열 번호 1 또는 서열 번호 69의 마지막 뉴클레오티드로 끝난다(즉, 뉴클레오티드 5118). 따라서, 상기 두 번째 단편을 코딩하는 폴리뉴클레오티드는 서열 번호 1 또는 서열 번호 69의 잔기 961-5118, 964-5118, 967-5118, 970-5118, 973-5118, 976-5118, 979-5118, 982-5118, 985-5118, 988-5118, 991-5118, 994-5118, 997-5118, 1000-5118, 1003-5118, 1006-5118, 1009-5118, 1012-5118, 1015-5118, 1018-5118, 1021-5118, 1024-5118, 1027-5118, 1030-5118, 1033-5118, 1036-5118, 1039-5118, 1042-5118, 1045-5118, 1048-5118, 1051-5118, 1054-5118, 1057-5118, 1060-5118, 1063-5118, 1066-5118, 1069-5118, 1072-5118, 1075-5118, 1078-5118, 1081-5118, 1084-5118, 1087-5118, 1090-5118, 1093-5118, 1096-5118, 1099-5118, 1102-5118, 1105-5118, 1108-5118, 1111-5118, 1114-5118, 1117-5118, 1120-5118, 1123-5118, 1126-5118, 1129-5118, 1132-5118, 1135-5118, 1138-5118, 1141-5118, 1144-5118, 1147-5118, 1150-5118, 1153-5118, 1156-5118 및 1159-5118로 이루어지는 군으로부터 선택된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, CyaA 유래 단백질은 서열 번호 10에 개시된 서열의 폴리펩티드를 포함하거나 이로 이루어진다; 서열 번호 10은 서열 번호 2의 잔기 1 내지 227로 이루어지는 단편과 융합된 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 단편으로 이루어진다.
또 다른 특정 실시양태에서, CyaA 유래 단백질은 서열 번호 12에 개시된 서열의 폴리펩티드를 포함하거나 이로 이루어진다; 서열 번호 12는 서열 번호 2의 잔기 1 내지 183으로 이루어지는 단편과 융합된 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 단편으로 이루어진다.
또한, 다른 특정 실시양태는 하기를 개시한다:
- CyaA 유래 단백질은 서열 번호 19에 개시된 서열의 폴리펩티드를 포함하거나 이로 이루어진다. 즉, 서열 번호 2의 잔기 1 내지 227로 이루어지는 단편과 융합된 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 단편으로 이루어진다.
- CyaA 유래 단백질은 서열 번호 20에 개시된 서열의 폴리펩티드를 포함하거나 이로 이루어진다. 즉, 서열 번호 2의 잔기 1 내지 183으로 이루어지는 단편과 융합된 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 단편으로 이루어진다.
단백질 또는 폴리펩티드를 나타낼 때, 표현 "∼에 융합된"은 각 펩티드 부분(예를 들어, 여러 CyaA 단편, 및 경우에 따라 이종 폴리펩티드)이 서로 펩티드 결합으로 공유적으로 연결된다는 것을 의미한다. 상기 상이한 펩티드 부분들의 순서는 본원에서 N-말단에서 C-말단으로, 즉 한 부분의 마지막 C-말단 잔기가 다른 부분의 첫 번째 N-말단 잔기에 펩티드 결합으로 연결되는 것으로 기재된다. 폴리뉴클레오티드를 나타낼 때, 표현 "융합된"은 두 개 이상의 폴리뉴클레오티드 부분(예를 들어, 여러 뉴클레오티드 CyaA 단편, 및 경우에 따라 이종 폴리펩티드를 코딩하는 뉴클레오티드)이 서로 포스포디에스터 결합으로 공유적으로 연결된다는 것을 의미한다. 상기 상이한 폴리뉴클레오티드 부분들의 순서는 본원에서 5'에서 3'으로, 즉 한 부분의 마지막 3' 뉴클레오티드가 다른 부분의 첫 번째 5' 뉴클레오티드에 포스포디에스터 결합으로 연결되는 것으로 기재된다. 뉴클레오티드 서열의 융합으로 이루어지는 폴리뉴클레오티드는, 예를 들어 CyaA의 천연 코딩 서열 내 서열 단편의 결실에 의하여, 특히 재조합 폴리뉴클레오티드가 얻어진다.
본 발명은 또한 변이형 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드에 관한 것으로, 상기 첫 번째 단편이 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 서열의 단편과 95% 이상의 유사성을 갖는 변이체이고/이거나, 상기 두 번째 단편이 서열 번호 2의 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 단편과 95% 이상의 유사성을 갖는 변이체이다.
단백질 또는 폴리펩티드를 나타낼 때, "95% 이상의 유사성을 갖는 변이체"는 아미노산 동일성이 변이되기 전의 폴리펩티드와 95% 이상, 96% 이상, 97% 이상, 98% 또는 99% 이상인 단백질 서열을 의미한다. 유사성의 백분율은 상기 변이체와 변이되기 전의 상기 폴리펩티드의 전장 서열을 비교하여, 특히 두 서열 중 더 짧은 것에 대해 계산된다. 따라서, 하나 이상의 첨가(들) 및/또는 하나 이상의 결실(들) 및/또는 하나 이상의 치환(들)에 의해 폴리펩티드의 잔기와 변이체의 잔기의 5%가 상이할 때, 변이체는 상기 폴리펩티드와 95%의 유사성을 갖는다. 특정 실시양태에서, 상기 변이체가 상기 폴리펩티드와 치환, 바람직하게는 보존적 치환에 의해서만 상이하여 변이되기 전의 서열과 동일한 길이를 유지한다. 또 다른 실시양태에서, 상기 변이체가 상기 폴리펩티드와 하나 이상의 단일 아미노산 결실, 바람직하게는 1, 2, 3, 4, 5, 또는 5개의 단일 아미노산 결실(들), 및 치환, 바람직하게는 보존적 치환에 의해 상이하다.
본 발명은 또한 서열 번호 1의 부분(또는 단편)을 코딩하는 폴리뉴클레오티드와 75% 이상의 유사성을 갖는 폴리뉴클레오티드 변이체에 관한 것이다. 특정 실시양태에서, 상기 첫 번째 단편을 코딩하는 폴리뉴클레오티드는, 상기 뉴클레오티드 단편의 길이가 3의 배수라서, 서열 번호 1의 첫 번째 뉴클레오티드로 시작하여 서열 번호 1의 위치 549 내지 위치 681에 위치하는 뉴클레오티드로 끝나는 폴리뉴클레오티드와 75%의 유사성을 갖는다. 또 다른 실시양태에서, 독립적으로 또는 상기 기재 내용과 조합하여, 상기 두 번째 단편을 코딩하는 폴리뉴클레오티드는, 상기 뉴클레오티드 단편의 길이가 3의 배수라서, 서열 번호 1의 위치 961 내지 위치 1159에 위치하는 뉴클레오티드로 시작하여 서열 번호 1의 마지막 뉴클레오티드(즉, 뉴클레오티드 5118)로 끝나는 폴리뉴클레오티드와 75%의 유사성을 갖는다. 특정 실시양태에서, 상기 첫 번째 단편 및 두 번째 단편을 코딩하는 폴리뉴클레오티드는 서열 번호 1과 75% 이상의 유사성을 갖는 전장 서열의 폴리뉴클레오티드로부터 유래한다. 상기 변이체의 한 예가 서열 번호 69이다. 특정 실시양태에서, 폴리뉴클레오티드 변이체는 상기에 개시된 서열 번호 1 또는 서열 번호 69의 폴리뉴클레오티드에서 얻어진 폴리뉴클레오티드에 적용된 유전자 코드의 퇴보(degenracy)의 결과이다. 특정 실시양태에서, 이렇게 얻어진 폴리뉴클레오티드 변이체는 워블(wobble) 위치에 퇴보된(degenrated) 염기를 갖는다.
폴리뉴클레오티드를 나타낼 때, "75% 이상의 유사성을 갖는 변이체"는 뉴클레오티드 동일성이 변이되기 전의 폴리뉴클레오티드와 75% 이상, 79% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상인 뉴클레오티드 서열을 의미한다. 유사성의 백분율은 상기 변이체와 변이되기 전의 상기 폴리뉴클레오티드의 전장 서열을 비교하여, 특히 두 서열 중 더 짧은 것에 대해 계산된다. 따라서, 하나 이상의 뉴클레오티드 첨가(들) 및/또는 하나 이상의 뉴클레오티드 결실(들) 및/또는 하나 이상의 뉴클레오티드 치환(들)에 의해 변이체 뉴클레오티드의 25%가 폴리뉴클레오티드의 뉴클레오티드와 상이할 때, 변이체는 상기 폴리뉴클레오티드와 75%의 유사성을 갖는다. 특정 실시양태에서, 상기 변이체가 뉴클레오티드 치환에 의해서만 상이하여 변이되기 전의 서열과 동일한 길이를 유지한다. 특정 실시양태에서, 상기 변이체가 사일런트 돌연변이에 의해서만 상이하면 변이되기 전의 서열에 의해 코딩된 단백질과 동일한 단백질을 코딩한다. 특정 실시양태에서, 상기 변이체는 일부가 사이런트 돌연변이인 뉴클레오티드 치환에 의해서만 상이하여 상기 폴리뉴클레오티드 변이체에 의해 코딩되는 단백질 서열이 본 발명의 단백질 또는 폴리펩티드와 95% 이상 유사성을 가지거나 100% 동일성을 갖는다.
본원에서 나타낸 뉴클레오티드 및 단백질 유사성 백분율은 니들레만 및 분쉬(Needleman and Wunsch) 알고리즘에 기초한 널리 공지된 프로그램, 예를 들어 MeAlign으로 계산될 수 있다[18].
특정 실시양태에서, 본원에서 정의된 변이형 CyaA 유래 단백질은 표적 세포에 결합하고/거나 그의 아데닐레이트 사이클라아제(AC) 도메인을 표적 세포의 세포 기질로 이동시킬 수 있는 능력을 유지한다. 특정 실시양태에서, 표적 세포는 CD11b-발현 세포 즉, 표면에 CD11b/CD18 수용체를 발현하는 세포(CD11b+)이다. 특히, 상기 세포들은 과립구/호중구, 대식세포, NK 세포, T CD8+ 서브셋, B 세포 서브셋, 랑게르한스 세포와 같은 수지상 세포, 또는 골수계 수지상 세포이다.
본 발명의 변이체들이 표적 세포에 결합하는 능력은 특히 EP03291486 또는 WO02/22169 출원에 개시된 방법에 따라 분석할 수 있다. 또는, 변이체가 그의 N-말단 도메인을 표적 세포의 세포 기질로 이동시키는 능력은 WO02/22169 출원에 기재된 방법 또는 p105 펩티드를 이용한 실시예 A에 기술된 방법을 적용하여 분석할 수 있다.
보르데텔라 페르투시스 CyaA 단백질의 야생형 전장 서열의 변이체가 공지되어 있다; 상기 변이체의 예시는 서열 번호 4(보르데텔라 힌지아이(hinzii)의 CyaA 단백질, 서열 번호 6(보르데텔라 파라페르투시스(parapertussis)의 CyaA 단백질) 및 서열 번호 8(보르데텔라 브론치셉티카(bronchiseptica)의 CyaA 단백질)에 개시된 서열을 참고로 제공한다. 서열 번호 4, 6 및 8을 코딩하는 뉴클레오티드 서열은 서열 번호 3, 5 및 7에 각각 개시된 바와 같거나, 사일런트 돌연변이에 의한 서열 번호 3, 5 및 7의 변이체이다. 본 발명 내에는, CyaA 유래 단백질이 서열 2, 4, 6 및 8을 포함하거나 이들로 이루어지지 않는다. 또한, 본 발명의 변이형 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드는 서열 번호 3, 5 또는 7을 포함하거나 이들로 이루어지지 않는다.
본 발명의 특정 실시양태에서, 변이형 CyaA 유래 단백질, 바람직하게는 본원에서 정의된 비. 페르투시스(B. pertussis) CyaA 유래 단백질의 변이체를 코딩하는 폴리뉴클레오티드는 (a) 서열 번호 4, 6 또는 8에 개시된 보르데텔라 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 4, 6 또는 8의 첫 번째 잔기로 시작하여 서열 번호 4, 6 또는 8의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편과 융합된 (b) 서열 번호 4, 6 또는 8에 개시된 보르데텔라 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 4, 6 또는 8의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 4, 6 또는 8의 마지막 잔기로 끝나는 것인 단편을 포함하거나 이들로 이루어지는 폴리펩티드를 코딩하는 폴리뉴클레오티드이다.
서열 번호 2의 단편을 포함하는 특정 CyaA 유래 단백질에 대한 상기 정의는 서열 번호 4 및 6의 단편을 포함하는 변이형 CyaA 유래 단백질에 동일하게 적용한다.
서열 8의 단편을 포함하는 변이형 CyaA 유래 단백질과 관련하여, 서열 번호 8의 마지막 잔기가 잔기 1706 대신에 잔기 1705인 경우를 제외한 모든 정의는 동일하게 적용한다. 따라서, 서열 번호 8의 단편을 포함하는 변이형 CyaA 유래 단백질의 경우, 잔기 1706을 언급하는 모든 측면은 잔기 1705로 대체되어야만 한다. 특히, 두 번째 단편은 1319 내지 1385개 잔기 범위의 크기를 가지며, 바람직하게는 1319 잔기 또는 1385개 잔기 길이이다. 서열 8의 단편을 포함하는 변이형 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드와 관련하여, 뉴클레오티드 5118을 언급하는 모든 정의 및 실시양태는 뉴클레오티드 5115로 대체되어야만 한다.
본 발명의 변이형 CyaA 유래 단백질을 코딩하는 특정 폴리뉴클레오티드는 하기의 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드 중에서 선택된다:
1) 서열 번호 13에 개시된 폴리펩티드를 코딩하는 폴리뉴클레오티드; 서열 번호 13은 서열 번호 4의 잔기 1 내지 227로 이루어지는 단편과 융합된 서열 번호 4의 잔기 321 내지 1706으로 이루어지는 단편으로 이루어진다;
2) 서열 번호 14에 개시된 폴리펩티드를 코딩하는 폴리뉴클레오티드; 서열 번호 14는 서열 번호 4의 잔기 1 내지 183으로 이루어지는 단편과 융합된 서열 번호 4의 잔기 387 내지 1706으로 이루어지는 단편으로 이루어진다;
3) 서열 번호 15에 개시된 폴리펩티드를 코딩하는 폴리뉴클레오티드; 서열 번호 15는 서열 번호 6의 잔기 1 내지 227로 이루어지는 단편과 융합된 서열 번호 6의 잔기 321 내지 1706으로 이루어지는 단편으로 이루어진다;
4) 서열 번호 16에 개시된 폴리펩티드를 코딩하는 폴리뉴클레오티드; 서열 번호 16은 서열 번호 6의 잔기 1 내지 183으로 이루어지는 단편과 융합된 서열 번호 6의 잔기 387 내지 1706으로 이루어지는 단편으로 이루어진다;
5) 서열 번호 17에 개시된 폴리펩티드를 코딩하는 폴리뉴클레오티드; 서열 번호 17은 서열 번호 8의 잔기 1 내지 227로 이루어지는 단편과 융합된 서열 번호 8의 잔기 321 내지 1705로 이루어지는 단편으로 이루어진다; 그리고
6) 서열 번호 18에 개시된 폴리펩티드를 코딩하는 폴리뉴클레오티드; 서열 번호 18은 서열 번호 8의 잔기 1 내지 183으로 이루어지는 단편과 융합된 서열 번호 8의 잔기 387 내지 1705로 이루어지는 단편으로 이루어진다.
또한, 본 발명의 CyaA 유래 단백질 또는 변이형 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드는 전장의 보르데텔라 CyaA 코딩 뉴클레오티드 서열의 결실된 형태, 즉, 서열 번호 2, 4, 6 또는 8을 포함하거나 이로 이루어지는 폴리펩티드를 코딩하는 폴리뉴클레오티드로, 첫 번째 아미노산 잔기가 서열 번호 2, 4, 6 또는 8 각각의 잔기 184 내지 잔기 228에 위치하고, 마지막 아미노산 잔기가 서열 번호 2, 4, 6 또는 8 각각의 잔기 320 내지 잔기 386에 위치하는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드까지 결실된 형태로 정의될 수 있다. 특정 실시양태에서, 상기 폴리뉴클레오티드는 서열 번호 2, 4, 6 또는 8을 포함하거나 이들로 이루어지는 폴리펩티드를 코딩하며, 이것은 첫 번째 아미노산 잔기가 서열 번호 2, 4, 6 또는 8 각각의 잔기 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227 및 228로 이루어지는 군으로부터 선택되고, 마지막 아미노산 잔기가 서열 번호 2, 4, 6 또는 8 각각의 잔기 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385 또는 386으로 이루어지는 군으로부터 선택되는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드로 결실된다.
본 발명의 CyaA 유래 단백질, 특히 본원에서 기재된 변이형 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드를 제조하는 방법 또한 본 발명의 일부분이다. 본 방법은 (a) 서열 번호 2, 4, 6 또는 8에 개시된 보르데텔라 CyaA를 코딩하는 폴리뉴클레오티드로부터, 상기 서열 내 연속적인 뉴클레오티드 잔기의 뉴클레오티드 단편으로서, 단편의 처음 3개 뉴클레오티드가 서열 번호 2, 4, 6 또는 8의 잔기 184 내지 잔기 228에 위치한 아미노산 잔기를 코딩하고 단편의 마지막 3개의 뉴클레오티드가 서열 번호 2, 4, 6 또는 8의 잔기 320 내지 잔기 386에 위치한 아미노산 잔기를 코딩하는 것인 단편을 결실시키는 단계, 및 (b) 상기 폴리뉴클레오티드를 회수하는 단계를 포함한다.
대안적으로, CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드는 통상의 방법을 이용하여, 원하는 CyaA 유래 단백질 서열에 따라, 경우에 따라 유전자 코드의 퇴보 및/또는 발현의 최적화를 고려하여 화학적으로 합성된다.
또한, 본 발명은 본원에서 기재된 본 발명의 폴리뉴클레오티드에 의해 코딩되는 CyaA 유래 단백질에 관한 것이다. 특정 CyaA 유래 단백질은 서열 번호 10, 12, 13, 14, 15, 16, 17, 18, 19 및 20에서 개시된 서열로 이루어진다.
본 발명의 범위 내에는, 변이형 CyaA 유래 단백질을 포함하여 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드가 상기 CyaA 유래 단백질 또는 변이형 CyaA 유래 단백질, 및 이종 폴리펩티드를 포함하거나 이들로 이루어지는 키메라 단백질을 코딩하는 본 발명의 키메라 폴리뉴클레오티드를 제조하는 데 사용된다. 여기서, 상기 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드는 CyaA의 결실된 뉴클레오티드 단편을 치환한다.
따라서, 본 발명은 키메라 폴리뉴클레오티드, 즉 본원에서 정의된 키메라 단백질을 코딩하는 폴리뉴클레오티드에 관한 것이며, CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드와 관련하여 본원에서 개시된 각각의 모든 실시양태에서 적용된다.
따라서, 본 발명은 또한 키메라 단백질을 코딩하는 폴리뉴클레오티드를 제조 방법에 관한 것으로,
(a) 서열 번호 2, 4, 6 또는 8에 개시된 보르데텔라 CyaA를 코딩하거나 서열 번호 2와 95% 이상의 유사성을 갖는 변이체를 코딩하는 폴리뉴클레오티드로부터, 처음 3개의 뉴클레오티드가 서열 번호 2, 4, 6 또는 8의 잔기 184 내지 잔기 228에 위치한 아미노산 잔기를 코딩하고 마지막 3개의 뉴클레오티드가 서열 번호 2, 4, 6 또는 8의 잔기 320 내지 잔기 386에 위치한 아미노산 잔기를 코딩하는 것인 뉴클레오티드 단편을 결실시키는 단계;
(b) (a)에서 얻어진 폴리뉴클레오티드 내 결실된 뉴클레오티드 단편 부위에 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드를 삽입하는 단계로서, 단계 (a) 및 (b)는 임의의 순서로 또는 동시에 수행될 수 있는 것인 단계; 및
(c) 키메라 단백질을 코딩하는 상기 폴리뉴클레오티드 회수하는 단계를 포함한다.
본 발명은 또한 키메라 단백질을 제조하는 방법에 관한 것으로,
(a) 서열 번호 2, 4, 6 또는 8에 개시된 보르데텔라 CyaA를 코딩하거나 서열 번호 2와 95% 이상의 유사성을 갖는 변이체를 코딩하는 폴리뉴클레오티드로부터, 처음 3개의 뉴클레오티드가 서열 번호 2, 4, 6 또는 8의 잔기 184 내지 잔기 228에 위치한 아미노산 잔기를 코딩하고 마지막 3개의 뉴클레오티드가 서열 번호 2, 4, 6 또는 8의 잔기 320 내지 잔기 386에 위치한 아미노산 잔기를 코딩하는 것인 뉴클레오티드 단편을 결실시키는 단계;
(b) (a)에서 얻어진 폴리뉴클레오티드 내 결실된 뉴클레오티드 단편 부위에 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드를 삽입하는 단계로서, 단계 (a) 및 (b)는 임의의 순서로 또는 동시에 수행될 수 있는 것인 단계;
(c) (b)에서 얻어진 폴리뉴클레오티드를 세포에서 발현시키는 단계; 및
(d) 상기 발현된 키메라 단백질을 회수하는 단계를 포함한다.
본 발명의 키메라 단백질을 제조하는 방법은 키메라 폴리뉴클레오티드 구조물 내에 단계 (b)에서 얻어진 폴리뉴클레오티드 및 CyaC 단백질을 코딩하는 폴리뉴클레오티드를 통합시키는 단계를 더 포함할 수 있다. 바람직한 실시양태에서, 단계 (b)에서 얻어진 폴리뉴클레오티드와 CyaC 단백질을 코딩하는 폴리뉴클레오티드는, 상기 통합 후에 얻어진 키메라 폴리뉴클레오티드가 5' 말단에서 3' 말단으로 단계 (b)의 폴리뉴클레오티드 구조물에 이어진 보르데텔라 균주, 특히 보르데텔라 페르투시스 균주의 CyaC 단백질을 코딩하는 폴리뉴클레오티드 구조물을 포함하거나 함유하도록, 구조물 내에 통합된다.
본 발명 내에서 "처음 3개의 뉴클레오티드" 또는 "마지막 3개의 뉴클레오티드"를 나타낼 때, 상기 3개의 뉴클레오티드는 유전 암호에 따라 서열 번호 2, 4, 6 또는 8의 그의 위치에 확인되는 아미노산 잔기에 대응하는 코돈을 나타내는 것으로 이해된다. 따라서, 폴리뉴클레오티드 뉴클레오티드 결실의 크기는 3의 배수이다. 게다가, 크기가 3의 배수인 것 외에도, 폴리뉴클레오티드 뉴클레오티드 결실은 프레임 내에 있다. 즉 결실은 리딩 프레임을 변경하거나 결실 주위(상류 및 하류)를 변경하지 않으면서 원하는 아미노산 잔기를 제거한다.
결실 단계와 삽입 단계의 순서는 중요하지 않으며 두 단계를 동시에 수행할 수 있다.
방법의 첫 번째 실시양태에서, 결실 단계는 삽입 단계에 앞서 시행된다. 따라서, 단편의 결실이 수행되면, 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드는 결실된 뉴클레오티드 부위에 삽입된다. "결실된 뉴클레오티드 단편의 부위에서"는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드가 CyaA의 N-말단부(첫 번째 CyaA 단편에 대응)과 CyaA의 C-말단부(두 번째 CyaA 단편에 대응) 사이에 삽입된다는 것을 의미한다. CyaA의 N-말단부 및 C-말단부 모두의 서열이 서열 번호 2, 4, 6 또는 8 또는 본 발명에 따른 변이체의 N-말단 부분 및 C-말단 부분과 동일하기 때문에, 삽입 부위는 쉽게 확인될 수 있다.
두 번째 실시양태에서, 삽입 단계는 결실 단계에 앞서 시행된다. 결실될 단편이 확인되면, 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드는 결실될 단편의 첫 번째 잔기를 코딩하는 세 개의 뉴클레오티드(코돈)의 상류(5') 또는 결실될 단편의 마지막 잔기를 코딩하는 마지막 세 개의 뉴클레오티드(코돈) 하류(3')에 삽입된다. 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드가 삽입되면, 결실될 단편은 CyaA/이종 폴리펩티드 분자를 코딩하는 폴리뉴클레오티드로부터 절제(excise)된다.
세 번째 실시양태에서, 결실 및 삽입 단계는 적합한 제한 효소를 사용하여 동시에, 즉 단일 반응 단계로 실시된다.
방법의 특정 실시양태에서, 결실 단계는 서열 번호 2, 4, 6 또는 8에 개시된 보르데텔라 CyaA를 코딩하는 폴리뉴클레오티드로부터, 서열 번호 2, 4, 6 또는 8의 잔기 228 내지 320을 코딩하는 뉴클레오티드 단편, 또는 서열 번호 2, 4, 6 또는 8의 잔기 184 내지 386을 코딩하는 뉴클레오티드 단편, 또는 서열 번호 2, 4, 6 또는 8의 잔기 228 내지 386을 코딩하는 뉴클레오티드 단편, 또는 서열 번호 2, 4, 6 또는 8의 잔기 184 내지 320을 코딩하는 뉴클레오티드 단편 또는 본 발명에 따른 변이체를 제거하는 단계를 포함한다.
또 다른 실시양태에서, 결실 단계는 서열 번호 1, 3, 5 또는 7 또는 서열 번호 69에 개시된 폴리뉴클레오티드로부터, 서열 번호 1, 3, 5 또는 7 또는 서열 번호 69의 뉴클레오티드 682 내지 960으로 이루어지는 뉴클레오티드 단편, 또는 서열 번호 1, 3, 5 또는 7 또는 서열 번호 69의 뉴클레오티드 550 내지 1158로 이루어지는 뉴클레오티드 단편, 또는 서열 번호 1, 3, 5 또는 7 또는 서열 번호 69에 개시된 폴리뉴클레오티드, 또는 서열 번호 1, 3, 5 또는 7 또는 서열 번호 69의 잔기 682 내지 1158로 이루어지는 뉴클레오티드 단편, 또는 서열 번호 1, 3, 5 또는 7 또는 서열 번호 69의 뉴클레오티드 550 내지 960으로 이루어지는 뉴클레오티드 단편을 제거하는 단계를 포함한다.
단편의 결실을 얻기 위해서, 당업자는 가능한 한 CyaA 코딩 폴리뉴클레오티드 내 더 큰 결실을 얻어야 하며, 그리고 나서 클로닝할 때 보충하여 최종 결과물로서 상기에 개시된 결실을 얻을 수 있다.
대안적으로, 본 발명의 키메라 단백질을 코딩하는 키메라 폴리뉴클레오티드는 통상의 방법을 이용하여, 원하는 키메라 단백질 서열에 따라, 경우에 따라 유전 암호의 퇴보성을 및/또는 발현의 최적화를 고려하여 화학적으로 합성된다. 따라서, 상기 화학적으로 합성된 폴리뉴클레오티드는 세포에서 발현되고, 발현된 키메라 단백질은 회수된다.
본 발명은 또한 키메라 단백질을 코딩하는 폴리뉴클레오티드에 관한 것으로, 상기 폴리뉴클레오티드는 5'에서 3'으로 (a) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편 또는 상기 단편과 95% 이상의 유사성을 갖는 변이체를 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 (c) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편 또는 상기 단편과 95% 이상의 유사성을 갖는 변이체를 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어진다.
서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편과 관련하여, 그리고 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편과 관련하여, CyaA 유래 단백질에 대해 상기에 기재된 정의는 키메라 단백질을 코딩하는 폴리뉴클레오티드의 맥락에서 상기 단편에 동일하게 적용된다.
95% 이상의 유사성을 갖는 변이체와 관련하여 상기에 기재된 정의는 키메라 단백질을 코딩하는 폴리뉴클레오티드의 맥락에서 기재된 단편의 변이체에 동일하게 적용된다.
특정 실시양태에서, 키메라 단백질을 코딩하는 상기 폴리뉴클레오티드는
1) 5'에서 3'으로 (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 2, 4 또는 6의 잔기 321 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
2) 5'에서 3'으로 (a) 서열 번호 8의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 8의 잔기 321 내지 1705로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
3) 5'에서 3'으로 (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 2, 4 또는 6의 잔기 387 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
4) 5'에서 3'으로 (a) 서열 번호 8의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 8의 잔기 387 내지 1705로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
5) 5'에서 3'으로 (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 2, 4 또는 6의 잔기 387 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
6) 5'에서 3'으로 (a) 서열 번호 8의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 8의 잔기 387 내지 1705로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
7) 5'에서 3'으로 (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 2, 4 또는 6의 잔기 321 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드; 및
8) 5'에서 3'으로 (a) 서열 번호 8의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 (c) 서열 번호 8의 잔기 321 내지 1705로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드; 로 이루어지는 군으로부터 선택된다.
본원에 정의된 키메라 단백질을 코딩하는 임의의 폴리뉴클레오티드의 특정 실시양태에서, 폴리뉴클레오티드 (a)는 폴리뉴클레오티드 (c)와 융합된 폴리뉴클레오티드 (b)에 융합된다.
본 발명 내에는, 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드는 폴리뉴클레오티드 (c)의 리딩 프레임(예를 들어, 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편의 리딩프레임)을 유지하기 위하여 3의 배수인 크기를 갖는다.
본 발명의 특정 실시양태에서, 키메라 폴리뉴클레오티드는 3' 말단에 보르데텔라 균주, 특히 보르데텔라 페르투시스 균주의 CyaC 단백질을 코딩하는 폴리뉴클레오티드를 더 포함한다.
키메라 단백질을 코딩하는 폴리뉴클레오티드는 본원에 기재된 방법에 의해 얻을 수 있다.
본 발명은 또한 본원에서 정의된 폴리뉴클레오티드, 즉, 변이형 CyaA 유래 단백질을 포함하여 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드 또는 키메라 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 핵산 벡터, 예를 들어 플라스미드에 관한 것이다. 특정 실시양태에서, 벡터는 발현 벡터, 즉, 분명하게 언급된 요소 외에도 본 발명의 폴리뉴클레오티드의 발현을 유도하는데 필수적인 요소(발현 조절 서열), 및 특히 전사 조절 요소를 포함하는 벡터이다. "전사 조절 요소"는 폴리뉴클레오티드의 전사 조절에 관련된 임의의 DNA 영역을 나타내며, 프로모터, 예를 들어 IPTG에 의한 유도성 프로모터, 예를 들어 lac, tac 또는 T7 프로모터, 또는 온도 변화에 의한 유도성 프로모터, 예를 들어 파아지 람다 pR 또는 pL 프로모터, 인핸서 또는 시스-작용 조절 요소를 포함한다. 상기 요소들, 및 특히 프로모터는 핵산 벡터로 형질감염 되는 세포의 특성에 따라 선택된다. 원하는 발현 수준 또는 형질 감염되는 세포에 따라 적합한 프로모터를 결정하는 것은 당업자들에게 공지되어있다. 특정 실시양태에서, 상기 벡터는 플라스미드이다. 본 발명의 벡터 제조에 적합한 통상적인 플라스미드의 예는 pUC 또는 pBR322이다.
특정 실시양태에서, 상기 핵산 벡터는 또한 서열 번호 21에 개시된 비. 페르투시스와 같은 보르데텔라 균주의 CyaC 코딩 서열을 포함한다. 또 다른 실시양태에서, 상기 핵산 벡터는 또한 특정 세포 유형에서, 특히 이. 콜라이에서 더 우수한 발현을 위해 최적화된 보르데텔라 균주의 CyaC 코딩 서열 형태를 포함한다. 이.콜라이에 최적화된 CyaC 서열의 형태는 서열 번호 22에 개시되어 있다.
본 발명에 정의된 키메라를 제조하는 데 사용될 수 있는 특정 플라스미드는 재료 및 방법에 기재된 것이며, 그 서열은 서열 번호 59, 62, 65 및 68에 개시되어 있다. 상기 4가지 플라스미드에 포함된 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드는 제거되고, 본원에서 기재된 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드에 의해 대체될 수 있다. 따라서, 서열 번호 59의 플라스미드로부터 시작하여, 뉴클레오티드 904와 1731 사이에 포함된 서열은 제거되고, 본원에 기재된 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드에 의해 대체된다. 대안적으로, 서열 번호 62의 플라스미드로부터 시작하여, 뉴클레오티드 772와 1599 사이에 포함된 서열은 제거되고, 본원에 기재된 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드에 의해 대체된다. 대안적으로, 서열 번호 65의 플라스미드로부터 시작하여, 뉴클레오티드 904와 1836 사이에 포함된 서열은 제거되고, 본원에서 기재된 이종 폴리펩티드를 코딩하는 폴리뉴클레오티에 의해 대체된다. 대안적으로, 서열 번호 68의 플라스미드로부터 시작하여, 뉴클레오티드 772와 1704 사이에 포함된 서열은 제거되고, 본원에 기재된 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드에 의해 대체된다.
핵산 벡터가 여러 폴리뉴클레오티드를 포함할 때, 전사 조절 요소(들)은 모든 폴리뉴클레오티드에 고유하거나 그들의 일부에 의해서 공유될 수 있거나, 반대로 각 폴리뉴클레오티드는 하나 이상의 특정 전사 조절 요소(들)과 연관될 수 있다는 것에 주의해야 한다. 후자의 경우, 여러 전사 조절 요소는 유사하거나 상이할 수 있다.
또한, 본 발명은 본원에서 정의된 폴리뉴클레오티드, 즉, 변이형 CyaA 유래 단백질을 포함하여 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드 또는 키메라 단백질을 코딩하는 폴리뉴클레오티드를 포함하거나 본원에서 정의된 벡터를 포함하는 세포(바람직하게는 단리된) 또는 세포 배양물에 관한 것이다. 특정 실시양태에서, 상기 세포 또는 세포 배양물은 본 발명의 벡터로 형질감염된다.
상기 세포는 원핵생물 또는 원핵 세포로 만든 세포 배양물일 수 있다. 특정 실시양태에서, 상기 세포는 재조합 단백질(들)을 발현하고/거나 생산하는 데 적합하다. 특정 실시양태에서, 상기 세포 또는 세포 배양물은 박테리아 또는 박테리아 배양물이다. 바람직한 실시양태에서, 상기 세포 또는 세포 배양물은 이. 콜라이 균주 배양물, 예를 들어 BL21, BLR, TG1 또는 HMS174 균주일 수 있다.
따라서, 본 발명의 세포 또는 세포 배양물은 본 발명의 폴리뉴클레오티드, 즉, 변이형 CyaA 유래 단백질을 포함하여 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드 또는 키메라 단백질을 코딩하는 폴리뉴클레오티드, 및, 적합한 경우, 동시에 CyaC 유전자 또는 CyaC 유전자의 최적화된 형태를 발현한다.
용어 "CyaA" 또는 "CyaA 유래 단백질" 또는 "키메라 단백질"은 보르데텔라 CyaA 단백질의 번역 후 변형된 형태를 포함하고, 바람직하게는 상기 형태이다. 따라서, 특정 실시양태에서, 본 발명의 상기 "CyaA 유래 단백질" 또는 "키메라 단백질"은 그의 잔기 중 한 개 이상, 특히 비. 페르투시스, 비. 힌지아이 또는 비. 파라페르투시스 CyaA의 전장 서열의 위치 860 및 983에 위치한 잔기에 대응하거나 비. 브론치셉티카 CyaA의 전장 서열의 위치 859 및 982에 위치한 잔기에 대응하는 두 개의 리신 잔기 중 한 개 이상, 바람직하게는 두 개가 번역 후 아실화에 의해 변형된다. "아실화"는 본원에서 팔미토일화, 즉, CyaA, CyaA 유래 단백질 또는 본 발명의 키메라 단백질에 팔미테이트 및/또는 팔미톨리에이트 기(들)의 첨가를 의미한다. 따라서, 상기 "CyaA 유래 단백질" 또는 "키메라 단백질"은 잔기 중 일부, 바람직하게는 특히 비. 페르투시스, 비. 힌지아이 또는 비. 파라페르투시스 CyaA의 전장 서열의 잔기 860 및 983에 대응하거나 비. 브론치셉티카 CyaA의 전장 서열의 위치 859 및 982에 위치한 잔기에 대응하는 두 개의 리신 잔기 중 한 개 또는 두 개에 팔미토일기를 갖는다. "에 대응한다"는 본 발명의 CyaA 유래 단백질 또는 키메라 단백질의 번역 후 변형되는 잔기가 비. 페르투시스, B. 힌지아이 또는 비. 파라페르투시스 CyaA(각각, 서열 번호 2, 4 및 6)의 CyaA 서열 내 리신 860 및 983 또는 비. 브론치셉티카 CyaA(서열 번호 8)의 서열 내 리신 859 및 982에 일치하는 위치에 있다는 것을 의미한다. 본 발명의 단백질 내 상기 리신 잔기는 본 발명의 단백질 서열을 서열 번호 2, 4, 6 또는 8의 서열과 정렬하고 비교함으로써 당업자에 의해 확인될 수 있다.
팔미토일화 과정은 보르데텔라 종의 CyaC 유전자, 바람직하게는 보르데텔라 페르투시스 CyaC 코딩 서열에 의해 매개되며 그 천연 서열은 서열 번호 21에 개시되어 있다. 이. 콜라이에서의 생산에 최적화된 CyaC 코딩 서열 형태는 서열 번호 22에 개시되어 있다. 이러한 번역 후 변형은 CyaA 단백질을 코딩하는 폴리뉴클레오티드, 본 발명의 CyaA 유래 단백질을 코딩하는 폴리뉴클레오티드 또는 본 발명의 키메라 단백질을 코딩하는 폴리뉴클레오티드와 CyaC 유전자의 동시 발현에 의해 얻을 수 있다.
특정 실시양태에서, CyaA 및 CyaC 단백질을 발현하는 본 발명의 폴리뉴클레오티드 구조물은 5' 말단에서 3' 말단으로, CyaA 폴리뉴클레오티드 또는 유전자, 유리하게는 결정된 숙주 세포, 예를 들어 이.콜라이에서의 발현을 위해 최적화된 서열로 이루어지는 CyaA 폴리뉴클레오티드 또는 유전자, 및 CyaC 폴리뉴클레오티드 또는 유전자, 유리하게는 결정된 숙주 세포, 예를 들어 이.콜라이에서의 발현을 위해 최적화된 서열로 이루어지는 CyaC 폴리뉴클레오티드 또는 유전자를 포함한다. 구조물 내 폴리뉴클레오티드의 상기 삽입 순서는 CyaA의 번역 후 변형된 형태의 발현 효율을 증가시키기에 적합한 각각의 양과 구조로 CyaA 및 CyaC 단백질의 발현을 유리하게 한다.
본 발명의 특정 실시양태에서, 본원에 개시된 야생형 보르데텔라 CyaA 단백질에 실시된 단편[첫 번째 아미노 잔기는 서열 번호 2, 4, 6 또는 8 각각의 잔기 184 내지 잔기 228에 위치하고, 마지막 아미노산 잔기는 서열 번호 2, 4, 6 또는 8 각각의 잔기 320 내지 잔기 386에 위치함]의 결실을 제외하고, 본 발명의 CyaA 유래 단백질 또는 키메라 단백질의 CyaA 부분은 서열 번호 2, 4, 6 또는 8과 비교할 때 다르게 변이(부가, 결실 및/또는 치환)되지 않는다.
흥미롭게도, 본 발명의 키메라 단백질뿐 아니라 CyaA 유래 단백질도 세포독성을 갖지 않는다. 즉, 그들의 효소 활성은, 첫 번째 아미노 잔기가 서열 번호 2, 4, 6 또는 8 각각의 잔기 184 내지 잔기 228에 위치하고, 마지막 아미노산 잔기가 서열 번호 2, 4, 6 또는 8 각각의 잔기 320 내지 잔기 386에 위치하는 단편의 결실 후에 불활성화되었다. 그래서, 특정 실시양태에서 삽입, 결실 또는 치환은 수행되지 않았다. 특히, CyaA의 잔기 188 및 189가 본 발명의 단백질에 여전히 존재할 때, 잔기 188 및 189 사이에는 어떤 디펩티드(예를 들어, 디펩티드 LQ 또는 GS)도 삽입되지 않는다.
또한, 본 발명은 본 발명의 폴리뉴클레오티드에 의해 코딩되고, 본 발명의 벡터로부터 발현되거나 본 발명의 세포 배양물에 의해 생산되는 키메라 단백질에 관한 것이다.
본 발명의 키메라 단백질은 N-말단에서 C-말단으로, (a) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편 또는 상기 단편과 95% 이상 유사성을 가지는 변이체, (b) 이종 폴리펩티드, 및 (c) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편 또는 상기 단편과 95% 이상 유사성을 가지는 변이체를 포함하거나 이들로 이루어진다.
서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편과 관련하여, 그리고 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편과 관련하여, CyaA 유래 단백질에 대한 상기 기재된 정의는 키메라 단백질을 코딩하는 폴리뉴클레오티드의 맥락에 있는 상기 단편에 동일하게 적용된다.
95% 이상의 유사성을 갖는 변이체와 관련하여 상기에 기재된 정의는 키메라 단백질의 맥락에 기재되는 단편에 동일하게 적용된다.
따라서, 본 발명은 또한
1) N-말단에서 C-말단으로, (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 227로 이루어지는 단편, (b) 이종 폴리펩티드 및 (c) 서열 번호 2, 4 또는 6의 잔기 321 내지 1706으로 이루어지는 단편;
2) N-말단에서 C-말단으로, (a) 서열 번호 8의 잔기 1 내지 227로 이루어지는 단편, (b) 이종 폴리펩티드 및 (c) 서열 번호 8의 잔기 321 내지 1705로 이루어지는 단편;
3) N-말단에서 C-말단으로, (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 183으로 이루어지는 단편, (b) 이종 폴리펩티드 및 (c) 서열 번호 2, 4 또는 6의 잔기 387 내지 1706으로 이루어지는 단편; 및
4) N-말단에서 C-말단으로, (a) 서열 번호 8의 잔기 1 내지 183으로 이루어지는 단편, (b) 이종 폴리펩티드 및 (c) 서열 번호 8의 잔기 387 내지 1705로 이루어지는 단편;을 포함하거나 이들로 이루어지는 키메라 단백질에 관한 것이다.
본원에서 정의된 키메라 단백질의 특정 실시양태에서, 단편 (a)는 단편 (c)와 융합된 이종 폴리펩티드(b)에 융합된다.
"키메라"는, 단백질이 본원에서 정의된 바와 같이 보르데텔라 CyaA로부터 유래한 단편 및 보르데텔라 CyaA로부터 유래하지 않은 폴리펩티드를 포함하거나 이들로 이루어진다는 것을 의미한다. 따라서, 상기 폴리펩티드는 이종이라고 말한다. 즉, 그의 전체 서열은 보르데텔라 CyaA의 부분, 특히 서열 번호 2, 4, 6 또는 8에 개시된 CyaA의 부분과 동일하지 않다; 특정 실시양태에서, 상기 이종 폴리펩티드의 전체 서열은 보르데텔라 CyaA의 부분, 특히 서열 번호 2, 4, 6 또는 8에 개시된 CyaA의 부분과 유사하지 않다. 즉, 그 서열은 보르데텔라 CyaA의 부분, 특히 서열 번호 2, 4, 6 또는 8에 개시된 CyaA의 부분과 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만 또는 20% 미만의 유사성을 갖는다. 상기 유사성은 이종 폴리펩티드의 서열과 동일한 크기의 보르데텔라 CyaA의 한 부분(동일 크기를 갖는 이종 폴리펩티드 및 보르데텔라 CyaA의 부분)을 비교하여 상기 정의에 따라 계산된다. 특정 실시양태에서, 이종 펩티드의 서열과 본원에서 정의된 보르데텔라 CyaA로부터 유래하는 부분(또는 단편)의 서열은 7개 초과의 연속적인 아미노산 잔기에 대해 동일성(100% 유사성)을 공유하지 않는다.
특정 실시양태에서, 이종 폴리펩티드는 9 내지 500개 아미노산 잔기, 특히 9 내지 400개 잔기, 9 내지 300개 잔기, 9 내지 200개 잔기, 9 내지 100개 잔기, 20 내지 500개 잔기, 20 내지 400개 잔기, 20 내지 300개 잔기, 20 내지 200개 잔기, 20 내지 100개 잔기, 50 내지 500개 잔기, 50 내지 400개 잔기, 50 내지 300개 잔기, 50 내지 200개 잔기, 50 내지 100개 잔기, 100 내지 500개 잔기, 100 내지 400개 잔기, 100 내지 300개 잔기 또는 100 내지 200개 잔기 범위의 크기를 갖는다. 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드의 크기는 27 내지 1500개 뉴클레오티드, 특히 27 내지 1200개 뉴클레오티드, 27 내지 900개 뉴클레오티드, 27 내지 600개 뉴클레오티드, 27 내지 300개 뉴클레오티드, 60 내지 1500개 뉴클레오티드, 60 내지 1200개 뉴클레오티드, 60 내지 900개 뉴클레오티드, 60 내지 600개 뉴클레오티드, 60 내지 300개 뉴클레오티드, 150 내지 1500개 뉴클레오티드, 150 내지 1200개 뉴클레오티드, 150 내지 900개 뉴클레오티드, 150 내지 600개 뉴클레오티드, 150 내지 300개 뉴클레오티드, 300 내지 1500개 뉴클레오티드, 300 내지 1200개 뉴클레오티드, 300 내지 900개 뉴클레오티드 또는 300 내지 600개 뉴클레오티드 범위에 있다. 단, 폴리뉴클레오티드의 크기(뉴클레오티드 수)가 3의 배수이다.
특정 실시양태에서, 이종 폴리펩티드는, 바람직하게는 상기에 정의된 크기 범위와 함께, 음전하를 갖는다. 즉, 이종 폴리펩티드는 산성이다. 또 다른 실시양태에서, 이종 폴리펩티드 단편은 음전하를 갖는다. 즉, 상기 이종 폴리펩티드 단편은 산성이다. 이종 폴리펩티드 단편은 전체 이종 폴리펩티드 크기의 10% 내지 40%, 바람직하게는 15% 내지 30% 크기의 연속된 아미노산 잔기의 연쇄를 갖는 것으로 정의된다.
특히, 정전하는 이종 폴리펩티드 내에 포함된 리신 및 아르기닌의 개수에서 아스파르트산 및 글루타민산의 개수를 뺀 것으로 정의된다. 한 실시양태에서, 이종 폴리펩티드의 정전하는 -1 이하, 특히 -2, -3, -4, -5, -10, -15, -20, -30, -40, -45 또는 -50 이하이다. 특정 실시양태에서, 바람직하게는 상기의 정전하 값 중 하나와 조합하여, 이종 폴리펩티드의 정전하는 -55, -60, -70 또는 -80 이상이다. 다시 말해서, 이종 폴리펩티드의 정전하는 -55 내지 -1, -50 내지 -2 또는 -40 내지 -3 범위에 있다. 비교로서, 전형적인 OVA 에피토프(SIINFEKL)는 0의 정전하를 갖는다.
본 발명의 키메라 단백질 내에 시험된 여러 이종 폴리펩티드의 예를 본원에서 보고한다:
- 키메라 단백질 Btpr_114 및 Btpr_116 내에 시험된 펩티드 216(서열 번호 34)은 -16의 정전하를 갖는다;
- 키메라 단백질 Btpr_115 및 Btpr_117 내에 시험된 펩티드 217(서열 번호 36)은 -37의 정전하를 갖는다;
- 키메라 단백질 Btpr_143 및 Btpr_144 내에 시험된 펩티드 233(서열 번호 38)은 -13의 정전하를 갖는다;
- 키메라 단백질 Btpr_145 및 Btpr-146 내에 시험된 펩티드 234(서열 번호 40)는 -38의 정전하를 갖는다;
- 키메라 단백질 Btpr_161 및 Btpr_169 내에 시험된 펩티드 326(서열 번호 42)은 -11의 정전하를 갖는다;
- 키메라 단백질 Btpr_162 및 Btpr_170 내에 시험된 펩티드 327(서열 번호 46)은 -10의 정전하를 갖는다;
- 키메라 단백질 Btpr_163 및 Btpr_171 내에 시험된 펩티드 328(서열 번호 50)은 -18의 정전하를 갖는다;
- 키메라 단백질 Btpr_164 및 Btpr_172 내에 시험된 펩티드 329(서열 번호 54)는 -19의 정전하를 갖는다;
- 키메라 단백질 Btpr_165 및 Btpr_173 내에 시험된 펩티드 330(서열 번호 44)은 -30의 정전하를 갖는다;
- 키메라 단백질 Btpr_166 및 Btpr_174 내에 시험된 펩티드 331(서열 번호 48)은 -30의 정전하를 갖는다;
- 키메라 단백질 Btpr_167 및 Btpr_175 내에 시험된 펩티드 332(서열 번호 52)는 -45의 정전하를 갖는다; 그리고
- 키메라 단백질 Btpr_168 및 Btpr_176 내에 시험된 펩티드 333(서열 번호 56)은 -46의 정전하를 갖는다.
특정 실시양태에서, 상기 이종 폴리펩티드는 하나 또는 여러 항원(들)을 포함하거나 이들로 이루어지며, 각 항원은 본원에서 정의된 하나 또는 여러 에피토프(들)을 포함한다. 본 발명 내에서, 항원은 상기 폴리펩티드(면역원성 폴리펩티드) 내 포함된 하나 또는 여러 에피토프에 대한 면역 반응, 특히 T 세포 면역 반응을 유발할 수 있는 폴리펩티드로 정의된다. 항원은 세포 또는 바이러스 기원의 전장의 항원성 폴리펩티드, 전장의 항원성 폴리펩티드의 단편으로서 상기 단편 내 포함된 항원성 결정 인자에 대한 면역 반응, 특히 T 세포 면역 반응을 유발할 수 있는 단편, 또는 합성의 비천연 폴리펩티드로서, 단, 합성 폴리펩티드가 상기 합성 폴리펩티드에 포함된 항원성 결정인자에 대한 T 세포 면역 반응을 유발할 수 있다면, 서로 융합된 여러 항원성 폴리펩티드의 하나 또는 여러 부분(들)로 이루어지는 폴리펩티드이다.
따라서, 상기 이종 폴리펩티드는 하나 이상의 에피토프(들), 바람직하게는 하나 이상의 CD8+ 에피토프(들) 및/또는 하나 이상의 CD4+ 에피토프(들)을 가지고 있거나, 포함하거나 이들로 이루어진다. "이상(at least)"은 에피토프 하나 또는 다수를 의미한다. 본원에서 에피토프는 세포 매개 면역 반응, 특히 T 세포 면역 반응의 유발 또는 유도에 관련된 임의의 아미노산 서열로서 정의되며, 선형 또는 입체형태이다. 따라서, 본원에 기재된 에피토프는 숙주 세포의 APC(항원 제시 세포)에 의해 프로세스되는 것, 특히 MHC I형(주조직 적합 복합체) 분자와 관련하여 인식되는 T 에피토프, 예를 들어 표적 세포가 CD8+ T 림프구인 에피토프, 또는 MHC II형 분자와 관련하여 인식되는 T 에피토프, 예를 들어 표적 세포가 CD4+ T 림프구인 에피토프를 포함한다. 본 발명에서 에피토프는 바람직하게는 9 내지 17개, 바람직하게는 9 내지 12개 잔기 범위의 크기를 갖는다. 본원에 기재된 에피토프는 또한 체액성 반응과 관련된 B 에피토프(들)을 포함한다.
본 발명자들은 다양한 기원의 여러 항원을 포함하는 특정 이종 폴리펩티드를 설계하였다. 본 이종 폴리펩티드는 마우스 및 인간 MHC I형(CD8 반응) 및 MHC II형(CD4 반응) 제한된 T-세포 에피토프: GFP11, MOG35 -55, OVA257 -264, IE191-110, CLA4, HA512-520, OVA323 -339, MELAN-A26-35, HA307-319, LCMV GP33-41, MAGEA3111 -180, MAGEA3244 -285, HPV16E7의 단편 및 HPV18E7의 단편을 포함하는 항원을 갖는다. 상기 항원의 아미노산 서열은 서열 번호 24에 개시되어 있으며 본 발명의 일부분이다.
특정 실시양태에서, 상기 이종 폴리펩티드는 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들), 바이러스 기원의 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)을 포함하거나 이들로 이루어진다. 따라서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 HIV, HBV, HCV, 아데노바이러스, EBV, 헤르페스 바이러스, HTLV.1 바이러스 및 CMV에서 유래한다. 특정 실시양태에서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 HPV에서 유래한다. 특정 실시양태에서, 상기 이종 폴리펩티드, 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 HPV로부터 유래하지 않는다. 특정 실시양태에서, 폴리펩티드가 1개 초과의 에피토프 또는 1개 초과의 항원을 포함하거나 이들로 이루어질 때, 상기 에피토프 또는 항원은 동일한 목(Order), 동일한 군(Group), 동일한 과(Family), 동일한 아과(Subfamily), 동일한 속(Genus) 또는 동일한 종(Spcies)에서 유래하고/거나 상이한 목, 상이한 군, 상이한 아, 상이한 아과, 상이한 속 또는 상이한 종에서 유래한다.
특정 실시양태에서, 상기 이종 폴리펩티드는 세포 유래의 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)을 포함하거나 이들로 이루어진다. 따라서 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 원핵 또는 진핵 세포에서 유래한다.
한 실시양태에서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 박테리아, 진균 또는 기생충, 예를 들어 클라미디아(Chlamydia ), 플라스모디윰(Plasmodium), 캔디다(Candida ), 레이슈마니아(Leishmania ) 또는 마이코박테리움 튜베큘로시스(Mycobacterium tuberculosis)로부터 유래되나 이에 제한되지는 않는다. 특정 실시양태에서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 보르데텔라 균주로부터 유래하지 않는다. 또 다른 실시양태에서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 CyaA가 아닌 보르데텔라 균주의 항원으로부터 유래한다. 특정 실시양태에서, 폴리펩티드가 1개 초과의 에피토프 또는 1개 초과의 항원을 포함하거나 이들을 이루어질 때, 상기 에피토프들 또는 항원들은 동일한 박테리아, 동일한 진균 또는 동일한 기생충로부터 유래한다. 또 다른 실시양태에서, 폴리펩티드가 1개 초과의 에피토프 또는 1개 초과의 항원을 포함하거나 이들을 이루어질 때, 상기 에피토프들 또는 항원들은 상이한 박테리아, 상이한 진균 또는 상이한 기생충로부터 유래한다.
또 다른 실시양태에서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 포유동물 세포로부터 유래한다. 특정 실시양태에서, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 종양 항원, 즉, 종양 또는 암세포에 의해 발현되는 펩티드로부터 유래되며, 종양은 자기이거나 또는 병원체에 의해 유도된다; 특정 실시양태에서, 종양 항원은 자기, 특히 인간 기원이다. 용어 "종양 항원"은 종양 항원의 하기 군을 포함하고, 본 발명의 키메라 단백질에 포함된 이종 폴리펩티드는 하기 군에서 하나 이상 선택될 수 있다: (a) 종양태아성 종양 항원, (b) 종양바이러스 종양 항원, (c) 매우 다양한 정상 조직에서 발현되거나 종양에서 과발현되는 과발현/축적된 종양 항원, (d) 많은 종양에서 발현되나 정상 조직에서 발현되지 않는 공유 종양-특이적 항원 또는 고환암 항원(BAGE 과, GAGE 과, MAGE 과, SAGE 과 및 XAGE 과 포함), (e) 계통-제한된 종양 항원, (f) 흔하게 발현되는 유전자 내 점 돌연변이 결과로 생성되는 변이된 종양 항원; 및 (g) 종양 기원이나 종양 특이적이지 않은 정상 조직에서 발현되는 분화 종양 항원.
본 발명의 이종 폴리펩티드가 여러 항원을 포함할 때, 상기 항원들은 융합되고, 펩티드 링커에 의해 분리되거나, 또는 두 개 이상의 상기 항원들은 융합되지만 두 개 이상의 항원이 하나의 링커에 의해 분리된다. 특정 실시양태에서, 상기 펩티드 링커는 2 내지 10개 잔기 범위의 크기를 갖는다. 링커는 항원을 분리시키고/거나 면역 반응을 향상시키기 위해 첨가될 수 있다.
특정 실시양태에서, 상기 이종 폴리펩티드는 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)을 포함하거나 이들로 이루어지고, 상기 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)은 HPV로부터 유래한다. 특정 실시양태에서, 상기 이종 폴리펩티드는 HPV로부터 유래하는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 항원들을 포함하거나 이들로 이루어진다. 바람직한 실시양태에서, 상기 이종 폴리펩티드는 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함한다. 특정 실시양태에서, 상기 HPV 항원(들)은 하나 이상의 에피토프(들), 바람직하게는 하나 이상의 CD8+ 에피토프(들) 및/또는 하나 이상의 CD4+ 에피토프(들)을 포함하거나 이들로 이루어진다.
따라서, 본 발명은 N-말단에서 C-말단으로:
(a) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편 또는 상기 단편과 95% 이상의 유사성을 갖는 변이체;
(b) 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및
(c) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편 또는 상기 단편과 95% 이상의 유사성을 갖는 변이체를 포함하거나 이들로 이루어지는 키메라 단백질에 관한 것이다.
서열 번호 2의 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편과 관련하여, 그리고 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편과 관련하여, CyaA 유래 단백질에 관한 상기에 기재된 정의는 키메라 단백질을 코딩하는 폴리뉴클레오티드의 맥락 내의 상기 단편에 동일하게 적용한다.
95% 이상의 유사성을 갖는 변이체에 관한 상기에 기재된 정의는 키메라 단백질의 맥락에서 기재된 단편에 동일하게 적용한다. 유사하게, 이종 폴리펩티드와 관련한 정의는 상기 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드를 정의하는 데 적용한다.
특정 실시양태에서, 본 발명의 키메라 단백질은
1) N-말단에서 C-말단으로, (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 227로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2, 4 또는 6의 잔기 321 내지 1706으로 이루어지는 단편;
2) N-말단에서 C-말단으로, (a) 서열 번호 8의 잔기 1 내지 227로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 8의 잔기 321 내지 1705로 이루어지는 단편;
3) N-말단에서 C-말단으로, (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 183으로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2, 4 또는 6의 잔기 387 내지 1706으로 이루어지는 단편;
4) N-말단에서 C-말단으로, (a) 서열 번호 8의 잔기 1 내지 183으로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 8의 잔기 387 내지 1705로 이루어지는 단편;
5) N-말단에서 C-말단으로, (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 227 로 이루어지는 단편, (b) 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2, 4 또는 6의 잔기 387 내지 1706으로 이루어지는 단편;
6) N-말단에서 C-말단으로, (a) 서열 번호 8의 잔기 1 내지 227로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 8의 잔기 387 내지 1705로 이루어지는 단편;
7) N-말단에서 C-말단으로, (a) 서열 번호 2, 4 또는 6의 잔기 1 내지 183으로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2, 4 또는 6의 잔기 321 내지 1706으로 이루어지는 단편; 및
8) N-말단에서 C-말단으로, (a) 서열 번호 8의 잔기 1 내지 183으로 이루어지는 단편, (b) 각각 상이한 HPV 형으로부터 유래하는 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 8의 잔기 321 내지 1705로 이루어지는 단편;을 포함하거나 이들로 이루어진다.
표현 "HPV 형"은 임의의 HPV 형, 특히 알파-파필로마바이러스, 베타-파필로마바이러스, 감마-파필로마바이러스, 델타-파필로마바이러스, 엡실론-파필로마바이러스, 제타-파필로마바이러스, 에타-파필로마바이러스, 쎄타-파필로마바이러스, 이오타-파필로마바이러스, 카파-파필로마바이러스, 람다-파필로마바이러스, 뮤-파필로마바이러스, 뉴-파필로마바이러스, 자이-파필로마바이러스, 오미크론-파필로마바이러스 및 파이-파필로마바이러스 속 중에서 선택된 HPV 형을 포함한다. 특정 실시양태에서, 인간 친화성을 갖는 파필로마바이러스, 예를 들어 알파-파필로마바이러스, 베타-파필로마바이러스, 감마-파필로마바이러스, 뮤-파필로마바이러스 또는 뉴-파필로마바이러스 속에 속하는 유형이 바람직하다. 특정 실시양태에서, 이종 폴리펩티드는 알파-파필로마바이러스 속의 HPV 형, 특히 알파-파필로마바이러스 속의 HPV 종 7 및 9에 속하는 유형으로부터의 항원을 포함하거나 이들로 이루어진다[17]. 따라서, 이종 폴리펩티드는 높은 발암성(oncogenic) HPV 표준 균종(type species), 예를 들어 HPV16, HPV18, HPV31, HPV33, HPV35, HPV45, HPV52 또는 HPV58로부터의 항원을 포함하거나 이들로 구성된다.
HPV 항원(들) 또는 에피토프(들)을 포함하는 키메라 단백질의 특정 실시양태에서, 이종 폴립펩티드에 포함된 상기 항원(들)은 HPV의 E1, E2, E4, E5, E6 및 E7 단백질 또는 그의 임의의 항원성 단편이거나 이들로부터 선택된다.
특정 실시양태에서, 이종 폴리펩티드에 포함된 상기 항원은 HPV 형의 E7 단백질이거나, 이종 폴리펩티드에 포함된 상기 항원들은 상이한 HPV 형의 E7 단백질 또는 상기 E7 단백질의 임의의 항원성 단편(E7 단편으로도 불림)이다. 바람직한 실시양태에서, E7 단백질 또는 그의 단편은 HPV16 형(서열 번호 25), HPV18 형(서열 번호 26), HPV31 형(서열 번호 27), HPV33 형(서열 번호 28), HPV45 형(서열 번호 29), HPV52 형(서열 번호 30) 또는 HPV58 형(서열 번호 32)으로부터 유래된다. 본 발명자들에 의해 확인된 HPV52 형의 E7 단백질 내에서 천연의 인간 자가 면역 에피토프(서열 번호 30에 개시됨)를 제거하기 위하여, 위치 84 및 86의 아미노산 잔기를 치환하였다(위치 84에서 M->L 및 위치 86에서 L->M); HPV52 형의 E7 단백질 내 상기 변형된 서열은 서열 번호 31에 개시된 바와 같으며 본 발명의 일부분이다.
특정 실시양태에서, 상기 이종 폴리펩티드는 HPV 형 E7 단백질의 3개 이상의 단편(항원성 단편)을 포함하거나 이들로 구성되며, 상기 단편 중 3개 이상은 상이한 HPV 형의 E7 단백질로부터 유래한다. 본 실시양태에서, "3개 이상의 단편"은 3, 4, 5, 6, 7, 8, 9 또는 10개 단편을 의미하며, 단, 상기의 3, 4, 5, 6, 7, 8, 9 또는 10개 단편 중에, 3개 이상이 상이한 HPV 형으로부터 유래한다. 바람직한 실시양태에서, 상기 이종 폴리펩티드는 6개의 E7 단편을 포함하거나 이들로 이루어지며, 그 중 3개는 3가지 상이한 HPV 형으로부터 유래한다. 또 다른 바람직한 실시양태에서, 상기 이종 폴리펩티드는 8개의 E7 단편을 포함하거나 이들로 이루어지며, 그 중 4개가 4가지 상이한 HPV 형으로부터 유래한다.
특정 실시양태에서, 모든 E7 단편들은 상이한 HPV 형으로부터 유래한다. 또 다른 실시양태에서, 일부 E7 단편(3개 이상)만이 상이한 HPV 형으로부터 유래하고, 나머지 E7 단편 모두가 상기의 상이한 유형 중 하나로부터 유래하거나, 상이한 HPV 형 중 두 가지로부터 유래하거나, 상기 상이한 HPV 형 중 세 가지로부터 유래하거나, 상기 상이한 HPV 형 중 네 가지로부터 유래하거나, 상기 상이한 HPV 형 중 다섯 가지로부터 유래한다. 특정 실시양태에서, 이종 폴리펩티드가 4개 이상의 E7 단백질의 단편을 포함하거나 이들로 이루어지며, 상기 E7 단백질 중 3개 이상은 상이한 HPV 형의 E7 단백질로부터 유래하고, 상기 E7 단편 중 2개 이상은 하나의 HPV 형의 동일한 E7 단백질로부터 유래한다(한 E7 단편은 상이한 HPV 형의 E7 단편의 군 및 동일한 HPV 형의 E7 단편의 군 모두에 속한다). 비제한적인 예로서, HPV 형의 6개의 E7 단편을 갖는 이종 폴리펩티드의 경우 하기와 같은 조합이 발견될 수 있다: a) 제1 HPV 형 E7 단편 1개, 제2 HPV 형의 E7 단편 1개, 및 제3 HPV 형의 E7 단편 4개; b) 제1 HPV 형의 E7 단편 1개, 제2 HPV 형의 E7 단편 2개, 및 제3 HPV 형의 E7 단편 3개; 및 c) 제1 HPV 형의 E7 단편 2개, 제2 HPV 형의 E7 단편 2개, 및 제3 HPV 형의 E7 단편 2개.
특정 실시양태에서, HPV 형의 상기 E7 단편은 E7 단백질의 N-말단 부분 또는 E7 단백질의 C-말단 부분으로 이루어진다.
"E7의 N-말단 부분"은 E7 단백질의 처음 25%, 처음 30%, 처음 35%, 처음 40% 이상 이상이고, 처음 N-말단 아미노산 잔기로 시작하여 E7 단백질의 아미노산 잔기 길이의 최대 50%인 서열의 단편을 의미한다. 따라서, "처음 25%"는 E7 단백질의 잔기 1에서 시작하여 전장의 E7 단백질 크기의 25%에 대응하는 잔기에서 끝나는 서열의 폴리펩티드를 의미한다. 특정 실시양태에서, E7 단백질의 N-말단 부분으로 이루어지는 단편은 E7 단백질의 처음 28% 내지 처음 31% 범위에 있는 서열로 이루어진다. 또 다른 실시양태에서, E7 단백질의 N-말단 부분으로 이루어지는 단편은 E7 단백질의 처음 31% 내지 처음 41% 범위에 있는 서열로 이루어진다. 특정 실시양태는 서열 번호 25의 잔기 1 내지 29로 이루어지는 단편, 서열 번호 26의 잔기 1 내지 31로 이루어지는 단편, 서열 번호 27의 잔기 1 내지 28로 이루어지는 단편, 서열 번호 28의 잔기 1 내지 29로 이루어지는 단편, 서열 번호 29의 잔기 1 내지 32로 이루어지는 단편, 서열 번호 31의 잔기 1 내지 29로 이루어지는 단편 또는 서열 번호 32의 잔기 1 내지 29로 이루어지는 단편이다. 다른 실시양태는 서열 번호 25의 잔기 1 내지 34로 이루어지는 단편, 서열 번호 26의 잔기 1 내지 42로 이루어지는 단편, 서열 번호 27의 잔기 1 내지 32로 이루어지는 단편, 서열 번호 28의 잔기 1 내지 31로 이루어지는 단편, 서열 번호 29의 잔기 1 내지 37로 이루어지는 단편, 서열 번호 31의 잔기 1 내지 31로 이루어지는 단편 또는 서열 번호 32의 잔기 1 내지 31로 이루어지는 단편이다.
"E7의 C-말단 부분"은 마지막 아미노산 잔기로 시작하여 E7 단백질의 아미노산 잔기 길이의 마지막 25%, 마지막 30%, 마지막 40%, 마지막 50%, 마지막 60% 이상이고, E7 단백질의 최대 마지막 70% 또는 마지막 80%인 서열의 단편을 의미한다. 따라서, "마지막 25%"는 E7 단백질의 마지막 잔기로 끝나고 전장의 E7 단백질 크기의 25%에 대응하는 잔기에서 시작하는 서열의 폴리펩티드를 의미한다. 특정 실시양태에서, E7 단백질의 C-말단 부분으로 이루어지는 단편은 E7 단백질의 마지막 55% 내지 마지막 61% 범위에 있는 서열로 이루어진다. 또 다른 실시양태에서, E7 단백질의 C-말단 부분으로 이루어지는 단편은 E7 단백질의 마지막 60% 내지 마지막 70% 범위에 있는 서열로 이루어진다. 특정 실시양태는 서열 번호 25의 잔기 43 내지 98로 이루어지는 단편, 서열 번호 26의 잔기 43 내지 105로 이루어지는 단편, 서열 번호 27의 잔기 42 내지 98로 이루어지는 단편, 서열 번호 28의 잔기 43 내지 97로 이루어지는 단편, 서열 번호 29의 잔기 44 내지 106으로 이루어지는 단편, 서열 번호 31의 잔기 45 내지 99로 이루어지는 단편 또는 서열 번호 32의 잔기 44 내지 98로 이루어지는 단편이다. 다른 실시양태는 서열 번호 25의 잔기 35 내지 98로 이루어지는 단편, 서열 번호 26의 잔기 43 내지 105로 이루어지는 단편, 서열 번호 27의 잔기 33 내지 98로 이루어지는 단편, 서열 번호 28의 잔기 32 내지 97로 이루어지는 단편, 서열 번호 29의 잔기 38 내지 106으로 이루어지는 단편, 서열 번호 31의 잔기 32 내지 99로 이루어지는 단편 또는 서열 번호 32의 잔기 32 내지 98로 이루어지는 단편이다.
특정 실시양태에서, 상기 이종 폴리펩티드는 동일한 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함한다. 특정 실시양태에서, 상기 이종 폴리펩티드가 동일한 HPV 형의 E7 단백질의 N-말단 단편 및 C-말단을 포함할 때(융합되지 않음), N-말단 부분과 C-말단 부분의 크기의 합은 전장의 E7 단백질의 크기를 초과하지 않는다.
또 다른 실시양태에서, 상기 이종 폴리펩티드가 제1 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제2 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제3 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편 및, 경우에 따라, 제4 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함한다. 상기 N-말단 및 C-말단 단편들은 폴리펩티드에서 각각 군을 이룰 수 있다. 또한, 이들은 천연 E7 단백질 내 위치에 대해 C-말단 단편이 N-말단 단편의 상류에 위치하도록 역위될 수 있다.
따라서, 본 발명의 키메라 단백질은 N-말단에서 C-말단으로, (i) 제1 HPV 형의 E7 단백질의 C-말단 부분, 제2 HPV 형의 E7 단백질의 C-말단 부분, 제3 HPV 형의 E7 단백질의 C-말단 부분, 또는 경우에 따라 제4 HPV 형의 E7 단백질의 C-말단 부분, 및 (ii) 상기 제1 HPV 형의 E7 단백질의 N-말단 부분, 상기 제2 HPV 형의 E7 단백질의 N-말단 부분, 상기 제3 HPV 형의 E7 단백질의 N-말단 부분, 및 경우에 따라 상기 제4 HPV 형의 E7 단백질의 N-말단 부분을 포함하거나 이들로 이루어지는 이종 폴리펩티드를 포함한다.
상기 정의에서 용어 "경우에 따라"는 HPV의 4가의 존재를 나타낸다. 따라서, 키메라 단백질은 상기에 정의된 바와 같이 제1, 제3, 제3 HPV의 E7 단백질의 C-말단 부분 및 N-말단 부분 모두, 및, 경우에 따라, 상이한 HPV의 제4 E7 단백질의 C-말단 부분 및 N-말단 부분을 포함한다.
특정 실시양태에서, 상이한 E7 단편이 융합되거나 펩티드 링커에 의해서 분리되거나, 또는 두 개 이상의 E7 단편이 융합되지만 두 개 이상의 E7 단편이 펩티드 링커에 의해 분리된다. 특정 실시양태에서, 상기 펩티드 링커는 2 내지 10 개 잔기 범위의 크기를 갖는다. 특정 실시양태에서, 상기 링커는 디펩티드 AS이다. 링커는 각 단편 또는 일부 단편을 분리시키고/거나 면역 반응을 향상시키기 위해 첨가될 수 있다. 특정 실시양태에서, 디펩티드 AS는 HPV의 E7 단편의 C-말단 부분의 바로 상류에첨가된다. 특정 실시양태에서, 디펩티드 AS는 HPV 18형의 E7 단편의 C-말단 부분의 바로 상류에, 특히 상기 단편의 상류에만 첨가된다.
본 발명의 특정 키메라 단백질은 N-말단에서 C-말단으로, 제1 HPV 형의 E7 단백질의 C-말단 부분, 제2 HPV 형의 E7 단백질의 C-말단 부분, 제3 HPV 형의 E7 단백질의 C-말단 부분, 상기 제1 HPV 형의 E7 단백질의 N-말단 부분, 상기 제2 HPV 형의 E7 단백질의 N-말단 부분, 상기 제3 HPV 형의 E7 단백질의 N-말단 부분이 융합되어 이루어지는 이종 폴리펩티드를 포함하거나 이들로 이루어진다.
본 발명의 또 다른 특정 키메라 단백질은 N-말단에서 C-말단으로, 제1 HPV 형의 E7 단백질의 C-말단 부분, 제2 HPV 형의 E7 단백질의 C-말단 부분, 제3 HPV 형의 E7 단백질의 C-말단 부분, 제4 HPV 형의 E7 단백질의 C-말단 부분, 상기 제1 HPV 형의 E7 단백질의 N-말단 부분, 상기 제2 HPV 형의 E7 단백질의 N-말단 부분, 상기 제3 HPV 형의 E7 단백질의 N-말단 부분, 상기 제4 HPV 형의 E7 단백질의 N-말단 부분이 융합되어 이루어지는 이종 폴리펩티드를 포함하거나 이들로 이루어진다.
본원에서 기재된 키메라 단백질의 특정 실시양태에서, 상기 제1, 제2 및 제3 HPV 형은 HPV16, HVP18 및 HPV45 형이다. 특정 실시양태에서, 상기 제1, 제2 및 제3 HPV 형은 HPV16, HVP18 및 HPV45 형이고, AS 디펩티드가 HPV18형의 E7 단백질의 C-말단 부분의 바로 상류에 첨가된다. 또 다른 실시양태에서, 상기 제1, 제2 및 제3 HPV 형은 HPV31, HPV52 및 HPV58 형이다. 또 다른 실시양태에서, 상기 제1, 제2 및 제3 HPV 형은 HPV31, HVP33 및 HPV52 형이다. 또 다른 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형은 HPV31, HPV33, HPV52 및 HPV58 형이다. 또 다른 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형은 HPV16, HVP18, HPV33 및 HPV45 형이다. 또 다른 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형은 HPV16, HVP18, HPV45 및 HPV58 형이다. 또 다른 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형은 HPV16, HVP18, HPV33 및 HPV45 형이고, AS 디펩티드는 HPV18형의 E7 단백질의 C-말단 부분의 바로 상류에 첨가된다. 또 다른 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형은 HPV16, HVP18, HPV45 및 HPV58 형이고, AS 디펩티드는 HPV18형의 E7 단백질의 C-말단 부분의 바로 상류에 첨가된다.
특정 실시양태에서, HPV 형의 E7 단백질의 N-말단 부분은 E7 단백질의 처음 28% 내지 처음 31% 범위에 있는 서열로 이루어지고 상기 동일한 HPV 형의 E7 단백질의 C-말단 부분은 E7 단백질의 마지막 55% 내지 마지막 61% 범위에 있는 서열로 이루어진다. 동일한 HPV 형의 E7 단백질의 N-말단 부분/C-말단 부분 쌍의 예시는 상기 이종 폴리펩티드 내에 그들의 배열과 상관없으며, 특히 본원에 기재된 배열에 따라 하기와 같다:
- 서열 번호 25의 잔기 1 내지 29 / 서열 번호 25의 잔기 43 내지 98;
- 서열 번호 26의 잔기 1 내지 31 / 서열 번호 26의 잔기 43 내지 105;
- 서열 번호 27의 잔기 1 내지 28 / 서열 번호 27의 잔기 42 내지 98;
- 서열 번호 28의 잔기 1 내지 29 / 서열 번호 28의 잔기 43 내지 97;
- 서열 번호 29의 잔기 1 내지 32 / 서열 번호 29의 잔기 44 내지 106;
- 서열 번호 31의 잔기 1 내지 29 / 서열 번호 31의 잔기 45 내지 99; 및
- 서열 번호 32의 잔기 1 내지 29 / 서열 번호 32의 잔기 44 내지 98.
또 다른 실시양태에서, HPV 형의 E7 단백질의 N-말단 부분은 E7 단백질의 처음 31% 내지 처음 41% 범위에 있는 서열로 이루어지고 E7 단백질의 C-말단 부분은 E7 단백질의 마지막 60% 내지 마지막 70% 범위에 있는 서열로 이루어진다. 특정 실시양태에서, E7 단백질의 N-말단 부분의 크기와 C-말단 부분의 크기의 합은 최대 E7 단백질 크기의 100%이다. 이 경우에, 전체 E7 단백질(두 개의 단편으로)은 이종 폴리펩티드 내에 포함될 수 있다. 동일한 HPV 형의 E7 단백질의 N-말단 부분/C-말단 부분 쌍의 예시는 상기 이종 폴리펩티드 내에 그들의 배열과 상관없으며, 특히 본원에 기재된 배열에 따르면 하기와 같다:
- 서열 번호 25의 잔기 1 내지 34 / 서열 번호 25의 잔기 35 내지 98;
- 서열 번호 26의 잔기 1 내지 42 / 서열 번호 26의 잔기 43 내지 105;
- 서열 번호 27의 잔기 1 내지 32 / 서열 번호 27의 잔기 33 내지 98;
- 서열 번호 28의 잔기 1 내지 31 / 서열 번호 28의 잔기 32 내지 97;
- 서열 번호 29의 잔기 1 내지 37 / 서열 번호 29의 잔기 38 내지 106;
- 서열 번호 31의 잔기 1 내지 31 / 서열 번호 31의 잔기 32 내지 99; 및
- 서열 번호 32의 잔기 1 내지 31 / 서열 번호 32의 잔기 32 내지 98.
키메라 단백질의 특정 실시양태에서, 상기 제1, 제2, 및 제3 HPV 형이 HPV16, HVP18 및 HPV45 형일 때, 이종 폴리펩티드는 서열 번호 34에 개시된 서열(서열 번호 33에 개시된 폴리뉴클레오티드에 의해 코딩됨) 또는 서열 번호 36에 개시된 서열(서열 번호 35에 개시된 폴리뉴클레오티드에 의해 코딩됨)로 이루어진다.
키메라 단백질의 특정 실시양태에서, 상기 제1, 제2, 및 제3 HPV 형이 HPV31, HVP52 및 HPV58 형일 때, 이종 폴리펩티드는 서열 번호 42에 개시된 서열(서열 번호 41에 개시된 폴리뉴클레오티드에 의해 코딩됨) 또는 서열 번호 44에 개시된 서열(서열 번호 43에 개시된 폴리뉴클레오티드에 의해 코딩됨)로 이루어진다.
키메라 단백질의 특정 실시양태에서, 상기 제1, 제2, 및 제3 HPV 형이 HPV31, HVP33 및 HPV52 형일 때, 이종 폴리펩티드는 서열 번호 46에 개시된 서열(서열 번호 45에 개시된 폴리뉴클레오티드에 의해 코딩됨) 또는 서열 번호 48에 개시된 서열(서열 번호 47에 개시된 폴리뉴클레오티드에 의해 코딩됨)로 이루어진다.
키메라 단백질의 특정 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형이 HPV31, HPV33, HPV52 및 HPV58 형일 때, 이종 폴리펩티드는 서열 번호 38에 개시된 서열(서열 번호 37에 개시된 폴리뉴클레오티드에 의해 코딩됨) 또는 서열 번호 40에 개시된 서열(서열 번호 39에 개시된 폴리뉴클레오티드에 의해 코딩됨)로 이루어진다.
키메라 단백질의 특정 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형이 HPV16, HVP18, HPV33 및 HPV45 형일 때, 이종 폴리펩티드는 서열 번호 50에 개시된 서열(서열 번호 49에 개시된 폴리뉴클레오티드에 의해 코딩됨) 또는 서열 번호 52에 개시된 서열(서열 번호 51에 개시된 폴리뉴클레오티드에 의해 코딩됨)로 이루어진다.
키메라 단백질의 특정 실시양태에서, 상기 제1, 제2, 제3 및 제4 HPV 형이 HPV16, HVP18, HPV45 및 HPV58 형일 때, 이종 폴리펩티드는 서열 번호 54에 개시된 서열(서열 번호 53에 개시된 폴리뉴클레오티드에 의해 코딩됨) 또는 서열 번호 56에 개시된 서열(서열 번호 55에 개시된 폴리뉴클레오티드에 의해 코딩됨)로 이루어진다.
본 발명은 또한 N-말단에서 C-말단으로, 제1 HPV 형의 E7 단백질의 C-말단 부분, 제2 HPV 형의 E7 단백질의 C-말단 부분, 제3 HPV 형의 E7 단백질의 C-말단 부분, 경우에 따라, 제4 HPV 형의 E7 단백질의 C-말단 부분, 상기 제1 HPV 형의 E7 단백질의 N-말단 부분, 상기 제2 HPV 형의 E7 단백질의 N-말단 부분, 상기 제3 HPV 형의 E7 단백질의 N-말단 부분, 경우에 따라 상기 제4 HPV 형의 E7 단백질의 N-말단 부분을 포함하거나 이들로 이루어지는 폴리펩티드에 관한 것이다. 특히, HPV 형의 E7 단백질의 N-말단 부분, HPV 형의 E7 단백질의 C-말단 부분, 경우에 따라 링커, 특히 AS 디펩티드의 존재, HPV 형의 특성, 서열 번호 25, 26, 27, 28, 29, 31 및 32로부터의 E7 단백질의 특정 단편의 정의와 관련하여, 본 발명의 키메라 단백질에 포함된 이종 폴리펩티드에 대해 본원에서 제공된 정의는 이와 같은 폴리펩티드에 동일하게 적용된다. 특히 상기 제1, 제2, 제3, 제4, 제5 및 제6 HPV 형 및, 적용가능한 경우, 상기 제7 HPV 형의 일반적 또는 특이적 조합과 관련하여, 본 발명의 키메라 단백질(들)을 포함하는 조성물에 대해 본원에서 제공된 정의는 이와 같은 폴리펩티드에 동일하게 적용된다.
특정 실시양태에서, 상기 폴리펩티드는 서열 번호 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54 또는 56에 개시된 서열로 이루어진다. 본 발명은 또한 폴리펩티드를 코딩하는 폴리뉴클레오티드, 특히 서열 번호 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53 및 55에 개시된 폴리뉴클레오티드 및 상기 폴리뉴클레오티드를 포함하는 벡터, 및 상기 폴리뉴클레오티드 또는 상기 폴리뉴클레오티드 포함 벡터를 포함하는 세포 또는 세포 배양물에 관한 것이다; 모두는 본원에서 정의된 바와 같다.
크기(200개 초과 잔기), 복합도(여러 시스테인 잔기의 존재) 및 음전하에도 불구하고, 상기 폴리펩티드는 놀랍게도 항원 제시 세포의 세포 기질로 효율적으로 이동되어 강력하고 큰 T-세포 면역 반응을 얻을 수 있다.
특정 실시양태에서, 본 발명은 서열 번호 58 또는 서열 번호 61에 개시된 서열을 포함하거나 이들로 이루어지는 본 발명의 키메라 단백질에 관한 것이다. 상기 키메라 단백질은 각각 서열 번호 57 또는 서열 번호 60에 개시되어 있는 서열의 폴리뉴클레오티드에 의해 코딩된다. 특정 실시양태에서, 서열 번호 58 또는 서열 번호 61의 키메라 단백질은 각각 서열 번호 59 또는 서열 번호 62 서열의 플라스미드로부터 발현된다.
특정 실시양태에서, 본 발명은 또한 서열 번호 64 또는 서열 번호 67에 개시된 서열을 포함하거나 이들로 이루어지는 본 발명의 키메라 단백질에 관한 것이다. 상기 키메라 단백질은 각각 서열 번호 63 또는 서열 번호 66에 개시된 서열의 폴리뉴클레오티드에 의해 코딩된다. 특정 실시양태에서, 서열 번호 64 또는 서열 번호 67의 키메라 단백질은 각각 서열 번호 65 및 서열 번호 68 서열의 플라스미드로부터 발현된다.
따라서, 본원에서 기재된 바와 같이, HPV로부터 유래하는 하나 이상의 항원(들) 또는 하나 이상의 에피토프(들)을 포함하거나 이들로 이루어지는 이종 폴리펩티드를 포함하는 본 발명의 임의의 키메라 단백질은 서열 번호 59, 서열 번호 62, 서열 번호 65 및 서열 번호 68의 플라스미드를 발현 벡터로 사용하여 발현될 수 있다. 다음 순서로, 서열 번호 59의 뉴클레오티드 904와 1731 사이에 포함된 폴리뉴클레오티드를 제거하고, 본 발명의 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로 대체하여, 상기 이종 폴리펩티드를 포함하는 본 발명의 키메라 단백질을 발현할 수 있다. 유사하게, 서열 번호 62의 뉴클레오티드 772와 1599 사이에 포함된 폴리뉴클레오티드를 제거하고, 본 발명의 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로 대체하여, 상기 이종 폴리펩티드를 포함하는 본 발명의 키메라 단백질을 발현할 수 있다. 유사하게, 서열 번호 65의 뉴클레오티드 904와 1836 사이에 포함된 폴리뉴클레오티드를 제거하고, 본 발명의 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로 대체하여, 상기 이종 폴리펩티드를 포함하는 본 발명의 키메라 단백질을 발현할 수 있다. 유사하게, 서열 번호 68의 뉴클레오티드 772와 1704 사이에 포함된 폴리뉴클레오티드를 제거하고, 본 발명의 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로 대체하여, 상기 이종 폴리펩티드를 포함하는 본 발명의 키메라 단백질을 발현할 수 있다.
본 발명의 특정 실시양태에서, 서열 번호 59의 뉴클레오티드 904와 1731 사이에 포함된 폴리뉴클레오티드를 제거하고, 고유한 HPV E7 단백질로부터 유래된 본 발명의 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로 대체한다. 여기서, 상기 폴리뉴클레오티드는 서열 번호 70, 서열 번호 71, 서열 번호 74, 서열 번호 73 및 서열 번호 72의 서열을 각각 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드 중에서 선택된다. 상기 구조물은 서열 번호 70, 서열 번호 71, 서열 번호 74, 서열 번호 73 또는 서열 번호 72를 갖는 이종 폴리펩티드를 포함하는 본 발명의 1가 키메라 단백질을 발현할 수 있다. 여기서, 상기 이종 폴리펩티드들은 각각 산성 영역이 결실된 HPV31 E7, 산성 영역이 결실된 HPV33 E7, 산성 영역이 결실된 HPV58 E7, 산성 영역이 결실된 HPV52 E7 및 산성 영역이 결실된 HPV45 E7을 각각 나타낸다.
본 발명의 특정 실시양태에서, 서열 번호 59의 뉴클레오티드 904와 1731 사이에 포함된 폴리뉴클레오티드를 제거하고, 고유한 HPV E7 단백질로부터 유래된 본 발명의 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로 대체한다. 여기서, 상기 폴리뉴클레오티드는 서열 번호 75, 서열 번호 76, 서열 번호 79, 서열 번호 78 및 서열 번호 77의 서열을 각각 갖는 폴리뉴클레오티드 중에서 선택된다.
본 발명은 또한 하나 이상, 바람직하게 하나 또는 두 개의 본 발명의 키메라 단백질(들), 특히 두 개 이상, 바람직하게는 두 개의 상이한 본 발명의 키메라 단백질을 포함하는 조성물에 관한 것이다.
특정 실시양태에서, 조성물이 1개 초과의 상이한, 바람직하게는 2개의 상이한 키메라 단백질을 포함할 때, 상기 키메라 단백질의 CyaA 부분(또는 단편)의 서열은 동일하거나 상이하지만, 이종 폴리펩티드의 서열은 상이하다. 특정 실시양태에서, 상이한, 바람직하게는 2개의 상이한 키메라 단백질은 본원에서 기재된 상이한 키메라 단백질로부터 선택된다. 특정 실시양태에서, 2개의 상이한 키메라 단백질은:
1) N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 단편 (b) 각각 상이한 HPV 형으로부터 유래한 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지는 2개의 키메라 단백질(단, 상기 2개의 키메라 단백질의 이종 폴리펩티드는 서열 및 HPV 형이 상이하다); 또는
2) N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 단편 (b) 각각 상이한 HPV 형으로부터 유래한 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지는 2개의 키메라 단백질(단, 상기 2개의 키메라 단백질의 이종 폴리펩티드는 서열 및 HPV 형이 상이하다)이다.
또 다른 실시양태에서, 상기 상이한, 바람직하게는 2개의 상이한 키메라 단백질의 CyaA 부분의 서열이 상이하고, 이종 폴리펩티드의 서열이 상이하다. 특정 실시양태에서, 키메라 단백질의 상이한, 바람직하게는 2개의 상이한 형태는 본원에 기재된 상이한 키메라 단백질로부터 선택된다. 특정 실시양태에서, 상이한, 바람직하게는 2개의 상이한 키메라 단백질 중 하나 이상, 바람직하게는 하나는 N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 단편 (b) 각각 상이한 HPV 형으로부터 유래한 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지고, 상이한, 바람직하게는 2개의 상이한 키메라 단백질 중 하나 이상, 바람직하게는 하나는 N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 단편 (b) 각각 상이한 HPV 형으로부터 유래한 3개 이상의 HPV 항원을 포함하는 이종 폴리펩티드(여기서 상기 이종 폴리펩티드는 다른 하나 이상의 키메라 단백질의 이종 폴리펩티드와 서열 및 HPV 형이 상이하다); 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어진다.
1개 초과의 상이한, 바람직하게는 2개의 상이한 형태의 키메라 단백질을 포함하는 조성물의 특정 실시양태에서, 이종 폴리펩티드는 본원에 정의된 바와 같다. 특정 실시양태에서, 각각의 이종 폴리펩티드는 제1 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제2 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제3 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 및 경우에 따라 제4 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함하며, 여기서 각각의 이종 폴리펩티드(들)과 다른 이종 폴리펩티드(들)과 상이한 서열을 갖는다.
특정 실시양태에서, 조성물은 2개의 상이한 유형의 키메라 단백질을 포함하며, 제1 유형의 키메라 단백질의 이종 폴리펩티드는 제1 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제2 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편 및 제3 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함하고, 제2 유형의 키메라 단백질의 이종 폴리펩티드는 제4 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제5 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편 및 제6 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함하며, 여기서 제1, 제2, 제3, 제4, 제5 및 제6 HPV 형은 상이한 HPV 형이다.
특정 실시양태에서, 제1, 제2, 제3, 제4, 제5 및 제6 HPV 형은 (a) HPV16, HPV18, HPV45, HPV31, HPV52 및 HPV58 중에서 선택되거나 (b) HPV16, HPV18 및 HPV45, HPV31, HPV33 및 HPV52 중에서 선택된다.
특정 실시양태에서, 제1, 제2 및 제3 HPV 형은 HPV16, HPV18 및 HPV45이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 34 또는 36에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 상기 키메라 단백질은 서열 번호 58, 61, 64 또는 67에 개시된 서열을 포함하거나 이로 이루어진다. 상기 특정 실시양태에, HPV33 또는 HPV58 중에서 선택된 제4 HPV 서브형을 결합시킬 수 있다.
특정 실시양태에서, 제1, 제2 및 제3 HPV 형에 관한 실시양태와 독립적으로, 또는 조합하여, 제4, 제5 및 제6 HPV 형은 HPV31, HPV52 및 HPV58이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 42 또는 44에 개시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 제1, 제2 및 제3 HPV 형에 관한 실시양태와 독립적으로, 또는 조합하여, 제4, 제5 및 제6 HPV 형이 HPV31, HPV33 및 HPV52이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 46 또는 48에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 상기 키메라 단백질은 서열 번호 34 또는 36에 개시된 서열은 서열 번호 42, 44, 46 또는 48에 개시된 서열에 의해 대체되어진, 서열 번호 58, 61, 64 또는 67 에 개시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, HPV 서브형을 열거하는 상기 명시된 순서에 대응하는 순서로, 또는 대안적으로 열거된 것들 중, 특히 HPV16, HPV18 및 HPV45 또는 HPV31, HPV52 및 HPV58 또는 HPV31, HPV33 및 HPV52의 군 중에서 제1, 제2, 제3 및 경우에 따라 제4의 임의의 조합에 대응하는 키메라 단백질 내 항원을 제시하는 임의의 순서로 상기 항원들이 키메라 단백질에 제공될 때 본 발명은 명시된 HPV 서브형의 상기에 열거된 항원들의 조합에 관한 것이다.
특정 실시양태에서, 제1, 제2, 제3, 제4, 제5 및 제6 HPV 형은 (a) 각각 HPV16, HPV18, HPV45, HPV31, HPV52 및 HPV58 또는 (b) 각각 HPV16, HPV18 및 HPV45, HPV31, HPV33 및 HPV52이다.
특정 실시양태에서, 두 개의 상이한 키메라 단백질은 본원에서 개시한 바와 같이 제1 키메라 단백질의 경우 HPV16, HPV18, HPV45, 제2 키메라 단백질의 경우 HPV31, HPV52, HPV58의 항원을 포함한다. 또 다른 특정 실시양태에서, 두 개의 상이한 키메라 단백질은 본원에서 개시한 바와 같이 제1 키메라 단백질의 경우 HPV16, HPV18, HPV45, 제2 키메라 단백질의 경우 HPV31, HPV33, HPV52의 항원을 포함한다. 바람직한 실시양태에서, 이렇게 정의된 HPV 항원들은 명시된 순서로 키메라 단백질에 삽입되나, 반드시 그렇지는 않다.
특정 실시양태에서, 조성물은 2개의 상이한 유형의 키메라 단백질을 포함하며, 제1 유형의 키메라 단백질의 이종 폴리펩티드는 제1 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제2 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제3 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제4 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함하고, 제2 유형의 키메라 단백질의 이종 폴리펩티드는 제5 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편, 제6 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편 및 제7 HPV 형의 E7 단백질의 본원에서 정의된 N-말단 단편 및 C-말단 단편을 포함하며, 여기서 제1, 제2, 제3, 제4, 제5, 제6 및 제7 HPV 형은 상이한 HPV 형이다.
특정 실시양태에서, 제1, 제2, 제3, 제4, 제5, 제6 및 제7 HPV 형은 (a) HPV31, HPV33, HPV52, HPV58, HPV16, HPV18 및 HPV45, (b) HPV16, HPV18, HPV33, HPV45, HPV31, HPV52 및 HPV58, (c) HPV16, HPV18, HPV45, HPV58, HPV31, HPV52 및 HPV33, (d) HPV16, HPV18, HPV33, HPV45, HPV31, HPV58 및 HPV52 (e) HPV16, HPV18, HPV45, HPV58, HPV31, HPV33 및 HPV52 및 (f) HPV16, HPV18, HPV45, HPV33, HPV31, HPV52 및 HPV58로 이루어지는 군으로부터 선택된다.
특정 실시양태에서, 제1, 제2, 제3 및 제4 HPV 형은 HPV16, HPV18, HPV33 및 HPV45이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 50 또는 52에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 제1, 제2, 제3 및 제4 HPV 형은 HPV16, HPV18, HPV45 및 HPV58이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 54 또는 56에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 제1, 제2, 제3 및 제4 HPV 형은 HPV31, HPV33, HPV52 및 HPV58이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 40 또는 42에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 상기 제1 키메라 단백질은 서열 번호 34 또는 36에 개시된 서열이 서열 번호 40, 42, 50, 52, 54 또는 56에 개시된 서열로 대체된, 서열 번호 58, 61, 64 또는 67에 개시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 제1, 제2, 제3 및 제4 HPV 형으로서 HPV31, HPV33, HPV52 및 HPV58에 관한 실시양태와 독립적으로, 또는 조합하여, 제5, 제6 및 제7 HPV 형은 HPV16, HPV18 및 HPV45이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 34 또는 36에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 상기 제2 키메라 단백질은 서열 번호 58, 61, 64 또는 67에 개시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 제1, 제2, 제3 및 제4 HPV 형으로서 각각 HPV16, HPV18, HPV33 및 HPV45 또는 HPV16, HPV18, HPV45 및 HPV58 에 관한 실시양태와 독립적으로, 또는 조합하여, 제5, 제6 및 제7 HPV 형은 각각 HPV31, HPV52 및 HPV58 또는 HPV31, HPV33, HPV52이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 42 또는 44에 개시된 서열을 포함하거나 이들로 이루어진다. 특정 실시양태에서, 제1, 제2, 제3 및 제4 HPV 형으로서 각각 HPV16, HPV18, HPV33 및 HPV45 또는 HPV16, HPV18, HPV45 및 HPV58에 관한 실시양태와 독립적으로, 또는 조합하여, 제5, 제6 및 제7 HPV 형은 각각 HPV31, HPV52 및 HPV58 또는 HPV31, HPV33 및 HPV52이다. 특정 실시양태에서, 이종 폴리펩티드는 서열 번호 46 또는 48에 개시된 서열을 포함하거나 이로 이루어진다. 특정 실시양태에서, 상기 제2 키메라 단백질은 서열 번호 34 또는 36에 개시된 서열이 서열 번호 42, 44, 46 또는 48에 개시된 서열로 대체된, 서열 번호 58, 61, 64 또는 67에 개시된 서열을 포함하거나 이로 이루어진다.
특정 실시양태에서, 제1, 제2, 제3, 제4, 제5, 제6 및 제7 HPV 형은 (a) 각각 HPV31, HPV33, HPV52, HPV58, HPV16, HPV18 및 HPV45, (b) 각각 HPV16, HPV18, HPV33, HPV45, HPV31, HPV52 및 HPV58, (c) 각각 HPV16, HPV18, HPV45, HPV58, HPV31, HPV52 및 HPV33, (d) 각각 HPV16, HPV18, HPV33, HPV45, HPV31, HPV58 및 HPV52 및 (e) 각각 HPV16, HPV18, HPV45, HPV58, HPV31, HPV33 및 HPV52로 이루어지는 군으로부터 선택된다.
특정 실시양태에서, HPV 서브형을 열거하는 상기 명시된 순서에 대응하는 순서로, 또는 대안적으로 열거된 것들 중, 특히 HPV16, HPV18, HPV33 및 HPV45의 군 또는 HPV16, HPV18, HPV45 및 HPV58의 군 또는 HPV31, HPV52 및 HPV58의 군 또는 HPV31, HPV33 및 HPV52의 군 중에서 제1, 제2, 제3 및 존재하는 경우 제4의 임의의 조합에 대응하는 키메라 단백질 내 항원을 제시하는 임의의 순서로 상기 항원들이 키메라 단백질에 제공될 때 본 발명은 명시된 HPV 서브형의 상기에 열거된 항원들의 조합에 관한 것이다.
특정 실시양태에서, 두 개의 상이한 키메라 단백질은 본원에서 개시한 바와 같이 제1 키메라 단백질의 경우 HPV16, HPV18, HPV45, HPV58, 제2 키메라 단백질의 경우 HPV31, HPV33, HPV52의 항원을 포함한다. 또 다른 특정 실시양태에서, 두 개의 상이한 키메라 단백질은 본원에서 개시한 바와 같이 제1 키메라 단백질의 경우 HPV16, HPV18, HPV45, HPV33, 제2 키메라 단백질의 경우 HPV31, HPV52, HPV58의 항원을 포함한다. 또 다른 특정 실시양태에서, 두 개의 상이한 키메라 단백질은 본원에서 개시한 바와 같이 제1 키메라 단백질의 경우 HPV31, HPV33, HPV52, HPV58, 제2 키메라 단백질의 경우 HPV16, HPV18, HPV45의 항원을 포함한다. 바람직한 실시양태에서, 이렇게 정의된 HPV 항원들은 명시된 순서로 키메라 단백질에 삽입되나, 반드시 그렇지는 않다.
특정 실시양태에서, 조성물은 또한 적합한 약학적 비이클을 포함하며, 이는 예를 들어 완충제, 식염수, 인산염완충식염수, 덱스트로스, 글리세롤, 물, 에탄올 등 및 이들의 조합으로부터 선택된다.
특정 실시양태에서, 조성물은 또한 적합한 약학적 비이클과 함께 또는 없이 하나 이상의 애쥬번트, 바람직하게는 하나의 애쥬번트, 및/또는 표면활성제 및/또는 면역조절 물질(예를 들어, 사이토카인 또는 케모카인) 및/또는 성장 인자, 예를 들어 GM-CSF을 포함한다. 다양한 애쥬번트가 당업계에 공지되어 있으며, 완전 프로인트 애쥬번트(CFA), 불완전 프로인트 애쥬번트(IFA), 몬타니드 ISA(불완전 세픽(seppic) 애쥬번트), 무라밀 펩티드, 예를 들어 무라밀 디펩티드(MDP) MDP-Lys(L18)(Nα아세틸레무라밀-L-알라닐-D-이소글루타미닐-Ne스테오로일-L-리신, 황산아연, 콜로이드 수산화철, 인산칼슘 또는 염화칼슘, CpG 올리고데옥시뉴클레오티드(CPG ODN) 예를 들어 CPG ODN 1826 및 CPG ODN 2007, 물에 5% 스쿠알렌(w/v), 0.5% Tween® 80(w/v) 및 0.5% Span(w/v)을 포함하는 계면활성제 안정화된 수중유형 에멀젼 MF59, TLR4 리간드(예를 들어, MPL, GLA), TLR3 리간드(예를 들어, 폴리 IC, 힐토놀(Hiltonol®)로 불리는 폴리-ICLC), 다당류(예를 들어 인슐린) 및 리포솜(예를 들어, 양이온 리포솜, ISCOM)을 포함한다.
특정 실시양태에서, 하나 이상의 애쥬번트는 T-세포 면역 반응을 활성화시키는 능력을 갖는 분자 중에서 선택된다. 바람직한 애쥬번트는 면역 세포(예를 들어 APC)에 TLR(톨(Toll) 유사 수용체) 3, 4, 7, 8 및/또는 9에 결합하는 것, 또는 이들에 대한 아고니스트이다. 특정 실시양태에서, 애쥬번트는 TLR 리간드, 특히 3형의 TLR 리간드, 예를 들어 폴리-ICLC, 4형의 TLR 리간드, 예를 들어 MPL, 9형의 TLR 리간드, 예를 들어 CpG, 및 7/8형의 TLR 리간드, 예를 들어 이미퀴모드(Imiquimod)로 이루어지는 군으로부터 선택된 TLR 리간드이다. 애쥬번트의 예는 이미퀴모드 및 폴리-ICLC이다. 상업적으로 이용가능한 이미퀴모드 기재 약물은 알다라(Aldara™)(5% 이미퀴모드를 포함하는 크림형태로 판매됨)이고, 폴리-ICLC는 온코비르 사(Oncovir Inc, (WA, US))로부터 힐토놀로 구입할 수 있다..
특정 실시양태에서, 본원에서 정의된 키메라 단백질(들) 또는 조성물은 상이한 경로를 통해 환자에게 주입될 수 있다: 피하(s.c.), 진피내(i.d.), 근육내(i.m.) 또는 정맥내(i.v.) 주사, 경구 투여 및 점막 투여, 특히 비강내 투여 또는 흡입. 특정 실시양태에서, 본원에서 정의된 키메라 단백질(들) 또는 조성물은 진피내 투여된다.
또한, 본원에서 정의된 키메라 단백질(들) 또는 조성물은 하나 이상의 면역강화제, 예를 들어 하나 이상의 애쥬번트, 바람직하게는 하나의 애쥬번트, 및/또는 표면활성제 및/또는 면역조절 물질과 조합되거나 혼합될 수 있다. "조합된"은 본원에서 정의된 키메라 단백질(들) 또는 조성물 및 면역강화제 모두를 동시 또는 상이한 시간 및/또는 동일하거나 상이한 투여 형태, 바람직하게는 동일한 접촉 부위에서 숙주와 접촉시키는 것을 의미한다. 반면, "혼합된"은 본원에서 정의된 키메라 단백질(들) 또는 조성물 및 면역강화제가 투여 시 동일한 제제에 있는 것을 의미한다.
본원에서 정의된 키메라 단백질(들) 또는 조성물은 고체 형태(캡슐, 분말, 정제, 환제, 좌약, 속방성 정제, 위 내성 정제, 서방성 정제), 주사 전에 예를 들어 희석제(들)로 재구성될 필요가 있는, 바람직하게는 동결건조 후, 분말 형태(동결건조된 형태 또는 동결건조된 분말 형태), 또는 액체 형태, 예를 들어 주사가능한 용액 또는 주사가능한 현탁액일 수 있다.
투여되는 키메라 단백질(들)의 양(투여량)은 환자의 상태, 개인의 면역계의 상태, 투여 경로 및 숙주의 체중을 고려하는 것을 포함하여 치료받을 피험체에 따른다. 통상적인 투여량은 1 내지 2400㎍, 100 내지 2000㎍, 200 내지 1000㎍, 500 내지 1000㎍ 범위이다. 특정 투여량은 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000 또는 2400㎍±10%로 이루어지는 군으로부터 선택된다. 또 다른 실시양태에서, 통상적인 투여량은 벡터에 포함된 폴리펩티드(들) 1 내지 100 ㎍, 1 내지 50㎍ 및 1 내지 10㎍ 범위이다. 본 발명의 활성 성분으로 전체 치료를 위한 총 투여량은 200 내지 2400㎍, 300 내지 2000㎍, 400 내지 1000㎍, 500 내지 800㎍ 범위이다. 상기 예들은 상황에 따라 당업자에 의해 변경될 수 있다.
본 발명은 또한 약제로서 사용하기 위한 본 발명의 키메라 단백질 또는 본 발명의 조성물에 관한 것이다. 특정 실시양태에서, 본 발명의 키메라 단백질 또는 본 발명의 조성물은 병원체 감염의 예방용 또는 치료용이다. 또 다른 실시양태에서, 본 발명의 키메라 단백질 또는 본 발명의 조성물은 발암성의, 바람직하게는 발암성의 종양 기반 질환, 예를 들어 종양성 질환, 악성 종양 질환 또는 악성 신생물의 예방용 또는 치료용이다. 특정 실시양태에서, 본 발명의 키메라 단백질 또는 본 발명의 조성물은 예방 면역 반응 또는 치료 면역 반응의 유도용이다.
특정 실시양태에서, 본 발명은 또한 병원체 감염을 나타내거나 병원체 감염된 것으로 의심되는 동물 또는 인간 환자를 치료하기 위한 방법으로서, (a) 가능하게는 다회 투여 용량으로서 상기 동물 또는 인간 환자에게 본 발명의 키메라 단백질 또는 조성물을 투여하는 단계, 및 (b) 상기 동물 또는 인간 환자의 상태를 추적 조사하는 단계를 포함하는 방법에 관한 것이다.
또 다른 실시양태에서, 본 발명은 또한 종양 질환을 나타내는 동물 또는 인간 환자을 치료하기 위한 방법으로서, (a) 가능하게는 다회 투여 용량으로서 상기 동물 또는 인간 환자에게 본 발명의 키메라 단백질 또는 조성물을 투여하는 단계, 및 (b) 상기 동물 또는 인간 환자의 상태를 추적 조사하는 단계를 포함하는 방법에 관한 것이다.
본 발명은 또한 동물 또는 인간 환자의 병원체 감염을 예방하기 위한 방법으로서, (a) 가능하게는 다회 투여 용량으로서 상기 동물 또는 인간 환자에게 본 발명의 키메라 단백질 또는 조성물을 투여하는 단계, 및 (b) 상기 동물 또는 인간 환자의 상태를 추적 조사하는 단계를 포함하는 방법에 관한 것이다.
본 발명은 또한 동물 또는 인간 환자에서 종양 질환의 발현 및 발달을 예방하기 위한 방법으로서, (a) 가능하게는 다회 투여 용량으로서 상기 동물 또는 인간 환자에게 본 발명의 키메라 단백질 또는 조성물을 투여하는 단계, 및 (b) 상기 동물 또는 인간 환자의 상태를 추적 조사하는 단계를 포함하는 방법에 관한 것이다.
본 발명에 따른 치료법은 이를 필요로 하는, 병원체에 감염되거나 감염된 것으로, 또는 병리학적 상태로 나타내는 것으로 진단받은 동물 또는 인간 환자의 임상 조건을 향상시키는 것을 목표로 한다. 특정 실시양태에서, 상기 치료는 질병의 원인 물질 또는 생물을 제거하거나, 상기 물질 또는 생물의 양을 낮추는 것을 목표로 한다. 바이러스 감염 상황에서, 치료는 숙주의 표적화된 조직에서 측정 시 검출될 수 있는 것보다 더 적은 수준으로 바이러스 양(load)을 유의하게 감소시킬 수 있다. 종양성 질환의 경우, 치료는 종양(들)의 크기 또는 발달을 낮추거나 종양세포를 없애거나 측정시 검출될 수 있는 것보나 낮은 수준으로 종양 세포 수를 감소시킬 수 있다. 또한 치료법은 병원체 감염 또는 종양 질환과 관련된 증상을 제거하거나 낮춤으로써 동물 또는 인간 환자의 임상 상태를 향상시키는 것을 목적으로 하고, 바람직하게는 건강을 회복시키는 것을 목표로 한다.
동물 또는 인간 환자의 예방 요법(prophylactic treatment)은 상기 동물 또는 인간 환자의 병원체 감염을 예방하는 것 또는 신생물의 종양성 질환의 발현 또는 발달을 예방하는 것, 상기 동물 또는 인간 환자의 병리 상태의 발생을 예방하는 것을 목적으로 한다. 예방 요법은 백신접종을 포함한다.
본 발명의 키메라 단백질 또는 조성물을 이용한 치료 요법(therapeutic treatment) 및 예방 요법은 숙주에서 이종 폴리펩티드 내에 포함된 에피토프(들)에 대한 효율적인 면역 반응, 바람직하게는 세포 면역 반응의 유발에 기초한다.
따라서, 본 발명은 또한 본 발명의 키메라 단백질 또는 조성물이 투여되는 숙주에서 이종 폴리펩티드 내에 포함된 에피토프(들)에 대한 면역 반응, 바람직하게는 세포 면역 반응(예를 들어 CTL 반응)을 유도하거나 유발하기 위한 본 발명의 키메라 단백질 또는 조성물의 용도에 관한 것이다.
특정 실시양태에서, 본 발명은 또한 (i) 이종 폴리펩티드 내에 포함된 제1 에피토프 군에 대한 T 세포 면역 반응을 유발함으로써 포유동물 숙주에서 진단받은 제1의 결정된 병리 상태의 면역 치료 요법에, 그리고 (ii) 상기 이종 폴리펩티드 내에 포함된 제2 에피토프 군에 대한 T 세포 기억 면역 반응을 유발함으로써 동일한 포유동물 숙주에서 제2의 결정된 병리 상태(들)에 대한 예방법에 사용하기 위한 본 발명의 키메라 단백질 또는 조성물에 관한 것으로, 상기 면역 반응은 상기 키메라 단백질 또는 상기 조성물을 상기 숙주에 투여 후에 얻어지며, 제2의 결정된 병리 상태(들)에 대한 상기 예방법은 상기 제2 에피토프 군이 상기 이종 폴리펩티드 내에 포함되지 않을 때 관찰되지 않는다.
실제로, 본 발명자들은 본 발명의 키메라 단백질이 APC에 접근, APC에 의한 프로세싱 및 제시, 및 사이토카인의 이용가능성과 관련하여 상이한 에피토프들 사이에 존재하는 경쟁을 우회할 수 있다는 것을 보여주었다. 따라서, 본 발명의 키메라 단백질을 이용하여, 치료 요법에서 제1 군의 에피토프에 대한 면역 반응을 유도할 수 있으며 예방 요법에서 제2 군의 에피토프에 대해 유도된 면역 반응 또한 유도할 수 있다. 따라서, 본 발명의 키메라 단백질은 숙주에서 진단받은 제1의 결정된 병리 상태(들)의 면역 치료 요법 내에서 T 세포 면역 반응을 유발하기에, 그리고 동일한 숙주에서 제2의 결정된 병리 상태(들)의 위험에 대한 예방 요법 내에서 T 세포 기억 면역 반응을 유발하기에 효율적이라는 것을 확인하였다.
실시예
I. 재료 및 방법
마우스
6주령 암컷 C57BL/6 마우스 (H-2b)는 장비에 래보러토리즈(Janvier Laboratories)로부터 구입하였다. 마우스는 물과 먹이를 무제한 공급하면서 무병원체 조건에서 수용하였다. 동물 및 동물 캐어와 관련한 과정은 국내 및 국제법 및 정책을 따르며 지역 윤리 위원회에 의해 검토된 젠티셀(Genticel) 가이드라인을 따랐다.
본 발명에 사용된 일부 HPV 형에는, 상이한 유전적 배경을 갖는 다른 마우스가 유리하게 사용될 수 있다. 이러한 마우스는 장비에 래보러토리즈로부터 구입할 수 있으며, DBA/2JRi (H2Kd/H2Dd), 또는 CBA/JRi (H2Kk/H2Dk) SJL/JRi (H2Ks/H2Ds) 및 FVB/NRi (H2Kq/H2Dq)를 포함한다.
또한, 다른 마우스, 예를 들어 HLA, 특히 HLA-A2 단상형(haplotype)을 갖는 인간화 마우스도 본 발명의 구조물에 의해 유발되는 면역 반응을 결정하는 데에 유리하다. 형질도입 HLA-A2.1 마우스를 타코닉 사(TACONIC, USA)로부터 구입하여, 인간 HLA-A2.1 단상형을 발현하는 마우스에서, 선택된 HPV 형으로부터의 각 E7에 대한 기재된 백신 후보의 면역원성을 시험할 수 있다.
상기 마우스들을 사용하여 선택된 HPV 형으로부터의 각 E7에 대한 기재된 후보 백신의 면역원성을 시험한다.
종양 세포주
TC-1(조직 배양 번호 1) 종양 세포 [19]는 C57BL/6 1차 마우스 폐 세포를 HPV16 E6 및 E7 종양유전자 및 활성화된 인간 c-Ha-Ras 종양유전자로 형질전환 시켜 준비하였다. 본 연구에 사용된 세포는 ATCC로부터 얻었다. TC-1 세포는 각 실험전에 해동시킨 후 주사 전 최소 10일 동안 시험관 내에서 배양하고 증식하였다.
루이스 폐 암종(Lewis lung carcinoma)(LL2)은 1차 루이스 폐 암종 이식으로 생성된 종양을 갖는 C57BL/6 마우스의 폐로부터 확립된 세포주이다(13). 상기 세포주는 암 전이 모델로 널리 사용되며, 암 치료 기전을 연구하는 데 유용하다(14). LL2 종양 세포주는 ATCC(CRL-1642)로부터 구입하였다.
상기 세포는 HPV18 E7 및 GFP 유전자 또는 GFP 유전자만을 포함하는 렌티바이러스 벡터(Vectalys, Labege, France)로 제조사의 프로토콜에 따라 형질도입하였다. MHC I형, GFP, 및 E7 발현을 기본으로 하여 3개의 클론을 선별하였다. 성장 프로파일 및 HPV18 E7-특이적 세포 독성 T CD8+ 림프구에 의해 표적화되는 능력에 따라 생체 내 예방 선별 후 한 클론을 선별하였다; 접종을 위한 최적의 세포 수를 위해 테이크 레이트(take rate) 실험을 수행하였다. 생체 내 선별에서, 치료 연구의 테이크 레이트 및 이상적인 시간은 온코디자인(Oncodesign(Dijon, France))으로 수행하였다. LL2 세포는 각 실험 전에 해동시킨 후 주사 전 최소 10일 동안 시험관 내 배양하고 증식하였다.
B16-IRES-GFP-OVA (B16-GFP) 및 B16-MAGEA3-IRES-GFP-OVA (B16-MAGEA3-GFP) 세포를 사용하여, 처리된 마우스로부터 얻어진 생체 외 비장세포를 재자극하였다. B16-MAGEA3 세포는 MAGE-A3 단백질을 발현하는 벡터라이스(Vectalys)에 의해 형질도입된 B16-F10 유전적동계(syngeneic)의 종양 세포이다. GFP 발현은 정상적으로 MAGE-A3 단백질 발현과 연관되어 있다.
종양 세포 접종
0일에, C57BL/6 마우스에게 100㎕ PBS 1X에 희석된 TC-1 세포(마우스 당 1x106 세포)를 오른쪽 옆구리 피하 경로를 통해 주사하였다. 일부 실험에서, 65일에 마우스에게 100㎕ PBS 1X에 희석된 LL2-GFP 또는 LL2-HPV18 E7-GFP 세포를 왼쪽 옆구리 피하 경로를 통해 주사하였다.
백신
재조합
CyaA
-
HPV16
E7
△30-42
(C16-1) 및
CyaA
-
HPV18
E7
△
32-42
(C18-
1)의
제작 및 정제.
제작 및 정제는 EP1 576 967 B1에 이미 기재되어 있다. 프로서빅스라는 2가 조성물을 제조하기 위해 젠티셀에서 두 가지 대량의 최종 CyaA-HPV16 E7△30-42 (C16-1)(도 1A) 및 CyaA-HPV18 E7△32-42(C18-1)(도 1B)를 1:1 비율로 혼합한 후 앨리쿼트(aliquot)로 -80℃에 보관하였다.
gtCyaAd93
- 및
gtCyaAd203
-기재 백신의 제작 및 정제:
야생형 CyaA의 DNA 서열(CyaAwt: GeneBank: CAE41066.1)은 이.콜라이에서의 발현을 위해 최적화하여 합성하였다(GeneCust). 최적화된 DNA 서열은 gtCyaA으로 명명하였다. 상기 서열은 CyaA 촉매 도메인으로 항원성 서열을 삽입하기 용이하게 하기 위해 첨가된 하기의 고유한 제한 부위를 포함한다: NdeI(CATATG), BamHI(GGATCC), EcoRI(GAATTC), EcoRV(GATATC), PciI(ACATGT), BclI(TGATCA), AgeI(ACCGGT), XmaI(CCCGGG), NcoI(CCATGG).
이어서, gtCyaA는 pTAC 유도성 프로모터를 포함하는 pGTPc608 플라스미드(GTP 테크놀로지(Labege, France)로부터 제공받은 플라스미드)에 삽입하였다.
두 가지 결실 변이체를 시험하였다: 비. 페르투시스 CyaA의 아미노산 위치 228 내지 위치 320 사이의 93개 아미노산의 결실 및 비. 페르투시스 CyaA의 아미노산 위치 184 내지 위치 386 사이의 203개 아미노산의 결실. 첫 번째 93개 잔기의 결실은 칼모듈린 상호작용 도메인(도메인 III)을 제거한다. 두 번째 203개 잔기의 결실은 도메인 II 및 III을 제거한다.
gtCyaA에서 93개 및 203개 aa의 결실은 항원을 삽입하는 동안 생성되었다.
발현된 각 단백질은 크로마토그래피 과정에 의해 정제하였다.; 특히 이온 교환 친화도 크로마토그래피 및 소수성 교환 크로마토그래피 기술을 실시하였다.
gtCyaAd93
-
pep216
-
CyaCopt
및
gtCyaAd203
-
pep216
-
CyaCopt의
제작 및 정제
모든 항원은 DNA 2.0.(USA) 또는 진커스트(Genecust)(Germany)로 합성하고 클로닝은 솔비아스(Solvias, Switzerland)로 수행하였다. gtCyaAd93-pep216-CyaACopt 및 gtCyaAd203-pep216-CyaACopt는 도 3A 및 3B에 개략적으로 나타낸다.
BLR 박테리아 균주는 각 플라스미드로 각각 전기천공하였다. 형질감염된 박테리아는 전형적인 배지에서 배양하고 IPTG를 첨가하여 생산을 유도하였다.
발현된 각 단백질은 크로마토그래피 과정에 의해 정제하였다; 특히 이온 교환 친화도 크로마토그래피 및 소수성 교환 크로마토그래피 기술을 실시하였다.
CyaAd203
-
pep105의
제작:
CyaAd203-PEP105opt 단백질은 203개 aa가 결실된 아데닐레이트 사이클라아제 서열로 이루어지며, 항원성 삽입물로서 폴리펩티드 105(PEP105)를 포함한다. CyaA의 최적화된 서열은 pKTRACE 플라스미드 NdeI 및 BamHI 제한 부위에 앞서 기재된 바와 같이 클로닝하였다. Pep105 항원을 합성하여 EcoRI과 XmaI 제한 부위에 클로닝하였다. 정제 프로토콜은 EP1 576 967 B1에 이미 기재되어 있다. pKTRACE CyaAd203-pep105opt은 도 4에 개략적으로 나타낸다.
폴리펩티드 pep105(서열 번호 24)는 N-말단에서 C-말단으로 하기의 항원들을 포함한다. 일부 항원은 융합되지만 나머지는 링커에 의해 분리된다. 특정 링커(AS 디펩티드)는 GVNHQHL 서열 앞에 도입되어 면역 반응 검정을 위한 강한 마우스 MHC I형 제한된 에피토프(H-2b 제한된) 이온을 생성한다(굵은 글씨체):
백신 투여
11일에, 종양 측정 후, 검출가능한 고형성 종양을 갖는 마우스를 진피 내(i.d.) 주사로 귀 진피(양쪽 귀 모두에 주사)에 백신접종하였다.
애쥬번트
분자
폴리-ICLC(TLR3 아고니스트)는 1 mL의 2 mg/mL 유백색 멸균액를 포함하는 바이알로 온비르(Oncovir)사(Inc, WA, US)에서 제공받았다. 폴리-ICLC는 본래 용기에 두어 +4℃에 보관하였다. 주사용 폴리-ICLC는 0.9% 염화나트륨 용액 내 1.5 mg/mL 폴리-L-리신 및 5 mg/mL 카복시메틸셀룰로스 나트륨으로 안정화되고 수산화나트륨으로 pH 7.6 내지 7.8로 조정된 폴리-IC 2mg/mL를 포함한다.
종양 측정
각각 다른 지표를 고려하여 마우스에서 종양 발달을 평가하였다:
o 종양 크기 : 종양은 종양 세포 접종 후 5일부터 시작하여 60일까지 1주일에 2회 캘리퍼를 사용하여 수동으로 측정하였다. 이어서, 종양 부피를 다음과 같이 계산하였다: 부피 = (길이 x 넓이2)/2.
o 마우스 생존: 윤리적인 이유로, 비정상적으로 현저하고/거나(제한 크기: 2000 mm3) 괴사성 종양으로 발달한 마우스 또는 종양 유도되어 운동성이 손상된 마우스는 안락사시켰다.
o 무종양 마우스의 수: 본 정보는 치료 백신접종이 완전한 종양 퇴행(촉지성 종양이 없음)을 유도하였을 때를 나타낸다.
T 세포 기억 세포독성 반응의 측정
CD8+ T 세포의 세포 독성을 생체 내에서 측정하는 방법은 광범위하게 기재되어 있다[22, 23]. 간략하게, 무접촉(naive) 마우스의 유전적동계 비장세포를 상이한 농도의 CFSE(카복시플루오레신 숙시니미딜 에스테르, Molecular Probes Invitrogen)로 표지하고 적절한 펩티드로 시험관 내 펄스하거나 펄스하지 않았다. 펩티드 펄스된 표적 세포 집단과 펄스되지 않은 표적 세포 집단 모두를 유전적동계 백신접종된 숙주로 정맥 내로 입양적으로(adoptively) 전달하고, 펩티드 펄스된 표적의 손실을 비장 내로 유세포 분석기(BD FACSCanto II)로 측정하였다. 살해율은 초기 비율로 보정된, 펄스되지 않은 세포에 대한 펄스된 표적 세포 퍼센트 비율에서의 감소로 평가하였다(하기 참조). 세포 제조물을 주사 전 유세포 분석법으로 분석하여 상이한 표적 세포의 CFSE 표지를 모니터하고 생체 내 살해율을 계산하기 위한 기준값(각 세포 집단의 실제 퍼센트)을 얻었다. 이어서, 세 가지 세포 집단을 각 백신접종된 마우스에 1:1:1로 정맥 내 주사하였다. 생체 내 살해율은 다음 식으로 다른 곳에서 기재된 바와 같이 계산한다[24]:
IFN -γ ELISpot(효소 결합된 면역스폿) 분석법
IFN-γ를 생산하는 특이적 CD8+ T 세포의 빈도는 H-2b-제한된 펩티드(HPV16 E749-57 및 HPV18 E7AS43 -49) 또는 HPV45 E7 단백질의 펩티드 뱅크로 비장세포의 생체 외 재자극에 의해 평가하였다. 상기는 IFN-g ELISpot 분석을 실시하여 달성하였다:
o 마우스의 혼주(pooled) 비장세포를 ELISpot 분석하였다.
간략하게, 백신접종된 마우스로부터 얻은 전체 비장세포를 자극시키지 않거나, 하기에 기재된 바와 같이 1 ㎍/mL의 각 펩티드로 37℃, 5% CO2에서 20시간 동안 재자극하였다:
o HPV16 E749-57 펩티드(H-2b 제한된 관련 에피토프)로 1x106 세포/웰
o OVA257 -264(H-2b 제한된 관련없는 에피토프)로 1x106 세포/웰.
o HPV18 E7AS43 -49(H-2b 제한된 관련없는 에피토프)로 0.25x106 세포/웰.
o HPV45 E7 펩티드 뱅크로 1x106 세포/웰
CyaAd203-PEP105opt을 이용한 실험을 위하여, 추가적인 항원성 자극을 사용하였다:
o #116-2/3 펩티드 뱅크(5㎍/ml) : #116-2 및 #116-3의 풀(pool)(1x106 세포/웰)
o #171 펩티드 뱅크(3 ㎍/ml) :#171-1, #171-2 및 #171-3의 풀(1x106 세포/웰)
o OVA323 -339, MHC-II형 제한된 펩티드, 10㎍/ml로 사용(1x106 세포/웰)
o LCMV GP33-41, MHC-I형 제한된 펩티드, 1㎍/ml로 사용(1x106 세포/웰)
o MOG35 -55, MHC-II형 제한된 펩티드, 10㎍/ml로 사용(1x106 세포/웰)
o 젠티셀에서 생산된 His-태그된 MAGEA3(TAA_002_MAGE-3) 단백질, 10㎍/ml로 사용.
o 비장세포:B16-GFP 세포(MAGEA3을 발현하거나 발현하지 않음)는 19:1 비율(950000개 비장세포:50000개 B16 세포)로 함께 배양하였다.
IFN-γ 분비는 스트렙타비딘-AKP를 이용하여 BCIP/NBT으로 확인되는 샌드위치 기반 ELISpot으로 모니터하였다. 자료는 바이로리더 5000-프로 S(Bioreader_ 5000-Pro S (Biosys))로 분석하였다.
II. 결과
A. 본 발명의 새로운 벡터의 모델
항원에 대한 면역 반응을
유도하는 능력의 확인
크고 다중 에피토프 항원을 운반하는 능력에 있어 본 발명의 새로운 벡터의 효율을 확인하기 위하여, 441개 아미노산을 갖는 모델 항원을 설계하였다(서열 번호 24).
0일에, 마우스는 CyaAd203-pep105opt 단백질로 백신접종하고 7일에 안락사시켜, 비장을 회수하여 비장세포를 단리하였다. 상기 세포를 사용하여, T-세포 매개 반응은 IFN-γ 및 IL-2 ELISpot 분석법을 이용하여 측정하였다. 프로서빅스로 백신접종된 마우스는 HPV16 E7 및 HPV18 E7 특이적 T 세포 반응의 유도에 대한 양성 대조군 및 CyaAd203-PEP105opt에 의해서만 운반되는 다른 항원에 대한 음성 대조군으로서 사용하였다. 모든 백신접종은 폴리-ICLC의 동시 주사로 애쥬번티드된다.
A.1.
HPV16
E7,
HPV18
E7 및
OVA
257
-264
특이적
IFN
-γ 반응의 유도
도 5는 HPV16 E749-57, HPV18 E7AS43 -49 및 OVA257 - 264 I형 제한된 펩티드 및 HPV16 E7(#116-2/3) 및 HPV18 E7(#171-1/2/3) 15-mers 펩티드 뱅크 재자극 후에 얻어진 결과를 나타낸다. 다음 결론을 얻을 수 있다:
- 폴리-ICLC 애쥬번티드-플라시보에 의해 백신접종된 마우스 군에서는 어떤 항원 특이적 면역 반응이 발견되지 않았다.
- 폴리-ICLC-애쥬번티드 프로서빅스 백신접종된 마우스 군과 관련하여, 재자극에 상관없이 기대된 결과를 얻었다:
- HPV16E749 -57 및 HPV18E7AS43 -49 I형 제한된 펩티드로 시험관 내 재자극은 명백한 HPV16 E7 및 HPV18 E7-특이적 IFN-γ 반응을 유도하였다;
- OVA257 -264 재자극으로 얻어진 특이적 반응은 없었다;
- 펩티드 뱅크(#116-2/3 및 #171-1/2/3)로 얻어진 HPV16 E7 및 HPV18 E7-특이적 IFN-γ 반응 세기는 MHC I형 제한된 펩티드(HPV16E749 -57, HPV18 E7AS43 - 49)로 얻어진 반응 수준에 근접했다.
- 폴리-ICLC-애쥬번티드 CyaAd203-PEP105opt로 백신접종된 마우스에 관련하여, HPV16 E7 및 HPV18 E7 펩티드 뱅크(#116-2/3 및 #171-1/2/3) 및 프로서빅스에 대해 시험된 모든 MHC I형 제한된 펩티드 HPV16E749 -57, HPV18E7AS43 -49 및 OVA257 -264 펩티드로 HPV16 E7 및 HPV18 E7-특이적 IFN-γ 반응을 확인하였다.
상기 결과는 상기 상이한 모든 펩티드로 생체 외 재자극이 CyaAd203-PEP105opt 진피 내 백신접종에 의해 유발된 HPV18 E7, HPV16 E7 및 OVA257 -264 항원 특이적 T-세포를 재자극 할 수 있다는 것을 보여주었다.
A.2. 항원
OVA
323
-339
,
LCMV
GP
33-41
,
MOG
35
-55
및
MAGEA3에
특이적인 T-세포
매개된
IFN
-γ 반응의 유도
도 6은 상이한 형태의 생체 외 재자극 후 얻어진 결과를 도식화한 것이다.
- OVA323 -339, MHC-II형 제한된 펩티드
- LCMV GP33-41, MHC-I형 제한된 펩티드
- MOG35 -55, MHC-II형 제한된 펩티드
- His-태그된 MAGEA3 단백질.
- APC로서 B16-MAGEA3-GFP 종양 세포를 사용하여 MAGE-A3 단백질의 내재 프로세싱의 결과로 생성되는 MHC I 형 제한된 에피토프를 제시함으로써 항원-특이적 CD8+ T 세포를 자극하였다. 또한, MAGE-A3 단백질을 발현하지 않은 B16-GFP 세포는 MAGEA3 면역 반응 특이성을 위한 음성 대조군으로서 시험하였다.
본 발명자들은 모든 군에서, 단백질 His-태그 MAGE-3은 동일한 비특이적 반응을 유도하였다는 것을 관찰할 수 있었다.
폴리-ICLC-애쥬번티드 플라시보 또는 폴리-ICLC-애쥬번티드 프로서빅스로 백신접종된 마우스의 경우, 상기 항원에 대한 면역반응이 확인되지 않았다.
폴리-ICLC-애쥬번티드 CyaAd203-PEP105opt로 백신접종된 마우스의 경우, 항원 특이적 IFN-γ 분비 T 세포는 OVA323 -339, GP33-41 및 MOG35 -55 펩티드 재자극 후뿐 아니라 B16-GFP 및 B16-MAGEA3-GFP 세포 재자극 후에도 확인되었다.
상기 결과는 CyaAd203-PEP105opt 백신접종이 I-Ab-제한된 OVA323 -339, H-2Db-제한된 LCMV GP33-41 및 MOG35 -55 및 GFP11 항원-특이적 T-세포를 유발하였다는 것을 보여 주었다.
종합해 보면, 상기 결과는 다중 에피토프 방식으로 강한 Ag-특이적 CD4+ T 세포 및 CD8+ T 세포 모두를 증가시킬 수 있는 CyaA-기반 백신 벡터의 뛰어난 효율을 강조한다.
불행하게도, IFN-γ 분비 T 세포의 유사한 빈도가 두 세포주 B16-GFP 또는 B16-MAGEA3-GFP로 생체 외 재자극 후 얻어졌기 때문에, MAGEA3-특이적 반응은 정확하게 측정될 수 없었다. CyaAd203-PEP105opt는 GFP11 항원을 포함하기 때문에, 상기 백신 벡터를 이용한 면역화는 MAGEA3-특이적 T 세포 반응을 방해하는 GFP-특이적 T-세포반응을 유도하였다.
본 연구는 203개
잔기가
결실된
CyaA
백신 벡터가 동일한
백신접종된
마우스에서 여러 관련없는 T-세포
에피토프에
대한 항원 특이적 T 세포 반응을 유도할 수 있는 능력을 처음으로 강조하고 있다. 또한, 상기 결과는 203개
잔기가
결실된
CyaA
벡신
벡터가 CD4
+
및 CD8
+
T 세포 반응 모두(
MHC
I 및
MHCII
제한된 펩티드 모두에 대해 확인된 특이적 반응)를 유도할 수 있는 뛰어난 능력을 강조한다.
B.
HPV
항원의 설계
침습 세포 암종(ICC)를 갖는 여성, HPV에 감염되었으나 정상의 세포진(細胞診, cytology)을 갖는 여성에서의 유병률에 기초하여 위험도가 최고인 7가지 HPV 형(16, 18, 45, 31, 33, 52 및 58)으로부터 7개의 E7 서열을 선택하였다[9][10]: HPV16 E7 변이체(gi_30172006; 서열 번호 25), HPV18 E7 변이체(gi_167996747; 서열 번호 26), HPV31 E7 변이체(gi_148727610; 서열 번호 27), HPV33 E7 변이체(gi_257472286; 서열 번호 28), HPV45 E7 변이체(gi_549287; 서열 번호 29), HPV52 E7 변이체(gi_237861305; 서열 번호 30) 및 HPV58 변이체(gi_19111001; 서열 번호 32).
E7은 산성 영역에 의해 분리되는 두 개의 기능성 도메인으로 이루어진다. 이들 도메인은 광범위하게 개시되어 있다 [11-13]. 단백질의 N-말단 부분은 pRB 결합 모티프(LXCXE)를 포함하고 단백질의 C-말단 부분은 아연 핑거 루프를 포함한다. HPV16, 18 및 45의 E7 단백질은 도 7A에 정렬되어 있으며, HPV 31, 33, 52 및 58의 E7 단백질은 도 7B에 정렬되어 있다.
두 개의 재조합 항원은 HPV16, 18 및 45 각각의 3개의 E7 서열의 융합에 의해 이루어져 있다(산성 영역의 존재 또는 비존재). 또한, 두 개의 재조합 항원은 HPV31, 33, 52 및 58 각각의 4개의 E7 서열의 융합에 의해 이루어져 있다(산성 영역의 존재 또는 비존재). 각 E7의 산성 영역의 존재 또는 비존재는 문헌에 지시된 규칙을 따르는 WO 2005089792에 개시된 원리를 따른다. 실제로, CyaA 내 산성 서열은 CyaA의 촉매 도메인이 세포 기질로 정상적으로 이동하는데 유해한 것으로 개시되었다[8]. 따라서, 상기 영역의 존재 및 비존재 서열은 본 발명의 새로운 벡터(gtCyaAd93 및 gtCyaAd203)가 상기 항원을 APC의 세포 기질로 전달하는 능력을 시험하게 하였다.
HPV16, 18 및 45 E7 서열로 이루어지는 항원을 설계하여 후보의 3가 CyaA-벡터 백신을 생성하였다. 상기 서열은 산성 영역이 결실되거나 결실되지 않았고(전장) E7 서열을 분할하고 역위시켜 도 8A에 나타낸 배열을 얻었다. 2가지 3가 후보 항원의 서열은 WO 2005089792에 기재된 강한 마우스 T-세포 에피토프를 도입하도록 추가로 변형시켰다. 상기 에피토프는 산성 영역 측면에 단백질 C-말단 부분에 있는 HPV18 E7 서열 GVNHQHL의 시작부위에 디펩티드 알라닌-세린(AS)를 삽입하여 생성한다.
HPV31, 33, 52 및 58 E7 서열로 이루어지는 항원을 설계하여 후보의 4가 CyaA-벡터 백신을 생성하였다. 후보 3가 항원의 경우와 같이, 상기 서열은 산성 영역이 결실되거나 결실되지 않았고 E7 서열을 분할하고 역위시켜 도 8B에 나타낸 배열을 얻었다.
각 후보에 대해, 인간 단백질에 대한 반응을 유도할 수 있는 에피토프(들)의 존재를 검색하였다. 놀랍게도, 야생형 서열의 HPV52 E7은 자가 면역 에피토프 B*2705 에피토프(9-mer, MHC I)일 수 있는 서열을 자연적으로 포함한다. 상기 에피토프의 서열은 인간 ITPR3(이노시톨 1,4,5-트리-포스페이트 수용체, 3형)의 서열과 100% 동일하다. 상기 에피토프를 피하기 위해, HPV31, 33 및 58 형의 E7 단백질과의 서열 상동성을 기초로 하여 서열 번호 30의 위치 84 메티오닌을 류신으로 위치 86 류신을 메티오닌으로 대체하도록 변형하였다(변형된 서열은 LRTLQQLLM). HPV52의 변형된 전장 E7 단백질의 서열은 서열 번호 31에 개시되어 있다. 따라서, 4가 항원의 서열 신기성(novelty)은 E7 단백질 C- 및 N-말단의 배열 및 HPV52 E7 서열에 수행된 2가지 변형의 존재로부터 유래 된다.
상기 특정 항원의 정전하는 상기에 설명된 바와 같이 계산하였다. 상기 항원은 -6보다 낮은 산성 전하를 가지며 3가 항원에 21개의 시스테인 및 4가 항원에 28개 시스테인을 각각 포함한다. 상기 항원들의 특징은 표 2에 요약한다.
이름 및
서열 번호 |
HPV 결합가 |
크기
( 잔기 ) |
정전하 |
Pep216 (서열 번호 34) |
산성 도메인 결실된 HPV16, 18 및 45 E7 단백질 (3가) |
276 | -16 |
Pep217 (서열 번호 36) |
전장의 HPV16, 18 및 45 E7 단백질 (3가) |
311 | -37 |
Pep233 (서열 번호 38) |
산성 도메인 결실된 HPV31, 33, 52 및 58 E7 단백질,(4가) |
337 | -13 |
Pep234 (서열 번호 40) |
전장의 HPV31, 33, 52 및 58 E7 단백질(4가), | 392 | -38 |
C.
CyaA의
촉매 도메인 내의 큰 결실은 크고 복잡한
항원의 삽입을 가능하게
한다
3가 Pep216 및 Pep217 항원의 DNA 및 4가 Pep233 및 Pep234 항원의 DNA를 합성하여 새로운 gtCyaAd93 및 gtCyaAd203 벡터에 클로닝하였다. 대조군으로서, 각 E7 단백질을 gtCyaAd93에 개별적으로 삽입하고, HPV31, 33, 45, 52 및 58의 E7 서열이 이전에 CyaA 단백질 내에 삽입된 적이 없었기 때문에 이들이 문제가 되는 지를 확인하였다.
후보의 결합가 | 단백질 코드 |
gtCyaA
결실
(벡터) |
항원 특이성 |
3가 | BTpr _114 | 93 | 산성 도메인이 결실된 HPV16 , 18, 45 E7 단백질 |
BTpr _116 | 203 | 산성 도메인이 결실된 HPV16 , 18, 45 E7 단백질 | |
BTpr _115 | 93 | 전장의 HPV16 , 18, 45 E7 단백질 | |
BTpr _117 | 203 | 전장의 HPV16 , 18, 45 E7 단백질 | |
4가 | BTpr _143 | 93 |
산성 도메인이 결실된
HPV31 , 33, 52 및 58 E7 단백질 |
BTpr _144 | 203 |
산성 도메인이 결실된
HPV31 , 33, 52 및 58 E7 단백질 |
|
BTpr _145 | 93 | 전장의 HPV31 , 33, 52 및 58 E7 단백질 | |
BTpr _146 | 203 | 전장의 HPV31 , 33, 52 및 58 E7 단백질 | |
1가 | BTpr _131 | 93 | 산성 도메인이 결실된 HPV31 E7 |
BTpr _132 | 93 | 산성 도메인이 결실된 HPV33 E7 | |
BTpr _133 | 93 | 산성 도메인이 결실된 HPV52 E7 | |
BTpr _134 | 93 | 산성 도메인이 결실된 HPV58 E7 | |
BTpr _120 | 93 | 산성 도메인이 결실된 HPV45 E7 |
(BTpr_114 서열은 서열 번호 58에 개시되어 있다 ; BTpr_116 서열은 서열 번호 61 에 개시되어 있다; BTpr_115 서열은 서열 번호 64에 개시되어 있다; BTpr_117 서열은 서열 번호 67에 개시되어 있다; BTpr_131의 E7 삽입물의 서열은 서열 번호 70에 개시되어 있다; BTpr_132의 E7 삽입물의 서열은 서열 번호 71에 개시되어 있다; BTpr_133의 E7 삽입물의 서열은 서열 번호 73에 개시되어 있다; BTpr_134의 E7 삽입물의 서열은 서열 번호 74에 개시되어 있다; BTpr_120의 E7 삽입물의 서열은 서열 번호 72에 개시되어 있다).
상기 1가, 3가 및 4가 항원의 생산 및 분석적 특징을 평가하였다.
따라서, 프리-마스터(Pre-Master) 세포 뱅크(프리-MCB)를 각 제작물에 대해 실시하고 IPTG로 관심 단백질의 유도에 대해 시험하였다(도 9). 1가 및 3가 후보는 SDS-page 겔 분석에서 유도 후 정상적인 프로파일을 보였으나 4가 후보는 기대했던 크기에서 약한 밴드를 보였다.
상기 프로파일은 5리터 배양기에서 배양된 각 분자에 대해 확인하였다. 생산된 키메라 단백질의 특징은 표 4에 요약한다.
단백질 코드 | 순도 % | LPS 함량 EU/mg |
HCP
함량
% |
효소 활성
( cAMP 시험) |
BTpr _114 | 93 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _116 | 91 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _115 | 93 | >100 및 <500 | <2 | 효소 활성 확인되지 않음 |
BTpr _117 | 90 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _143 | 11 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _144 | 11 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _131 | 96 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _132 | 96 | <100 | <2 | 효소 활성 확인되지 않음 |
BTpr _133 | 96 | <100 | <2 | 효소 활성 확인되지 않음 |
Btpr _134 | 96 | <100 | <2 | 효소 활성 확인되지 않음 |
Btpr _120 | 97 | <100 | <2 | 효소 활성 확인되지 않음 |
생산의 관점에서, 결실에 상관없이, 1가 및 3가의 항원을 갖는 재조합 gtCyaA는 허용가능한 생산량 및 순도를 가져왔지만(>90%) 4가 후보는 감소된 순도를 보였다(관심 단백질의 11%).
93개 잔기가 결실된 후보 vs 203개 잔기가 결실된 후보를 비교할 때 전체 순도를 고려하면, 후자가 gtCyaAd93(Btpr114 & Btpr_115) 구조물보다 낮은 생산량을 갖는 것으로 보인다. 더 짧은 재조합 gtCyaA이 생산하기 더 쉬울 것으로 예상하고 있었기 때문에 이러한 차이는 상당히 놀라운 것이다.
이들 항원을 갖는 벡터 모두 효소 활성을 가지지 않으며 이것은 결실이 벡터의 독성을 없애기에 충분하다는 것을 강조한다.
D. 4개 이상의 E7을 갖는
GtCyaAs를
생산은 서열 의존적이다.
또한, 본 발명자들은 4가 후보에서 얻어진 결과가 CyaA 내 E7 폴리펩티드 서열의 개수, 또는 CyaA 내 E7 폴리펩티드 서열의 특정 조합(assembly)으로 인한 것인 지를 조사하였다. 이 목적으로 여러 가지 구조물을 시험하였다(표 5).
단백질 코드 | gtCyaA 결실 | 삽입물 내의 HPV 형 | 삽입물크기 |
Btpr _161 | 93 |
산성 영역이 결실된
31, 52, 58 E7 단백질 |
253 aa |
Btpr _162 | 93 |
산성 영역이 결실된
31, 33, 52 E7 단백질 |
253 aa |
Btpr _163 | 93 |
산성 영역이 결실된
16, 18, 45, 33 E7 단백질 |
360 aa |
Btpr _164 | 93 |
산성 영역이 결실된
16, 18, 45, 58 E7 단백질 |
360 aa |
Btpr _165 | 93 | 전장의 31, 52, 58 E7 단백질 | 295 aa |
Btpr _166 | 93 | 전장의 31, 33, 52 E7 단백질 | 294 aa |
Btpr _167 | 93 | 전장의 16, 18, 45, 33 E7 단백질 | 408 aa |
Btpr _168 | 93 | 전장의 16, 18, 45, 58 E7 단백질 | 409 aa |
Btpr _169 | 203 |
산성 영역이 결실된
31, 52, 58 E7 단백질 |
253 aa |
Btpr _170 | 203 |
산성 영역이 결실된
31, 33, 52 E7 단백질 |
253 aa |
Btpr _171 | 203 |
산성 영역이 결실된
16, 18, 45, 33 E7 단백질 |
360 aa |
Btpr _172 | 203 |
산성 영역이 결실된
16, 18, 45, 58 E7 단백질 |
360 aa |
Btpr _173 | 203 | 전장의 31, 52, 58 E7 단백질 | 295 aa |
Btpr _174 | 203 | 전장의 31, 33, 52 E7 단백질 | 294 aa |
Btpr _175 | 203 | 전장의 16, 18, 45, 33 E7 단백질 | 408 aa |
Btpr _176 | 203 | 전장의 16, 18, 45, 58 E7 단백질 | 409 aa |
프리-MCB 유도 시험을 실시하였으며, 그 결과 놀랍게도 CyaA 내 E7 서열의 개수가 제한이 되지 않았다. 오히려 제한이 되는 것은 항원의 전체 서열의 성질이었다. 게다가, Btpr_161, 162, 169 및 170은 전장의 항원(BTpr_165, 166, 173 및 174)과 비교하였을 때 관심 단백질의 생산량이 낮았다(표 6).
단백질 코드 | 삽입물 내 HPV 형 | gtCyaA 결실 | 유도능 ( Inductibility ) 결과 |
Btpr _161 |
산성 영역이 결실된
31, 52, 58 E7 단백질 |
93 | Btpr _165보다 약한 단백질 발현 |
Btpr _162 |
산성 영역이 결실된
31, 33, 52 E7 단백질 |
93 | BTpr _166보다 약한 단백질 발현 |
Btpr _163 |
산성 영역이 결실된
16, 18, 45, 33 E7 단백질 |
93 | BTpr _143보다 상당히 우수한 프로파일 발현 |
Btpr _164 |
산성 영역이 결실된
16, 18, 45, 58 E7 단백질 |
93 | BTpr _143보다 상당히 우수한 프로파일 발현 |
Btpr _165 |
전장의
31, 52, 58 E7 단백질 |
93 | BTpr _114와 유사한 단백질 발현 프로파일 |
Btpr _166 |
전장의
31, 33, 52 E7 단백질 |
93 | BTpr _114와 유사한 단백질 발현 프로파일 |
Btpr _167 |
전장의
16, 18, 45, 33 E7 단백질 |
93 | / |
Btpr _168 |
전장의
16, 18, 45, 58 E7 단백질 |
93 | / |
Btpr _169 |
산성 영역이 결실된
31, 52, 58 E7 단백질 |
203 | Btpr _173보다 약한 단백질 발현 |
Btpr _170 |
산성 영역이 결실된
31, 33, 52 E7 단백질 |
203 | Btpr _174보다 약한 단백질 발현 |
Btpr _171 |
산성 영역이 결실된
16, 18, 45, 33 E7 단백질 |
203 | / |
Btpr _172 |
산성 영역이 결실된
16, 18, 45, 58 E7 단백질 |
203 | / |
Btpr _173 |
전장의
31, 52, 58 E7 단백질 |
203 | BTpr _114와 유사한 단백질 발현 프로파일 |
Btpr _174 |
전장의
31, 33, 52 E7 단백질 |
203 | BTpr _114와 유사한 단백질 발현 프로파일 |
Btpr _175 |
전장의
16, 18, 45, 33 E7 단백질 |
203 | / |
Btpr _176 |
전장의
16, 18, 45, 58 E7 단백질 |
203 | / |
상기 실험으로부터, 본 발명자들은
gtCyaAd93
및
gtCyaAd203은
4개 이상의 E7 단백질에 대응하는 등가의 폴리펩티드 서열을 수용한다는 결론을 얻었다
. 그러나, 선택된
E7 단편의 서열 및 배열은 생산량 및 순도에 영향을 줄 수 있으며, 따라서 다소 바람직한 산업화 가능성을 갖는다.
프리
-
MCB로
관찰된 결과의 확인
본 발명자들은 또한 프리-MCB 수준에서 얻어진 결과가 확인되는가를 gtCyaAd93 벡터 내 4가 구조물에 특별히 중점을 두어 조사하였다. BTpr_143보다 더 우수하거나 BTpr_115와 등가인 발현 프로파일을 갖는 단백질을 5L 규모로 시험하였다. 다음 표는 얻어진 결과를 요약한다.
단백질 코드 | 삽입물 내 HPV 형 | gtCyaA 결실 |
유도능
결과
( 프리 - MCB ) |
5리터 규모 결과
|
Btpr _163 |
산성 영역이 결실된
16, 18, 45, 33 E7 단백질 |
93 | BTpr _143보다 상당히 우수한 프로파일 발현 | BTpr _143보다 3배이상 우수한생산성 및 6배 이상 우수한 순도 |
Btpr _164 |
산성 영역이 결실된
16, 18, 45, 58 E7 단백질 |
93 | BTpr _143보다 상당히 우수한 프로파일 발현 | BTpr _143보다 4배이상 우수한 생산성 및 6배 이상 우수한 순도 |
Btpr _165 |
전장의
31, 52, 58 E7 단백질 |
93 | BTpr _115와 유사한 단백질 발현 프로파일 | PBTpr _115보다 1.5배이 상 우수한 생산성 및 동등한 순도 |
Btpr _166 |
전장의
31, 33, 52 E7 단백질 |
93 | BTpr _115와 유사한 단백질 발현 프로파일 | PBTpr _115보다 1.5배이상 우수한 생산성 및 동등한 순도 |
Btpr _167 |
전장의
16, 18, 45, 33 E7 단백질 |
93 | BTpr _143보다 우수한 프로파일 발현 | BTpr _143보다 2배이상 우수한생산성 및 5배 이상 우수한 순도 |
Btpr _168 |
전장의
16, 18, 45, 58 E7 단백질 |
93 | BTpr _143보다 우수한 프로파일 발현 | BTpr _143보다 3배이상 우수한 생산성 및 5배 이상 우수한 순도 |
Btpr _173 |
전장의
31, 52, 58 E7 단백질 |
203 | BTpr _ 117와 유사한 단백질 발현 프로파일 | BTpr _117보다 2배이상 우수한 생산성 및 동등한 순도 |
Btpr _175 |
전장의
16, 18, 45, 33 E7 단백질 |
203 | Btpr _143보다 우수한 단백질 발현 프로파일 | BTpr _143보다 낮은 생산성인 반면 상당히 우수한 순도(6배이상) |
상기 실험으로부터 다음과 같은 결론을 내렸다:
1. 전체 생산성 및 순도는 Btpr_175를 제외하고 시험된 모든 구조물에서 향상되었다.
2. 생산성 및 발현 프로파일은 gtCyaAd93를 갖는 재조합 단백질보다 gtCyaAd203을 갖는 재조합 단백질에서 항상 낮았다.
3. gtCyaAd93 벡터는 gtCyaAd203 벡터보다 우수한 생산량과 순도로 4개의 HPV 항원을 포함하는 재조합 단백질 생산을 가능하게 한다.
4. 상기 결과는 프리-MCB에서의 관찰을 확인해준다.
E. 큰 항원을 포함하는
gtCyaAd93
및
gtCyaAd203는
면역원성을 갖는다.
E.1.
BTpr
_114,
BTpr
_115,
BTpr
_116 및
BTpr
_117의 면역원성
BTpr_114, BTpr_115, BTpr_116 및 BTpr_117 키메라 단백질의 면역원성을 또한 조사하였다. 마우스는 플라시보, 또는 프로서빅스(CyaA-HPV16 E7 + CyaA-HPV18 E7로 이루어지는 양성 대조군), 또는 Btpr_114(gtCyaAd93-PEP216-CyaCopt), BTpr_115(gtCyaAd93-pep217-CyaCopt), BTpr_116(gtCyaAd203-pep216-CyaCopt) 및 BTpr_117(gtCyaAd203-pep217-CyaCopt) 각각으로 진피 내 백신접종하였다. 모든 군은 폴리 IC-LC로 애쥬번티드되었다. 백신접종 후 7일에 마우스를 안락사시키고 비장세포는 앞서 확인된 MHC I형 제한된 펩티드로 재자극하였다. 결과는 도 10에 나타내었다.
도 10은 다음을 나타내었다.
- 10 ㎍의 프로서빅스로 면역화는 예상했던 수준의 HPV16 E749-57 및 HPV18 E7AS43-49-특이적 IFN-γ 반응을 유도하였다.
- 3가 후보 백신으로 얻어진 항원-특이적 반응은 프로서빅스로 얻어진 것과 등가였다.
- 특이적 T 세포 반응 빈도에 있어서, 3가 후보들 사이에서 차이는 발견되지 않았다.
- HPV16 항원에 대한 더 낮은 반응은 HPV16 에피토프가 C56LB/6 마우스가 매우 민감한 HPV 18 에피토프보다 더 약하다는 사실에 기인한다.
상기 관찰로 진피 내 면역화 후 마우스 내 HPV16 E749-57 및 HPV18 E7AS43 -49-특이적 IFN -γ 반응을 유도하는데 있어, 폴리 - ICLC - 애쥬번티드 gtCyaAd93 -PEP216-CyaCopt, gtCyaAd203 - PEP216 - CyaCopt , gtCyaAd93 - PEP217 - CyaCopt 및 gtCyaAd203-PEP217-CyaCopt는 폴리 - ICLC - 애쥬번티드 프로서빅스만큼 효율적이라는 결론을 내릴 수 있었다.
실험 당시, HPV45 E7의 경우 MHC-I-제한된 펩티드가 확인되지 않았기 때문에, 비장세포를 3개의 서브풀(#218-1, #218-2 및 #218-3)로 나누어 HPV45 E7 펩티드 라이브러리로 재자극하였다. 본 실험은 공지된 에피토프에 대응하는 펩티드보다는 펩티드 라이브러리로 만들어진, 발명자들에게 공지된 첫 번째 재자극이다.
도 11은 #218-3 펩티드 서브풀로 시험관 내 재자극은 gtCyaAd93-PEP216-CyaCopt, gtCyaAd203-PEP216-CyaCopt, gtCyaAd93-PEP217-CyaCopt 및 gtCyaAd203-PEP217-CyaCopt 백신접종에 의해 유발된 T-세포를 재자극시킬 수 있었으나 #218-1 및 #218-2 서브풀은 재자극시킬 수 없었다는 것을 보여주었다. 상기 면역 반응의 원인이 되는 펩티드 서열은 IELTVESSAEDLRTL이다.
놀랍게도, 유사한 반응이 HPV45 E7 서열을 포함하고 있지 않은 프로서빅스로 백신접종된 군으로 확인되었다. 상기 결과는 #218-3 풀 및 프로서빅스 백신 내 포함된 HPV16 E7 또는 HPV18 E7 서열에 존재하는 에피토프 사이의 교차 반응성에 의해 설명될 수 있다.
종합해 보면, 상기 결과는 복잡한 구조(21개 시스테인) 및 산성 전하를 갖는 항원이
gtCyaAd93
및
gtCyaAd203에
의해 정확하게 운반되고 항원 제시 세포(APC)에 의해
프로세스된다는
것을 보여준다. 이것은
프레빌
등 [5],
카리모바
등 [7] 및 그미로 등[8]에서 교시하는 결과를 고려해볼 때 예상하지 못한 것이다.
게다가,
CyaA의
촉매 도메인 내 생성된 결실은
CyaA
-특이적 T-세포 및
CyaA
-특이적 B-세포 반응의 수준을 감소시킴으로써 운반되는 이종 폴리펩티드와 관련하여 이점을 제공할 수 있었다(상기 결실은
CyaA의
MHC
I형 및 II형 제한된
에피토프
의 수를 감소시키는 결과를 가져온다).
E.2. Btpr _163, BTpr _164, BTpr _165, BTpr _166, BTpr _167, BTpr _168, BTpr_173 및 BTpr_175에 존재하는 새로운 리드(lead)의 면역원성
또한, Btpr_163, BTpr_164, BTpr_165, BTpr_166, BTpr_167, BTpr_168, BTpr_173 및 BTpr_175에 존재하는 새로운 리드의 면역원성을 C57BL/6 마우스에서 조사하였다.
마우스는 플라시보 또는 각 리드로 각각 진피 내 백신접종하였다. 모든 군은 폴리-ICLC로 애쥬번티드되었다.
백신접종 후 7일에 마우스를 안락사시키고 비장 세포를 시험되는 각 E7 항원의 펩티드 라이브러리로 재자극하였다. 시험된 모든 리드는 면역원성이었다.
HPV31, 45 및 58에 대한 면역원성은, 도구가 적합하지 않았기 때문에(유전적 백그라운드가 적합하지 않음), C57BL/6 마우스에서 시험하지 않았다. 이들 E7 단백질의 면역원성은 재료 및 방법에 기재된 바와 같이 다른 마우스 품종에서 시험된다.
단백질 코드 | 삽입물의 HPV 형 | gtCyaA 결실 | 면역원성 Yes /No (IFN-γ ELISpot 분석법) | 측정된 E7 특이적 T-세포 반응을 갖는 HPV 형 |
Btpr _163 |
산성영역이 결실된
16, 18, 45, 33 E7 단백질 |
93 | Yes | 16, 18, 33 |
Btpr _164 |
산성영역이 결실된
16, 18, 45, 58 E7 단백질 |
93 | Yes | 16, 18 |
Btpr _165 | 전장의 31, 52, 58 E7 단백질 | 93 | Yes | 52 |
Btpr _166 | 전장의 31, 33, 52 E7 단백질 | 93 | Yes | 33, 52 |
Btpr _167 | 전장의 16, 18, 45, 33 E7 단백질 | 93 | Yes | 16, 18, 33 |
Btpr _168 | 전장의 16, 18, 45, 58 E7 단백질 | 93 | Yes | 16, 18 |
Btpr _173 | 전장의 31, 52, 58 E7 단백질 | 203 | Yes | 52 |
Btpr _175 | 전장의 16, 18, 45, 33 E7 단백질 | 203 | Yes | 16, 18, 33 |
상기 결과는 다음을 나타내었다.
- 10㎍의 각 리드로 면역화는 특이적 IFN-γ 반응을 유도하였다.
- gtCyaAd93 및 gtCyaAd203는 항원을 항원 제시 세포로 정확하게 운반하였다.
- HPV16, 18, 33 및 52 E7 단백질에 대한 특이적 면역 반응이 측정되었다.
상기 결과로 6가 및 7가 혼합물에 대한 면역 반응을 추가적으로 조사하게 되었다.
E.
3: 7가
후보 백신의 면역원성
두 가지 3가 리드의 6가 혼합물의 면역 반응은 C57BL/6 마우스에서 평가하였다. 본 리드는 HPV 16-18-45 E7 단백질 및 HPV 31-52-58 E7 단백질을 각각 포함하는 BTpr_114 및 BTpr_165이다. 앞서 기재된 바와 같은 동일한 프로토콜을 이용하였다. 실험 당시 마우스에서 HPV52 E7에 대해 확인된 공지된 MHC I 제한된 펩티드가 없었기 때문에, 비장세포를 세 가지 서브풀(221-1, 221-2 및 221-3)로 나누어 HPV52 E7-펩티드 라이브러리로 재자극하였다. HPV16 E7 및 HPV18 E7의 재자극에, 3가지 서브풀(각각 116-1, 116-II, 116-III 및 171-I, 171-II 및 171-3)로 나누어진 펩티드 라이브러리를 또한 사용하였다.
결과는 도 15에 나타낸다.
상기 결과는 다음을 확인해 준다:
- 10 ㎍의 6가 혼합물로 면역화는 IFN-γ ELISPot에 의해 측정된 바와 같이 HPV16 E7, HPV18 E7 및 HPV52 T 세포 반응을 유도하였다.
- 각각의 항원을 갖는 gtCyaAd93 각각은 항원을 항원 제시 세포(APC)로 전달하고 측정가능한 HPV 형에 대한 항원-특이적 T 세포 반응을 촉진할 수 있었다.
- E7-특이적 T 세포 반응의 빈도에 있어서 3가 구성성분 단독과 6가 후보 백신 사이에 차이가 관찰되지 않았다(자료 제시하지 않음)
상기 관찰로
폴리
-
ICLC
-
애쥬번티드
Btpr
_114 및
Btpr
_165는
C57BL
/6 마우스에서 진피 내
면역화후
HPV16
E7,
HPV18
E7 및
HPV52
E7-특이적 T 세포 반응을 유도하는데 효율적이라는 결론을 내릴 수 있었다.
E.4. 2가지 7가 후보 백신의 면역원성
생산성 및 순도 결과를 기초로 하여, 2가지 7가 조합물을 C57BL/6 마우스에서 시험하였다: Btpr_165+Btpr_163 및 Btpr_166 + Btpr_164. 마우스는 각 7가 후보 백신 10 ㎍으로 각각 진피 내 면역시켰다.
도 16에 나타낸 바와 같이, 본 결과는 다음을 나타낸다:
HPV16 E7: #116-2j (c+d) 펩티드 서브풀로 시험관 내 재자극은 HPV16 E7을 포함하는 7가 후보 백신 또는 그의 구성성분 단독으로 백신접종에 의해 유발되는 T- 세포를 재자극할 수 있었다.
HPV18 E7: #171-I 및 #171-II 펩티드 서브풀로 시험관 내 재자극은 HPV18 E7을 포함하는 7가 후보 백신 또는 그의 구성성분 단독으로 백신접종에 의해 유발되는 T- 세포를 재자극할 수 있었다.
HPV33
E7:
o Btpr_166 및 Btpr_164로 이루어지는 7가 후보 백신의 경우, #220-2 펩티드 서브풀로 시험관 내 재자극은 백신접종에 의해 유발되는 T- 세포를 재자극할 수 있었다.
o Btpr_165 및 Btpr_163을 포함하는 7가 후보 백신의 경우, #220-1, #220-2 및 #220-3 펩티드 서브풀로 시험관 내 재자극은 백신접종에 의해 유발되는 T- 세포를 재자극할 수 있었다.
- HPV52 E7: #221-2 및 #221-3 펩티드 서브풀로 시험관 내 재자극은 HPV52 E7을 포함하는 7가 후보 백신 또는 그의 구성성분 단독으로 백신접종에 의해 유발되는 T- 세포를 재자극할 수 있었다.
종합해 보면, 생산성 및 면역원성의 상기 결과는 다음을 나타낸다:
- 3 및 4개의 HPV E7 단백질을 갖는 재조합 gtCyaAd93은 우수한 생산성으로 생산되고 정제될 수 있다;
- 재조합 gtCyaAd203 단백질은 또한 동일한 항원을 포함하는 gtCyaAd93 벡터에 비해 낮은 생산성이긴 하지만 생산되고 정제될 수 있다.
- 3 및 4개 HPV E7 단백질을 갖는 두 가지의 재조합 gtCyaAd93은 그들의 항원을 APC에 정확하게 전달할 수 있다.
- 특이적 면역 반응은 C57BL/6 마우스에서 각각의 면역원성 HPV 형에 대해 측정된다.
재조합 gtCyaAd93과 함께 E7 단백질의 설계는, 예를 들어 HPV33 E7에서 예시된 바와 같이, E7 항원에 대한 면역 반응에 영향을 줄 수 있다.
- 복잡한 구조(21개의 시스테인) 및 산성 전하를 갖는 항원은 gtCyaAd93에 의해 정확하게 전달되어 항원 제시 세포(APC)에 의해 프로세스된다. 이것은 그미라 등(2001) 및 페이욜 등(Fayolle et al. 1998)의 결과를 고려해 볼 때 예상하지 못한 것이다.
F. 후보의 세포독성 효율
F.1. 3가 후보 백신의 CD8-
매개된
세포독성 효율
세포독성 유도에 있어 3가 후보의 효율을 비교하기 위하여, 생체 내 살해 분석을 애쥬번트 존재 및 비존재 하에서 수행하였다. 무접촉 마우스의 비장세포를 회수하여 HPV16, HPV18 및 HPV45 E7 단백질 각각으로부터의 펩티드 라이브러리로 로딩하였다.
4개 군의 마우스를 플라시보, gtCyaAd93-pep216-CyaCopt, gtCyaAd93-pep217- CyaCopt 및 gtCyaAd203-pep217-CyaCopt 각각으로 폴리-ICLC 존재 또는 비존재 하에 백신접종하였다.
애쥬번트가 존재하는 경우, 후보 사이에 차이가 관찰되지 않았다(자료 미제시). 도 12의 왼쪽 패널(라이브러리 #171-1 및 #171-2로 로딩)에서, 결실된 항원 pep216을 포함하는 키메라 단백질로 백신접종된 마우스와 비교하여 전장의 항원(pep217)을 포함하는 키메라 단백질로 백신접종된 마우스에서 살해율이 높았다. 유사하게, 도 12의 오른쪽 패널에서(펩티드 라이브러리 #218-3으로 로딩), 플라시보와 비교할 때 pep217을 포함하는 키메라 단백질로 백신접종된 마우스에서 살해율이 높지만 pep216을 포함하는 키메라 단백질로 백신접종된 마우스에서는 살해가 확인되지 않는다. 폴리-LCLC 애쥬번트가 존재하지 않는 경우, 전장의 항원을 포함하는 gtCyaA는 산성 도메인이 결실된 항원과 비교하여 표적 세포를 살해하는데 더 효율적이었다. 전장의 항원은 E7 산성 도메인을 포함하고 있고 문헌의 교시에 따르면 산성 도메인이 결실된 항원보다 더 낮은 효율을 보여야 하기 때문에, 상기는 예상하지 못한 것이다.
상기 결과는 다음을
나타낸다
-
전장의 항원은 아마도 CD8
+
T 림프구에 의한 살해 반응에 유리한
에피토프(보조 T-세포 에피토프)를
갖는다; 그리고
-
gtCyaA
벡터는 산성 영역을 갖는 항원의 전달을 가능하게 한다.
F.2. 7가 후보 백신의 CD8-
매개된
세포독성 효율
E7-특이적 세포독성 T 림프구(CTL)를 유도하는 능력에 있어 7가 후보의 효율을 비교하기 위하여, 생체 내 살해 분석을 애쥬번트 존재하에 실시하였다. 무접촉 마우스의 비장세포를 회수하여 HPV16 및 HPV18 E7 단백질 각각으로부터의 펩티드 라이브러리로 로딩하였다.
3개 마우스 군을 플라시보, BTpr165 + BTpr163 및 BTpr166 + BTpr164로 폴리-ICLC 존재하에 각각 백신접종하였다.
플라시보군에서는 E7-특이적 살해가 관찰되지 않았다. 7가 후보 백신 모두는 HPV16 E7 펩티드 라이브러리(도 17-A) 또는 HPV18 E7 펩티드 라이브러리(도 17-B)로 각각 로딩된 세포의 E7-특이적 살해를 유도하였다.
상기 결과는 7가 후보 모두가 기능적 HPV16 및 HPV18 E7-특이적 CTL을 유도하였다는 것을 나타낸다.
G.
TC
-1 종양을 갖는 마우스에서 종양 퇴행 분석
본 발명자들은 또한 TC-1 종양 세포 모델을 이용하여 4가지 3가 후보 Btpr_114(gtCyaAd93-PEP216-CyaCopt), BTpr_115(gtCyaAd93-pep217-CyaCopt), BTpr_116(gtCyaAd203-pep216-CyaCopt) 및 BTpr_117(gtCyaAd203-pep217-CyaCopt)의 치료 효율을 조사하였다.
마우스는 0일에 모두 TC-1 세포(HPV16 E7 항원을 발현하는)로 접종하였다. 1군은 처리하지 않았다. 2군은 PBS 및 폴리-ICLC로 처리하고, 3군은 폴리-ICLC 애쥬번티드 프로서빅스로 처리하고, 4군은 폴리-ICLC 애쥬번티드 gtCyaAd93-pep216으로 처리하고, 5군은 폴리-ICLC 애쥬번티드 gtCyaAd203-pep216, 6군은 폴리-ICLC 애쥬번티드 gtCyaAd93-pep217로, 7군은 폴리-ICLC 애쥬번티드 gtCyaAd203-pep217로 처리하였다. 각 군은 10마리 마우스로 이루어졌다.
도 13은 모든 마우스가 종양을 발달시켰다는 것을 나타낸다. 그러나, HPV16 E7 항원을 포함하는 CyaA 후보 백신으로 백신접종되고 폴리-ICLC 애쥬번티드 마우스는 65일에 강한 종양 제거율을 나타냈다; 프로서빅스+ 폴리-ICLC로 처리된 마우스 10마리 중 9마리가 종양을 제거하였다(3군); gtCyaAd93-pep216 + 폴리-ICLC 처리된 마우스 10마리 중 9마리가 종양을 퇴행시켰다(4군); gtCyaAd203-pep216 + 폴리-ICLC로 백신접종된 마우스 10마리 중 8마리가 종양을 퇴행시켰다(5군); gtCyaAd93-pep217 + 폴리-ICLC로 처리된 마우스 10마리 중 9마리가 종양을 퇴행시켰다(6군); gtCyaAd203-pep217 + 폴리-ICLC로 백신접종된 마우스 10마리 중 9마리가 종양을 퇴행시켰다(7군). 미처리 마우스 10마리 중 0마리, 플라시보 + 폴리-ICLC 처리된 마우스 10마리 중 1마리가 각각 종양을 퇴행시켰다.(1군 및 2군). 따라서, HPV16 E7 항원을 포함하는 후보 백신으로 백신접종된 마우스만이 유의하게 종양을 퇴행시켰다. 4가지 후보 가운데, 종양을 퇴행시키는 능력에서는 차이가 발견되지 않았다.
상기 결과는 본 발명의 키메라 단백질, 예를 들어 Btpr _114( gtCyaAd93 -PEP216-CyaCopt), BTpr _115( gtCyaAd93 - pep217 - CyaCopt ), BTpr _116( gtCyaAd203 -pep216-CyaCopt) 및 BTpr _117( gtCyaAd203 - pep217 - CyaCopt )의 투여는 발암성 질환을 일으키는 종양을 효율적으로 퇴행시킬 수 있다는 것을 보여준다.
H.
3가 후보의 치료 및 예방 효과
백신접종된 마우스가 상이한 항원을 발현하는 첫 번째 종양을 제거한 후 종양의 발달 및 성장에 대해 예방되어질 수 있는 지를 또한 평가하였다. HPV18 E7 항원을 발현하는 LL2 종양 세포 및 대조군 세포주 LL2-GFP를 앞서 TC-1 이식된 종양(HPV16 E7 항원을 발현하는)을 완전히 퇴행시킨 백신접종된 생존 마우스의 옆구리에 접종하였다.
각 군의 생존 마우스를 두 개의 서브군으로 나누고 LL2-HPV18 E7 세포 또는 LL2-GFP 세포로 접종하였다. 결과는 도 14에 나타낸다.
HPV18 E7 항원을 포함하는 gtCyaA 후보 백신으로 백신접종되고 폴리-ICLC로 애쥬번티드 마우스는 LL2-HPV18 E7 세포주의 성장에 대한 강한 예방 효과를 나타내었으나(3b, 4b, 5b, 6b 및 7b군에서 마우스는 종양을 발달시키지 못하였다), LL2-GFP 세포주의 성장에 대한 예방 효과는 나타내지 못하였다(3a, 4a, 5a, 6a 및 7a군에서 모든 마우스가 종양을 발달시켰다).
종합해 보면, 상기 결과는
TC
-1 종양을 제거한 3가 후보로
백신처리된
마우스는 LL2-
HPV18
E7 종양에 대해 또한 예방되었다는 것을 강조하며,
HPV16
E7 항원에 대한 치유력 있는 항원-특이적 T 세포 반응을 발달시킨 상기
백신접종된
마우스는 또한 HPV18 E7 항원에 대한
예방적인
항원 특이적 T- 세포 반응을 발달시켰다는 것을 나타낸다.
참고문헌
[1] Ladant D, Glaser P, Ullmann A. Insertional mutagenesis of Bordetella pertussis adenylate cyclase. J Biol Chem 1992;267: 2244-50.
[2] Sebo P, Fayolle C, d'Andria O, Ladant D, Leclerc C, Ullmann A. Cell-invasive activity of epitope-tagged adenylate cyclase of Bordetella pertussis allows in vitro presentation of a foreign epitope to CD8+ cytotoxic T cells. Infect Immun 1995;63: 3851-7.
[3] Dadaglio G, Moukrim Z, Lo-Man R, Sheshko V, Sebo P, Leclerc C. Induction of a polarized Th1 response by insertion of multiple copies of a viral T-cell epitope into adenylate cyclase of Bordetella pertussis. Infect Immun 2000;68: 3867-72.
[4] Fayolle C, Ladant D, Karimova G, Ullmann A, Leclerc C. Therapy of murine tumours with recombinant Bordetella pertussis adenylate cyclase carrying a cytotoxic T cell epitope. J Immunol 1999;162: 4157-62.
[5] Preville X, Ladant D, Timmerman B, Leclerc C. Eradication of established tumours by vaccination with recombinant Bordetella pertussis adenylate cyclase carrying the human papillomavirus 16 E7 oncoprotein. Cancer Res 2005;65: 641-9.
[6] Berraondo P, Nouze C, Preville X, Ladant D, Leclerc C. Eradication of large tumours in mice by a tritherapy targeting the innate, adaptive, and regulatory components of the immune system. Cancer Res 2007;67: 8847-55.
[7] Karimova G, Fayolle C, Gmira S, Ullmann A, Leclerc C, Ladant D. Charge-dependent translocation of Bordetella pertussis adenylate cyclase toxin into eukaryotic cells: implication for the in vivo delivery of CD8(+) T cell epitopes into antigen-presenting cells. Proc Natl Acad Sci USA 1998;95: 12532-7.
[8] Gmira S, Karimova G, Ladant D. Characterization of recombinant Bordetella pertussis adenylate cyclase toxins carrying passenger proteins. Res Microbiol 2001;152: 889-900.
[9] de Sanjose S et al. Human papillomavirus genotype attribution in invasive cervical cancer: a retrospective cross-sectional worldwide study. Lancet Oncol 201011: 1048-56.
[10] Bruni L, Diaz M, Castellsague X, Ferrer E, Bosch FX, de Sanjose S. Cervical human papillomavirus prevalence in 5 continents: meta-analysis of 1 million women with normal cytological findings. J Infect Dis 2010 202: 1789-99.
[11] Morandell D, Rostek U, Bouvard V, Campo-Fernandez B, Fiedler M, Jansen-Durr P, Zwerschke W. Human papillomavirus type 45 E7 is a transforming protein inducing retinoblastoma protein degradation and anchorage-independent cell cycle progression. Virology 2008;379: 20-9.
[12] Liu X, Clements A, Zhao K, Marmorstein R. Structure of the human Papillomavirus E7 oncoprotein and its mechanism for inactivation of the retinoblastoma tumour suppressor. J Biol Chem 2006;281: 578-86.
[13] Liu S, Tian Y, Greenaway FT, Sun MZ. A C-terminal hydrophobic, solvent-protected core and a flexible N-terminus are potentially required for human papillomavirus 18 E7 protein functionality. Biochimie 2010 92: 901-8.
[14] El-Azami-El-Idrissi M, Bauche C, Loucka J, Osicka R, Sebo P, Ladant D, Leclerc C. Interaction of Bordetella pertussis adenylate cyclase with CD11b/CD18: Role of toxin acylation and identification of the main integrin interaction domain. J Biol Chem 2003;278: 38514-21.
[15] Glaser P, Elmaoglou-Lazaridou A, Krin E, Ladant D, Barzu O, Danchin A. Identification of residues essential for catalysis and binding of calmodulin in Bordetella pertussis adenylate cyclase by site-directed mutagenesis. EMBO J 1989;8: 967-72.
[16] Glaser P, Munier H, Gilles AM, Krin E, Porumb T, Barzu O, Sarfati R, Pellecuer C, Danchin A. Functional consequences of single amino acid substitutions in calmodulin-activated adenylate cyclase of Bordetella pertussis. EMBO J 1991;10: 1683-8.
[17] De Villiers EM, Fauquet C, Broker TR, Bernard HU, & zur Hausen H (2004) Virology 324, 17-27
[18] Khafizov et al. A study of the evolution of inverted-topology repeats from LeuT-fold transporters using AlignMe. Biochemistry, 2010, 49 ; 10702-10713
[19] Lin KY, Guarnieri FG, Staveley-O'Carroll KF, Levitsky HI, August JT, Pardoll DM, Wu TC. Treatment of established tumors with a novel vaccine that enhances major histocompatibility class II presentation of tumor antigen. Cancer Res 1996;56: 21-6.
[20] Bertram JS, Janik P. Establishment of a cloned line of Lewis Lung Carcinoma cells adapted to cell culture. Cancer Lett 1980;11: 63-73.
[21] Savai R, Schermuly RT, Pullamsetti SS, Schneider M, Greschus S, Ghofrani HA, Traupe H, Grimminger F, Banat GA. A combination hybrid-based vaccination/adoptive cellular therapy to prevent tumor growth by involvement of T cells. Cancer Res 2007;67: 5443-53.
[22] Barchet W, Oehen S, Klenerman P, Wodarz D, Bocharov G, Lloyd AL, Nowak MA, Hengartner H, Zinkernagel RM, Ehl S. Direct quantitation of rapid elimination of viral antigen-positive lymphocytes by antiviral CD8(+) T cells in vivo. Eur J Immunol 2000;30: 1356-63.
[23] Ingulli E. Tracing tolerance and immunity in vivo by CFSE-labeling of administered cells. Methods Mol Biol 2007;380: 365-76.
[24] Barber DL, Wherry EJ, Ahmed R. Cutting edge: rapid in vivo killing by memory CD8 T cells. J Immunol 2003;171: 27-31.
[25] Holubova et al. Delivery of large heterologous polypeptides across the cytoplasmic membrane of antigen-presenting cells by the Bordetella RTX hemolysin moiety lacking the adenylyl cyclase domain. Infect Immun. 2012 Mar;80(3):1181-92.
SEQUENCE LISTING
<110> GENTICEL
<120> CYAA-BASED CHIMERIC PROTEINS COMPRISING A HETEROLOGOUS
POLYPEPTIDE AND THEIR USES IN THE INDUCTION OF IMMUNE RESPONSES
<130> B09985A - PCT - AD/KN
<140> PCT/EP2013/065546
<141> 2013-07-23
<150> EP12305897.6
<151> 2012-07-23
<160> 79
<170> PatentIn version 3.5
<210> 1
<211> 5121
<212> DNA
<213> Bordetella pertussis (wild type CyaA)
<220>
<221> CDS
<222> (1)..(5121)
<400> 1
atg cag caa tcg cat cag gct ggt tac gca aac gcc gcc gac cgg gag 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggc atc ccc gca gcc gta ctc gat ggc atc aag gcc gtg gcg aag 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gaa aaa aac gcc aca ttg atg ttc cgc ctg gtc aac ccc cat tcc acc 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
agc ctg att gcc gaa ggg gtg gcc acc aaa gga ttg ggc gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aag tcg tcc gat tgg ggg ttg cag gcg ggc tac att ccc gtc aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctt tcc aaa ctg ttc ggc cgt gcg ccc gag gtg atc gcg cgg gcc 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gac gtc aac agc agc ctg gcg cat ggc cat acc gcg gtc gac 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acg ctg tcg aaa gag cgg ctt gac tat ctg cgg caa gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtc acc ggc atg gcc gat ggc gtg gtc gcg agc aac cac gca ggc tac 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gag cag ttc gag ttt cgc gtg aag gaa acc tcg gac ggg cgc tat gcc 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tat cgc cgc aag ggc ggc gac gat ttc gag gcg gtc aag gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggc aat gcc gcc ggt att cca ctg acg gcg gat atc gac atg ttc 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc att atg ccg cat ctg tcc aac ttc cgc gac tcg gcg cgc agt tcg 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acc agc ggc gat tcg gtg acc gat tac ctg gcg cgc acg cgg cgg 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcc gcc agc gag gcc acg ggc ggc ctg gat cgc gaa cgc atc gac ttg 720
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
ttg tgg aaa atc gct cgc gcc ggc gcc cgt tcc gca gtg ggc acc gag 768
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
gcg cgt cgc cag ttc cgc tac gac ggc gac atg aat atc ggc gtg atc 816
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
acc gat ttc gag ctg gaa gtg cgc aat gcg ctg aac agg cgg gcg cac 864
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
gcc gtc ggc gcg cag gac gtg gtc cag cat ggc act gag cag aac aat 912
Ala Val Gly Ala Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
cct ttc ccg gag gca gat gag aag att ttc gtc gta tcg gcc acc ggt 960
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
gaa agc cag atg ctc acg cgc ggg caa ctg aag gaa tac att ggc cag 1008
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
cag cgc ggc gag ggc tat gtc ttc tac gag aac cgt gca tac ggc gtg 1056
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
gcg ggg aaa agc ctg ttc gac gat ggg ctg gga gcc gcg ccc ggc gtg 1104
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
ccg agc gga cgt tcg aag ttc tcg ccg gat gta ctg gaa acg gtg ccg 1152
Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
gcg tca ccc gga ttg cgg cgg ccg tcg ctg ggc gca gtg gaa cgc cag 1200
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
gat tcc ggc tat gac agc ctt gat ggg gtg gga tcg cga tcg ttc tcg 1248
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
ttg ggc gag gtg tcc gac atg gcc gcc gtg gaa gcg gcg gaa ctg gaa 1296
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
atg acc cgg caa gtc ttg cac gcc ggg gcg cgg cag gac gat gcc gag 1344
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
ccg ggc gtg agc ggt gcg tcg gcg cac tgg ggg cag cgg gcg ctg cag 1392
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
ggc gcc cag gcg gtg gcg gcg gcg cag cgg ctg gtt cat gcc att gcc 1440
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
ctg atg acg caa ttc ggc cgg gcc ggt tcc acc aac acg ccg cag gaa 1488
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
gcg gcc tcg ttg tcg gcg gcc gtg ttc ggc ttg ggc gag gcc agc agc 1536
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
gcc gtg gcc gaa acc gtg agc ggt ttt ttc cgc ggg tct tcg cgc tgg 1584
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
gcc ggc ggt ttc ggc gtg gct ggc ggc gcg atg gcg ctg gga ggc ggc 1632
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
atc gcc gcg gcc gtt ggc gcc ggg atg tcg ttg acc gat gac gcg ccg 1680
Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro
545 550 555 560
gcc gga cag aag gcc gcc gcc ggc gcc gag atc gcg ctg cag ttg aca 1728
Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr
565 570 575
ggt gga acg gtc gag ctg gct tct tcc atc gcg ttg gcg ctg gcc gcg 1776
Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala
580 585 590
gcg cgc ggc gtg acc agc ggc ttg cag gtg gcc ggg gcg tcg gcc ggg 1824
Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly
595 600 605
gcg gct gcc ggc gca ttg gcc gcg gcg ctc agt ccc atg gag atc tac 1872
Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr
610 615 620
ggc ctg gtg cag caa tcg cac tat gcg gat cag ctg gac aag ctg gcg 1920
Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala
625 630 635 640
cag gaa tcg agc gca tac ggt tac gag ggc gac gcc ttg ctg gcc cag 1968
Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln
645 650 655
ctg tat cgc gac aag acg gcc gcc gag ggc gcc gtc gcc ggc gtc tcc 2016
Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser
660 665 670
gcc gtc ctg agc acg gtg ggg gcg gcg gtg tcg atc gcc gcg gcg gcc 2064
Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala
675 680 685
agc gtg gta ggg gcc ccg gtg gcg gtg gtc act tcc ttg ctg acc ggg 2112
Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly
690 695 700
gct ctc aac ggc atc ctg cgc ggc gtg cag cag ccc atc atc gaa aag 2160
Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys
705 710 715 720
ctg gcc aac gat tac gct cgc aag atc gac gag ctg ggc ggg ccg caa 2208
Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln
725 730 735
gcg tac ttc gag aaa aac ctg cag gcg cgt cac gaa caa ctg gcc aat 2256
Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn
740 745 750
tcg gac ggc cta cgg aaa atg ctg gcc gac ctg cag gcc ggt tgg aac 2304
Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn
755 760 765
gcc agc agc gtg atc ggg gtg cag acg aca gag atc tcc aag tcg gcg 2352
Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala
770 775 780
ctc gaa ctg gcc gcc att acc ggc aac gcg gac aac ctg aaa tcc gtc 2400
Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Val
785 790 795 800
gac gtg ttc gtg gac cgc ttc gtc cag ggc gag cgg gtg gcc ggc cag 2448
Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln
805 810 815
ccg gtg gtc ctc gac gtc gcc gcc ggc ggc atc gat atc gcc agc cgc 2496
Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg
820 825 830
aag ggc gag cgg ccg gcg ctg acg ttc atc acg ccg ctg gcc gcg cca 2544
Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro
835 840 845
gga gaa gag cag cgc cgg cgc acg aaa acg ggc aag agc gaa ttc acc 2592
Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr
850 855 860
aca ttc gtc gag atc gtg ggc aag cag gac cgc tgg cgc atc cgg gac 2640
Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
865 870 875 880
ggc gcg gcc gac acc acc atc gat ctg gcc aag gtg gtg tcg caa ctg 2688
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu
885 890 895
gtc gac gcc aat ggc gtg ctc aag cac agc atc aaa ctg gat gtg atc 2736
Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile
900 905 910
ggc gga gat ggc gat gac gtc gtg ctt gcc aat gct tcg cgc atc cat 2784
Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His
915 920 925
tat gac ggc ggc gcg ggc acc aac acg gtc agc tat gcc gcc ctg ggt 2832
Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly
930 935 940
cga cag gat tcc att acc gtg tcc gcc gac ggg gaa cgt ttc aac gtg 2880
Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
945 950 955 960
cgc aag cag ttg aac aac gcc aac gtg tat cgc gaa ggc gtg gct acc 2928
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr
965 970 975
cag aca acc gcc tac ggc aag cgc acg gag aat gtc caa tac cgc cat 2976
Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His
980 985 990
gtc gag ctg gcc cgt gtc ggg caa ctg gtg gag gtc gac acg ctc gag 3024
Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu
995 1000 1005
cat gtg cag cac atc atc ggc ggg gcc ggc aac gat tcg atc acc 3069
His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
1010 1015 1020
ggc aat gcg cac gac aac ttc cta gcc ggc ggg tcg ggc gac gac 3114
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp
1025 1030 1035
agg ctg gat ggc ggc gcc ggc aac gac acc ctg gtt ggc ggc gag 3159
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
1040 1045 1050
ggc caa aac acg gtc atc ggc ggc gcc ggc gac gac gta ttc ctg 3204
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu
1055 1060 1065
cag gac ctg ggg gta tgg agc aac cag ctc gat ggc ggc gcg ggc 3249
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
1070 1075 1080
gtc gat acc gtg aag tac aac gtg cac cag cct tcc gag gag cgc 3294
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg
1085 1090 1095
ctc gaa cgc atg ggc gac acg ggc atc cat gcc gat ctt caa aag 3339
Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
1100 1105 1110
ggc acg gtc gag aag tgg ccg gcc ctg aac ctg ttc agc gtc gac 3384
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp
1115 1120 1125
cat gtc aag aat atc gag aat ctg cac ggc tcc cgc ctg aac gac 3429
His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp
1130 1135 1140
cgc atc gcc ggc gac gac cag gac aac gag ctc tgg ggc cac gat 3474
Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp
1145 1150 1155
ggc aac gac acg ata cgc ggc cgg ggc ggc gac gac atc ctg cgc 3519
Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg
1160 1165 1170
ggc ggc ctg ggc ctg gac acg ctg tat ggc gag gac ggc aac gac 3564
Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp
1175 1180 1185
atc ttc ctg cag gac gac gag acc gtc agc gat gac atc gac ggc 3609
Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly
1190 1195 1200
ggc gcg ggg ctg gac acc gtc gac tac tcc gcc atg atc cat cca 3654
Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro
1205 1210 1215
ggc agg atc gtt gcg ccg cat gaa tac ggc ttc ggg atc gag gcg 3699
Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala
1220 1225 1230
gac ctg tcc agg gaa tgg gtg cgc aag gcg tcc gcg ctg ggc gtg 3744
Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val
1235 1240 1245
gac tat tac gat aat gtc cgc aat gtc gaa aac gtc atc ggt acg 3789
Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr
1250 1255 1260
agc atg aag gat gtg ctc atc ggc gac gcg caa gcc aat acc ctg 3834
Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu
1265 1270 1275
atg ggc cag ggc ggc gac gat acc gtg cgc ggc ggc gac ggc gat 3879
Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp
1280 1285 1290
gat ctg ctg ttc ggc ggc gac ggc aac gac atg ctg tat ggc gac 3924
Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp
1295 1300 1305
gcc ggc aac gac acc ctc tac ggg ggg ctg ggc gac gat acc ctt 3969
Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu
1310 1315 1320
gaa ggc ggc gcg ggc aac gat tgg ttc ggc cag acg cag gcg cgc 4014
Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg
1325 1330 1335
gag cat gac gtg ctg cgc ggc gga gat ggg gtg gat acc gtc gat 4059
Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp
1340 1345 1350
tac agc cag acc ggc gcg cat gcc ggc att gcc gcg ggt cgc atc 4104
Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile
1355 1360 1365
ggg ctg ggc atc ctg gct gac ctg ggc gcc ggc cgc gtc gac aag 4149
Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys
1370 1375 1380
ctg ggc gag gcc ggc agc agc gcc tac gat acg gtt tcc ggt atc 4194
Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile
1385 1390 1395
gag aac gtg gtg ggc acg gaa ctg gcc gac cgc atc acg ggc gat 4239
Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp
1400 1405 1410
gcg cag gcc aac gtg ctg cgc ggc gcg ggt ggc gcc gac gtg ctt 4284
Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu
1415 1420 1425
gcg ggc ggc gag ggc gac gat gtg ctg ctg ggc ggc gac ggc gac 4329
Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp
1430 1435 1440
gac cag ctg tcg ggc gac gcc gga cgc gat cgc ttg tac ggc gaa 4374
Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu
1445 1450 1455
gcc ggt gac gac tgg ttc ttc cag gat gcc gcc aat gcc ggc aat 4419
Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn
1460 1465 1470
ctg ctc gac ggc ggc gac ggc cgc gat acc gtg gat ttc agc ggc 4464
Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly
1475 1480 1485
ccg ggc cgg ggc ctc gac gcc ggc gca aag ggc gta ttc ctg agc 4509
Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser
1490 1495 1500
ttg ggc aag ggg ttc gcc agc ctg atg gac gaa ccc gaa acc agc 4554
Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser
1505 1510 1515
aac gtg ttg cgc aat atc gag aac gcc gtg ggc agc gcg cgt gat 4599
Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp
1520 1525 1530
gac gtg ctg atc ggc gac gca ggc gcc aac gtc ctc aat ggc ctg 4644
Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu
1535 1540 1545
gcg ggc aac gac gtg ctg tcc ggc ggc gct ggc gac gat gtg ctg 4689
Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu
1550 1555 1560
ctg ggc gac gag ggc tcg gac ctg ctc agc ggc gat gcg ggc aac 4734
Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn
1565 1570 1575
gac gat ctg ttc ggc ggg cag ggc gat gat act tat ctg ttc ggg 4779
Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly
1580 1585 1590
gtc ggg tac ggg cac gac acg atc tac gaa tcg ggc ggc ggc cat 4824
Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His
1595 1600 1605
gac acc atc cgc atc aac gcg ggg gcg gac cag ctg tgg ttc gcg 4869
Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala
1610 1615 1620
cgc cag ggc aac gac ctg gag atc cgc att ctc ggc acc gac gat 4914
Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp
1625 1630 1635
gca ctt acc gtg cac gac tgg tat cgc gac gcc gat cac cgg gtg 4959
Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val
1640 1645 1650
gaa atc atc cat gcc gcc aac cag gcg gta gac cag gca ggc atc 5004
Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile
1655 1660 1665
gaa aag ctg gtc gag gca atg gcg cag tat ccg gac ccc ggc gcg 5049
Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala
1670 1675 1680
gcg gcg gct gcc ccg ccg gcg gcg cgc gtg ccg gac acg ctg atg 5094
Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met
1685 1690 1695
cag tcc ctg gct gtc aac tgg cgc tga 5121
Gln Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 2
<211> 1706
<212> PRT
<213> Bordetella pertussis (wild type CyaA)
<400> 2
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
Ala Val Gly Ala Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro
545 550 555 560
Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr
565 570 575
Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala
580 585 590
Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly
595 600 605
Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr
610 615 620
Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala
625 630 635 640
Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln
645 650 655
Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser
660 665 670
Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala
675 680 685
Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly
690 695 700
Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys
705 710 715 720
Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln
725 730 735
Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn
740 745 750
Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn
755 760 765
Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala
770 775 780
Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Val
785 790 795 800
Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln
805 810 815
Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg
820 825 830
Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro
835 840 845
Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr
850 855 860
Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
865 870 875 880
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu
885 890 895
Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile
900 905 910
Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His
915 920 925
Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly
930 935 940
Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
945 950 955 960
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr
965 970 975
Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His
980 985 990
Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu
995 1000 1005
His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
1010 1015 1020
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp
1025 1030 1035
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
1040 1045 1050
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu
1055 1060 1065
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
1070 1075 1080
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg
1085 1090 1095
Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
1100 1105 1110
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp
1115 1120 1125
His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp
1130 1135 1140
Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp
1145 1150 1155
Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg
1160 1165 1170
Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp
1175 1180 1185
Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly
1190 1195 1200
Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro
1205 1210 1215
Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala
1220 1225 1230
Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val
1235 1240 1245
Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr
1250 1255 1260
Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu
1265 1270 1275
Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp
1280 1285 1290
Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp
1295 1300 1305
Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu
1310 1315 1320
Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg
1325 1330 1335
Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp
1340 1345 1350
Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile
1355 1360 1365
Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys
1370 1375 1380
Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile
1385 1390 1395
Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp
1400 1405 1410
Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu
1415 1420 1425
Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp
1430 1435 1440
Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu
1445 1450 1455
Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn
1460 1465 1470
Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly
1475 1480 1485
Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser
1490 1495 1500
Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser
1505 1510 1515
Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp
1520 1525 1530
Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu
1535 1540 1545
Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu
1550 1555 1560
Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn
1565 1570 1575
Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly
1580 1585 1590
Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His
1595 1600 1605
Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala
1610 1615 1620
Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp
1625 1630 1635
Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val
1640 1645 1650
Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile
1655 1660 1665
Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala
1670 1675 1680
Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met
1685 1690 1695
Gln Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 3
<211> 5121
<212> DNA
<213> Bordetella hinzii (wild type CyaA)
<220>
<221> CDS
<222> (1)..(5121)
<400> 3
atg cag caa tcg cat cag gct ggt tac gca aac gcc gcc gac cgg gag 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggc atc ccc gca gcc gta ctc gat ggc atc aag gcc gtg gcg aag 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gaa aaa aac gcc aca ttg atg ttc cgc ctg gtc aac ccc cat tcc acc 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
agc ctg att gcc gaa ggg gtg gcc acc aaa gga ttg ggc gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aag tcg tcc gat tgg ggg ttg cag gcg ggc tac att ccc gtc aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctt tcc aaa ctg ttc ggc cgt gcg ccc gag gtg atc gcg cgg gcc 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gac gtc aac agc agc ctg gcg cat ggc cat acc gcg gtc gac 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acg ctg tcg aaa gag cgg ctt gac tat ctg cgg caa gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtc acc ggc atg gcc gat ggc gtg gtc gcg agc aac cac gca ggc tac 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gag cag ttc gag ttt cgc gtg aag gaa acc tcg gac ggg cgc tat gcc 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tat cgc cgc aag ggc ggc gac gat ttc gag gcg gtc aag gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggc aat gcc gcc ggt att cca ctg acg gcg gat atc gac atg ttc 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc att atg ccg cat ctg tcc aac ttc cgc gac tcg gcg cgc agt tcg 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acc agc ggc gat tcg gtg acc gat tac ctg gcg cgc acg cgg cgg 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcc gcc agc gag gcc acg ggc ggc ctg gat cgc gaa cgc atc gac ttg 720
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
ttg tgg aaa atc gct cgc gcc ggc gcc cgt tcc gca gtg ggc acc gag 768
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
gcg cgt cgc cag ttc cgc tac gac ggc gac atg aat atc ggc gtg atc 816
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
acc gat ttc gag ctg gaa gtg cgc aat gcg ctg aac agg cgg gcg cac 864
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
gcc gtc ggc gcg cag gac gtg gtc cag cat ggc act gag cag aac aat 912
Ala Val Gly Ala Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
cct ttc ccg gag gca gat gag aag att ttc gtc gta tcg gcc acc ggt 960
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
gaa agc cag atg ctc acg cgc ggg caa ctg aag gaa tac att ggc cag 1008
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
cag cgc ggc gag ggc tat gtc ttc tac gag aac cgt gca tac ggc gtg 1056
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
gcg ggg aaa agc ctg ttc gac gat ggg ctg gga gcc gcg ccc ggc gtg 1104
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
ccg agc gga cgt tcg aag ttc tcg ccg gat gta ctg gaa acg gtg ccg 1152
Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
gcg tca ccc gga ttg cgg cgg ccg tcg ctg ggc gca gtg gaa cgc cag 1200
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
gat tcc ggc tat gac agc ctt gat ggg gtg gga tcg cga tcg ttc tcg 1248
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
ttg ggc gag gtg tcc gac atg gcc gcc gtg gaa gcg gcg gaa ctg gaa 1296
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
atg acc cgg caa gtc ttg cac gcc ggg gcg cgg cag gac gat gcc gag 1344
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
ccg ggc gtg agc ggt gcg tcg gcg cac tgg ggg cag cgg gcg ctg cag 1392
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
ggc gcc cag gcg gtg gcg gcg gcg cag cgg ctg gtt cat gcc att gcc 1440
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
ctg atg acg caa ttc ggc cgg gcc ggt tcc acc aac acg ccg cag gaa 1488
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
gcg gcc tcg ttg tcg gcg gcc gtg ttc ggc ttg ggc gag gcc agc agc 1536
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
gcc gtg gcc gaa acc gtg agc ggt ttt ttc cgc ggg tct tcg cgc tgg 1584
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
gcc ggc ggt ttc ggc gtg gct ggc ggc gcg atg gcg ctg gga ggc ggc 1632
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
atc gcc gcg gcc gtt ggc gcc ggg atg tcg ttg acc gat gac gcg ccg 1680
Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro
545 550 555 560
gcc gga cag aag gcc gcc gcc ggc gcc gag atc gcg ctg cag ttg aca 1728
Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr
565 570 575
ggt gga acg gtc gag ctg gct tct tcc atc gcg ttg gcg ctg gcc gcg 1776
Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala
580 585 590
gcg cgc ggc gtg acc agc ggc ttg cag gtg gcc ggg gcg tcg gcc ggg 1824
Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly
595 600 605
gcg gct gcc ggc gca ttg gcc gcg gcg ctc agt ccc atg gag atc tac 1872
Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr
610 615 620
ggc ctg gtg cag caa tcg cac tat gcg gat cag ctg gac aag ctg gcg 1920
Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala
625 630 635 640
cag gaa tcg agc gca tac ggt tac gag ggc gac gcc ttg ctg gcc cag 1968
Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln
645 650 655
ctg tat cgc gac aag acg gcc gcc gag ggc gcc gtc gcc ggc gtc tcc 2016
Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser
660 665 670
gcc gtc ctg agc acg gtg ggg gcg gcg gtg tcg atc gcc gcg gcg gcc 2064
Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala
675 680 685
agc gtg gta ggg gcc ccg gtg gcg gtg gtc act tcc ttg ctg acc ggg 2112
Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly
690 695 700
gct ctc aac ggc atc ctg cgc ggc gtg cag cag ccc atc atc gaa aag 2160
Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys
705 710 715 720
ctg gcc aac gat tac gct cgc aag atc gac gag ctg ggc ggg ccg caa 2208
Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln
725 730 735
gcg tac ttc gag aaa aac ctg cag gcg cgt cac gaa caa ctg gcc aat 2256
Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn
740 745 750
tcg gac ggc cta cgg aaa atg ctg gcc gac ctg cag gcc ggt tgg aac 2304
Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn
755 760 765
gcc agc agc gtg atc ggg gtg cag acg aca gag atc tcc aag tcg gcg 2352
Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala
770 775 780
ctc gaa ctg gcc gcc att acc ggc aac gcg gac aac ctg aaa tcc gtc 2400
Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Val
785 790 795 800
gac gtg ttc gtg gac cgc ttc gtc cag ggc gag cgg gtg gcc ggc cag 2448
Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln
805 810 815
ccg gtg gtc ctc gac gtc gcc gcc ggc ggc atc gat atc gcc agc cgc 2496
Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg
820 825 830
aag ggc gag cgg ccg gcg ctg acg ttc atc acg ccg ctg gcc gcg cca 2544
Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro
835 840 845
gga gaa gag cag cgc cgg cgc acg aaa acg ggc aag agc gaa ttc acc 2592
Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr
850 855 860
aca ttc gtc gag atc gtg ggc aag cag gac cgc tgg cgc atc cgg gac 2640
Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
865 870 875 880
ggc gcg gcc gac acc acc atc gat ctg gcc aag gtg gtg tcg caa ctg 2688
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu
885 890 895
gtc gac gcc aat ggc gtg ctc aag cac agc atc aaa ctg gat gtg atc 2736
Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile
900 905 910
ggc gga gat ggc gat gac gtc gtg ctt gcc aat gct tcg cgc atc cat 2784
Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His
915 920 925
tat gac ggc ggc gcg ggc acc aac acg gtc agc tat gcc gcc ctg ggt 2832
Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly
930 935 940
cga cag gat tcc att acc gtg tcc gcc gac ggg gaa cgt ttc aac gtg 2880
Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
945 950 955 960
cgc aag cag ttg aac aac gcc aac gtg tat cgc gaa ggc gtg gct acc 2928
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr
965 970 975
cag aca acc gcc tac ggc aag cgc acg gag aat gtc caa tac cgc cat 2976
Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His
980 985 990
gtc gag ctg gcc cgt gtc ggg caa ctg gtg gag gtc gac acg ctc gag 3024
Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu
995 1000 1005
cat gtg cag cac atc atc ggc ggg gcc ggc aac gat tcg atc acc 3069
His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
1010 1015 1020
ggc aat gcg cac gac aac ttc cta gcc ggc ggg tcg ggc gac gac 3114
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp
1025 1030 1035
agg ctg gat ggc ggc gcc ggc aac gac acc ctg gtt ggc ggc gag 3159
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
1040 1045 1050
ggc caa aac acg gtc atc ggc ggc gcc ggc gac gac gta ttc ctg 3204
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu
1055 1060 1065
cag gac ctg ggg gta tgg agc aac cag ctc gat ggc ggc gcg ggc 3249
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
1070 1075 1080
gtc gat acc gtg aag tac aac gtg cac cag cct tcc gag gag cgc 3294
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg
1085 1090 1095
ctc gaa cgc atg ggc gac acg ggc atc cat gcc gat ctt caa aag 3339
Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
1100 1105 1110
ggc acg gtc gag aag tgg ccg gcc ctg aac ctg ttc agc gtc gac 3384
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp
1115 1120 1125
cat gtc aag aat atc gag aat ctg cac ggc tcc cgc ctg aac gac 3429
His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp
1130 1135 1140
cgc atc gcc ggc gac gac cag gac aac gag ctc tgg ggc cac gat 3474
Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp
1145 1150 1155
ggc aac gac acg ata cgc ggc cgg ggc ggc gac gac atc ctg cgc 3519
Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg
1160 1165 1170
ggc ggc ctg ggc ctg gac acg ctg tat ggc gag gac ggc aac gac 3564
Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp
1175 1180 1185
atc ttc ctg cag gac gac gag acc gtc agc gat gac atc gac ggc 3609
Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly
1190 1195 1200
ggc gcg ggg ctg gac acc gtc gac tac tcc gcc atg atc cat cca 3654
Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro
1205 1210 1215
ggc agg atc gtt gcg ccg cat gaa tac ggc ttc ggg atc gag gcg 3699
Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala
1220 1225 1230
gac ctg tcc agg gaa tgg gtg cgc aag gcg tcc gcg ctg ggc gtg 3744
Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val
1235 1240 1245
gac tat tac gat aat gtc cgc aat gtc gaa aac gtc atc ggt acg 3789
Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr
1250 1255 1260
agc atg aag gat gtg ctc atc ggc gac gcg caa gcc aat acc ctg 3834
Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu
1265 1270 1275
atg ggc cag ggc ggc gac gat acc gtg cgc ggc ggc gac ggc gat 3879
Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp
1280 1285 1290
gat ctg ctg ttc ggc ggc gac ggc aac gac atg ctg tat ggc gac 3924
Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp
1295 1300 1305
gcc ggc aac gac acc ctc tac ggg ggg ctg ggc gac gat acc ctt 3969
Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu
1310 1315 1320
gaa ggc ggc gcg ggc aac gat tgg ttc ggc cag acg cag gcg cgc 4014
Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg
1325 1330 1335
gag cat gac gtg ctg cgc ggc gga gat ggg gtg gat acc gtc gat 4059
Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp
1340 1345 1350
tac agc cag acc ggc gcg cat gcc ggc att gcc gcg ggt cgc atc 4104
Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile
1355 1360 1365
ggg ctg ggc atc ctg gct gac ctg ggc gcc ggc cgc gtc gac aag 4149
Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys
1370 1375 1380
ctg ggc gag gcc ggc agc agc gcc tac gat acg gtt tcc ggt atc 4194
Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile
1385 1390 1395
gag aac gtg gtg ggc acg gaa ctg gcc gac cgc atc acg ggc gat 4239
Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp
1400 1405 1410
gcg cag gcc aac gtg ctg cgc ggc gcg ggt ggc gcc gac gtg ctt 4284
Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu
1415 1420 1425
gcg ggc ggc gag ggc gac gat gtg ctg ctg ggc ggc gac ggc gac 4329
Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp
1430 1435 1440
gac cag ctg tcg ggc gac gcc gga cgc gat cgc ttg tac ggc gaa 4374
Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu
1445 1450 1455
gcc ggt gac gac tgg ttc ttc cag gat gcc gcc aat gcc ggc aat 4419
Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn
1460 1465 1470
ctg ctc gac ggc ggc gac ggc cgc gat acc gtg gat ttc agc ggc 4464
Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly
1475 1480 1485
ccg ggc cgg ggc ctc gac gcc ggc gca aag ggc gta ttc ctg agc 4509
Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser
1490 1495 1500
ttg ggc aag ggg ttc gcc agc ctg atg gac gaa ccc gaa acc agc 4554
Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser
1505 1510 1515
aac gtg ttg cgc aat atc gag aac gcc gtg ggc agc gcg cgt gat 4599
Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp
1520 1525 1530
gac gtg ctg atc ggc gac gca ggc gcc aac gtc ctc aat ggc ctg 4644
Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu
1535 1540 1545
gcg ggc aac gac gtg ctg tcc ggc ggc gct ggc gac gat gtg ctg 4689
Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu
1550 1555 1560
ctg ggc gac gag ggc tcg gac ctg ctc agc ggc gat gcg ggc aac 4734
Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn
1565 1570 1575
gac gat ctg ttc ggc ggg cag ggc gat gat act tat ctg ttc ggg 4779
Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly
1580 1585 1590
gtc ggg tac ggg cac gac acg atc tac gaa tcg ggc ggc ggc cat 4824
Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His
1595 1600 1605
gac acc atc cgc atc aac gcg ggg gcg gac cag ctg tgg ttc gcg 4869
Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala
1610 1615 1620
cgc cag ggc aac gac ctg gag atc cgc att ctc ggc acc gac gat 4914
Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp
1625 1630 1635
gca ctt acc gtg cac gac tgg tat cgc gac gcc gat cac cgg gtg 4959
Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val
1640 1645 1650
gaa atc atc cat gcc gcc aac cag gcg gta gac cag gca ggc atc 5004
Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile
1655 1660 1665
gaa aag ctg gtc gag gca atg gcg cag tat ccg gac ccc ggc gcg 5049
Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala
1670 1675 1680
gcg gcg gct gcc ccg ccg gcg gcg cgc gtg ccg gac acg ctg atg 5094
Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met
1685 1690 1695
cag tcc ctg gct gtc aac tgg cgc tga 5121
Gln Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 4
<211> 1706
<212> PRT
<213> Bordetella hinzii (wild type CyaA)
<400> 4
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
Ala Val Gly Ala Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro
545 550 555 560
Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr
565 570 575
Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala
580 585 590
Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly
595 600 605
Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr
610 615 620
Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala
625 630 635 640
Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln
645 650 655
Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser
660 665 670
Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala
675 680 685
Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly
690 695 700
Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys
705 710 715 720
Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln
725 730 735
Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn
740 745 750
Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn
755 760 765
Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala
770 775 780
Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Val
785 790 795 800
Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln
805 810 815
Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg
820 825 830
Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro
835 840 845
Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr
850 855 860
Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
865 870 875 880
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu
885 890 895
Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile
900 905 910
Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His
915 920 925
Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly
930 935 940
Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
945 950 955 960
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr
965 970 975
Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His
980 985 990
Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu
995 1000 1005
His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
1010 1015 1020
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp
1025 1030 1035
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
1040 1045 1050
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu
1055 1060 1065
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
1070 1075 1080
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg
1085 1090 1095
Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
1100 1105 1110
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp
1115 1120 1125
His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp
1130 1135 1140
Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp
1145 1150 1155
Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg
1160 1165 1170
Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp
1175 1180 1185
Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly
1190 1195 1200
Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro
1205 1210 1215
Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala
1220 1225 1230
Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val
1235 1240 1245
Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr
1250 1255 1260
Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu
1265 1270 1275
Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp
1280 1285 1290
Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp
1295 1300 1305
Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu
1310 1315 1320
Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg
1325 1330 1335
Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp
1340 1345 1350
Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile
1355 1360 1365
Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys
1370 1375 1380
Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile
1385 1390 1395
Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp
1400 1405 1410
Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu
1415 1420 1425
Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp
1430 1435 1440
Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu
1445 1450 1455
Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn
1460 1465 1470
Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly
1475 1480 1485
Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser
1490 1495 1500
Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser
1505 1510 1515
Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp
1520 1525 1530
Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu
1535 1540 1545
Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu
1550 1555 1560
Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn
1565 1570 1575
Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly
1580 1585 1590
Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His
1595 1600 1605
Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala
1610 1615 1620
Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp
1625 1630 1635
Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val
1640 1645 1650
Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile
1655 1660 1665
Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala
1670 1675 1680
Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met
1685 1690 1695
Gln Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 5
<211> 5121
<212> DNA
<213> Bordetella parapertussis (wild type CyaA)
<220>
<221> CDS
<222> (1)..(5121)
<400> 5
atg cag caa tcg cat cag gct ggt tac gca aac gcc gcc gac cgg gag 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggc atc ccc gca gcc gta ctc gat ggc atc aag gcc gtg gcg aag 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gaa aaa aac gcc aca ttg atg ttc cgc ctg gtc aac ccc cat tcc acc 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
agc ctg att gcc gaa ggg gtg gcc acc aaa gga ttg ggc gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aag tcg tcc gat tgg ggg ttg cag gcg ggc tac att ccc gtc aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctt tcc aaa ctg ttc ggc cgt gcg ccc gag gtg atc gcg cgg gcc 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gac gtc aac agc agc ctg gcg cat ggc cat acc gcg gtc gac 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acg ctg tcg aaa gag cgg ctt gac tat ctg cgg caa gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtc acc ggc atg gcc gat ggc gtg gtc gcg agc aac cac gca ggc tac 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gag cag ttc gag ttt cgc gtg aag gaa acc tcg gac ggg cgc tat gcc 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tat cgc cgc aag ggc ggc gac gat ttc gag gcg gtc aag gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggc aat gcc gcc ggt att cca ctg acg gcg gat atc gac atg ttc 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc atc atg ccg cat ctg tcc aac ttc cgc gac tcg gcg cgc agt tcg 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acc agc ggc gat tcg gtg acc gat tac ctg gcg cgc acg cgg cgg 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcc gcc agc gag gcc acg ggc ggc ctg gat cgc gaa cgc atc gac ttg 720
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
ttg tgg aaa atc gct cgc gcc ggc gcc cgt tcc gca gtg ggc acc gag 768
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
gcg cgt cgc cag ttc cgc tac gac ggc gac atg aat atc ggc gtg atc 816
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
acc gat ttc gag ctg gaa gtg cgc aat gcg ctg aac agg cgg gcg cac 864
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
gcc gtc ggc gcg cag gac gtg gtc cag cat ggc act gag cag aac aat 912
Ala Val Gly Ala Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
cct ttc ccg gag gca gat gag aag att ttc gtc gta tcg gcc acc ggt 960
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
gaa agc cag atg ctc acg cgc ggg caa ctg aag gaa tac att ggc cag 1008
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
cag cgc ggc gag ggc tat gtc ttc tac gag aac cgt gca tac ggc gtg 1056
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
gcg ggg aaa agc ctg ttc gac gat ggg ctg gga gcc gcg ccc ggc gtg 1104
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
ccg ggc gga cgt tcg aag tcc tcg ccg gat gta ctg gaa acg gtg ccg 1152
Pro Gly Gly Arg Ser Lys Ser Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
gcg tca ccc gga ttg cgg cgg ccg tcg ctg ggc gca gtg gaa cgc cag 1200
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
gat tcc ggc tat gac agc ctt gat ggg gtg gga tcg cga tcg ttc tcg 1248
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
ttg ggc gag gtg tcc gac atg gcc gcc gtg gaa gcg gcg gaa ctg gaa 1296
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
atg acc cgg caa gtc ttg cac gcc ggg gcg cgg cag gac gat gcc gag 1344
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
ccg ggc gtg agc ggt gcg tcg gcg cac tgg ggg cag cgg gcg ctg cag 1392
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
ggc gcc cag gcg gtg gcg gcg gcg cag cgg ctg gtt cat gcc att gcc 1440
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
ctg atg acg caa ttc ggc cgg gcc ggt tcc acc aac acg ccg cag gaa 1488
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
gcg gcc tcg ttg tcg gcg gcc gtg ttc ggc ttg ggc gag gcc agc agc 1536
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
gcc gtg gcc gaa acc gtg agc ggt ttt ttc cgc ggg tct tcg cgc tgg 1584
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
gcc ggc ggt ttc ggc gtg gct ggc ggc gcg atg gcg ctg gga ggc ggc 1632
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
atc gcc gcg gcc gtt ggc gcc ggg atg tcg ttg acc gat gac gcg ccg 1680
Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro
545 550 555 560
gcc gga cag aag gcc gcc gtc ggc gcc gag atc gcg ctg cag ttg aca 1728
Ala Gly Gln Lys Ala Ala Val Gly Ala Glu Ile Ala Leu Gln Leu Thr
565 570 575
ggt gga acg gtc gag ctg gct tct tcc atc gcg ttg gcg ctg gcc gcg 1776
Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala
580 585 590
gcg cgc ggc gtg acc agc ggc ttg cag gtg gcg ggg gcg tcg gcc ggg 1824
Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly
595 600 605
gcg gct gcc ggc gca ttg gcc gcg gcg ctc agt ccc atg gag atc tac 1872
Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr
610 615 620
ggc ctg gtg cag caa tcg cac tat gcg gat cag ctg gac aag ctg gcg 1920
Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala
625 630 635 640
cag gaa tcg agc gca tac ggt tac gag ggc gac gcc ttg ctg gcc cag 1968
Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln
645 650 655
ctg tat cgc gac aag acg gcc gcc gag ggc gcc gtc gcc ggc gtc tcc 2016
Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser
660 665 670
gcc gtc ctg agc acg gtg ggg gcg gcg gtg tcg atc gcc gcg gcg gcc 2064
Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala
675 680 685
agc gtg gta ggc gcc ccg gtg gcg gtg gtc act tcc ttg ttg acc ggg 2112
Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly
690 695 700
gct ctc aac ggc atc ctg cgc ggc gtg cag cag ccc atc atc gaa aag 2160
Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys
705 710 715 720
ctg gcc aat gat tac gct cgc aag atc gac gag ctg ggc ggg ccg caa 2208
Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln
725 730 735
gcg tac ttc gag aaa aac ctg cag gcg cgt cac gaa caa ctg gcc aat 2256
Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn
740 745 750
tcg gac ggc cta cgg aaa atg ctg gct gac ctg cag gcc ggg tgg aac 2304
Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn
755 760 765
gcc agc agc gtg atc ggg gtg cag acg aca gag att tcc aag tcg gcg 2352
Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala
770 775 780
ctc gaa ctg gcc gcc att acc ggc aac gcg gac aac ctg aaa tcc gcc 2400
Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Ala
785 790 795 800
gac gtg ttc gtg gac cgc ttc atc cag ggc gag cgg gtg gcc ggc cag 2448
Asp Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg Val Ala Gly Gln
805 810 815
ccg gtg gta ctc gac gtc gcc gcc ggc ggc atc gat atc gcc agc cgc 2496
Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg
820 825 830
aag ggc gag cgg ccg gcg ctg acg ttc atc acg ccg ctg gcc gcg cca 2544
Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro
835 840 845
gga gaa gag cag cgc cgg cgc acg aag acg ggc aag agc gaa ttc acc 2592
Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr
850 855 860
aca ttc gtc gag atc gtg ggc aag cag gac cgc tgg cgc atc cgg gac 2640
Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
865 870 875 880
ggc gcg gcc gac acc acc atc gat ctg gcc aag gtg gtg tcg caa ctg 2688
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu
885 890 895
gtc gac gcc aat ggc gtg ctc aag cac agc atc aaa ctg gag gtg atc 2736
Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Glu Val Ile
900 905 910
ggc gga gat ggc gat gat gtc gtg ctt gcc aat gct tcg cgc atc cat 2784
Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His
915 920 925
tac gac ggc ggc gcg gga acc aac acg gtc agc tat gcc gcc ctg ggc 2832
Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly
930 935 940
cga cag gat tcc att acc gtg tcc gcc gac ggg gaa cgt ttc aac gtg 2880
Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
945 950 955 960
cgc aag cag ttg aac aac gcc aac gtg tat cgc gaa ggc gtg gct acc 2928
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr
965 970 975
cag aaa acc gcc tac ggc aag cgc acg gag aat gtc caa tac cgc cat 2976
Gln Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His
980 985 990
gtc gag ctg gcc cgt gtc ggg caa ctg gtg gag gtc gac acg ctc gag 3024
Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu
995 1000 1005
cat gtg cag cac atc atc ggc ggg gcc ggc aac gat tcg atc acc 3069
His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
1010 1015 1020
ggc aat gcg cac gac aac ttc ctg gcc ggc ggg gcg ggc gac gac 3114
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly Asp Asp
1025 1030 1035
agg ctg gat ggc ggc gcc ggc aac gac aca ctg gtc ggc ggc gag 3159
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
1040 1045 1050
ggc cac aac acg gtc gtc ggc ggc gct ggc gac gac gta ttc ctg 3204
Gly His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu
1055 1060 1065
cag gac ctg ggg gta tgg agc aac cag ctc gat ggc ggc gcg ggc 3249
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
1070 1075 1080
gtc gat acc gtg aag tac aac gtg cac cag cct tcc gag gaa cgc 3294
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg
1085 1090 1095
ctc gaa cgc atg ggc gac acg ggc atc cat gcc gat ctt caa aag 3339
Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
1100 1105 1110
ggc acg gtc gag aag tgg ccg gcc ctg aac ctg ttc agc gtc gac 3384
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp
1115 1120 1125
cat gtc aag aat atc gag aat ctg cac ggc tcc agc ctg aac gac 3429
His Val Lys Asn Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp
1130 1135 1140
agc atc gcc ggc gac gac cgg gac aac gag ctc tgg ggc gac gat 3474
Ser Ile Ala Gly Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp
1145 1150 1155
ggc aac gac acg ata cac ggc cgg ggc ggc gac gat atc ctg cgc 3519
Gly Asn Asp Thr Ile His Gly Arg Gly Gly Asp Asp Ile Leu Arg
1160 1165 1170
ggc ggc ctg ggc ctg gac acg ctg tat ggc gag gac ggc aac gac 3564
Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp
1175 1180 1185
atc ttc ctg cag gac gac gag acc gtc agc gat gac atc gac ggc 3609
Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly
1190 1195 1200
ggc gcg ggg ctg gac acc gtc gac tat tcc gcc atg atc cat gca 3654
Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Ala
1205 1210 1215
ggc aag atc gtt gcg ccg cat gaa tac ggc ttc ggg atc gag gcg 3699
Gly Lys Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala
1220 1225 1230
gac ctg tcc gaa ggg tgg gtg cgc aag gcg gcc cgg cgc ggc atg 3744
Asp Leu Ser Glu Gly Trp Val Arg Lys Ala Ala Arg Arg Gly Met
1235 1240 1245
ggc tac tac gac agt gtc cgc agt gtc gaa aac gtc atc ggc acg 3789
Gly Tyr Tyr Asp Ser Val Arg Ser Val Glu Asn Val Ile Gly Thr
1250 1255 1260
agc atg aag gat gtg ctc atc ggc gac gcg caa gcc aat acc ctg 3834
Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu
1265 1270 1275
atg ggc cag ggc ggc gac gat acc gtg cgc ggc ggc gac ggc gat 3879
Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp
1280 1285 1290
gat ctg ctg ttc ggc ggc gac ggc aac gac atg ctg tat gga gac 3924
Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp
1295 1300 1305
gcc ggc aac gac acc ctc tac gga ggg ctg ggc gac gat acc ctt 3969
Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu
1310 1315 1320
gaa ggc ggc gcg ggc aac gat tgg ttc ggc cag acg ccg gcg cgc 4014
Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Pro Ala Arg
1325 1330 1335
gag cat gac gtg ctg cgc ggc ggg gct ggg gtg gat acc gtg gat 4059
Glu His Asp Val Leu Arg Gly Gly Ala Gly Val Asp Thr Val Asp
1340 1345 1350
tac agc cag gcg ggc gcg cat gcc ggc gtt gcc acg ggt cgc atc 4104
Tyr Ser Gln Ala Gly Ala His Ala Gly Val Ala Thr Gly Arg Ile
1355 1360 1365
ggg ctg ggt att ctg gcg gac ctg ggc gcc ggc cgc gtc gac aag 4149
Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys
1370 1375 1380
ctg ggc gag gcc ggc agc agc gcc tac gat acg gtt tcc ggc atc 4194
Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile
1385 1390 1395
gaa aat gtg gtg ggc acg gaa ctg gcc gac cgc atc acg ggc gat 4239
Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp
1400 1405 1410
gcg cag gcc aac gta ctg cgc ggc gcg ggt ggt gcc gac gtg ctt 4284
Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu
1415 1420 1425
gcg ggc ggc gag ggc gac gat gtg ctg ctg ggc ggc gag ggc gat 4329
Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Glu Gly Asp
1430 1435 1440
gac cag ctg tcg ggc gac gcc gga cgc gac cgc ttg tac ggc gaa 4374
Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu
1445 1450 1455
gcc ggt gac gac tgg ttc ttc cag gat gcc gcc aat gcc ggc aat 4419
Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn
1460 1465 1470
ctg ctc gac ggt ggt gac ggc aac gat acc gtg gat ttc agc ggc 4464
Leu Leu Asp Gly Gly Asp Gly Asn Asp Thr Val Asp Phe Ser Gly
1475 1480 1485
ccg ggc cgg ggc ctc gac gcc ggc gca aag ggc gta ttc ctg agc 4509
Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser
1490 1495 1500
ctg ggc aag ggg ttc gcc agc ctg atg gac gaa ccc gaa acc agc 4554
Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser
1505 1510 1515
aac gtg ttg cgc cat atc gag aac gcc gtg ggc agc gtg cgt gat 4599
Asn Val Leu Arg His Ile Glu Asn Ala Val Gly Ser Val Arg Asp
1520 1525 1530
gac gtg ctg atc ggc gac gca ggc gcc aac gtc ctc aat ggc ctg 4644
Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu
1535 1540 1545
gcg ggc aac gac gtg ttg tcc ggc ggc gcc ggc gac gat gtg ctg 4689
Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu
1550 1555 1560
ctg ggc gac gag ggc tcg gac ctg ctc agc ggc gat gcg ggc aac 4734
Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn
1565 1570 1575
gac gat ctg ttc ggc ggg cag ggc gat gat acc tat ctg ttc ggg 4779
Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly
1580 1585 1590
gcc ggg tac gga cat gac acg atc tac gaa tcg ggc ggc ggc cat 4824
Ala Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His
1595 1600 1605
gac acc atc cgt atc aac gcg ggg gcg gac cag ctg tgg ttt gcg 4869
Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala
1610 1615 1620
cgc cag ggc aac gac ctg gag atc cgc att ctt ggc acc gac gat 4914
Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp
1625 1630 1635
gca ctt acc gtg cac gac tgg tat cgc gac gcc gat cac cgg gtg 4959
Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val
1640 1645 1650
gaa gcc atc cat gcc gcc aac cag gcc ata gac ccg gcc ggc atc 5004
Glu Ala Ile His Ala Ala Asn Gln Ala Ile Asp Pro Ala Gly Ile
1655 1660 1665
gaa aag ctg gtc gag gca atg gcg cag tac ccg gac ccc ggc gcg 5049
Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala
1670 1675 1680
gcg gcg gct gcc ccg ccg gcg gcg cgc gtg ccg gac acg ctg atg 5094
Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met
1685 1690 1695
cag tcc ctg gct gtc aac tgg cgc tga 5121
Gln Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 6
<211> 1706
<212> PRT
<213> Bordetella parapertussis (wild type CyaA)
<400> 6
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
Ala Val Gly Ala Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
Pro Gly Gly Arg Ser Lys Ser Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro
545 550 555 560
Ala Gly Gln Lys Ala Ala Val Gly Ala Glu Ile Ala Leu Gln Leu Thr
565 570 575
Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala
580 585 590
Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly
595 600 605
Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr
610 615 620
Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala
625 630 635 640
Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln
645 650 655
Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser
660 665 670
Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala
675 680 685
Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly
690 695 700
Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys
705 710 715 720
Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln
725 730 735
Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn
740 745 750
Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn
755 760 765
Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala
770 775 780
Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Ala
785 790 795 800
Asp Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg Val Ala Gly Gln
805 810 815
Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg
820 825 830
Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro
835 840 845
Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr
850 855 860
Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
865 870 875 880
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu
885 890 895
Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Glu Val Ile
900 905 910
Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His
915 920 925
Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly
930 935 940
Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
945 950 955 960
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr
965 970 975
Gln Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His
980 985 990
Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu
995 1000 1005
His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
1010 1015 1020
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly Asp Asp
1025 1030 1035
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
1040 1045 1050
Gly His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu
1055 1060 1065
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
1070 1075 1080
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg
1085 1090 1095
Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
1100 1105 1110
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp
1115 1120 1125
His Val Lys Asn Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp
1130 1135 1140
Ser Ile Ala Gly Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp
1145 1150 1155
Gly Asn Asp Thr Ile His Gly Arg Gly Gly Asp Asp Ile Leu Arg
1160 1165 1170
Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp
1175 1180 1185
Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly
1190 1195 1200
Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Ala
1205 1210 1215
Gly Lys Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala
1220 1225 1230
Asp Leu Ser Glu Gly Trp Val Arg Lys Ala Ala Arg Arg Gly Met
1235 1240 1245
Gly Tyr Tyr Asp Ser Val Arg Ser Val Glu Asn Val Ile Gly Thr
1250 1255 1260
Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu
1265 1270 1275
Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp
1280 1285 1290
Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp
1295 1300 1305
Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu
1310 1315 1320
Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Pro Ala Arg
1325 1330 1335
Glu His Asp Val Leu Arg Gly Gly Ala Gly Val Asp Thr Val Asp
1340 1345 1350
Tyr Ser Gln Ala Gly Ala His Ala Gly Val Ala Thr Gly Arg Ile
1355 1360 1365
Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys
1370 1375 1380
Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile
1385 1390 1395
Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp
1400 1405 1410
Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu
1415 1420 1425
Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Glu Gly Asp
1430 1435 1440
Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu
1445 1450 1455
Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn
1460 1465 1470
Leu Leu Asp Gly Gly Asp Gly Asn Asp Thr Val Asp Phe Ser Gly
1475 1480 1485
Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser
1490 1495 1500
Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser
1505 1510 1515
Asn Val Leu Arg His Ile Glu Asn Ala Val Gly Ser Val Arg Asp
1520 1525 1530
Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu
1535 1540 1545
Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu
1550 1555 1560
Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn
1565 1570 1575
Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly
1580 1585 1590
Ala Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His
1595 1600 1605
Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala
1610 1615 1620
Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp
1625 1630 1635
Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val
1640 1645 1650
Glu Ala Ile His Ala Ala Asn Gln Ala Ile Asp Pro Ala Gly Ile
1655 1660 1665
Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala
1670 1675 1680
Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met
1685 1690 1695
Gln Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 7
<211> 5118
<212> DNA
<213> Bordetella bronchiseptica (wild type CyaA)
<220>
<221> CDS
<222> (1)..(5118)
<400> 7
atg cag caa tcg cat cag gct ggt tac gca aac gcc gcc gac cgg gag 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggc atc ccc gca gcc gta ctc gat ggc atc aag gcc gtg gcg aag 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gaa aaa aac gcc aca ttg atg ttc cgc ctg gtc aac ccc cat tcc acc 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
agc ctg att gcc gaa ggg gtg gcc acc aaa gga ttg ggc gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aag tcg tcc gat tgg ggg ttg cag gcg ggc tac att ccc gtc aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctt tcc aaa ctg ttc ggc cgt gcg ccc gag gtg atc gcg cgg gcc 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gac gtc aac agc agc ctg gcg cat ggc cat acc gcg gtc gac 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acg ctg tcg aaa gag cgg ctt gac tat ctg cgg caa gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtc acc ggc atg gcc gat ggc gtg gtc gcg agc aac cac gca ggc tac 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gag cag ttc gag ttt cgc gtg aag gaa acc tcg gac ggg cgc tat gcc 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tat cgc cgc aag ggc ggc gac gat ttc gag gcg gtc aag gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggc aat gcc gcc ggt att cca ctg acg gcg gat atc gac atg ttc 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc atc atg ccg cat ctg tcc aac ttc cgc gac tcg gcg cgc agt tcg 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acc agc ggc gat tcg gtg acc gat tac ctg gcg cgc acg cgg cgg 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcc gcc agc gag gcc acg ggc ggc ctg gat cgc gaa cgc atc gac ttg 720
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
ttg tgg aaa atc gct cgc gcc ggc gcc cgt tcc gca gtg ggc acc gag 768
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
gcg cgt cgc cag ttc cgc tac gac ggc gac atg aat atc ggc gtg atc 816
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
acc gat ttc gag ctg gaa gtg cgc aat gcg ctg aac agg cgg gcg cac 864
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
gcg gtc ggc agg cag gac gtg gtc cag cat ggc act gag cag aac aat 912
Ala Val Gly Arg Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
cct ttc ccg gag gca gat gag aag att ttc gtc gta tcg gcc acc ggt 960
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
gaa agc cag atg ctc acg cgc ggg caa ctg aag gaa tac att ggc cag 1008
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
cag cgc ggc gag ggc tat gtc ttc tac gag aac cgt gcg tac ggc gtg 1056
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
gcg ggg aaa agc ctg ttc gac gat ggg ctg gga gcc gcg ccc ggc gtg 1104
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
ccg ggg cga cgt tcg aag tcc tcg ccg gat gta ctg gaa acg gtg ccg 1152
Pro Gly Arg Arg Ser Lys Ser Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
gcg tca ccc gga ttg cgg cgg ccg tcg ctg ggc gca gtg gaa cgc cag 1200
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
gat tcc ggc tat gac agc ctt gat ggg gtg gga tcg cga tcg ttc tcg 1248
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
ttg ggc gag gtg tcc gac atg gcc gcc gtg gaa gcg gcg gaa ctg gaa 1296
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
atg acc cgg caa gtc ttg cac gcc ggg gcg cgg cag gac gat gcc gag 1344
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
ccg ggc gtg agc ggt gcg tcg gcg cac tgg ggg cag cgg gcg ctg cag 1392
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
ggc gcc cag gcg gtg gcg gcg gcg cag cgg ctg gtt cat gcc att gcc 1440
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
ctg atg acg caa ttc ggc cgg gcc ggt tcc acc aac acg ccg cag gaa 1488
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
gcg gcc tcg ttg tcg gcg gcc gtg ttc ggc ttg ggc gag gcc agc agc 1536
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
gcc gtg gcc gaa acc gtg agc ggt ttt ttc cgc ggg tct tcg cgc tgg 1584
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
gcc ggc ggt ttc ggc gtg gct ggc ggc gcg atg gcg ctg gga ggc ggc 1632
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
atc ggc gcc gtt ggc gcc ggg atg tcg ttg acc gat gac gcg ccg gcc 1680
Ile Gly Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro Ala
545 550 555 560
gga cag aag gcc gcc gcc ggc gcc gag atc gcg ctg cag ttg aca ggt 1728
Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly
565 570 575
gga acg gtc gag ctg gct tct tcc atc gcg ttg gcg ctg gcc gcg gcg 1776
Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala
580 585 590
cgc ggc gtg acc agc ggc ttg cag gtg gcg ggg gcg tcg gcc ggg gcg 1824
Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly Ala
595 600 605
gct gcc ggc gca ttg gcc gcg gcg ctc agt ccc atg gag atc tac ggc 1872
Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly
610 615 620
ctg gtg cag caa tcg cac tat gcg gat cag ctg gac aag ctg gcg cag 1920
Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln
625 630 635 640
gaa tcg agc gca tac ggt tac gag ggc gac gcc ttg ctg gcc cag ctg 1968
Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu
645 650 655
tat cgc gac aag acg gcc gcc gag ggc gcc gtc gcc ggc gtc tcc gcc 2016
Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser Ala
660 665 670
gtc ctg agc acg gtg ggg gct gcg gtg tcg atc gcc gcg gcg gcc agc 2064
Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala Ser
675 680 685
gtg gta ggc gcc ccg gtg gcg gtg gtc act tcc ttg ttg acc ggg gct 2112
Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly Ala
690 695 700
ctc aac ggc atc ctg cgc ggc gtg cag cag ccc atc atc gaa aag ctg 2160
Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys Leu
705 710 715 720
gcc aat gat tac gct cgc aag atc gac gag ctg ggc ggg ccg caa gcg 2208
Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala
725 730 735
tac ttc gag aaa aac ctg cag gcg cgt cac gaa caa ctg gcc aat tcg 2256
Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn Ser
740 745 750
gac ggc cta cgg aaa atg ctg gcc gac ctg cag gcc ggg tgg aac gcc 2304
Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala
755 760 765
agc agc gtg atc ggg gtg cag acg aca gag att tcc aag tcg gcg ctc 2352
Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu
770 775 780
gaa ctg gcc gcc att acc ggc aac gcg gac aac ctg aaa tcc gcc gac 2400
Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Ala Asp
785 790 795 800
gtg ttc gtg gac cgc ttc atc cag ggc gag cgg gtg gcc ggc cag ccg 2448
Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg Val Ala Gly Gln Pro
805 810 815
gtg gta ctc gac gtc gcc gcc ggc ggc atc gat atc gcc agc cgc aag 2496
Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys
820 825 830
ggc gag cgg ccg gcg ctg acg ttc atc acg ccg ctg gcc gcg cca gga 2544
Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly
835 840 845
gaa gag cag cgc cgg cgc acg aaa acg ggc aag agc gaa ttc acc aca 2592
Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr
850 855 860
ttc gtc gag atc gtg ggc aag cag gac cgc tgg cgc atc cgg gac ggc 2640
Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly
865 870 875 880
gcg gcc gac acc acc atc gat ctg gcc aag gtg gtg tcg caa ctg gtc 2688
Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu Val
885 890 895
gac gcc aat ggc gtg ctc aag cac agc atc aaa ctg gag gtg atc ggc 2736
Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Glu Val Ile Gly
900 905 910
gga gat ggc gat gat gtc gtg ctt gcc aat gct tcg cgc atc cat tac 2784
Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His Tyr
915 920 925
gac ggc ggc gcg gga acc aac acg gtc agc tat gcc gcc ctg ggc cga 2832
Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg
930 935 940
cag gat tcc att acc gtg tcc gcc gac ggg gaa cgt ttc aac gtg cgc 2880
Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val Arg
945 950 955 960
aag cag ttg aac aac gcc aac gtg tat cgc gaa ggc gtg gct acc cag 2928
Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr Gln
965 970 975
aaa acc gcc tac ggc aag cgc acg gag aat gtc caa tac cgc cat gtc 2976
Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His Val
980 985 990
gag ctg gcc cgt gtc ggg caa ctg gtg gag gtc gac acg ctc gag cat 3024
Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu His
995 1000 1005
gtg cag cac atc atc ggc ggg gcc ggc aac gat tcg atc acc ggc 3069
Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr Gly
1010 1015 1020
aat gcg cac gac aac ttc ctg gcc ggc ggg gcg ggc gac gac agg 3114
Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly Asp Asp Arg
1025 1030 1035
ctg gat ggc ggc gcc ggc aac gac aca ctg gtc ggc ggc gag ggc 3159
Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu Gly
1040 1045 1050
cac aac acg gtc gtc ggc ggc gct ggc gac gac gta ttc ctg cag 3204
His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu Gln
1055 1060 1065
gac ctg ggg gta tgg agc aac cag ctc gat ggc ggc gcg ggc gtc 3249
Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val
1070 1075 1080
gat acc gtg aag tac aac gtg cac cag cct tcc gag gaa cgc ctc 3294
Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu
1085 1090 1095
gaa cgc atg ggc gac acg ggc atc cat gcc gat ctt caa aag ggc 3339
Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly
1100 1105 1110
acg gtc gag aag tgg ccg gcc ctg aac ctg ttc agc gtc gac cat 3384
Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His
1115 1120 1125
gtc aag aat atc gag aat ctg cac ggc tcc agc ctg aac gac agc 3429
Val Lys Asn Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp Ser
1130 1135 1140
atc gcc ggc gac gac cgg gac aac gag ctc tgg ggc gac gat ggc 3474
Ile Ala Gly Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp Gly
1145 1150 1155
aac gac acg ata cac ggc cgg ggc ggc gac gat atc ctg cgc ggc 3519
Asn Asp Thr Ile His Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly
1160 1165 1170
ggc ctg ggc ctg gac acg ctg tat ggc gag gac ggc aac gac atc 3564
Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile
1175 1180 1185
ttc ctg cag gac gac gag acc gtc agc gat gac atc gac ggt ggc 3609
Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly
1190 1195 1200
gcg gga ctg gac acc gtc gac tat tcc gcc atg atc cat gca ggc 3654
Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Ala Gly
1205 1210 1215
aag atc gtt gcg ccg cat gaa tac ggc ttc ggg atc gag gcg gac 3699
Lys Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp
1220 1225 1230
ctg tcc gaa ggg tgg gtg cgc aag gcg gcc cgg cgc ggc atg gac 3744
Leu Ser Glu Gly Trp Val Arg Lys Ala Ala Arg Arg Gly Met Asp
1235 1240 1245
tac tac gac agt gtc cgc agt gtc gaa aac gtc atc ggc acg agc 3789
Tyr Tyr Asp Ser Val Arg Ser Val Glu Asn Val Ile Gly Thr Ser
1250 1255 1260
atg aag gat gtg ctc atc ggc gac gcg caa gcc aat acc ctg atg 3834
Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met
1265 1270 1275
ggc cag ggc ggc gac gat acc gtg cgc ggc ggc gac ggc gat gat 3879
Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp
1280 1285 1290
ctg ctg ttc ggc ggc gac ggc aac gac atg ctg tat gga gac gcc 3924
Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala
1295 1300 1305
ggc aac gac acc ctc tac gga ggg ctg ggc gac gat acc ctt gaa 3969
Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu
1310 1315 1320
ggc ggc gcg ggc aac gat tgg ttc ggc cag acg ccg gcg cgc gag 4014
Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Pro Ala Arg Glu
1325 1330 1335
cat gac gtg ctg cgc ggc ggg gct ggg gtg gat acc gtg gat tac 4059
His Asp Val Leu Arg Gly Gly Ala Gly Val Asp Thr Val Asp Tyr
1340 1345 1350
agc cag gcg ggc gcg cat gcc ggc gtt gcc acg ggt cgc atc ggg 4104
Ser Gln Ala Gly Ala His Ala Gly Val Ala Thr Gly Arg Ile Gly
1355 1360 1365
ctg ggt att ctg gcg gac ctg ggc gcc ggc cgc gtc gac aag ctg 4149
Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu
1370 1375 1380
ggc gag gcc ggc agc agc gcc tac gat acg gtt tcc ggc atc gaa 4194
Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu
1385 1390 1395
aat gtg gtg ggc acg gaa ctg gcc gac cgc atc acg ggc gat gcg 4239
Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala
1400 1405 1410
cag gcc aac gta ctg cgc ggc gcg ggt ggc gcc gac gtg ctt gcg 4284
Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala
1415 1420 1425
ggc ggc gag ggc gac gat gtg ctg ctg ggc ggc gac ggc gac gac 4329
Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp
1430 1435 1440
cag ctg tcg ggc gac gcc gga cgc gac cgc ttg tac ggc gaa gcc 4374
Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala
1445 1450 1455
ggt gac gac tgg ttc ttc cag gat gcc gcc aat gcc ggc aat ctg 4419
Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu
1460 1465 1470
ctc gac ggt ggt gac ggc aac gat acc gtg gat ttc agc ggc ccg 4464
Leu Asp Gly Gly Asp Gly Asn Asp Thr Val Asp Phe Ser Gly Pro
1475 1480 1485
ggc cgg ggc ctc gac gcc ggc gca aag ggc gta ttc ctg agc ctg 4509
Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu
1490 1495 1500
ggc aag ggg ttc gcc agc ctg atg gac gaa ccc gaa acc agc aac 4554
Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn
1505 1510 1515
gtg ttg cgc cat atc gag aac gcc gtg ggc agc gtg cgt gat gac 4599
Val Leu Arg His Ile Glu Asn Ala Val Gly Ser Val Arg Asp Asp
1520 1525 1530
gtg ctg atc ggc gac gca ggc gcc aac gtc ctc aat ggc ctg gcg 4644
Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala
1535 1540 1545
ggc aac gac gtg ctg tcc ggc ggc gcc ggc gac gat gtg ctg ctg 4689
Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu
1550 1555 1560
ggc gac gag ggc tcg gac ctg ctc agc ggc gat gcg ggc aac gac 4734
Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp
1565 1570 1575
gat ctg ttc ggc ggg cag ggc gat gat acc tat ctg ttc ggg gcc 4779
Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Ala
1580 1585 1590
ggg tac gga cat gac acg atc tac gaa tcg ggc ggc ggc cat gac 4824
Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp
1595 1600 1605
acc atc cgt atc aac gcg ggg gcg gac cag ctg tgg ttt gcg cgc 4869
Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg
1610 1615 1620
cag ggc aac gac ctg gag atc cgc att ctt ggc acc gac gat gca 4914
Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala
1625 1630 1635
ctt acc gtg cac gac tgg tat cgc gac gcc gat cac cgg gtg gaa 4959
Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu
1640 1645 1650
gcc atc cat gcc gcc aac cag gcc ata gac ccg gcc ggc atc gaa 5004
Ala Ile His Ala Ala Asn Gln Ala Ile Asp Pro Ala Gly Ile Glu
1655 1660 1665
aag ctg gtc gag gca atg gcg cag tac ccg gac ccc ggc gcg gcg 5049
Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala
1670 1675 1680
gcg gct gcc ccg ccg gcg gcg cgc gtg ccg gac acg ctg atg cag 5094
Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln
1685 1690 1695
tcc ctg gct gtc aac tgg cgc tga 5118
Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 8
<211> 1705
<212> PRT
<213> Bordetella bronchiseptica (wild type CyaA)
<400> 8
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ala Thr Gly Gly Leu Asp Arg Glu Arg Ile Asp Leu
225 230 235 240
Leu Trp Lys Ile Ala Arg Ala Gly Ala Arg Ser Ala Val Gly Thr Glu
245 250 255
Ala Arg Arg Gln Phe Arg Tyr Asp Gly Asp Met Asn Ile Gly Val Ile
260 265 270
Thr Asp Phe Glu Leu Glu Val Arg Asn Ala Leu Asn Arg Arg Ala His
275 280 285
Ala Val Gly Arg Gln Asp Val Val Gln His Gly Thr Glu Gln Asn Asn
290 295 300
Pro Phe Pro Glu Ala Asp Glu Lys Ile Phe Val Val Ser Ala Thr Gly
305 310 315 320
Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln
325 330 335
Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val
340 345 350
Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala Pro Gly Val
355 360 365
Pro Gly Arg Arg Ser Lys Ser Ser Pro Asp Val Leu Glu Thr Val Pro
370 375 380
Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln
385 390 395 400
Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser
405 410 415
Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu
420 425 430
Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu
435 440 445
Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln
450 455 460
Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala
465 470 475 480
Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu
485 490 495
Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser
500 505 510
Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp
515 520 525
Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly
530 535 540
Ile Gly Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro Ala
545 550 555 560
Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly
565 570 575
Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala
580 585 590
Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly Ala
595 600 605
Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly
610 615 620
Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln
625 630 635 640
Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu
645 650 655
Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser Ala
660 665 670
Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala Ser
675 680 685
Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly Ala
690 695 700
Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys Leu
705 710 715 720
Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala
725 730 735
Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn Ser
740 745 750
Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala
755 760 765
Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu
770 775 780
Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Ala Asp
785 790 795 800
Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg Val Ala Gly Gln Pro
805 810 815
Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys
820 825 830
Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly
835 840 845
Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr
850 855 860
Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly
865 870 875 880
Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu Val
885 890 895
Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Glu Val Ile Gly
900 905 910
Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His Tyr
915 920 925
Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg
930 935 940
Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val Arg
945 950 955 960
Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr Gln
965 970 975
Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His Val
980 985 990
Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu His
995 1000 1005
Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr Gly
1010 1015 1020
Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly Asp Asp Arg
1025 1030 1035
Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu Gly
1040 1045 1050
His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu Gln
1055 1060 1065
Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val
1070 1075 1080
Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu
1085 1090 1095
Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly
1100 1105 1110
Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His
1115 1120 1125
Val Lys Asn Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp Ser
1130 1135 1140
Ile Ala Gly Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp Gly
1145 1150 1155
Asn Asp Thr Ile His Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly
1160 1165 1170
Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile
1175 1180 1185
Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly
1190 1195 1200
Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Ala Gly
1205 1210 1215
Lys Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp
1220 1225 1230
Leu Ser Glu Gly Trp Val Arg Lys Ala Ala Arg Arg Gly Met Asp
1235 1240 1245
Tyr Tyr Asp Ser Val Arg Ser Val Glu Asn Val Ile Gly Thr Ser
1250 1255 1260
Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met
1265 1270 1275
Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp
1280 1285 1290
Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala
1295 1300 1305
Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu
1310 1315 1320
Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Pro Ala Arg Glu
1325 1330 1335
His Asp Val Leu Arg Gly Gly Ala Gly Val Asp Thr Val Asp Tyr
1340 1345 1350
Ser Gln Ala Gly Ala His Ala Gly Val Ala Thr Gly Arg Ile Gly
1355 1360 1365
Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu
1370 1375 1380
Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu
1385 1390 1395
Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala
1400 1405 1410
Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala
1415 1420 1425
Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp
1430 1435 1440
Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala
1445 1450 1455
Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu
1460 1465 1470
Leu Asp Gly Gly Asp Gly Asn Asp Thr Val Asp Phe Ser Gly Pro
1475 1480 1485
Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu
1490 1495 1500
Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn
1505 1510 1515
Val Leu Arg His Ile Glu Asn Ala Val Gly Ser Val Arg Asp Asp
1520 1525 1530
Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala
1535 1540 1545
Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu
1550 1555 1560
Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp
1565 1570 1575
Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Ala
1580 1585 1590
Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp
1595 1600 1605
Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg
1610 1615 1620
Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala
1625 1630 1635
Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu
1640 1645 1650
Ala Ile His Ala Ala Asn Gln Ala Ile Asp Pro Ala Gly Ile Glu
1655 1660 1665
Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala
1670 1675 1680
Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln
1685 1690 1695
Ser Leu Ala Val Asn Trp Arg
1700 1705
<210> 9
<211> 4842
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence encoding polypeptide 1-227 + 321-1706 of SEQ
ID NO:2
<220>
<221> CDS
<222> (1)..(4842)
<400> 9
atg cag cag tcc cat cag gcc ggt tac gca aac gca gcc gat cgt gaa 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggt atc ccg gca gcg gtt ctg gat ggt att aag gca gtt gcc aaa 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gag aag aac gct acc ctg atg ttc cgt ctg gtc aac cca cac tct act 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
tcc ctg atc gcg gaa ggt gtg gcg acc aaa ggc ctg ggt gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aaa agc agc gac tgg ggt ctg cag gca ggt tat att ccg gtg aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctg tct aaa ctg ttc ggt cgt gcc ccg gag gtg atc gca cgt gca 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gat gtc aac tct tct ctg gcg cat ggt cac acc gcg gtt gat 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acc ctg tcc aaa gaa cgc ctg gat tac ctg cgt cag gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtg acg ggc atg gcc gac ggt gtt gta gcg agc aac cac gcg ggt tat 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gaa caa ttt gag ttt cgc gtt aaa gag acc tct gac ggt cgt tac gcg 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tac cgc cgc aaa ggt ggc gat gac ttt gaa gct gtc aaa gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggt aac gct gct gga att ccg ctg acc gcg gat atc gac atg ttt 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc atc atg cct cac ctg tcc aac ttt cgc gat tcc gca cgc agc tct 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acg tct ggt gat tcc gtc act gac tac ctg gct cgt acc cgt cgt 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcg gcc tct gaa tcc cag atg ctg act cgt ggc cag ctg aaa gaa tac 720
Ala Ala Ser Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr
225 230 235 240
atc ggc caa cag cgt ggc gaa ggc tac gtt ttc tac gag aat cgt gct 768
Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala
245 250 255
tac ggc gtt gcg ggc aaa tcc ctg ttc gac gat ggt ctg ggc gct gca 816
Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala
260 265 270
ccg ggc gtt ccg agc ggc cgt tct aaa ttc agc ccg gac gta ctg gaa 864
Pro Gly Val Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu
275 280 285
act gtg ccg gct tcc ccg ggc ctg cgc cgt ccg tcc ctg ggc gca gtc 912
Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val
290 295 300
gaa cgt cag gac tcc ggc tac gat tcc ctg gat ggc gtt ggc tcc cgc 960
Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg
305 310 315 320
tcc ttc tcc ctg ggc gag gtt tct gac atg gct gcg gtg gaa gcg gca 1008
Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala
325 330 335
gag ctg gaa atg acc cgt caa gtg ctg cac gcg ggc gca cgt cag gac 1056
Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp
340 345 350
gat gct gag ccg ggc gtg tcc ggt gcg tct gca cac tgg ggt caa cgt 1104
Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg
355 360 365
gcc ctg cag ggt gct caa gct gtc gcg gca gcg cag cgt ctg gta cat 1152
Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His
370 375 380
gcg atc gca ctg atg acc cag ttc ggt cgc gca ggt tct acc aac act 1200
Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr
385 390 395 400
cct cag gaa gca gct agc ctg tct gct gct gtt ttc ggt ctg ggc gaa 1248
Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu
405 410 415
gcg tct tct gcg gtt gca gaa acc gtg agc ggt ttc ttc cgt ggt tct 1296
Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser
420 425 430
agc cgc tgg gcg ggt ggt ttt ggt gta gca ggt ggc gct atg gcc ctg 1344
Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu
435 440 445
ggt ggc ggt atc gcg gct gct gtc ggc gca ggt atg agc ctg acc gac 1392
Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp
450 455 460
gat gct cct gcg ggc cag aaa gcc gca gct ggc gct gaa atc gcg ctg 1440
Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu
465 470 475 480
cag ctg act ggt ggt acc gtt gaa ctg gct agc tct atc gcg ctg gct 1488
Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala
485 490 495
ctg gca gcg gca cgt ggc gtg act tct ggc ctg caa gtc gcc ggt gcc 1536
Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala
500 505 510
tct gcg ggc gct gct gcg ggc gct ctg gca gct gca ctg tcc ccc atg 1584
Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met
515 520 525
gaa atc tac ggt ctg gta cag cag tct cac tac gca gac cag ctg gat 1632
Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp
530 535 540
aaa ctg gcg cag gag tct tct gca tac ggt tac gaa ggc gac gca ctg 1680
Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu
545 550 555 560
ctg gcg cag ctg tat cgt gac aaa act gct gct gaa ggt gct gtg gca 1728
Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala
565 570 575
ggc gtt tct gcg gta ctg tct acc gtt ggc gct gcg gtt tct att gcg 1776
Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala
580 585 590
gct gcc gca tcc gtt gta ggt gcg ccg gtt gct gta gtt acc tct ctg 1824
Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu
595 600 605
ctg act ggt gca ctg aac ggt atc ctg cgt ggt gtt cag cag cct att 1872
Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile
610 615 620
atc gaa aaa ctg gcg aat gat tat gcc cgt aaa atc gac gaa ctg ggc 1920
Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly
625 630 635 640
ggt ccg cag gct tat ttt gaa aaa aac ctg cag gcg cgc cac gaa cag 1968
Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln
645 650 655
ctg gca aac agc gac ggc ctg cgc aaa atg ctg gca gac ctg caa gct 2016
Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala
660 665 670
ggt tgg aac gcg tct tct gtg atc ggc gtg cag acc acc gaa att agc 2064
Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser
675 680 685
aaa tct gcg ctg gaa ctg gct gca att act ggc aac gcg gat aac ctg 2112
Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu
690 695 700
aaa agc gtt gat gtt ttt gtc gat cgc ttc gtt cag ggc gag cgc gtt 2160
Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val
705 710 715 720
gct ggt cag ccg gtt gtt ctg gac gtt gcg gca ggc ggc atc gac atc 2208
Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile
725 730 735
gct agc cgc aag ggc gag cgt ccg gct ctg act ttc att acc ccg ctg 2256
Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu
740 745 750
gca gct ccg ggt gaa gaa cag cgt cgc cgt acc aag act ggt aaa agc 2304
Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser
755 760 765
gag ttc acc acc ttc gtg gaa atc gta ggt aaa cag gac cgc tgg cgt 2352
Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg
770 775 780
att cgc gac ggt gcg gcg gac acc acc atc gac ctg gca aaa gtt gtt 2400
Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val
785 790 795 800
tcc caa ctg gta gat gct aac ggc gtg ctg aaa cat tct att aaa ctg 2448
Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu
805 810 815
gat gta atc ggc ggt gac ggc gat gac gtt gta ctg gcg aac gcg tct 2496
Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser
820 825 830
cgt atc cac tat gac ggc ggc gca ggt acc aac acg gtt tcc tac gca 2544
Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala
835 840 845
gcg ctg ggc cgc cag gat tcc atc act gtt agc gcc gat ggc gaa cgt 2592
Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg
850 855 860
ttc aac gtg cgt aaa cag ctg aat aac gca aac gtc tat cgt gag ggt 2640
Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly
865 870 875 880
gta gct acc cag acc acc gcg tac ggt aag cgt acc gaa aac gtt cag 2688
Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln
885 890 895
tat cgt cac gtg gaa ctg gca cgt gtg ggt cag ctg gta gag gtg gat 2736
Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
900 905 910
acg ctg gaa cac gtg cag cac atc atc ggt ggc gcc ggt aac gat tcc 2784
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser
915 920 925
att act ggt aac gct cac gac aac ttc ctg gca ggt ggt tct ggt gat 2832
Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp
930 935 940
gat cgt ctg gac ggt ggt gcg ggt aac gat acg ctg gta ggc ggc gaa 2880
Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
945 950 955 960
ggt cag aac acc gta att ggt ggt gcc ggt gac gac gtt ttc ctg cag 2928
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu Gln
965 970 975
gat ctg ggc gtt tgg agc aac cag ctg gat ggc ggt gcc ggt gtt gac 2976
Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp
980 985 990
acg gtt aag tat aac gtt cac cag ccg tct gaa gag cgc ctg gaa cgt 3024
Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg
995 1000 1005
atg ggt gac act ggt att cat gcc gat ctg cag aaa ggc act gtt 3069
Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val
1010 1015 1020
gaa aaa tgg cct gcg ctg aac ctg ttc tct gtg gac cat gtt aag 3114
Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
1025 1030 1035
aac att gaa aac ctg cat ggc tct cgc ctg aac gac cgt atc gct 3159
Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala
1040 1045 1050
ggt gac gac cag gat aac gaa ctg tgg ggt cat gac ggc aat gat 3204
Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp
1055 1060 1065
acc att cgc ggt cgt ggc ggc gac gat att ctg cgt ggc ggt ctg 3249
Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu
1070 1075 1080
ggc ctg gat acc ctg tat ggt gaa gat ggt aac gat att ttc ctg 3294
Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu
1085 1090 1095
caa gac gat gaa acg gta tct gat gac atc gac ggt ggt gca ggc 3339
Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly
1100 1105 1110
ctg gac acc gta gat tac agc gct atg atc cat ccg ggt cgt atc 3384
Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro Gly Arg Ile
1115 1120 1125
gta gct ccg cac gag tac ggc ttc ggt atc gag gcg gac ctg tct 3429
Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser
1130 1135 1140
cgt gaa tgg gtt cgt aaa gcg tcc gcg ctg ggt gtg gac tac tac 3474
Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr
1145 1150 1155
gat aac gtt cgt aac gtg gaa aac gtg atc ggt acc tcc atg aaa 3519
Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr Ser Met Lys
1160 1165 1170
gac gtg ctg att ggc gac gca cag gcc aac act ctg atg ggc cag 3564
Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln
1175 1180 1185
ggc ggt gat gac acg gtt cgc ggc ggc gac ggt gat gac ctg ctg 3609
Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu
1190 1195 1200
ttc ggt ggt gac ggc aac gac atg ctg tac ggc gac gcg ggc aac 3654
Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn
1205 1210 1215
gac acc ctg tac ggc ggt ctg ggt gac gac act ctg gaa ggt ggt 3699
Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly
1220 1225 1230
gca ggt aac gac tgg ttc ggc caa acc cag gca cgc gaa cac gac 3744
Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg Glu His Asp
1235 1240 1245
gtg ctg cgt ggt ggc gac ggc gta gac acc gtg gat tac tcc caa 3789
Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp Tyr Ser Gln
1250 1255 1260
act ggc gct cac gcg ggt atc gcg gcc ggt cgt atc ggt ctg ggc 3834
Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly
1265 1270 1275
att ctg gcc gat ctg ggt gcc ggc cgt gtc gac aaa ctg ggt gag 3879
Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu
1280 1285 1290
gct ggc tct agc gcc tat gat act gtt tcc ggc atc gaa aac gtg 3924
Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val
1295 1300 1305
gta ggc act gaa ctg gca gat cgt atc acg ggt gac gcg caa gcg 3969
Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala
1310 1315 1320
aac gtt ctg cgt ggt gct ggc ggt gca gac gtg ctg gcg ggt ggt 4014
Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly
1325 1330 1335
gaa ggc gac gac gta ctg ctg ggc ggt gac ggt gac gat cag ctg 4059
Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu
1340 1345 1350
agc ggt gat gcg ggt cgt gac cgt ctg tac ggt gaa gca ggt gac 4104
Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp
1355 1360 1365
gat tgg ttc ttc cag gac gct gct aac gct ggc aac ctg ctg gac 4149
Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp
1370 1375 1380
ggc ggc gat ggc cgt gac act gtt gac ttc agc ggt ccg ggt cgc 4194
Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly Pro Gly Arg
1385 1390 1395
ggt ctg gac gca ggc gcg aaa ggc gtt ttc ctg agc ctg ggt aag 4239
Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys
1400 1405 1410
ggt ttc gca tct ctg atg gac gaa cca gaa acc agc aat gtc ctg 4284
Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu
1415 1420 1425
cgt aac atc gaa aac gct gtc ggt tcc gca cgc gat gat gtt ctg 4329
Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp Asp Val Leu
1430 1435 1440
att ggc gat gct ggt gcc aat gtt ctg aac ggt ctg gcg ggt aat 4374
Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn
1445 1450 1455
gat gta ctg tct ggt ggc gct ggt gat gat gtc ctg ctg ggt gat 4419
Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp
1460 1465 1470
gag ggc agc gat ctg ctg tcc ggc gat gcc ggc aac gac gat ctg 4464
Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu
1475 1480 1485
ttc ggt ggc caa ggt gat gat act tac ctg ttc ggc gtt ggc tat 4509
Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr
1490 1495 1500
ggt cat gac acc atc tat gag tct ggt ggc ggc cac gat acg att 4554
Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile
1505 1510 1515
cgt att aat gca ggt gct gac caa ctg tgg ttt gca cgt cag ggt 4599
Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly
1520 1525 1530
aac gat ctg gaa att cgc atc ctg ggt act gat gac gct ctg acc 4644
Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr
1535 1540 1545
gta cac gac tgg tac cgc gat gcg gat cac cgc gta gaa atc atc 4689
Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ile Ile
1550 1555 1560
cat gcg gct aac caa gct gta gac cag gct ggt att gaa aaa ctg 4734
His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile Glu Lys Leu
1565 1570 1575
gta gaa gcg atg gca cag tat ccg gac cca ggt gcg gct gct gca 4779
Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala
1580 1585 1590
gca cct cca gcg gct cgt gtg ccg gat acc ctg atg cag agc ctg 4824
Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu
1595 1600 1605
gcc gtc aat tgg cgt taa 4842
Ala Val Asn Trp Arg
1610
<210> 10
<211> 1613
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr
225 230 235 240
Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala
245 250 255
Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala
260 265 270
Pro Gly Val Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu
275 280 285
Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val
290 295 300
Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg
305 310 315 320
Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala
325 330 335
Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp
340 345 350
Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg
355 360 365
Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His
370 375 380
Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr
385 390 395 400
Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu
405 410 415
Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser
420 425 430
Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu
435 440 445
Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp
450 455 460
Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu
465 470 475 480
Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala
485 490 495
Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala
500 505 510
Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met
515 520 525
Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp
530 535 540
Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu
545 550 555 560
Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala
565 570 575
Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala
580 585 590
Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu
595 600 605
Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile
610 615 620
Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly
625 630 635 640
Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln
645 650 655
Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala
660 665 670
Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser
675 680 685
Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu
690 695 700
Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val
705 710 715 720
Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile
725 730 735
Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu
740 745 750
Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser
755 760 765
Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg
770 775 780
Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val
785 790 795 800
Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu
805 810 815
Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser
820 825 830
Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala
835 840 845
Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg
850 855 860
Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly
865 870 875 880
Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln
885 890 895
Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
900 905 910
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser
915 920 925
Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp
930 935 940
Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
945 950 955 960
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu Gln
965 970 975
Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp
980 985 990
Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg
995 1000 1005
Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val
1010 1015 1020
Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
1025 1030 1035
Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala
1040 1045 1050
Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp
1055 1060 1065
Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu
1070 1075 1080
Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu
1085 1090 1095
Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly
1100 1105 1110
Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro Gly Arg Ile
1115 1120 1125
Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser
1130 1135 1140
Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr
1145 1150 1155
Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr Ser Met Lys
1160 1165 1170
Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln
1175 1180 1185
Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu
1190 1195 1200
Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn
1205 1210 1215
Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly
1220 1225 1230
Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg Glu His Asp
1235 1240 1245
Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp Tyr Ser Gln
1250 1255 1260
Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly
1265 1270 1275
Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu
1280 1285 1290
Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val
1295 1300 1305
Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala
1310 1315 1320
Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly
1325 1330 1335
Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu
1340 1345 1350
Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp
1355 1360 1365
Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp
1370 1375 1380
Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly Pro Gly Arg
1385 1390 1395
Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys
1400 1405 1410
Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu
1415 1420 1425
Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp Asp Val Leu
1430 1435 1440
Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn
1445 1450 1455
Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp
1460 1465 1470
Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu
1475 1480 1485
Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr
1490 1495 1500
Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile
1505 1510 1515
Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly
1520 1525 1530
Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr
1535 1540 1545
Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ile Ile
1550 1555 1560
His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile Glu Lys Leu
1565 1570 1575
Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala
1580 1585 1590
Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu
1595 1600 1605
Ala Val Asn Trp Arg
1610
<210> 11
<211> 4512
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence encoding polypeptide 1-183 + 387-1706 of SEQ
ID NO:2
<220>
<221> CDS
<222> (1)..(4512)
<400> 11
atg cag cag tcc cat cag gcc ggt tac gca aac gca gcc gat cgt gaa 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggt atc ccg gca gcg gtt ctg gat ggt att aag gca gtt gcc aaa 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gag aag aac gct acc ctg atg ttc cgt ctg gtc aac cca cac tct act 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
tcc ctg atc gcg gaa ggt gtg gcg acc aaa ggc ctg ggt gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aaa agc agc gac tgg ggt ctg cag gca ggt tat att ccg gtg aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctg tct aaa ctg ttc ggt cgt gcc ccg gag gtg atc gca cgt gca 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gat gtc aac tct tct ctg gcg cat ggt cac acc gcg gtt gat 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acc ctg tcc aaa gaa cgc ctg gat tac ctg cgt cag gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtg acg ggc atg gcc gac ggt gtt gta gcg agc aac cac gcg ggt tat 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gaa caa ttt gag ttt cgc gtt aaa gag acc tct gac ggt cgt tac gcg 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tac cgc cgc aaa ggt ggc gat gac ttt gaa gct gtc aaa gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggt aac gct gct gga att ccg ggc ctg cgc cgt ccg tcc ctg ggc 576
Ile Gly Asn Ala Ala Gly Ile Pro Gly Leu Arg Arg Pro Ser Leu Gly
180 185 190
gca gtc gaa cgt cag gac tcc ggc tac gat tcc ctg gat ggc gtt ggc 624
Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly
195 200 205
tcc cgc tcc ttc tcc ctg ggc gag gtt tct gac atg gct gcg gtg gaa 672
Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu
210 215 220
gcg gca gag ctg gaa atg acc cgt caa gtg ctg cac gcg ggc gca cgt 720
Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg
225 230 235 240
cag gac gat gct gag ccg ggc gtg tcc ggt gcg tct gca cac tgg ggt 768
Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly
245 250 255
caa cgt gcc ctg cag ggt gct caa gct gtc gcg gca gcg cag cgt ctg 816
Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu
260 265 270
gta cat gcg atc gca ctg atg acc cag ttc ggt cgc gca ggt tct acc 864
Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr
275 280 285
aac act cct cag gaa gca gct agc ctg tct gct gct gtt ttc ggt ctg 912
Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu
290 295 300
ggc gaa gcg tct tct gcg gtt gca gaa acc gtg agc ggt ttc ttc cgt 960
Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg
305 310 315 320
ggt tct agc cgc tgg gcg ggt ggt ttt ggt gta gca ggt ggc gct atg 1008
Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met
325 330 335
gcc ctg ggt ggc ggt atc gcg gct gct gtc ggc gca ggt atg agc ctg 1056
Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu
340 345 350
acc gac gat gct cct gcg ggc cag aaa gcc gca gct ggc gct gaa atc 1104
Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile
355 360 365
gcg ctg cag ctg act ggt ggt acc gtt gaa ctg gct agc tct atc gcg 1152
Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala
370 375 380
ctg gct ctg gca gcg gca cgt ggc gtg act tct ggc ctg caa gtc gcc 1200
Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala
385 390 395 400
ggt gcc tct gcg ggc gct gct gcg ggc gct ctg gca gct gca ctg tcc 1248
Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser
405 410 415
ccc atg gaa atc tac ggt ctg gta cag cag tct cac tac gca gac cag 1296
Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln
420 425 430
ctg gat aaa ctg gcg cag gag tct tct gca tac ggt tac gaa ggc gac 1344
Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp
435 440 445
gca ctg ctg gcg cag ctg tat cgt gac aaa act gct gct gaa ggt gct 1392
Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala
450 455 460
gtg gca ggc gtt tct gcg gta ctg tct acc gtt ggc gct gcg gtt tct 1440
Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser
465 470 475 480
att gcg gct gcc gca tcc gtt gta ggt gcg ccg gtt gct gta gtt acc 1488
Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr
485 490 495
tct ctg ctg act ggt gca ctg aac ggt atc ctg cgt ggt gtt cag cag 1536
Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln
500 505 510
cct att atc gaa aaa ctg gcg aat gat tat gcc cgt aaa atc gac gaa 1584
Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu
515 520 525
ctg ggc ggt ccg cag gct tat ttt gaa aaa aac ctg cag gcg cgc cac 1632
Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His
530 535 540
gaa cag ctg gca aac agc gac ggc ctg cgc aaa atg ctg gca gac ctg 1680
Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu
545 550 555 560
caa gct ggt tgg aac gcg tct tct gtg atc ggc gtg cag acc acc gaa 1728
Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu
565 570 575
att agc aaa tct gcg ctg gaa ctg gct gca att act ggc aac gcg gat 1776
Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp
580 585 590
aac ctg aaa agc gtt gat gtt ttt gtc gat cgc ttc gtt cag ggc gag 1824
Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu
595 600 605
cgc gtt gct ggt cag ccg gtt gtt ctg gac gtt gcg gca ggc ggc atc 1872
Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile
610 615 620
gac atc gct agc cgc aag ggc gag cgt ccg gct ctg act ttc att acc 1920
Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr
625 630 635 640
ccg ctg gca gct ccg ggt gaa gaa cag cgt cgc cgt acc aag act ggt 1968
Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly
645 650 655
aaa agc gag ttc acc acc ttc gtg gaa atc gta ggt aaa cag gac cgc 2016
Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg
660 665 670
tgg cgt att cgc gac ggt gcg gcg gac acc acc atc gac ctg gca aaa 2064
Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys
675 680 685
gtt gtt tcc caa ctg gta gat gct aac ggc gtg ctg aaa cat tct att 2112
Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile
690 695 700
aaa ctg gat gta atc ggc ggt gac ggc gat gac gtt gta ctg gcg aac 2160
Lys Leu Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn
705 710 715 720
gcg tct cgt atc cac tat gac ggc ggc gca ggt acc aac acg gtt tcc 2208
Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser
725 730 735
tac gca gcg ctg ggc cgc cag gat tcc atc act gtt agc gcc gat ggc 2256
Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly
740 745 750
gaa cgt ttc aac gtg cgt aaa cag ctg aat aac gca aac gtc tat cgt 2304
Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg
755 760 765
gag ggt gta gct acc cag acc acc gcg tac ggt aag cgt acc gaa aac 2352
Glu Gly Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn
770 775 780
gtt cag tat cgt cac gtg gaa ctg gca cgt gtg ggt cag ctg gta gag 2400
Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu
785 790 795 800
gtg gat acg ctg gaa cac gtg cag cac atc atc ggt ggc gcc ggt aac 2448
Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn
805 810 815
gat tcc att act ggt aac gct cac gac aac ttc ctg gca ggt ggt tct 2496
Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
820 825 830
ggt gat gat cgt ctg gac ggt ggt gcg ggt aac gat acg ctg gta ggc 2544
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly
835 840 845
ggc gaa ggt cag aac acc gta att ggt ggt gcc ggt gac gac gtt ttc 2592
Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe
850 855 860
ctg cag gat ctg ggc gtt tgg agc aac cag ctg gat ggc ggt gcc ggt 2640
Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
865 870 875 880
gtt gac acg gtt aag tat aac gtt cac cag ccg tct gaa gag cgc ctg 2688
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu
885 890 895
gaa cgt atg ggt gac act ggt att cat gcc gat ctg cag aaa ggc act 2736
Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr
900 905 910
gtt gaa aaa tgg cct gcg ctg aac ctg ttc tct gtg gac cat gtt aag 2784
Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
915 920 925
aac att gaa aac ctg cat ggc tct cgc ctg aac gac cgt atc gct ggt 2832
Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala Gly
930 935 940
gac gac cag gat aac gaa ctg tgg ggt cat gac ggc aat gat acc att 2880
Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp Thr Ile
945 950 955 960
cgc ggt cgt ggc ggc gac gat att ctg cgt ggc ggt ctg ggc ctg gat 2928
Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp
965 970 975
acc ctg tat ggt gaa gat ggt aac gat att ttc ctg caa gac gat gaa 2976
Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu
980 985 990
acg gta tct gat gac atc gac ggt ggt gca ggc ctg gac acc gta gat 3024
Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp
995 1000 1005
tac agc gct atg atc cat ccg ggt cgt atc gta gct ccg cac gag 3069
Tyr Ser Ala Met Ile His Pro Gly Arg Ile Val Ala Pro His Glu
1010 1015 1020
tac ggc ttc ggt atc gag gcg gac ctg tct cgt gaa tgg gtt cgt 3114
Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg
1025 1030 1035
aaa gcg tcc gcg ctg ggt gtg gac tac tac gat aac gtt cgt aac 3159
Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn
1040 1045 1050
gtg gaa aac gtg atc ggt acc tcc atg aaa gac gtg ctg att ggc 3204
Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly
1055 1060 1065
gac gca cag gcc aac act ctg atg ggc cag ggc ggt gat gac acg 3249
Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr
1070 1075 1080
gtt cgc ggc ggc gac ggt gat gac ctg ctg ttc ggt ggt gac ggc 3294
Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly
1085 1090 1095
aac gac atg ctg tac ggc gac gcg ggc aac gac acc ctg tac ggc 3339
Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly
1100 1105 1110
ggt ctg ggt gac gac act ctg gaa ggt ggt gca ggt aac gac tgg 3384
Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp
1115 1120 1125
ttc ggc caa acc cag gca cgc gaa cac gac gtg ctg cgt ggt ggc 3429
Phe Gly Gln Thr Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly
1130 1135 1140
gac ggc gta gac acc gtg gat tac tcc caa act ggc gct cac gcg 3474
Asp Gly Val Asp Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala
1145 1150 1155
ggt atc gcg gcc ggt cgt atc ggt ctg ggc att ctg gcc gat ctg 3519
Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu
1160 1165 1170
ggt gcc ggc cgt gtc gac aaa ctg ggt gag gct ggc tct agc gcc 3564
Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala
1175 1180 1185
tat gat act gtt tcc ggc atc gaa aac gtg gta ggc act gaa ctg 3609
Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu
1190 1195 1200
gca gat cgt atc acg ggt gac gcg caa gcg aac gtt ctg cgt ggt 3654
Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly
1205 1210 1215
gct ggc ggt gca gac gtg ctg gcg ggt ggt gaa ggc gac gac gta 3699
Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val
1220 1225 1230
ctg ctg ggc ggt gac ggt gac gat cag ctg agc ggt gat gcg ggt 3744
Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly
1235 1240 1245
cgt gac cgt ctg tac ggt gaa gca ggt gac gat tgg ttc ttc cag 3789
Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln
1250 1255 1260
gac gct gct aac gct ggc aac ctg ctg gac ggc ggc gat ggc cgt 3834
Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg
1265 1270 1275
gac act gtt gac ttc agc ggt ccg ggt cgc ggt ctg gac gca ggc 3879
Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly
1280 1285 1290
gcg aaa ggc gtt ttc ctg agc ctg ggt aag ggt ttc gca tct ctg 3924
Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu
1295 1300 1305
atg gac gaa cca gaa acc agc aat gtc ctg cgt aac atc gaa aac 3969
Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn
1310 1315 1320
gct gtc ggt tcc gca cgc gat gat gtt ctg att ggc gat gct ggt 4014
Ala Val Gly Ser Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly
1325 1330 1335
gcc aat gtt ctg aac ggt ctg gcg ggt aat gat gta ctg tct ggt 4059
Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly
1340 1345 1350
ggc gct ggt gat gat gtc ctg ctg ggt gat gag ggc agc gat ctg 4104
Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu
1355 1360 1365
ctg tcc ggc gat gcc ggc aac gac gat ctg ttc ggt ggc caa ggt 4149
Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly
1370 1375 1380
gat gat act tac ctg ttc ggc gtt ggc tat ggt cat gac acc atc 4194
Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile
1385 1390 1395
tat gag tct ggt ggc ggc cac gat acg att cgt att aat gca ggt 4239
Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly
1400 1405 1410
gct gac caa ctg tgg ttt gca cgt cag ggt aac gat ctg gaa att 4284
Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile
1415 1420 1425
cgc atc ctg ggt act gat gac gct ctg acc gta cac gac tgg tac 4329
Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr
1430 1435 1440
cgc gat gcg gat cac cgc gta gaa atc atc cat gcg gct aac caa 4374
Arg Asp Ala Asp His Arg Val Glu Ile Ile His Ala Ala Asn Gln
1445 1450 1455
gct gta gac cag gct ggt att gaa aaa ctg gta gaa gcg atg gca 4419
Ala Val Asp Gln Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala
1460 1465 1470
cag tat ccg gac cca ggt gcg gct gct gca gca cct cca gcg gct 4464
Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala
1475 1480 1485
cgt gtg ccg gat acc ctg atg cag agc ctg gcc gtc aat tgg cgt 4509
Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1490 1495 1500
taa 4512
<210> 12
<211> 1503
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Gly Leu Arg Arg Pro Ser Leu Gly
180 185 190
Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly
195 200 205
Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu
210 215 220
Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg
225 230 235 240
Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly
245 250 255
Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu
260 265 270
Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr
275 280 285
Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu
290 295 300
Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg
305 310 315 320
Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met
325 330 335
Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu
340 345 350
Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile
355 360 365
Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala
370 375 380
Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala
385 390 395 400
Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser
405 410 415
Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln
420 425 430
Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp
435 440 445
Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala
450 455 460
Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser
465 470 475 480
Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr
485 490 495
Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln
500 505 510
Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu
515 520 525
Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His
530 535 540
Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu
545 550 555 560
Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu
565 570 575
Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp
580 585 590
Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu
595 600 605
Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile
610 615 620
Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr
625 630 635 640
Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly
645 650 655
Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg
660 665 670
Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys
675 680 685
Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile
690 695 700
Lys Leu Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn
705 710 715 720
Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser
725 730 735
Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly
740 745 750
Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg
755 760 765
Glu Gly Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn
770 775 780
Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu
785 790 795 800
Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn
805 810 815
Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
820 825 830
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly
835 840 845
Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe
850 855 860
Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
865 870 875 880
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu
885 890 895
Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr
900 905 910
Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
915 920 925
Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala Gly
930 935 940
Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp Thr Ile
945 950 955 960
Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp
965 970 975
Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu
980 985 990
Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp
995 1000 1005
Tyr Ser Ala Met Ile His Pro Gly Arg Ile Val Ala Pro His Glu
1010 1015 1020
Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg
1025 1030 1035
Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn
1040 1045 1050
Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly
1055 1060 1065
Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr
1070 1075 1080
Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly
1085 1090 1095
Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly
1100 1105 1110
Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp
1115 1120 1125
Phe Gly Gln Thr Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly
1130 1135 1140
Asp Gly Val Asp Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala
1145 1150 1155
Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu
1160 1165 1170
Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala
1175 1180 1185
Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu
1190 1195 1200
Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly
1205 1210 1215
Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val
1220 1225 1230
Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly
1235 1240 1245
Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln
1250 1255 1260
Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg
1265 1270 1275
Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly
1280 1285 1290
Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu
1295 1300 1305
Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn
1310 1315 1320
Ala Val Gly Ser Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly
1325 1330 1335
Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly
1340 1345 1350
Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu
1355 1360 1365
Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly
1370 1375 1380
Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile
1385 1390 1395
Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly
1400 1405 1410
Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile
1415 1420 1425
Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr
1430 1435 1440
Arg Asp Ala Asp His Arg Val Glu Ile Ile His Ala Ala Asn Gln
1445 1450 1455
Ala Val Asp Gln Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala
1460 1465 1470
Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala
1475 1480 1485
Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1490 1495 1500
<210> 13
<211> 1613
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-227 + 321-1706 of SEQ ID NO: 4
<400> 13
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr
225 230 235 240
Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala
245 250 255
Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala
260 265 270
Pro Gly Val Pro Ser Gly Arg Ser Lys Phe Ser Pro Asp Val Leu Glu
275 280 285
Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val
290 295 300
Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg
305 310 315 320
Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala
325 330 335
Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp
340 345 350
Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg
355 360 365
Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His
370 375 380
Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr
385 390 395 400
Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu
405 410 415
Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser
420 425 430
Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu
435 440 445
Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp
450 455 460
Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu
465 470 475 480
Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala
485 490 495
Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala
500 505 510
Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met
515 520 525
Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp
530 535 540
Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu
545 550 555 560
Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala
565 570 575
Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala
580 585 590
Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu
595 600 605
Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile
610 615 620
Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly
625 630 635 640
Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln
645 650 655
Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala
660 665 670
Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser
675 680 685
Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu
690 695 700
Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val
705 710 715 720
Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile
725 730 735
Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu
740 745 750
Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser
755 760 765
Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg
770 775 780
Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val
785 790 795 800
Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu
805 810 815
Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser
820 825 830
Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala
835 840 845
Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg
850 855 860
Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly
865 870 875 880
Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln
885 890 895
Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
900 905 910
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser
915 920 925
Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp
930 935 940
Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
945 950 955 960
Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu Gln
965 970 975
Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp
980 985 990
Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg
995 1000 1005
Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val
1010 1015 1020
Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
1025 1030 1035
Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala
1040 1045 1050
Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp
1055 1060 1065
Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu
1070 1075 1080
Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu
1085 1090 1095
Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly
1100 1105 1110
Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro Gly Arg Ile
1115 1120 1125
Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser
1130 1135 1140
Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr
1145 1150 1155
Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr Ser Met Lys
1160 1165 1170
Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln
1175 1180 1185
Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu
1190 1195 1200
Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn
1205 1210 1215
Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly
1220 1225 1230
Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg Glu His Asp
1235 1240 1245
Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp Tyr Ser Gln
1250 1255 1260
Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly
1265 1270 1275
Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu
1280 1285 1290
Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val
1295 1300 1305
Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala
1310 1315 1320
Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly
1325 1330 1335
Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu
1340 1345 1350
Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp
1355 1360 1365
Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp
1370 1375 1380
Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly Pro Gly Arg
1385 1390 1395
Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys
1400 1405 1410
Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu
1415 1420 1425
Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp Asp Val Leu
1430 1435 1440
Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn
1445 1450 1455
Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp
1460 1465 1470
Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu
1475 1480 1485
Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr
1490 1495 1500
Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile
1505 1510 1515
Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly
1520 1525 1530
Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr
1535 1540 1545
Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ile Ile
1550 1555 1560
His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile Glu Lys Leu
1565 1570 1575
Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala
1580 1585 1590
Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu
1595 1600 1605
Ala Val Asn Trp Arg
1610
<210> 14
<211> 1503
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-183 + 387-1706 of SEQ ID NO:4
<400> 14
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Gly Leu Arg Arg Pro Ser Leu Gly
180 185 190
Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly
195 200 205
Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu
210 215 220
Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg
225 230 235 240
Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly
245 250 255
Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu
260 265 270
Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr
275 280 285
Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu
290 295 300
Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg
305 310 315 320
Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met
325 330 335
Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu
340 345 350
Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile
355 360 365
Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala
370 375 380
Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala
385 390 395 400
Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser
405 410 415
Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln
420 425 430
Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp
435 440 445
Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala
450 455 460
Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser
465 470 475 480
Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr
485 490 495
Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln
500 505 510
Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu
515 520 525
Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His
530 535 540
Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu
545 550 555 560
Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu
565 570 575
Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp
580 585 590
Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu
595 600 605
Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile
610 615 620
Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr
625 630 635 640
Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly
645 650 655
Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg
660 665 670
Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys
675 680 685
Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile
690 695 700
Lys Leu Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn
705 710 715 720
Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser
725 730 735
Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly
740 745 750
Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg
755 760 765
Glu Gly Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn
770 775 780
Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu
785 790 795 800
Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn
805 810 815
Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
820 825 830
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly
835 840 845
Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe
850 855 860
Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
865 870 875 880
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu
885 890 895
Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr
900 905 910
Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
915 920 925
Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala Gly
930 935 940
Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp Thr Ile
945 950 955 960
Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp
965 970 975
Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu
980 985 990
Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp
995 1000 1005
Tyr Ser Ala Met Ile His Pro Gly Arg Ile Val Ala Pro His Glu
1010 1015 1020
Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg
1025 1030 1035
Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn
1040 1045 1050
Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly
1055 1060 1065
Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr
1070 1075 1080
Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly
1085 1090 1095
Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly
1100 1105 1110
Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp
1115 1120 1125
Phe Gly Gln Thr Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly
1130 1135 1140
Asp Gly Val Asp Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala
1145 1150 1155
Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu
1160 1165 1170
Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala
1175 1180 1185
Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu
1190 1195 1200
Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly
1205 1210 1215
Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val
1220 1225 1230
Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly
1235 1240 1245
Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln
1250 1255 1260
Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg
1265 1270 1275
Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly
1280 1285 1290
Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu
1295 1300 1305
Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn
1310 1315 1320
Ala Val Gly Ser Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly
1325 1330 1335
Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly
1340 1345 1350
Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu
1355 1360 1365
Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly
1370 1375 1380
Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile
1385 1390 1395
Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly
1400 1405 1410
Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile
1415 1420 1425
Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr
1430 1435 1440
Arg Asp Ala Asp His Arg Val Glu Ile Ile His Ala Ala Asn Gln
1445 1450 1455
Ala Val Asp Gln Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala
1460 1465 1470
Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala
1475 1480 1485
Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1490 1495 1500
<210> 15
<211> 1613
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-227 + 321-1706 of SEQ ID NO:6
<400> 15
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr
225 230 235 240
Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala
245 250 255
Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala
260 265 270
Pro Gly Val Pro Gly Gly Arg Ser Lys Ser Ser Pro Asp Val Leu Glu
275 280 285
Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val
290 295 300
Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg
305 310 315 320
Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala
325 330 335
Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp
340 345 350
Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg
355 360 365
Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His
370 375 380
Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr
385 390 395 400
Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu
405 410 415
Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser
420 425 430
Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu
435 440 445
Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp
450 455 460
Asp Ala Pro Ala Gly Gln Lys Ala Ala Val Gly Ala Glu Ile Ala Leu
465 470 475 480
Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala
485 490 495
Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala
500 505 510
Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met
515 520 525
Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp
530 535 540
Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu
545 550 555 560
Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala
565 570 575
Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala
580 585 590
Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu
595 600 605
Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile
610 615 620
Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly
625 630 635 640
Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln
645 650 655
Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala
660 665 670
Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser
675 680 685
Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu
690 695 700
Lys Ser Ala Asp Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg Val
705 710 715 720
Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile
725 730 735
Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu
740 745 750
Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser
755 760 765
Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg
770 775 780
Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val
785 790 795 800
Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu
805 810 815
Glu Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser
820 825 830
Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala
835 840 845
Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg
850 855 860
Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly
865 870 875 880
Val Ala Thr Gln Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln
885 890 895
Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
900 905 910
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser
915 920 925
Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly Asp
930 935 940
Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu
945 950 955 960
Gly His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu Gln
965 970 975
Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp
980 985 990
Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg
995 1000 1005
Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val
1010 1015 1020
Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
1025 1030 1035
Asn Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp Ser Ile Ala
1040 1045 1050
Gly Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp Gly Asn Asp
1055 1060 1065
Thr Ile His Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu
1070 1075 1080
Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu
1085 1090 1095
Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly
1100 1105 1110
Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Ala Gly Lys Ile
1115 1120 1125
Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser
1130 1135 1140
Glu Gly Trp Val Arg Lys Ala Ala Arg Arg Gly Met Gly Tyr Tyr
1145 1150 1155
Asp Ser Val Arg Ser Val Glu Asn Val Ile Gly Thr Ser Met Lys
1160 1165 1170
Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln
1175 1180 1185
Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu
1190 1195 1200
Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn
1205 1210 1215
Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly
1220 1225 1230
Ala Gly Asn Asp Trp Phe Gly Gln Thr Pro Ala Arg Glu His Asp
1235 1240 1245
Val Leu Arg Gly Gly Ala Gly Val Asp Thr Val Asp Tyr Ser Gln
1250 1255 1260
Ala Gly Ala His Ala Gly Val Ala Thr Gly Arg Ile Gly Leu Gly
1265 1270 1275
Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu
1280 1285 1290
Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val
1295 1300 1305
Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala
1310 1315 1320
Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly
1325 1330 1335
Glu Gly Asp Asp Val Leu Leu Gly Gly Glu Gly Asp Asp Gln Leu
1340 1345 1350
Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp
1355 1360 1365
Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp
1370 1375 1380
Gly Gly Asp Gly Asn Asp Thr Val Asp Phe Ser Gly Pro Gly Arg
1385 1390 1395
Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys
1400 1405 1410
Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu
1415 1420 1425
Arg His Ile Glu Asn Ala Val Gly Ser Val Arg Asp Asp Val Leu
1430 1435 1440
Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn
1445 1450 1455
Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp
1460 1465 1470
Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu
1475 1480 1485
Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Ala Gly Tyr
1490 1495 1500
Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile
1505 1510 1515
Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly
1520 1525 1530
Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr
1535 1540 1545
Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ala Ile
1550 1555 1560
His Ala Ala Asn Gln Ala Ile Asp Pro Ala Gly Ile Glu Lys Leu
1565 1570 1575
Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala
1580 1585 1590
Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu
1595 1600 1605
Ala Val Asn Trp Arg
1610
<210> 16
<211> 1503
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-183 + 387-1706 of SEQ ID NO:6
<400> 16
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Gly Leu Arg Arg Pro Ser Leu Gly
180 185 190
Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly
195 200 205
Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu
210 215 220
Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg
225 230 235 240
Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly
245 250 255
Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu
260 265 270
Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr
275 280 285
Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu
290 295 300
Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg
305 310 315 320
Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met
325 330 335
Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu
340 345 350
Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Val Gly Ala Glu Ile
355 360 365
Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala
370 375 380
Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala
385 390 395 400
Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser
405 410 415
Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln
420 425 430
Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp
435 440 445
Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala
450 455 460
Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser
465 470 475 480
Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr
485 490 495
Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln
500 505 510
Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu
515 520 525
Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His
530 535 540
Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu
545 550 555 560
Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu
565 570 575
Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp
580 585 590
Asn Leu Lys Ser Ala Asp Val Phe Val Asp Arg Phe Ile Gln Gly Glu
595 600 605
Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile
610 615 620
Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr
625 630 635 640
Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly
645 650 655
Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg
660 665 670
Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys
675 680 685
Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile
690 695 700
Lys Leu Glu Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn
705 710 715 720
Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser
725 730 735
Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly
740 745 750
Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg
755 760 765
Glu Gly Val Ala Thr Gln Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn
770 775 780
Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu
785 790 795 800
Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn
805 810 815
Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala
820 825 830
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly
835 840 845
Gly Glu Gly His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe
850 855 860
Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly
865 870 875 880
Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu
885 890 895
Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr
900 905 910
Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys
915 920 925
Asn Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp Ser Ile Ala Gly
930 935 940
Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp Gly Asn Asp Thr Ile
945 950 955 960
His Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp
965 970 975
Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu
980 985 990
Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp
995 1000 1005
Tyr Ser Ala Met Ile His Ala Gly Lys Ile Val Ala Pro His Glu
1010 1015 1020
Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Glu Gly Trp Val Arg
1025 1030 1035
Lys Ala Ala Arg Arg Gly Met Gly Tyr Tyr Asp Ser Val Arg Ser
1040 1045 1050
Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly
1055 1060 1065
Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr
1070 1075 1080
Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly
1085 1090 1095
Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly
1100 1105 1110
Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp
1115 1120 1125
Phe Gly Gln Thr Pro Ala Arg Glu His Asp Val Leu Arg Gly Gly
1130 1135 1140
Ala Gly Val Asp Thr Val Asp Tyr Ser Gln Ala Gly Ala His Ala
1145 1150 1155
Gly Val Ala Thr Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu
1160 1165 1170
Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala
1175 1180 1185
Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu
1190 1195 1200
Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly
1205 1210 1215
Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val
1220 1225 1230
Leu Leu Gly Gly Glu Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly
1235 1240 1245
Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln
1250 1255 1260
Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Asn
1265 1270 1275
Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly
1280 1285 1290
Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu
1295 1300 1305
Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg His Ile Glu Asn
1310 1315 1320
Ala Val Gly Ser Val Arg Asp Asp Val Leu Ile Gly Asp Ala Gly
1325 1330 1335
Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly
1340 1345 1350
Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu
1355 1360 1365
Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly
1370 1375 1380
Asp Asp Thr Tyr Leu Phe Gly Ala Gly Tyr Gly His Asp Thr Ile
1385 1390 1395
Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly
1400 1405 1410
Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile
1415 1420 1425
Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr
1430 1435 1440
Arg Asp Ala Asp His Arg Val Glu Ala Ile His Ala Ala Asn Gln
1445 1450 1455
Ala Ile Asp Pro Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala
1460 1465 1470
Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala
1475 1480 1485
Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1490 1495 1500
<210> 17
<211> 1612
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-227 + 321-1705 of SEQ ID NO:8
<400> 17
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Ser Gln Met Leu Thr Arg Gly Gln Leu Lys Glu Tyr
225 230 235 240
Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr Glu Asn Arg Ala
245 250 255
Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly Leu Gly Ala Ala
260 265 270
Pro Gly Val Pro Gly Arg Arg Ser Lys Ser Ser Pro Asp Val Leu Glu
275 280 285
Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val
290 295 300
Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg
305 310 315 320
Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala
325 330 335
Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp
340 345 350
Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg
355 360 365
Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His
370 375 380
Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr
385 390 395 400
Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu
405 410 415
Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser
420 425 430
Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu
435 440 445
Gly Gly Gly Ile Gly Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp
450 455 460
Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln
465 470 475 480
Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu
485 490 495
Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser
500 505 510
Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu
515 520 525
Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys
530 535 540
Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu
545 550 555 560
Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly
565 570 575
Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala
580 585 590
Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu
595 600 605
Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile
610 615 620
Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly
625 630 635 640
Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu
645 650 655
Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly
660 665 670
Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys
675 680 685
Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys
690 695 700
Ser Ala Asp Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg Val Ala
705 710 715 720
Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala
725 730 735
Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala
740 745 750
Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu
755 760 765
Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile
770 775 780
Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser
785 790 795 800
Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Glu
805 810 815
Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg
820 825 830
Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala
835 840 845
Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe
850 855 860
Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val
865 870 875 880
Ala Thr Gln Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr
885 890 895
Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr
900 905 910
Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile
915 920 925
Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly Asp Asp
930 935 940
Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu Gly
945 950 955 960
His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu Gln Asp
965 970 975
Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp Thr
980 985 990
Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg Met
995 1000 1005
Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val Glu
1010 1015 1020
Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys Asn
1025 1030 1035
Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp Ser Ile Ala Gly
1040 1045 1050
Asp Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp Gly Asn Asp Thr
1055 1060 1065
Ile His Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly
1070 1075 1080
Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln
1085 1090 1095
Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu
1100 1105 1110
Asp Thr Val Asp Tyr Ser Ala Met Ile His Ala Gly Lys Ile Val
1115 1120 1125
Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Glu
1130 1135 1140
Gly Trp Val Arg Lys Ala Ala Arg Arg Gly Met Asp Tyr Tyr Asp
1145 1150 1155
Ser Val Arg Ser Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp
1160 1165 1170
Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly
1175 1180 1185
Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe
1190 1195 1200
Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp
1205 1210 1215
Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala
1220 1225 1230
Gly Asn Asp Trp Phe Gly Gln Thr Pro Ala Arg Glu His Asp Val
1235 1240 1245
Leu Arg Gly Gly Ala Gly Val Asp Thr Val Asp Tyr Ser Gln Ala
1250 1255 1260
Gly Ala His Ala Gly Val Ala Thr Gly Arg Ile Gly Leu Gly Ile
1265 1270 1275
Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala
1280 1285 1290
Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val
1295 1300 1305
Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn
1310 1315 1320
Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu
1325 1330 1335
Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser
1340 1345 1350
Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp
1355 1360 1365
Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly
1370 1375 1380
Gly Asp Gly Asn Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly
1385 1390 1395
Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly
1400 1405 1410
Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg
1415 1420 1425
His Ile Glu Asn Ala Val Gly Ser Val Arg Asp Asp Val Leu Ile
1430 1435 1440
Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp
1445 1450 1455
Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu
1460 1465 1470
Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe
1475 1480 1485
Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Ala Gly Tyr Gly
1490 1495 1500
His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg
1505 1510 1515
Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn
1520 1525 1530
Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val
1535 1540 1545
His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ala Ile His
1550 1555 1560
Ala Ala Asn Gln Ala Ile Asp Pro Ala Gly Ile Glu Lys Leu Val
1565 1570 1575
Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala
1580 1585 1590
Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala
1595 1600 1605
Val Asn Trp Arg
1610
<210> 18
<211> 1502
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-183 + 387-1705 of SEQ ID NO:8
<400> 18
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Gly Leu Arg Arg Pro Ser Leu Gly
180 185 190
Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly
195 200 205
Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu
210 215 220
Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg
225 230 235 240
Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly
245 250 255
Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu
260 265 270
Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr
275 280 285
Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu
290 295 300
Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg
305 310 315 320
Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met
325 330 335
Ala Leu Gly Gly Gly Ile Gly Ala Val Gly Ala Gly Met Ser Leu Thr
340 345 350
Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala
355 360 365
Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu
370 375 380
Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly
385 390 395 400
Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro
405 410 415
Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu
420 425 430
Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala
435 440 445
Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val
450 455 460
Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile
465 470 475 480
Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser
485 490 495
Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro
500 505 510
Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu
515 520 525
Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu
530 535 540
Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln
545 550 555 560
Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile
565 570 575
Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn
580 585 590
Leu Lys Ser Ala Asp Val Phe Val Asp Arg Phe Ile Gln Gly Glu Arg
595 600 605
Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp
610 615 620
Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro
625 630 635 640
Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys
645 650 655
Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp
660 665 670
Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val
675 680 685
Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys
690 695 700
Leu Glu Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala
705 710 715 720
Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr
725 730 735
Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu
740 745 750
Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu
755 760 765
Gly Val Ala Thr Gln Lys Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val
770 775 780
Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val
785 790 795 800
Asp Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp
805 810 815
Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ala Gly
820 825 830
Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly
835 840 845
Glu Gly His Asn Thr Val Val Gly Gly Ala Gly Asp Asp Val Phe Leu
850 855 860
Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val
865 870 875 880
Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu
885 890 895
Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val
900 905 910
Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys Asn
915 920 925
Ile Glu Asn Leu His Gly Ser Ser Leu Asn Asp Ser Ile Ala Gly Asp
930 935 940
Asp Arg Asp Asn Glu Leu Trp Gly Asp Asp Gly Asn Asp Thr Ile His
945 950 955 960
Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr
965 970 975
Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu Thr
980 985 990
Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp Tyr
995 1000 1005
Ser Ala Met Ile His Ala Gly Lys Ile Val Ala Pro His Glu Tyr
1010 1015 1020
Gly Phe Gly Ile Glu Ala Asp Leu Ser Glu Gly Trp Val Arg Lys
1025 1030 1035
Ala Ala Arg Arg Gly Met Asp Tyr Tyr Asp Ser Val Arg Ser Val
1040 1045 1050
Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly Asp
1055 1060 1065
Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr Val
1070 1075 1080
Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly Asn
1085 1090 1095
Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly Gly
1100 1105 1110
Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp Phe
1115 1120 1125
Gly Gln Thr Pro Ala Arg Glu His Asp Val Leu Arg Gly Gly Ala
1130 1135 1140
Gly Val Asp Thr Val Asp Tyr Ser Gln Ala Gly Ala His Ala Gly
1145 1150 1155
Val Ala Thr Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu Gly
1160 1165 1170
Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala Tyr
1175 1180 1185
Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu Ala
1190 1195 1200
Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly Ala
1205 1210 1215
Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val Leu
1220 1225 1230
Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly Arg
1235 1240 1245
Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln Asp
1250 1255 1260
Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Asn Asp
1265 1270 1275
Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly Ala
1280 1285 1290
Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu Met
1295 1300 1305
Asp Glu Pro Glu Thr Ser Asn Val Leu Arg His Ile Glu Asn Ala
1310 1315 1320
Val Gly Ser Val Arg Asp Asp Val Leu Ile Gly Asp Ala Gly Ala
1325 1330 1335
Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly Gly
1340 1345 1350
Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu Leu
1355 1360 1365
Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly Asp
1370 1375 1380
Asp Thr Tyr Leu Phe Gly Ala Gly Tyr Gly His Asp Thr Ile Tyr
1385 1390 1395
Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly Ala
1400 1405 1410
Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile Arg
1415 1420 1425
Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr Arg
1430 1435 1440
Asp Ala Asp His Arg Val Glu Ala Ile His Ala Ala Asn Gln Ala
1445 1450 1455
Ile Asp Pro Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala Gln
1460 1465 1470
Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala Arg
1475 1480 1485
Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1490 1495 1500
<210> 19
<211> 1547
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide 1-227 + 387-1706 of SEQ ID NO:2
<400> 19
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Pro Gly Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg
225 230 235 240
Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe
245 250 255
Ser Leu Gly Glu Val Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu
260 265 270
Glu Met Thr Arg Gln Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala
275 280 285
Glu Pro Gly Val Ser Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu
290 295 300
Gln Gly Ala Gln Ala Val Ala Ala Ala Gln Arg Leu Val His Ala Ile
305 310 315 320
Ala Leu Met Thr Gln Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln
325 330 335
Glu Ala Ala Ser Leu Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser
340 345 350
Ser Ala Val Ala Glu Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg
355 360 365
Trp Ala Gly Gly Phe Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly
370 375 380
Gly Ile Ala Ala Ala Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala
385 390 395 400
Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu
405 410 415
Thr Gly Gly Thr Val Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala
420 425 430
Ala Ala Arg Gly Val Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala
435 440 445
Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile
450 455 460
Tyr Gly Leu Val Gln Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu
465 470 475 480
Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala
485 490 495
Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val
500 505 510
Ser Ala Val Leu Ser Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala
515 520 525
Ala Ser Val Val Gly Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr
530 535 540
Gly Ala Leu Asn Gly Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu
545 550 555 560
Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro
565 570 575
Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala
580 585 590
Asn Ser Asp Gly Leu Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp
595 600 605
Asn Ala Ser Ser Val Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser
610 615 620
Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser
625 630 635 640
Val Asp Val Phe Val Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly
645 650 655
Gln Pro Val Val Leu Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser
660 665 670
Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala
675 680 685
Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe
690 695 700
Thr Thr Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg
705 710 715 720
Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln
725 730 735
Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp Val
740 745 750
Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile
755 760 765
His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu
770 775 780
Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn
785 790 795 800
Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala
805 810 815
Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg
820 825 830
His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu
835 840 845
Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr
850 855 860
Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp Arg
865 870 875 880
Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu Gly Gln
885 890 895
Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu Gln Asp Leu
900 905 910
Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp Thr Val
915 920 925
Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg Met Gly
930 935 940
Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val Glu Lys Trp
945 950 955 960
Pro Ala Leu Asn Leu Phe Ser Val Asp His Val Lys Asn Ile Glu Asn
965 970 975
Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln Asp
980 985 990
Asn Glu Leu Trp Gly His Asp Gly Asn Asp Thr Ile Arg Gly Arg Gly
995 1000 1005
Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr Leu Tyr
1010 1015 1020
Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu Thr Val
1025 1030 1035
Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp Tyr
1040 1045 1050
Ser Ala Met Ile His Pro Gly Arg Ile Val Ala Pro His Glu Tyr
1055 1060 1065
Gly Phe Gly Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg Lys
1070 1075 1080
Ala Ser Ala Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn Val
1085 1090 1095
Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly Asp
1100 1105 1110
Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr Val
1115 1120 1125
Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly Asn
1130 1135 1140
Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly Gly
1145 1150 1155
Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp Phe
1160 1165 1170
Gly Gln Thr Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly Asp
1175 1180 1185
Gly Val Asp Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala Gly
1190 1195 1200
Ile Ala Ala Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu Gly
1205 1210 1215
Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala Tyr
1220 1225 1230
Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu Ala
1235 1240 1245
Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly Ala
1250 1255 1260
Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val Leu
1265 1270 1275
Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly Arg
1280 1285 1290
Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln Asp
1295 1300 1305
Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg Asp
1310 1315 1320
Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly Ala
1325 1330 1335
Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu Met
1340 1345 1350
Asp Glu Pro Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn Ala
1355 1360 1365
Val Gly Ser Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly Ala
1370 1375 1380
Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly Gly
1385 1390 1395
Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu Leu
1400 1405 1410
Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly Asp
1415 1420 1425
Asp Thr Tyr Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile Tyr
1430 1435 1440
Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly Ala
1445 1450 1455
Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile Arg
1460 1465 1470
Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr Arg
1475 1480 1485
Asp Ala Asp His Arg Val Glu Ile Ile His Ala Ala Asn Gln Ala
1490 1495 1500
Val Asp Gln Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala Gln
1505 1510 1515
Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala Arg
1520 1525 1530
Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1535 1540 1545
<210> 20
<211> 1569
<212> PRT
<213> Artificial Sequence
<220>
<223> polypeptide 1-183 + 321-1706 of SEQ ID NO:2
<400> 20
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Glu Ser Gln Met Leu Thr Arg Gly Gln
180 185 190
Leu Lys Glu Tyr Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr
195 200 205
Glu Asn Arg Ala Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly
210 215 220
Leu Gly Ala Ala Pro Gly Val Pro Ser Gly Arg Ser Lys Phe Ser Pro
225 230 235 240
Asp Val Leu Glu Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser
245 250 255
Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly
260 265 270
Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala
275 280 285
Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly
290 295 300
Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His
305 310 315 320
Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln
325 330 335
Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly
340 345 350
Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe
355 360 365
Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe
370 375 380
Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly
385 390 395 400
Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met
405 410 415
Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala
420 425 430
Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser
435 440 445
Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln
450 455 460
Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala
465 470 475 480
Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala
485 490 495
Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu
500 505 510
Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu
515 520 525
Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala
530 535 540
Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val
545 550 555 560
Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val
565 570 575
Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile
580 585 590
Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala
595 600 605
Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala
610 615 620
Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr
625 630 635 640
Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn
645 650 655
Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln
660 665 670
Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly
675 680 685
Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr Phe
690 695 700
Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg Thr Lys
705 710 715 720
Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly Lys Gln
725 730 735
Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile Asp Leu
740 745 750
Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu Lys His
755 760 765
Ser Ile Lys Leu Asp Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu
770 775 780
Ala Asn Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr
785 790 795 800
Val Ser Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala
805 810 815
Asp Gly Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val
820 825 830
Tyr Arg Glu Gly Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr
835 840 845
Glu Asn Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln Leu
850 855 860
Val Glu Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala
865 870 875 880
Gly Asn Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly
885 890 895
Gly Ser Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu
900 905 910
Val Gly Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp
915 920 925
Val Phe Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly
930 935 940
Ala Gly Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu
945 950 955 960
Arg Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys
965 970 975
Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His
980 985 990
Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile
995 1000 1005
Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn
1010 1015 1020
Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly
1025 1030 1035
Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe
1040 1045 1050
Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala
1055 1060 1065
Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro Gly Arg
1070 1075 1080
Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu
1085 1090 1095
Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr
1100 1105 1110
Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr Ser Met
1115 1120 1125
Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly
1130 1135 1140
Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu
1145 1150 1155
Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly
1160 1165 1170
Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly
1175 1180 1185
Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg Glu His
1190 1195 1200
Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp Tyr Ser
1205 1210 1215
Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu
1220 1225 1230
Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly
1235 1240 1245
Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn
1250 1255 1260
Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln
1265 1270 1275
Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly
1280 1285 1290
Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln
1295 1300 1305
Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly
1310 1315 1320
Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu
1325 1330 1335
Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly Pro Gly
1340 1345 1350
Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly
1355 1360 1365
Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val
1370 1375 1380
Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp Asp Val
1385 1390 1395
Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly
1400 1405 1410
Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly
1415 1420 1425
Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp
1430 1435 1440
Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly
1445 1450 1455
Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr
1460 1465 1470
Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln
1475 1480 1485
Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu
1490 1495 1500
Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ile
1505 1510 1515
Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile Glu Lys
1520 1525 1530
Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala
1535 1540 1545
Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser
1550 1555 1560
Leu Ala Val Asn Trp Arg
1565
<210> 21
<211> 558
<212> DNA
<213> Bordetella pertussis
<400> 21
atgcttccgt ccgcccaagc gccctccctc ctcaatccca ccgacgactt cgcggcactg 60
ggcaatattg cctggctgtg gatgaactct cccatgcacc gcgactggcc ggtgcatctg 120
ctcgcacgca acacgctcgc gccgattcaa ctgggccaat acattctgct gcgatgcaat 180
gacgtgccgg ttgcatactg cagctgggcc ctaatggacg ccgacaccga actctcctat 240
gtcatggcgc cctcgtcgct gggcgggaat gcctggaact gcggcgaccg actgtggatc 300
atcgactgga tcgcgccatt ctcgcgcgac gacaatcgtg cgctgcgccg cgcgctggcc 360
gaacggcacc ccgacagcgt gggccgttcg ctgcgcgttc ggcgcggcgg cgacaccgcg 420
cgcgtcaagg agtaccgagg ccgcgcgctg gacgcggccg ccgctcgcgc gcagctggac 480
cgctaccatg ccgaactgat cgcaggactg cgcgcgagca acggcggata cgcgccgcga 540
ggccggggca ccgcctga 558
<210> 22
<211> 558
<212> DNA
<213> Artificial Sequence
<220>
<223> Optimized version of CyaC nucleotide coding sequence
<220>
<221> CDS
<222> (1)..(558)
<400> 22
atg ctg ccg tct gca cag gcg ccg tct ctg ctg aat cca act gat gac 48
Met Leu Pro Ser Ala Gln Ala Pro Ser Leu Leu Asn Pro Thr Asp Asp
1 5 10 15
ttc gct gcg ctg ggt aac atc gcg tgg ctg tgg atg aac agc ccg atg 96
Phe Ala Ala Leu Gly Asn Ile Ala Trp Leu Trp Met Asn Ser Pro Met
20 25 30
cac cgt gac tgg ccg gtt cac ctg ctg gca cgt aac acg ctg gcg ccg 144
His Arg Asp Trp Pro Val His Leu Leu Ala Arg Asn Thr Leu Ala Pro
35 40 45
atc cag ctg ggt caa tac atc ctg ctg cgt tgt aac gac gtg cct gtg 192
Ile Gln Leu Gly Gln Tyr Ile Leu Leu Arg Cys Asn Asp Val Pro Val
50 55 60
gcg tat tgc tcc tgg gca ctg atg gat gcg gat acc gag ctg tcc tac 240
Ala Tyr Cys Ser Trp Ala Leu Met Asp Ala Asp Thr Glu Leu Ser Tyr
65 70 75 80
gtt atg gcc cca tct agc ctg ggc ggt aac gct tgg aac tgc ggc gat 288
Val Met Ala Pro Ser Ser Leu Gly Gly Asn Ala Trp Asn Cys Gly Asp
85 90 95
cgt ctg tgg atc att gat tgg att gct ccg ttt agc cgt gac gac aac 336
Arg Leu Trp Ile Ile Asp Trp Ile Ala Pro Phe Ser Arg Asp Asp Asn
100 105 110
cgt gct ctg cgt cgc gcg ctg gcc gaa cgt cat ccg gat tct gtt ggc 384
Arg Ala Leu Arg Arg Ala Leu Ala Glu Arg His Pro Asp Ser Val Gly
115 120 125
cgt tcc ctg cgc gta cgt cgc ggt ggc gac acc gct cgc gtc aaa gaa 432
Arg Ser Leu Arg Val Arg Arg Gly Gly Asp Thr Ala Arg Val Lys Glu
130 135 140
tac cgt ggt cgt gct ctg gac gca gcg gcg gcc cgc gct cag ctg gac 480
Tyr Arg Gly Arg Ala Leu Asp Ala Ala Ala Ala Arg Ala Gln Leu Asp
145 150 155 160
cgc tac cac gca gaa ctg att gcc ggt ctg cgt gca tcc aat ggc ggt 528
Arg Tyr His Ala Glu Leu Ile Ala Gly Leu Arg Ala Ser Asn Gly Gly
165 170 175
tat gct ccg cgt ggc cgt ggc acc gca taa 558
Tyr Ala Pro Arg Gly Arg Gly Thr Ala
180 185
<210> 23
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 23
Met Leu Pro Ser Ala Gln Ala Pro Ser Leu Leu Asn Pro Thr Asp Asp
1 5 10 15
Phe Ala Ala Leu Gly Asn Ile Ala Trp Leu Trp Met Asn Ser Pro Met
20 25 30
His Arg Asp Trp Pro Val His Leu Leu Ala Arg Asn Thr Leu Ala Pro
35 40 45
Ile Gln Leu Gly Gln Tyr Ile Leu Leu Arg Cys Asn Asp Val Pro Val
50 55 60
Ala Tyr Cys Ser Trp Ala Leu Met Asp Ala Asp Thr Glu Leu Ser Tyr
65 70 75 80
Val Met Ala Pro Ser Ser Leu Gly Gly Asn Ala Trp Asn Cys Gly Asp
85 90 95
Arg Leu Trp Ile Ile Asp Trp Ile Ala Pro Phe Ser Arg Asp Asp Asn
100 105 110
Arg Ala Leu Arg Arg Ala Leu Ala Glu Arg His Pro Asp Ser Val Gly
115 120 125
Arg Ser Leu Arg Val Arg Arg Gly Gly Asp Thr Ala Arg Val Lys Glu
130 135 140
Tyr Arg Gly Arg Ala Leu Asp Ala Ala Ala Ala Arg Ala Gln Leu Asp
145 150 155 160
Arg Tyr His Ala Glu Leu Ile Ala Gly Leu Arg Ala Ser Asn Gly Gly
165 170 175
Tyr Ala Pro Arg Gly Arg Gly Thr Ala
180 185
<210> 24
<211> 441
<212> PRT
<213> Artificial Sequence
<220>
<223> Model antigen (peptide 105)
<400> 24
Met Gly Ile Arg Ser Arg Asp His Met Val Leu His Glu Tyr Val Asn
1 5 10 15
Ala Ala Gly Ile Thr Gly Ser Asp Arg Met Glu Val Gly Trp Tyr Arg
20 25 30
Ser Pro Phe Ser Arg Val Val His Leu Tyr Arg Asn Gly Lys Ser Ile
35 40 45
Ile Asn Phe Glu Lys Leu Val Arg Val Asp Met Val Arg His Arg Ile
50 55 60
Lys Glu His Met Leu Lys Lys Tyr Thr Gln Ile Tyr Ser Thr Val Ala
65 70 75 80
Ser Ser Leu Ser Gly Glu Lys Ile Ser Gln Ala Val His Ala Ala His
85 90 95
Ala Glu Ile Asn Glu Ala Gly Arg Glu Leu Ala Gly Ile Gly Ile Leu
100 105 110
Thr Val Pro Lys Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Lys
115 120 125
Ala Val Tyr Asn Phe Ala Thr Cys Ser Gly Arg Lys Val Ala Glu Leu
130 135 140
Val His Phe Leu Leu Leu Lys Tyr Arg Ala Arg Glu Pro Val Thr Lys
145 150 155 160
Ala Glu Met Leu Gly Ser Val Val Gly Asn Trp Gln Tyr Phe Phe Pro
165 170 175
Val Ile Phe Ser Lys Ala Ser Ser Ser Leu Gln Leu Val Phe Gly Ile
180 185 190
Glu Leu Met Glu Val Asp Pro Ile Gly His Leu Tyr Ile Phe Ala Thr
195 200 205
Lys Leu Leu Thr Gln His Phe Val Gln Glu Asn Tyr Leu Glu Tyr Arg
210 215 220
Gln Val Pro Gly Ser Asp Pro Ala Cys Tyr Glu Phe Leu Trp Gly Pro
225 230 235 240
Arg Ala Leu Val Glu Thr Ser Tyr Val Lys Thr Gly Met His Gly Asp
245 250 255
Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr
260 265 270
Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Gly Pro Ala Gly Gln Ala Glu
275 280 285
Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp
290 295 300
Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr
305 310 315 320
Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys
325 330 335
Ser Gln Lys Pro Met His Gly Pro Lys Ala Thr Leu Gln Asp Ile Val
340 345 350
Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp Leu Leu Cys His
355 360 365
Glu Gln Leu Ser Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg
370 375 380
Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys
385 390 395 400
Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg
405 410 415
Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp
420 425 430
Cys Ala Ser Gln Gln Leu Lys Gly Pro
435 440
<210> 25
<211> 98
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV16
<400> 25
Met His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln
1 5 10 15
Pro Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Asp Ser Ser
20 25 30
Glu Glu Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp
35 40 45
Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr
50 55 60
Leu Arg Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu
65 70 75 80
Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln
85 90 95
Lys Pro
<210> 26
<211> 105
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV18
<400> 26
Met His Gly Pro Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu
1 5 10 15
Pro Gln Asn Glu Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser
20 25 30
Asp Ser Glu Glu Glu Asn Asp Glu Ile Asp Gly Val Asn His Gln His
35 40 45
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
50 55 60
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
65 70 75 80
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
85 90 95
Val Cys Pro Trp Cys Ala Ser Gln Gln
100 105
<210> 27
<211> 98
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV31
<400> 27
Met Arg Gly Glu Thr Pro Thr Leu Gln Asp Tyr Val Leu Asp Leu Gln
1 5 10 15
Pro Glu Ala Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Pro Asp Ser Ser
20 25 30
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
35 40 45
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
50 55 60
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
65 70 75 80
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
85 90 95
Arg Leu
<210> 28
<211> 97
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV33
<400> 28
Met Arg Gly His Lys Pro Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr
1 5 10 15
Pro Glu Pro Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Ser Asp Ser Ser
20 25 30
Asp Glu Asp Glu Gly Leu Asp Arg Pro Asp Gly Gln Ala Gln Pro Ala
35 40 45
Thr Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr
50 55 60
Val Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln
65 70 75 80
Gln Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln
85 90 95
Leu
<210> 29
<211> 106
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV45
<400> 29
Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu
1 5 10 15
Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu
20 25 30
Ser Glu Ser Glu Glu Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala
35 40 45
Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys
50 55 60
Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser
65 70 75 80
Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser
85 90 95
Phe Val Cys Pro Trp Cys Ala Thr Asn Gln
100 105
<210> 30
<211> 99
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV52
<400> 30
Met Arg Gly Asp Lys Ala Thr Ile Lys Asp Tyr Ile Leu Asp Leu Gln
1 5 10 15
Pro Glu Thr Thr Asp Leu His Cys Tyr Glu Gln Leu Gly Asp Ser Ser
20 25 30
Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro Asp Gly Gln Ala Glu
35 40 45
Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys His Ser Cys Asp
50 55 60
Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr Asp Leu Arg Thr
65 70 75 80
Leu Gln Gln Met Leu Leu Gly Thr Leu Gln Val Val Cys Pro Gly Cys
85 90 95
Ala Arg Leu
<210> 31
<211> 99
<212> PRT
<213> Artificial Sequence
<220>
<223> Modified version of protein sequence of E7 of HPV52
<400> 31
Met Arg Gly Asp Lys Ala Thr Ile Lys Asp Tyr Ile Leu Asp Leu Gln
1 5 10 15
Pro Glu Thr Thr Asp Leu His Cys Tyr Glu Gln Leu Gly Asp Ser Ser
20 25 30
Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro Asp Gly Gln Ala Glu
35 40 45
Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys His Ser Cys Asp
50 55 60
Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr Asp Leu Arg Thr
65 70 75 80
Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val Cys Pro Gly Cys
85 90 95
Ala Arg Leu
<210> 32
<211> 98
<212> PRT
<213> Artificial Sequence
<220>
<223> Protein sequence of E7 of HPV 58
<400> 32
Met Arg Gly Asn Asn Pro Thr Leu Arg Glu Tyr Ile Leu Asp Leu His
1 5 10 15
Pro Glu Pro Thr Asp Leu Phe Cys Tyr Glu Gln Leu Cys Asp Ser Ser
20 25 30
Asp Glu Asp Glu Ile Gly Leu Asp Arg Pro Asp Gly Gln Ala Gln Pro
35 40 45
Ala Thr Ala Asn Tyr Tyr Ile Val Thr Cys Cys Tyr Thr Cys Asp Thr
50 55 60
Thr Val Arg Leu Cys Ile Asn Ser Thr Thr Thr Asp Val Arg Thr Leu
65 70 75 80
Gln Gln Leu Leu Met Gly Thr Cys Thr Ile Val Cys Pro Ser Cys Ala
85 90 95
Gln Gln
<210> 33
<211> 828
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV16, HVP18 and HPV45
acidic-deleted
<220>
<221> CDS
<222> (1)..(828)
<400> 33
ggt cag gcg gaa ccg gat cgc gcg cac tac aac atc gtt act ttt tgt 48
Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys
1 5 10 15
tgc aaa tgt gat tcc act ctg cgc ctg tgt gtg caa tcc acc cac gta 96
Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val
20 25 30
gac att cgc act ctg gaa gac ctg ctg atg ggt acc ctt ggt att gtt 144
Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val
35 40 45
tgt ccg att tgc tcc cag aag ccg gcg tct ggc gtt aac cac caa cac 192
Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His
50 55 60
ctg ccg gcg cgt cgc gca gag ccg cag cgt cac acc atg ctg tgc atg 240
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
65 70 75 80
tgc tgt aaa tgt gag gcc cgt atc gag ctg gtc gtt gag tct agc gcc 288
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
85 90 95
gac gat ctg cgt gcg ttt cag cag ctg ttc ctg aac acg ctg agc ttc 336
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
100 105 110
gtt tgc ccg tgg tgt gct agc cag cag ggc gtg tct cac gct cag ctg 384
Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His Ala Gln Leu
115 120 125
ccg gca cgt cgt gct gag cct cag cgt cac aaa atc ctg tgc gtg tgc 432
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys
130 135 140
tgc aaa tgc gat ggc cgc atc gaa ctg acc gtg gaa tct agc gca gaa 480
Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu
145 150 155 160
gac ctg cgt acg ctg cag caa ctg ttc ctg agc acg ctg tcc ttc gta 528
Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val
165 170 175
tgc cct tgg tgc gca act aat cag atg cac ggt gac acc ccg acc ctg 576
Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr Pro Thr Leu
180 185 190
cac gaa tac atg ctg gac ctg cag cca gaa acc acc gat ctg tac tgt 624
His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Cys
195 200 205
tac gaa cag ctg aac atg cat ggc cca aaa gct act ctg cag gat atc 672
Tyr Glu Gln Leu Asn Met His Gly Pro Lys Ala Thr Leu Gln Asp Ile
210 215 220
gtc ctg cat ctg gaa cca cag aac gaa atc ccg gta gat ctg ctg tgc 720
Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp Leu Leu Cys
225 230 235 240
cat gag cag ctg atg cat ggt ccg cgt gaa acc ctg cag gaa atc gtt 768
His Glu Gln Leu Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val
245 250 255
ctg cac ctg gaa ccg caa aac gaa ctg gac ccg gtt gac ctg ctg tgc 816
Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys
260 265 270
tat gaa cag ctg 828
Tyr Glu Gln Leu
275
<210> 34
<211> 276
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 34
Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys
1 5 10 15
Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val
20 25 30
Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val
35 40 45
Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His
50 55 60
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
65 70 75 80
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
85 90 95
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
100 105 110
Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His Ala Gln Leu
115 120 125
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys
130 135 140
Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu
145 150 155 160
Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val
165 170 175
Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr Pro Thr Leu
180 185 190
His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Cys
195 200 205
Tyr Glu Gln Leu Asn Met His Gly Pro Lys Ala Thr Leu Gln Asp Ile
210 215 220
Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp Leu Leu Cys
225 230 235 240
His Glu Gln Leu Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val
245 250 255
Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys
260 265 270
Tyr Glu Gln Leu
275
<210> 35
<211> 933
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide for antigen E7 of HPV16, HPV18 and HPV45 full
<220>
<221> CDS
<222> (1)..(933)
<400> 35
gaa gac gaa atc gac ggc cct gcg ggc cag gct gaa cca gat cgt gct 48
Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp Arg Ala
1 5 10 15
cac tac aac atc gta act ttt tgc tgt aag tgc gat agc act ctg cgt 96
His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg
20 25 30
ctg tgc gta cag tct act cac gtt gat atc cgc act ctg gaa gat ctg 144
Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu
35 40 45
ctg atg ggt acc ctg ggt atc gtc tgc cca atc tgc tct caa aag cct 192
Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro
50 55 60
gct tct ggt gtt aac cat cag cac ctg ccg gct cgt cgc gct gaa cca 240
Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro
65 70 75 80
cag cgt cat acc atg ctg tgc atg tgt tgc aaa tgc gag gct cgc atc 288
Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile
85 90 95
gaa ctg gtt gtt gaa tcc agc gct gac gac ctg cgt gcg ttt cag caa 336
Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln
100 105 110
ctg ttc ctg aac acg ctg tct ttt gtt tgt ccg tgg tgt gcc tcc cag 384
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln
115 120 125
cag gag aac gat gaa gcg gat ggc gtg tcc cac gcg cag ctg ccg gca 432
Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln Leu Pro Ala
130 135 140
cgt cgt gca gaa ccg cag cgc cac aag att ctg tgc gtt tgc tgt aaa 480
Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys Cys Lys
145 150 155 160
tgt gat ggc cgt atc gaa ctg act gtg gaa tcc tcc gcg gaa gat ctg 528
Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu Asp Leu
165 170 175
cgt acg ctg cag cag ctg ttc ctg tct acc ctg tct ttc gtg tgc ccg 576
Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val Cys Pro
180 185 190
tgg tgc gcc acc aat caa atg cac ggc gac acc ccg acc ctg cac gaa 624
Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr Pro Thr Leu His Glu
195 200 205
tac atg ctg gac ctg cag ccg gaa acc acg gat ctg tat tgt tat gaa 672
Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Cys Tyr Glu
210 215 220
cag ctg aac gat agc agc gag gaa atg cac ggt ccg aaa gca act ctg 720
Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys Ala Thr Leu
225 230 235 240
cag gac att gtg ctg cat ctg gag cca cag aac gaa atc ccg gtt gat 768
Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp
245 250 255
ctg ctg tgc cac gag caa ctg agc gat tcc gaa gag gaa aac gac gaa 816
Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu Asn Asp Glu
260 265 270
att gat atg cat ggt ccg cgc gag acc ctg caa gaa atc gtc ctg cac 864
Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val Leu His
275 280 285
ctg gaa ccg caa aac gaa ctg gac cct gta gac ctg ctg tgc tac gaa 912
Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys Tyr Glu
290 295 300
cag ctg tcc gaa tct gaa gaa 933
Gln Leu Ser Glu Ser Glu Glu
305 310
<210> 36
<211> 311
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 36
Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp Arg Ala
1 5 10 15
His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg
20 25 30
Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu
35 40 45
Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro
50 55 60
Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro
65 70 75 80
Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile
85 90 95
Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln
100 105 110
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln
115 120 125
Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln Leu Pro Ala
130 135 140
Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys Cys Lys
145 150 155 160
Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu Asp Leu
165 170 175
Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val Cys Pro
180 185 190
Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr Pro Thr Leu His Glu
195 200 205
Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Cys Tyr Glu
210 215 220
Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys Ala Thr Leu
225 230 235 240
Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp
245 250 255
Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu Asn Asp Glu
260 265 270
Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val Leu His
275 280 285
Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys Tyr Glu
290 295 300
Gln Leu Ser Glu Ser Glu Glu
305 310
<210> 37
<211> 1011
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV31, 33, 52 and 58
acidic-deleted
<220>
<221> CDS
<222> (1)..(1011)
<400> 37
gcg ggt caa gcg aag ccg gat acg agc aac tat aac att gtc acg ttc 48
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
tgc tgc cag tgt gaa agc acc ttg cgt ctg tgt gtc cag agc acc caa 96
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
gtt gac atc cgt att ctg cag gag ttg ctg atg ggc agc ttt ggc atc 144
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
gtg tgc ccg aat tgc agc act cgc ctg ggt cag gca cag ccg gcc acc 192
Val Cys Pro Asn Cys Ser Thr Arg Leu Gly Gln Ala Gln Pro Ala Thr
50 55 60
gct gac tac tac att gtt act tgt tgc cat acc tgc aat acc acg gtc 240
Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr Val
65 70 75 80
cgc ctg tgc gtc aat tcc acc gct tcc gac ttg cgt acc att cag caa 288
Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln Gln
85 90 95
ctg ctg atg ggc acg gtt aac atc gtt tgc ccg tct tgt gcg cag ctg 336
Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln Leu
100 105 110
ggc caa gcg gaa cag gcg acg agc aat tac tac atc gtg act tac tgt 384
Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys
115 120 125
cac tcg tgt gac agc acg ctg cgt ttg tgc att cac agc acc gcg acc 432
His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr
130 135 140
gat ctg cgt acg ctg caa caa ttg ctg atg ggt acc ctg cag gtg gtg 480
Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val
145 150 155 160
tgc cct ggt tgc gca cgt ctg ggt caa gct caa ccg gca acc gcg aac 528
Cys Pro Gly Cys Ala Arg Leu Gly Gln Ala Gln Pro Ala Thr Ala Asn
165 170 175
tac tat atc gtt acg tgt tgt tat acg tgt gat acc acc gtt cgt ctg 576
Tyr Tyr Ile Val Thr Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu
180 185 190
tgc atc aac agc acc acc acc gat gtc cgc acg ctg caa caa ctg ctg 624
Cys Ile Asn Ser Thr Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu
195 200 205
atg ggt acg tgt acg att gtt tgc ccg agc tgt gcc cag caa atg cgt 672
Met Gly Thr Cys Thr Ile Val Cys Pro Ser Cys Ala Gln Gln Met Arg
210 215 220
ggt gaa acc cca acg ctg cag gac tac gtg ctg gat ttg cag ccg gaa 720
Gly Glu Thr Pro Thr Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu
225 230 235 240
gca acc gac ctg tac tgc tac gag cag ctg atg cgt ggt cac aag ccg 768
Ala Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Met Arg Gly His Lys Pro
245 250 255
acg ctg aaa gag tat atc ttg gac ctg tat ccg gag cct acc gat ctg 816
Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu
260 265 270
tat tgc tat gaa cag ctg agc atg cgt ggc gat aag gcg acc atc aaa 864
Tyr Cys Tyr Glu Gln Leu Ser Met Arg Gly Asp Lys Ala Thr Ile Lys
275 280 285
gac tac att ctg gac ttg cag ccg gaa acc acg gat ctg cat tgc tac 912
Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr
290 295 300
gaa caa ctg ggc atg cgc ggt aac aat ccg acc ctg cgc gag tat atc 960
Glu Gln Leu Gly Met Arg Gly Asn Asn Pro Thr Leu Arg Glu Tyr Ile
305 310 315 320
ctg gat ctg cac cca gag ccg act gac ctg ttc tgc tat gag cag ttg 1008
Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe Cys Tyr Glu Gln Leu
325 330 335
tgc 1011
Cys
<210> 38
<211> 337
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 38
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
Val Cys Pro Asn Cys Ser Thr Arg Leu Gly Gln Ala Gln Pro Ala Thr
50 55 60
Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr Val
65 70 75 80
Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln Gln
85 90 95
Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln Leu
100 105 110
Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys
115 120 125
His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr
130 135 140
Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val
145 150 155 160
Cys Pro Gly Cys Ala Arg Leu Gly Gln Ala Gln Pro Ala Thr Ala Asn
165 170 175
Tyr Tyr Ile Val Thr Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu
180 185 190
Cys Ile Asn Ser Thr Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu
195 200 205
Met Gly Thr Cys Thr Ile Val Cys Pro Ser Cys Ala Gln Gln Met Arg
210 215 220
Gly Glu Thr Pro Thr Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu
225 230 235 240
Ala Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Met Arg Gly His Lys Pro
245 250 255
Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu
260 265 270
Tyr Cys Tyr Glu Gln Leu Ser Met Arg Gly Asp Lys Ala Thr Ile Lys
275 280 285
Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr
290 295 300
Glu Gln Leu Gly Met Arg Gly Asn Asn Pro Thr Leu Arg Glu Tyr Ile
305 310 315 320
Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe Cys Tyr Glu Gln Leu
325 330 335
Cys
<210> 39
<211> 1176
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV31, 33, 52 and 58 full
<220>
<221> CDS
<222> (1)..(1176)
<400> 39
gat gaa gag gat gtc atc gat tcc cca gca ggc caa gca aag ccg gac 48
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
1 5 10 15
acc agc aat tac aat atc gtg acc ttc tgc tgc caa tgt gag tcc act 96
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
20 25 30
ctg cgt ctg tgc gtt cag agc acc cag gtt gac att cgt att ctg caa 144
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
35 40 45
gaa ttg ttg atg ggt agc ttt ggc att gtg tgt ccg aac tgc agc acc 192
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
50 55 60
cgt ctg tcg gat gaa gat gaa ggt ctg gat cgt ccg gat ggt caa gcg 240
Arg Leu Ser Asp Glu Asp Glu Gly Leu Asp Arg Pro Asp Gly Gln Ala
65 70 75 80
cag ccg gcg act gca gat tac tat atc gtc act tgt tgc cac acc tgc 288
Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys
85 90 95
aat acc acc gtg cgt ctg tgt gtg aac agc acg gcg agc gac ctg cgc 336
Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg
100 105 110
acg atc caa cag ttg ttg atg ggc acc gtg aat atc gtc tgc cca agc 384
Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser
115 120 125
tgt gct cag ttg agc gat gaa gag gac acc gac ggt gtc gac cgt ccg 432
Cys Ala Gln Leu Ser Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro
130 135 140
gac ggc caa gct gag cag gcg acc agc aac tac tat atc gtt acg tac 480
Asp Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr
145 150 155 160
tgt cac agc tgc gat agc act ctg cgc ctg tgt att cat agc acg gcc 528
Cys His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala
165 170 175
acc gat ctg cgt acc ctg caa caa ctg ctg atg ggt act ctg cag gtt 576
Thr Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val
180 185 190
gtg tgc cca ggt tgt gct cgt ctg tcc gac gag gac gaa atc ggc ctg 624
Val Cys Pro Gly Cys Ala Arg Leu Ser Asp Glu Asp Glu Ile Gly Leu
195 200 205
gac cgt cct gat ggc cag gcc cag ccg gca acg gcg aac tat tac att 672
Asp Arg Pro Asp Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile
210 215 220
gtg acc tgc tgc tat acg tgc gat acc acg gtc cgt ctg tgc att aac 720
Val Thr Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn
225 230 235 240
tct acc acc acg gat gtt cgc acg ctg cag caa ctg ctg atg ggt acc 768
Ser Thr Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr
245 250 255
tgt acc att gtt tgc ccg tct tgt gcc cag cag atg cgc ggt gaa acg 816
Cys Thr Ile Val Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Glu Thr
260 265 270
ccg acc ctg cag gat tat gtt ctg gac ctg caa ccg gag gcg acc gat 864
Pro Thr Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp
275 280 285
ctg tat tgc tac gag caa ctg ccg gac agc tcg atg cgt ggt cac aaa 912
Leu Tyr Cys Tyr Glu Gln Leu Pro Asp Ser Ser Met Arg Gly His Lys
290 295 300
ccg acg ctg aaa gag tac atc ctg gac ctg tac ccg gaa cct acg gat 960
Pro Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp
305 310 315 320
ctg tac tgt tat gaa caa ctg agc gat agc atg cgt ggt gac aag gcg 1008
Leu Tyr Cys Tyr Glu Gln Leu Ser Asp Ser Met Arg Gly Asp Lys Ala
325 330 335
acg att aag gac tac atc ttg gat ctg cag ccg gaa acc acc gac ctg 1056
Thr Ile Lys Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu
340 345 350
cac tgc tat gag cag ctg ggt gat tct atg cgc ggt aac aat ccg acc 1104
His Cys Tyr Glu Gln Leu Gly Asp Ser Met Arg Gly Asn Asn Pro Thr
355 360 365
ctg cgc gag tac att ctg gac ttg cat ccg gaa ccg acg gac ctg ttc 1152
Leu Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe
370 375 380
tgt tac gag cag ctg tgt gac agc 1176
Cys Tyr Glu Gln Leu Cys Asp Ser
385 390
<210> 40
<211> 392
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 40
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
1 5 10 15
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
20 25 30
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
35 40 45
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
50 55 60
Arg Leu Ser Asp Glu Asp Glu Gly Leu Asp Arg Pro Asp Gly Gln Ala
65 70 75 80
Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys
85 90 95
Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg
100 105 110
Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser
115 120 125
Cys Ala Gln Leu Ser Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro
130 135 140
Asp Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr
145 150 155 160
Cys His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala
165 170 175
Thr Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val
180 185 190
Val Cys Pro Gly Cys Ala Arg Leu Ser Asp Glu Asp Glu Ile Gly Leu
195 200 205
Asp Arg Pro Asp Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile
210 215 220
Val Thr Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn
225 230 235 240
Ser Thr Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr
245 250 255
Cys Thr Ile Val Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Glu Thr
260 265 270
Pro Thr Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp
275 280 285
Leu Tyr Cys Tyr Glu Gln Leu Pro Asp Ser Ser Met Arg Gly His Lys
290 295 300
Pro Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp
305 310 315 320
Leu Tyr Cys Tyr Glu Gln Leu Ser Asp Ser Met Arg Gly Asp Lys Ala
325 330 335
Thr Ile Lys Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu
340 345 350
His Cys Tyr Glu Gln Leu Gly Asp Ser Met Arg Gly Asn Asn Pro Thr
355 360 365
Leu Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe
370 375 380
Cys Tyr Glu Gln Leu Cys Asp Ser
385 390
<210> 41
<211> 759
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV31, 52 and 58 acidic-deleted
<220>
<221> CDS
<222> (1)..(759)
<400> 41
gcg ggt caa gcc aaa ccg gat acc tcc aac tac aac att gtg acc ttc 48
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
tgt tgt caa tgc gag agc acg ctg cgt ctg tgt gtt caa agc acc cag 96
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
gtt gac att cgt atc ctg caa gaa ctg ctg atg ggc tct ttt ggc atc 144
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
gtc tgc cca aat tgc agc act cgc ctg ggc cag gcg gag cag gcg acg 192
Val Cys Pro Asn Cys Ser Thr Arg Leu Gly Gln Ala Glu Gln Ala Thr
50 55 60
agc aac tac tac att gtc acg tat tgc cat tcc tgt gat agc act ctg 240
Ser Asn Tyr Tyr Ile Val Thr Tyr Cys His Ser Cys Asp Ser Thr Leu
65 70 75 80
cgt ctg tgt atc cac agc acg gca acc gat ctg cgt acc ttg caa caa 288
Arg Leu Cys Ile His Ser Thr Ala Thr Asp Leu Arg Thr Leu Gln Gln
85 90 95
ctg ctg atg ggc acc ctg cag gtg gtt tgt ccg ggt tgc gct cgc ctg 336
Leu Leu Met Gly Thr Leu Gln Val Val Cys Pro Gly Cys Ala Arg Leu
100 105 110
ggc cag gcg cag cca gcg acg gcc aat tac tac atc gtt acc tgt tgc 384
Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr Cys Cys
115 120 125
tat acg tgc gat act acc gtc cgt ctg tgc att aac agc acc acc acg 432
Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr Thr Thr
130 135 140
gac gtg cgt acc ctg caa cag ctg ctg atg ggt acc tgc acg att gtt 480
Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr Ile Val
145 150 155 160
tgt ccg agc tgt gca caa caa atg cgt ggt gaa acg ccg acc ctg cag 528
Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Glu Thr Pro Thr Leu Gln
165 170 175
gat tat gtg ttg gac ttg cag ccg gag gca acg gac ctg tac tgc tat 576
Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr Cys Tyr
180 185 190
gag cag ctg atg cgt ggt gac aag gcc acc att aaa gat tac atc ctg 624
Glu Gln Leu Met Arg Gly Asp Lys Ala Thr Ile Lys Asp Tyr Ile Leu
195 200 205
gac ttg caa ccg gaa acc acc gac ctg cac tgc tat gag cag ctg ggt 672
Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr Glu Gln Leu Gly
210 215 220
atg cgc ggt aat aac ccg acc ttg cgt gag tat atc ttg gac ctg cac 720
Met Arg Gly Asn Asn Pro Thr Leu Arg Glu Tyr Ile Leu Asp Leu His
225 230 235 240
ccg gag ccg acc gat ctg ttc tgt tac gaa cag ctg tgc 759
Pro Glu Pro Thr Asp Leu Phe Cys Tyr Glu Gln Leu Cys
245 250
<210> 42
<211> 253
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 42
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
Val Cys Pro Asn Cys Ser Thr Arg Leu Gly Gln Ala Glu Gln Ala Thr
50 55 60
Ser Asn Tyr Tyr Ile Val Thr Tyr Cys His Ser Cys Asp Ser Thr Leu
65 70 75 80
Arg Leu Cys Ile His Ser Thr Ala Thr Asp Leu Arg Thr Leu Gln Gln
85 90 95
Leu Leu Met Gly Thr Leu Gln Val Val Cys Pro Gly Cys Ala Arg Leu
100 105 110
Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr Cys Cys
115 120 125
Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr Thr Thr
130 135 140
Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr Ile Val
145 150 155 160
Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Glu Thr Pro Thr Leu Gln
165 170 175
Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr Cys Tyr
180 185 190
Glu Gln Leu Met Arg Gly Asp Lys Ala Thr Ile Lys Asp Tyr Ile Leu
195 200 205
Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr Glu Gln Leu Gly
210 215 220
Met Arg Gly Asn Asn Pro Thr Leu Arg Glu Tyr Ile Leu Asp Leu His
225 230 235 240
Pro Glu Pro Thr Asp Leu Phe Cys Tyr Glu Gln Leu Cys
245 250
<210> 43
<211> 885
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV31, 52 and 58 full
<220>
<221> CDS
<222> (1)..(885)
<400> 43
gat gaa gag gat gtc atc gat tcc cca gca ggc caa gca aag ccg gac 48
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
1 5 10 15
acc agc aat tac aat atc gtg acc ttc tgc tgc caa tgt gag tcc act 96
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
20 25 30
ctg cgt ctg tgc gtt cag agc acc cag gtt gac att cgt att ctg caa 144
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
35 40 45
gaa ttg ttg atg ggt agc ttt ggc att gtg tgt ccg aac tgc agc acc 192
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
50 55 60
cgt ctg agc gat gaa gag gac acc gac ggt gtc gac cgt ccg gac ggc 240
Arg Leu Ser Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro Asp Gly
65 70 75 80
caa gct gag cag gcg acc agc aac tac tat atc gtt acg tac tgt cac 288
Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys His
85 90 95
agc tgc gat agc act ctg cgc ctg tgt att cat agc acg gcc acc gat 336
Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr Asp
100 105 110
ctg cgt acc ctg caa caa ctg ctg atg ggt act ctg cag gtt gtg tgc 384
Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val Cys
115 120 125
cca ggt tgt gct cgt ctg tcc gac gag gac gaa atc ggc ctg gac cgt 432
Pro Gly Cys Ala Arg Leu Ser Asp Glu Asp Glu Ile Gly Leu Asp Arg
130 135 140
cct gat ggc cag gcc cag ccg gca acg gcg aac tat tac att gtg acc 480
Pro Asp Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr
145 150 155 160
tgc tgc tat acg tgc gat acc acg gtc cgt ctg tgc att aac tct acc 528
Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr
165 170 175
acc acg gat gtt cgc acg ctg cag caa ctg ctg atg ggt acc tgt acc 576
Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr
180 185 190
att gtt tgc ccg tct tgt gcc cag cag atg cgc ggt gaa acg ccg acc 624
Ile Val Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Glu Thr Pro Thr
195 200 205
ctg cag gat tat gtt ctg gac ctg caa ccg gag gcg acc gat ctg tat 672
Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr
210 215 220
tgc tac gag caa ctg ccg gac agc tcg atg cgt ggt gac aag gcg acg 720
Cys Tyr Glu Gln Leu Pro Asp Ser Ser Met Arg Gly Asp Lys Ala Thr
225 230 235 240
att aag gac tac atc ttg gat ctg cag ccg gaa acc acc gac ctg cac 768
Ile Lys Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His
245 250 255
tgc tat gag cag ctg ggt gat tct atg cgc ggt aac aat ccg acc ctg 816
Cys Tyr Glu Gln Leu Gly Asp Ser Met Arg Gly Asn Asn Pro Thr Leu
260 265 270
cgc gag tac att ctg gac ttg cat ccg gaa ccg acg gac ctg ttc tgt 864
Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe Cys
275 280 285
tac gag cag ctg tgt gac agc 885
Tyr Glu Gln Leu Cys Asp Ser
290 295
<210> 44
<211> 295
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 44
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
1 5 10 15
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
20 25 30
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
35 40 45
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
50 55 60
Arg Leu Ser Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro Asp Gly
65 70 75 80
Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys His
85 90 95
Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr Asp
100 105 110
Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val Cys
115 120 125
Pro Gly Cys Ala Arg Leu Ser Asp Glu Asp Glu Ile Gly Leu Asp Arg
130 135 140
Pro Asp Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr
145 150 155 160
Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr
165 170 175
Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr
180 185 190
Ile Val Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Glu Thr Pro Thr
195 200 205
Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr
210 215 220
Cys Tyr Glu Gln Leu Pro Asp Ser Ser Met Arg Gly Asp Lys Ala Thr
225 230 235 240
Ile Lys Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His
245 250 255
Cys Tyr Glu Gln Leu Gly Asp Ser Met Arg Gly Asn Asn Pro Thr Leu
260 265 270
Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe Cys
275 280 285
Tyr Glu Gln Leu Cys Asp Ser
290 295
<210> 45
<211> 759
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV31, 33 and 52 acidic-deleted
<220>
<221> CDS
<222> (1)..(759)
<400> 45
gcg ggt caa gcc aaa ccg gat acc tcc aac tac aac att gtg acc ttc 48
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
tgt tgt caa tgc gag agc acg ctg cgt ctg tgt gtt caa agc acc cag 96
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
gtt gac att cgt atc ctg caa gaa ctg ctg atg ggc tct ttt ggc atc 144
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
gtc tgc cca aat tgc agc act cgc ctg ggt cag gcg caa ccg gcc acg 192
Val Cys Pro Asn Cys Ser Thr Arg Leu Gly Gln Ala Gln Pro Ala Thr
50 55 60
gcg gac tac tat atc gtg acc tgt tgc cac acc tgc aac act acc gtt 240
Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr Val
65 70 75 80
cgc ttg tgt gtc aat agc acc gct tcc gat ctg cgt acc att caa caa 288
Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln Gln
85 90 95
ctg ctg atg ggt acc gtt aac atc gtg tgc ccg agc tgc gca cag ctg 336
Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln Leu
100 105 110
ggc cag gcg gag cag gcg acg agc aac tac tac att gtc acg tat tgc 384
Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys
115 120 125
cat tcc tgt gat agc act ctg cgt ctg tgt atc cac agc acg gca acc 432
His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr
130 135 140
gat ctg cgt acc ttg caa caa ctg ctg atg ggc acc ctg cag gtg gtt 480
Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val
145 150 155 160
tgt ccg ggt tgc gct cgc ctg atg cgt ggt gaa acg ccg acc ctg cag 528
Cys Pro Gly Cys Ala Arg Leu Met Arg Gly Glu Thr Pro Thr Leu Gln
165 170 175
gat tat gtg ttg gac ttg cag ccg gag gca acg gac ctg tac tgc tat 576
Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr Cys Tyr
180 185 190
gag cag ctg atg cgt ggc cat aag ccg acg ctg aaa gag tat att ctg 624
Glu Gln Leu Met Arg Gly His Lys Pro Thr Leu Lys Glu Tyr Ile Leu
195 200 205
gac ctg tac cca gag ccg acg gat ttg tac tgt tat gaa cag ctg agc 672
Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Ser
210 215 220
atg cgt ggt gac aag gcc acc att aaa gat tac atc ctg gac ttg caa 720
Met Arg Gly Asp Lys Ala Thr Ile Lys Asp Tyr Ile Leu Asp Leu Gln
225 230 235 240
ccg gaa acc acc gac ctg cac tgc tat gag cag ctg ggt 759
Pro Glu Thr Thr Asp Leu His Cys Tyr Glu Gln Leu Gly
245 250
<210> 46
<211> 253
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 46
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
Val Cys Pro Asn Cys Ser Thr Arg Leu Gly Gln Ala Gln Pro Ala Thr
50 55 60
Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr Val
65 70 75 80
Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln Gln
85 90 95
Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln Leu
100 105 110
Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys
115 120 125
His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr
130 135 140
Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val
145 150 155 160
Cys Pro Gly Cys Ala Arg Leu Met Arg Gly Glu Thr Pro Thr Leu Gln
165 170 175
Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr Cys Tyr
180 185 190
Glu Gln Leu Met Arg Gly His Lys Pro Thr Leu Lys Glu Tyr Ile Leu
195 200 205
Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Ser
210 215 220
Met Arg Gly Asp Lys Ala Thr Ile Lys Asp Tyr Ile Leu Asp Leu Gln
225 230 235 240
Pro Glu Thr Thr Asp Leu His Cys Tyr Glu Gln Leu Gly
245 250
<210> 47
<211> 882
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV31, 33 and 52 full
<220>
<221> CDS
<222> (1)..(882)
<400> 47
gat gaa gag gat gtc atc gat tcc cca gca ggc caa gca aag ccg gac 48
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
1 5 10 15
acc agc aat tac aat atc gtg acc ttc tgc tgc caa tgt gag tcc act 96
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
20 25 30
ctg cgt ctg tgc gtt cag agc acc cag gtt gac att cgt att ctg caa 144
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
35 40 45
gaa ttg ttg atg ggt agc ttt ggc att gtg tgt ccg aac tgc agc acc 192
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
50 55 60
cgt ctg tcg gat gaa gat gaa ggt ctg gat cgt ccg gat ggt caa gcg 240
Arg Leu Ser Asp Glu Asp Glu Gly Leu Asp Arg Pro Asp Gly Gln Ala
65 70 75 80
cag ccg gcg act gca gat tac tat atc gtc act tgt tgc cac acc tgc 288
Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys
85 90 95
aat acc acc gtg cgt ctg tgt gtg aac agc acg gcg agc gac ctg cgc 336
Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg
100 105 110
acg atc caa cag ttg ttg atg ggc acc gtg aat atc gtc tgc cca agc 384
Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser
115 120 125
tgt gct cag ttg agc gat gaa gag gac acc gac ggt gtc gac cgt ccg 432
Cys Ala Gln Leu Ser Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro
130 135 140
gac ggc caa gct gag cag gcg acc agc aac tac tat atc gtt acg tac 480
Asp Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr
145 150 155 160
tgt cac agc tgc gat agc act ctg cgc ctg tgt att cat agc acg gcc 528
Cys His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala
165 170 175
acc gat ctg cgt acc ctg caa caa ctg ctg atg ggt act ctg cag gtt 576
Thr Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val
180 185 190
gtg tgc cca ggt tgt gct cgt ctg atg cgc ggt gaa acg ccg acc ctg 624
Val Cys Pro Gly Cys Ala Arg Leu Met Arg Gly Glu Thr Pro Thr Leu
195 200 205
cag gat tat gtt ctg gac ctg caa ccg gag gcg acc gat ctg tat tgc 672
Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr Cys
210 215 220
tac gag caa ctg ccg gac agc tcg atg cgt ggt cac aaa ccg acg ctg 720
Tyr Glu Gln Leu Pro Asp Ser Ser Met Arg Gly His Lys Pro Thr Leu
225 230 235 240
aaa gag tac atc ctg gac ctg tac ccg gaa cct acg gat ctg tac tgt 768
Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr Cys
245 250 255
tat gaa caa ctg agc gat agc atg cgt ggt gac aag gcg acg att aag 816
Tyr Glu Gln Leu Ser Asp Ser Met Arg Gly Asp Lys Ala Thr Ile Lys
260 265 270
gac tac atc ttg gat ctg cag ccg gaa acc acc gac ctg cac tgc tat 864
Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr
275 280 285
gag cag ctg ggt gat tct 882
Glu Gln Leu Gly Asp Ser
290
<210> 48
<211> 294
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 48
Asp Glu Glu Asp Val Ile Asp Ser Pro Ala Gly Gln Ala Lys Pro Asp
1 5 10 15
Thr Ser Asn Tyr Asn Ile Val Thr Phe Cys Cys Gln Cys Glu Ser Thr
20 25 30
Leu Arg Leu Cys Val Gln Ser Thr Gln Val Asp Ile Arg Ile Leu Gln
35 40 45
Glu Leu Leu Met Gly Ser Phe Gly Ile Val Cys Pro Asn Cys Ser Thr
50 55 60
Arg Leu Ser Asp Glu Asp Glu Gly Leu Asp Arg Pro Asp Gly Gln Ala
65 70 75 80
Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys
85 90 95
Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg
100 105 110
Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser
115 120 125
Cys Ala Gln Leu Ser Asp Glu Glu Asp Thr Asp Gly Val Asp Arg Pro
130 135 140
Asp Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr
145 150 155 160
Cys His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala
165 170 175
Thr Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val
180 185 190
Val Cys Pro Gly Cys Ala Arg Leu Met Arg Gly Glu Thr Pro Thr Leu
195 200 205
Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr Cys
210 215 220
Tyr Glu Gln Leu Pro Asp Ser Ser Met Arg Gly His Lys Pro Thr Leu
225 230 235 240
Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr Cys
245 250 255
Tyr Glu Gln Leu Ser Asp Ser Met Arg Gly Asp Lys Ala Thr Ile Lys
260 265 270
Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr
275 280 285
Glu Gln Leu Gly Asp Ser
290
<210> 49
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV16, 18, 33 and 45
acidic-deleted
<220>
<221> CDS
<222> (1)..(1080)
<400> 49
ggt cag gcg gaa ccg gat cgc gcg cac tac aac atc gtt act ttt tgt 48
Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys
1 5 10 15
tgc aaa tgt gat tcc act ctg cgc ctg tgt gtg caa tcc acc cac gta 96
Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val
20 25 30
gac atc cgc act ctg gaa gac ctg ctg atg ggt acc ctg ggt att gtt 144
Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val
35 40 45
tgt ccg att tgc tcc cag aag ccg gcg tct ggc gtt aac cac caa cac 192
Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His
50 55 60
ctg ccg gcg cgt cgc gca gag ccg cag cgt cac acc atg ctg tgc atg 240
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
65 70 75 80
tgc tgt aaa tgt gag gcc cgt att gaa ctg gtc gtt gag tct agc gcc 288
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
85 90 95
gac gat ctg cgt gcg ttt cag cag ctg ttc ctg aac acg ctg agc ttc 336
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
100 105 110
gtt tgc ccg tgg tgt gct agc cag cag ggc gtg tct cac gct cag ctg 384
Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His Ala Gln Leu
115 120 125
ccg gca cgt cgt gct gag cct cag cgt cac aaa atc ctg tgc gtg tgc 432
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys
130 135 140
tgc aaa tgc gat ggc cgc atc gaa ctg acc gtg gaa tct agc gca gaa 480
Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu
145 150 155 160
gac ctg cgt acg ctg cag caa ctg ttc ctg agc acg ctg tcc ttc gta 528
Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val
165 170 175
tgc cct tgg tgc gca act aat cag ggt cag gcg caa ccg gcc acg gcg 576
Cys Pro Trp Cys Ala Thr Asn Gln Gly Gln Ala Gln Pro Ala Thr Ala
180 185 190
gac tac tat atc gtg acc tgt tgc cac acc tgc aac act acc gtt cgc 624
Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr Val Arg
195 200 205
ttg tgt gtc aat agc acc gct tcc gat ctg cgt acc att caa caa ctg 672
Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln Gln Leu
210 215 220
ctg atg ggt acc gtt aac atc gtg tgc ccg agc tgc gca cag ctg atg 720
Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln Leu Met
225 230 235 240
cac ggt gac acc ccg acc ctg cac gaa tac atg ctg gac ctg cag cca 768
His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro
245 250 255
gaa acc acc gat ctg tac tgt tac gaa cag ctg aac atg cat ggc cca 816
Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro
260 265 270
aaa gct act ctg cag gat atc gtc ctg cat ctg gaa cca cag aac gaa 864
Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu
275 280 285
atc ccg gta gat ctg ctg tgc cat gag cag ctg atg cat ggt ccg cgt 912
Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg
290 295 300
gaa acc ctg cag gaa atc gtt ctg cac ctg gaa ccg caa aac gaa ctg 960
Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu
305 310 315 320
gac ccg gtt gac ctg ctg tgc tat gaa cag ctg atg cgt ggc cat aag 1008
Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu Met Arg Gly His Lys
325 330 335
ccg acg ctg aaa gag tat att ctg gac ctg tac cca gag ccg acg gat 1056
Pro Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp
340 345 350
ttg tac tgt tat gaa cag ctg agc 1080
Leu Tyr Cys Tyr Glu Gln Leu Ser
355 360
<210> 50
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 50
Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys
1 5 10 15
Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val
20 25 30
Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val
35 40 45
Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His
50 55 60
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
65 70 75 80
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
85 90 95
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
100 105 110
Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His Ala Gln Leu
115 120 125
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys
130 135 140
Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu
145 150 155 160
Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val
165 170 175
Cys Pro Trp Cys Ala Thr Asn Gln Gly Gln Ala Gln Pro Ala Thr Ala
180 185 190
Asp Tyr Tyr Ile Val Thr Cys Cys His Thr Cys Asn Thr Thr Val Arg
195 200 205
Leu Cys Val Asn Ser Thr Ala Ser Asp Leu Arg Thr Ile Gln Gln Leu
210 215 220
Leu Met Gly Thr Val Asn Ile Val Cys Pro Ser Cys Ala Gln Leu Met
225 230 235 240
His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro
245 250 255
Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro
260 265 270
Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu
275 280 285
Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg
290 295 300
Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu
305 310 315 320
Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu Met Arg Gly His Lys
325 330 335
Pro Thr Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp
340 345 350
Leu Tyr Cys Tyr Glu Gln Leu Ser
355 360
<210> 51
<211> 1224
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV16, 18, 33 and 45 full
<220>
<221> CDS
<222> (1)..(1224)
<400> 51
gaa gac gaa atc gac ggc cct gcg ggc cag gct gaa cca gat cgt gct 48
Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp Arg Ala
1 5 10 15
cac tac aac atc gta act ttt tgc tgt aag tgc gat agc act ctg cgt 96
His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg
20 25 30
ctg tgc gta cag tct act cac gtt gat atc cgc act ctg gaa gat ctg 144
Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu
35 40 45
ctg atg ggt acc ctg ggt atc gtc tgc cca atc tgc tct caa aag cct 192
Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro
50 55 60
gct tct ggt gtt aac cat cag cac ctg ccg gct cgt cgc gct gaa cca 240
Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro
65 70 75 80
cag cgt cat acc atg ctg tgc atg tgt tgc aaa tgc gag gct cgc atc 288
Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile
85 90 95
gaa ctg gtt gtt gaa tcc agc gct gac gac ctg cgt gcg ttt cag caa 336
Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln
100 105 110
ctg ttc ctg aac acg ctg tct ttt gtt tgt ccg tgg tgt gcc tcc cag 384
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln
115 120 125
cag gag aac gat gaa gcg gat ggc gtg tcc cac gcg cag ctg ccg gca 432
Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln Leu Pro Ala
130 135 140
cgt cgt gca gaa ccg cag cgc cac aag att ctg tgc gtt tgc tgt aaa 480
Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys Cys Lys
145 150 155 160
tgt gat ggc cgt atc gaa ctg act gtg gaa tcc tcc gcg gaa gat ctg 528
Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu Asp Leu
165 170 175
cgt acg ctg cag cag ctg ttc ctg tct acc ctg tct ttc gtg tgc ccg 576
Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val Cys Pro
180 185 190
tgg tgc gcc acc aat caa tcg gat gaa gat gaa ggt ctg gat cgt ccg 624
Trp Cys Ala Thr Asn Gln Ser Asp Glu Asp Glu Gly Leu Asp Arg Pro
195 200 205
gat ggt caa gcg cag ccg gcg act gca gat tac tat atc gtc act tgt 672
Asp Gly Gln Ala Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys
210 215 220
tgc cac acc tgc aat acc acc gtg cgt ctg tgt gtg aac agc acg gcg 720
Cys His Thr Cys Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala
225 230 235 240
agc gac ctg cgc acg atc caa cag ttg ttg atg ggc acc gtg aat atc 768
Ser Asp Leu Arg Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile
245 250 255
gtc tgc cca agc tgt gct cag ttg atg cac ggc gac acc ccg acc ctg 816
Val Cys Pro Ser Cys Ala Gln Leu Met His Gly Asp Thr Pro Thr Leu
260 265 270
cac gaa tac atg ctg gac ctg cag ccg gaa acc acg gat ctg tat tgt 864
His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Cys
275 280 285
tat gaa cag ctg aac gat agc agc gag gaa atg cac ggt ccg aaa gca 912
Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys Ala
290 295 300
act ctg cag gac att gtg ctg cat ctg gag cca cag aac gaa atc ccg 960
Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro
305 310 315 320
gtt gat ctg ctg tgc cac gag caa ctg agc gat tcc gaa gag gaa aac 1008
Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu Asn
325 330 335
gac gaa att gat atg cat ggt ccg cgc gag acc ctg caa gaa atc gtc 1056
Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val
340 345 350
ctg cac ctg gaa ccg caa aac gaa ctg gac cct gta gac ctg ctg tgc 1104
Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys
355 360 365
tac gaa cag ctg tcc gaa tct gaa gaa atg cgt ggt cac aaa ccg acg 1152
Tyr Glu Gln Leu Ser Glu Ser Glu Glu Met Arg Gly His Lys Pro Thr
370 375 380
ctg aaa gag tac atc ctg gac ctg tac ccg gaa cct acg gat ctg tac 1200
Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr
385 390 395 400
tgt tat gaa caa ctg agc gat agc 1224
Cys Tyr Glu Gln Leu Ser Asp Ser
405
<210> 52
<211> 408
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 52
Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp Arg Ala
1 5 10 15
His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg
20 25 30
Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu
35 40 45
Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro
50 55 60
Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro
65 70 75 80
Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile
85 90 95
Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln
100 105 110
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln
115 120 125
Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln Leu Pro Ala
130 135 140
Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys Cys Lys
145 150 155 160
Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu Asp Leu
165 170 175
Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val Cys Pro
180 185 190
Trp Cys Ala Thr Asn Gln Ser Asp Glu Asp Glu Gly Leu Asp Arg Pro
195 200 205
Asp Gly Gln Ala Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys
210 215 220
Cys His Thr Cys Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala
225 230 235 240
Ser Asp Leu Arg Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile
245 250 255
Val Cys Pro Ser Cys Ala Gln Leu Met His Gly Asp Thr Pro Thr Leu
260 265 270
His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr Cys
275 280 285
Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys Ala
290 295 300
Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro
305 310 315 320
Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu Asn
325 330 335
Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val
340 345 350
Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys
355 360 365
Tyr Glu Gln Leu Ser Glu Ser Glu Glu Met Arg Gly His Lys Pro Thr
370 375 380
Leu Lys Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr
385 390 395 400
Cys Tyr Glu Gln Leu Ser Asp Ser
405
<210> 53
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV16, 18, 45 and 58
acidic-deleted
<220>
<221> CDS
<222> (1)..(1080)
<400> 53
ggt cag gcg gaa ccg gat cgc gcg cac tac aac atc gtt act ttt tgt 48
Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys
1 5 10 15
tgc aaa tgt gat tcc act ctg cgc ctg tgt gtg caa tcc acc cac gta 96
Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val
20 25 30
gac atc cgc act ctg gaa gac ctg ctg atg ggt acc ctg ggt att gtt 144
Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val
35 40 45
tgt ccg att tgc tcc cag aag ccg gcg tct ggc gtt aac cac caa cac 192
Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His
50 55 60
ctg ccg gcg cgt cgc gca gag ccg cag cgt cac acc atg ctg tgc atg 240
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
65 70 75 80
tgc tgt aaa tgt gag gcc cgt att gaa ctg gtc gtt gag tct agc gcc 288
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
85 90 95
gac gat ctg cgt gcg ttt cag cag ctg ttc ctg aac acg ctg agc ttc 336
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
100 105 110
gtt tgc ccg tgg tgt gct agc cag cag ggc gtg tct cac gct cag ctg 384
Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His Ala Gln Leu
115 120 125
ccg gca cgt cgt gct gag cct cag cgt cac aaa atc ctg tgc gtg tgc 432
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys
130 135 140
tgc aaa tgc gat ggc cgc atc gaa ctg acc gtg gaa tct agc gca gaa 480
Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu
145 150 155 160
gac ctg cgt acg ctg cag caa ctg ttc ctg agc acg ctg tcc ttc gta 528
Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val
165 170 175
tgc cct tgg tgc gca act aat cag ggc cag gcg cag cca gcg acg gcc 576
Cys Pro Trp Cys Ala Thr Asn Gln Gly Gln Ala Gln Pro Ala Thr Ala
180 185 190
aat tac tac atc gtt acc tgt tgc tat acg tgc gat act acc gtc cgt 624
Asn Tyr Tyr Ile Val Thr Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg
195 200 205
ctg tgc att aac agc acc acc acg gac gtg cgt acc ctg caa cag ctg 672
Leu Cys Ile Asn Ser Thr Thr Thr Asp Val Arg Thr Leu Gln Gln Leu
210 215 220
ctg atg ggt acc tgc acg att gtt tgt ccg agc tgt gca caa caa atg 720
Leu Met Gly Thr Cys Thr Ile Val Cys Pro Ser Cys Ala Gln Gln Met
225 230 235 240
cac ggt gac acc ccg acc ctg cac gaa tac atg ctg gac ctg cag cca 768
His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro
245 250 255
gaa acc acc gat ctg tac tgt tac gaa cag ctg aac atg cat ggc cca 816
Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro
260 265 270
aaa gct act ctg cag gat atc gtc ctg cat ctg gaa cca cag aac gaa 864
Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu
275 280 285
atc ccg gta gat ctg ctg tgc cat gag cag ctg atg cat ggt ccg cgt 912
Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg
290 295 300
gaa acc ctg cag gaa atc gtt ctg cac ctg gaa ccg caa aac gaa ctg 960
Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu
305 310 315 320
gac ccg gtt gac ctg ctg tgc tat gaa cag ctg atg cgc ggt aat aac 1008
Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu Met Arg Gly Asn Asn
325 330 335
ccg acc ttg cgt gag tat atc ttg gac ctg cac ccg gag ccg acc gat 1056
Pro Thr Leu Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp
340 345 350
ctg ttc tgt tac gaa cag ctg tgc 1080
Leu Phe Cys Tyr Glu Gln Leu Cys
355 360
<210> 54
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 54
Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys
1 5 10 15
Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val
20 25 30
Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val
35 40 45
Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His
50 55 60
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met
65 70 75 80
Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala
85 90 95
Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe
100 105 110
Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His Ala Gln Leu
115 120 125
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys
130 135 140
Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu
145 150 155 160
Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val
165 170 175
Cys Pro Trp Cys Ala Thr Asn Gln Gly Gln Ala Gln Pro Ala Thr Ala
180 185 190
Asn Tyr Tyr Ile Val Thr Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg
195 200 205
Leu Cys Ile Asn Ser Thr Thr Thr Asp Val Arg Thr Leu Gln Gln Leu
210 215 220
Leu Met Gly Thr Cys Thr Ile Val Cys Pro Ser Cys Ala Gln Gln Met
225 230 235 240
His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro
245 250 255
Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro
260 265 270
Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu
275 280 285
Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg
290 295 300
Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu
305 310 315 320
Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu Met Arg Gly Asn Asn
325 330 335
Pro Thr Leu Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp
340 345 350
Leu Phe Cys Tyr Glu Gln Leu Cys
355 360
<210> 55
<211> 1227
<212> DNA
<213> Artificial Sequence
<220>
<223> polynucleotide for antigen E7 of HPV16, 18, 45 and 58 full
<220>
<221> CDS
<222> (1)..(1227)
<400> 55
gaa gac gaa atc gac ggc cct gcg ggc cag gct gaa cca gat cgt gct 48
Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp Arg Ala
1 5 10 15
cac tac aac atc gta act ttt tgc tgt aag tgc gat agc act ctg cgt 96
His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg
20 25 30
ctg tgc gta cag tct act cac gtt gat atc cgc act ctg gaa gat ctg 144
Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu
35 40 45
ctg atg ggt acc ctg ggt atc gtc tgc cca atc tgc tct caa aag cct 192
Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro
50 55 60
gct tct ggt gtt aac cat cag cac ctg ccg gct cgt cgc gct gaa cca 240
Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro
65 70 75 80
cag cgt cat acc atg ctg tgc atg tgt tgc aaa tgc gag gct cgc atc 288
Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile
85 90 95
gaa ctg gtt gtt gaa tcc agc gct gac gac ctg cgt gcg ttt cag caa 336
Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln
100 105 110
ctg ttc ctg aac acg ctg tct ttt gtt tgt ccg tgg tgt gcc tcc cag 384
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln
115 120 125
cag gag aac gat gaa gcg gat ggc gtg tcc cac gcg cag ctg ccg gca 432
Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln Leu Pro Ala
130 135 140
cgt cgt gca gaa ccg cag cgc cac aag att ctg tgc gtt tgc tgt aaa 480
Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys Cys Lys
145 150 155 160
tgt gat ggc cgt atc gaa ctg act gtg gaa tcc tcc gcg gaa gat ctg 528
Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu Asp Leu
165 170 175
cgt acg ctg cag cag ctg ttc ctg tct acc ctg tct ttc gtg tgc ccg 576
Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val Cys Pro
180 185 190
tgg tgc gcc acc aat caa tcc gac gag gac gaa atc ggc ctg gac cgt 624
Trp Cys Ala Thr Asn Gln Ser Asp Glu Asp Glu Ile Gly Leu Asp Arg
195 200 205
cct gat ggc cag gcc cag ccg gca acg gcg aac tat tac att gtg acc 672
Pro Asp Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr
210 215 220
tgc tgc tat acg tgc gat acc acg gtc cgt ctg tgc att aac tct acc 720
Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr
225 230 235 240
acc acg gat gtt cgc acg ctg cag caa ctg ctg atg ggt acc tgt acc 768
Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr
245 250 255
att gtt tgc ccg tct tgt gcc cag cag atg cac ggc gac acc ccg acc 816
Ile Val Cys Pro Ser Cys Ala Gln Gln Met His Gly Asp Thr Pro Thr
260 265 270
ctg cac gaa tac atg ctg gac ctg cag ccg gaa acc acg gat ctg tat 864
Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr
275 280 285
tgt tat gaa cag ctg aac gat agc agc gag gaa atg cac ggt ccg aaa 912
Cys Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys
290 295 300
gca act ctg cag gac att gtg ctg cat ctg gag cca cag aac gaa atc 960
Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile
305 310 315 320
ccg gtt gat ctg ctg tgc cac gag caa ctg agc gat tcc gaa gag gaa 1008
Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu
325 330 335
aac gac gaa att gat atg cat ggt ccg cgc gag acc ctg caa gaa atc 1056
Asn Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile
340 345 350
gtc ctg cac ctg gaa ccg caa aac gaa ctg gac cct gta gac ctg ctg 1104
Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu
355 360 365
tgc tac gaa cag ctg tcc gaa tct gaa gaa atg cgc ggt aac aat ccg 1152
Cys Tyr Glu Gln Leu Ser Glu Ser Glu Glu Met Arg Gly Asn Asn Pro
370 375 380
acc ctg cgc gag tac att ctg gac ttg cat ccg gaa ccg acg gac ctg 1200
Thr Leu Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu
385 390 395 400
ttc tgt tac gag cag ctg tgt gac agc 1227
Phe Cys Tyr Glu Gln Leu Cys Asp Ser
405
<210> 56
<211> 409
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 56
Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro Asp Arg Ala
1 5 10 15
His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg
20 25 30
Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu
35 40 45
Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro
50 55 60
Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro
65 70 75 80
Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile
85 90 95
Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln
100 105 110
Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln
115 120 125
Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln Leu Pro Ala
130 135 140
Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val Cys Cys Lys
145 150 155 160
Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala Glu Asp Leu
165 170 175
Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe Val Cys Pro
180 185 190
Trp Cys Ala Thr Asn Gln Ser Asp Glu Asp Glu Ile Gly Leu Asp Arg
195 200 205
Pro Asp Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr
210 215 220
Cys Cys Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr
225 230 235 240
Thr Thr Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr
245 250 255
Ile Val Cys Pro Ser Cys Ala Gln Gln Met His Gly Asp Thr Pro Thr
260 265 270
Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr
275 280 285
Cys Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys
290 295 300
Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile
305 310 315 320
Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu
325 330 335
Asn Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile
340 345 350
Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu
355 360 365
Cys Tyr Glu Gln Leu Ser Glu Ser Glu Glu Met Arg Gly Asn Asn Pro
370 375 380
Thr Leu Arg Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu
385 390 395 400
Phe Cys Tyr Glu Gln Leu Cys Asp Ser
405
<210> 57
<211> 5670
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleotide encoding chimeric CyaA delta 93+ antigen HPV16, HPV18
and HPV45 acidic-deleted
<220>
<221> CDS
<222> (1)..(5670)
<400> 57
atg cag cag tcc cat cag gcc ggt tac gca aac gca gcc gat cgt gaa 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggt atc ccg gca gcg gtt ctg gat ggt att aag gca gtt gcc aaa 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gag aag aac gct acc ctg atg ttc cgt ctg gtc aac cca cac tct act 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
tcc ctg atc gcg gaa ggt gtg gcg acc aaa ggc ctg ggt gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aaa agc agc gac tgg ggt ctg cag gca ggt tat att ccg gtg aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctg tct aaa ctg ttc ggt cgt gcc ccg gag gtg atc gca cgt gca 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gat gtc aac tct tct ctg gcg cat ggt cac acc gcg gtt gat 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acc ctg tcc aaa gaa cgc ctg gat tac ctg cgt cag gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtg acg ggc atg gcc gac ggt gtt gta gcg agc aac cac gcg ggt tat 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gaa caa ttt gag ttt cgc gtt aaa gag acc tct gac ggt cgt tac gcg 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tac cgc cgc aaa ggt ggc gat gac ttt gaa gct gtc aaa gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggt aac gct gct gga att ccg ctg acc gcg gat atc gac atg ttt 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc atc atg cct cac ctg tcc aac ttt cgc gat tcc gca cgc agc tct 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acg tct ggt gat tcc gtc act gac tac ctg gct cgt acc cgt cgt 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcg gcc tct ggt cag gcg gaa ccg gat cgc gcg cac tac aac atc gtt 720
Ala Ala Ser Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val
225 230 235 240
act ttt tgt tgc aaa tgt gat tcc act ctg cgc ctg tgt gtg caa tcc 768
Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser
245 250 255
acc cac gta gac att cgc act ctg gaa gac ctg ctg atg ggt acc ctt 816
Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu
260 265 270
ggt att gtt tgt ccg att tgc tcc cag aag ccg gcg tct ggc gtt aac 864
Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn
275 280 285
cac caa cac ctg ccg gcg cgt cgc gca gag ccg cag cgt cac acc atg 912
His Gln His Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met
290 295 300
ctg tgc atg tgc tgt aaa tgt gag gcc cgt atc gag ctg gtc gtt gag 960
Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu
305 310 315 320
tct agc gcc gac gat ctg cgt gcg ttt cag cag ctg ttc ctg aac acg 1008
Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr
325 330 335
ctg agc ttc gtt tgc ccg tgg tgt gct agc cag cag ggc gtg tct cac 1056
Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His
340 345 350
gct cag ctg ccg gca cgt cgt gct gag cct cag cgt cac aaa atc ctg 1104
Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu
355 360 365
tgc gtg tgc tgc aaa tgc gat ggc cgc atc gaa ctg acc gtg gaa tct 1152
Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser
370 375 380
agc gca gaa gac ctg cgt acg ctg cag caa ctg ttc ctg agc acg ctg 1200
Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu
385 390 395 400
tcc ttc gta tgc cct tgg tgc gca act aat cag atg cac ggt gac acc 1248
Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr
405 410 415
ccg acc ctg cac gaa tac atg ctg gac ctg cag cca gaa acc acc gat 1296
Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp
420 425 430
ctg tac tgt tac gaa cag ctg aac atg cat ggc cca aaa gct act ctg 1344
Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro Lys Ala Thr Leu
435 440 445
cag gat atc gtc ctg cat ctg gaa cca cag aac gaa atc ccg gta gat 1392
Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp
450 455 460
ctg ctg tgc cat gag cag ctg atg cat ggt ccg cgt gaa acc ctg cag 1440
Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg Glu Thr Leu Gln
465 470 475 480
gaa atc gtt ctg cac ctg gaa ccg caa aac gaa ctg gac ccg gtt gac 1488
Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp
485 490 495
ctg ctg tgc tat gaa cag ctg gaa tcc cag atg ctg act cgt ggc cag 1536
Leu Leu Cys Tyr Glu Gln Leu Glu Ser Gln Met Leu Thr Arg Gly Gln
500 505 510
ctg aaa gaa tac atc ggc caa cag cgt ggc gaa ggc tac gtt ttc tac 1584
Leu Lys Glu Tyr Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr
515 520 525
gag aat cgt gct tac ggc gtt gcg ggc aaa tcc ctg ttc gac gat ggt 1632
Glu Asn Arg Ala Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly
530 535 540
ctg ggc gct gca ccg ggc gtt ccg agc ggc cgt tct aaa ttc agc ccg 1680
Leu Gly Ala Ala Pro Gly Val Pro Ser Gly Arg Ser Lys Phe Ser Pro
545 550 555 560
gac gta ctg gaa act gtg ccg gct tcc ccg ggc ctg cgc cgt ccg tcc 1728
Asp Val Leu Glu Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser
565 570 575
ctg ggc gca gtc gaa cgt cag gac tcc ggc tac gat tcc ctg gat ggc 1776
Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly
580 585 590
gtt ggc tcc cgc tcc ttc tcc ctg ggc gag gtt tct gac atg gct gcg 1824
Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala
595 600 605
gtg gaa gcg gca gag ctg gaa atg acc cgt caa gtg ctg cac gcg ggc 1872
Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly
610 615 620
gca cgt cag gac gat gct gag ccg ggc gtg tcc ggt gcg tct gca cac 1920
Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His
625 630 635 640
tgg ggt caa cgt gcc ctg cag ggt gct caa gct gtc gcg gca gcg cag 1968
Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln
645 650 655
cgt ctg gta cat gcg atc gca ctg atg acc cag ttc ggt cgc gca ggt 2016
Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly
660 665 670
tct acc aac act cct cag gaa gca gct agc ctg tct gct gct gtt ttc 2064
Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe
675 680 685
ggt ctg ggc gaa gcg tct tct gcg gtt gca gaa acc gtg agc ggt ttc 2112
Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe
690 695 700
ttc cgt ggt tct agc cgc tgg gcg ggt ggt ttt ggt gta gca ggt ggc 2160
Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly
705 710 715 720
gct atg gcc ctg ggt ggc ggt atc gcg gct gct gtc ggc gca ggt atg 2208
Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met
725 730 735
agc ctg acc gac gat gct cct gcg ggc cag aaa gcc gca gct ggc gct 2256
Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala
740 745 750
gaa atc gcg ctg cag ctg act ggt ggt acc gtt gaa ctg gct agc tct 2304
Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser
755 760 765
atc gcg ctg gct ctg gca gcg gca cgt ggc gtg act tct ggc ctg caa 2352
Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln
770 775 780
gtc gcc ggt gcc tct gcg ggc gct gct gcg ggc gct ctg gca gct gca 2400
Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala
785 790 795 800
ctg tcc ccc atg gaa atc tac ggt ctg gta cag cag tct cac tac gca 2448
Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala
805 810 815
gac cag ctg gat aaa ctg gcg cag gag tct tct gca tac ggt tac gaa 2496
Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu
820 825 830
ggc gac gca ctg ctg gcg cag ctg tat cgt gac aaa act gct gct gaa 2544
Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu
835 840 845
ggt gct gtg gca ggc gtt tct gcg gta ctg tct acc gtt ggc gct gcg 2592
Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala
850 855 860
gtt tct att gcg gct gcc gca tcc gtt gta ggt gcg ccg gtt gct gta 2640
Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val
865 870 875 880
gtt acc tct ctg ctg act ggt gca ctg aac ggt atc ctg cgt ggt gtt 2688
Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val
885 890 895
cag cag cct att atc gaa aaa ctg gcg aat gat tat gcc cgt aaa atc 2736
Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile
900 905 910
gac gaa ctg ggc ggt ccg cag gct tat ttt gaa aaa aac ctg cag gcg 2784
Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala
915 920 925
cgc cac gaa cag ctg gca aac agc gac ggc ctg cgc aaa atg ctg gca 2832
Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala
930 935 940
gac ctg caa gct ggt tgg aac gcg tct tct gtg atc ggc gtg cag acc 2880
Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr
945 950 955 960
acc gaa att agc aaa tct gcg ctg gaa ctg gct gca att act ggc aac 2928
Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn
965 970 975
gcg gat aac ctg aaa agc gtt gat gtt ttt gtc gat cgc ttc gtt cag 2976
Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln
980 985 990
ggc gag cgc gtt gct ggt cag ccg gtt gtt ctg gac gtt gcg gca ggc 3024
Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly
995 1000 1005
ggc atc gac atc gct agc cgc aag ggc gag cgt ccg gct ctg act 3069
Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr
1010 1015 1020
ttc att acc ccg ctg gca gct ccg ggt gaa gaa cag cgt cgc cgt 3114
Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg
1025 1030 1035
acc aag act ggt aaa agc gag ttc acc acc ttc gtg gaa atc gta 3159
Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val
1040 1045 1050
ggt aaa cag gac cgc tgg cgt att cgc gac ggt gcg gcg gac acc 3204
Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr
1055 1060 1065
acc atc gac ctg gca aaa gtt gtt tcc caa ctg gta gat gct aac 3249
Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn
1070 1075 1080
ggc gtg ctg aaa cat tct att aaa ctg gat gta atc ggc ggt gac 3294
Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile Gly Gly Asp
1085 1090 1095
ggc gat gac gtt gta ctg gcg aac gcg tct cgt atc cac tat gac 3339
Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His Tyr Asp
1100 1105 1110
ggc ggc gca ggt acc aac acg gtt tcc tac gca gcg ctg ggc cgc 3384
Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg
1115 1120 1125
cag gat tcc atc act gtt agc gcc gat ggc gaa cgt ttc aac gtg 3429
Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
1130 1135 1140
cgt aaa cag ctg aat aac gca aac gtc tat cgt gag ggt gta gct 3474
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala
1145 1150 1155
acc cag acc acc gcg tac ggt aag cgt acc gaa aac gtt cag tat 3519
Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr
1160 1165 1170
cgt cac gtg gaa ctg gca cgt gtg ggt cag ctg gta gag gtg gat 3564
Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
1175 1180 1185
acg ctg gaa cac gtg cag cac atc atc ggt ggc gcc ggt aac gat 3609
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp
1190 1195 1200
tcc att act ggt aac gct cac gac aac ttc ctg gca ggt ggt tct 3654
Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
1205 1210 1215
ggt gat gat cgt ctg gac ggt ggt gcg ggt aac gat acg ctg gta 3699
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val
1220 1225 1230
ggc ggc gaa ggt cag aac acc gta att ggt ggt gcc ggt gac gac 3744
Gly Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp
1235 1240 1245
gtt ttc ctg cag gat ctg ggc gtt tgg agc aac cag ctg gat ggc 3789
Val Phe Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly
1250 1255 1260
ggt gcc ggt gtt gac acg gtt aag tat aac gtt cac cag ccg tct 3834
Gly Ala Gly Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser
1265 1270 1275
gaa gag cgc ctg gaa cgt atg ggt gac act ggt att cat gcc gat 3879
Glu Glu Arg Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp
1280 1285 1290
ctg cag aaa ggc act gtt gaa aaa tgg cct gcg ctg aac ctg ttc 3924
Leu Gln Lys Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe
1295 1300 1305
tct gtg gac cat gtt aag aac att gaa aac ctg cat ggc tct cgc 3969
Ser Val Asp His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg
1310 1315 1320
ctg aac gac cgt atc gct ggt gac gac cag gat aac gaa ctg tgg 4014
Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp
1325 1330 1335
ggt cat gac ggc aat gat acc att cgc ggt cgt ggc ggc gac gat 4059
Gly His Asp Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp
1340 1345 1350
att ctg cgt ggc ggt ctg ggc ctg gat acc ctg tat ggt gaa gat 4104
Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp
1355 1360 1365
ggt aac gat att ttc ctg caa gac gat gaa acg gta tct gat gac 4149
Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp
1370 1375 1380
atc gac ggt ggt gca ggc ctg gac acc gta gat tac agc gct atg 4194
Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met
1385 1390 1395
atc cat ccg ggt cgt atc gta gct ccg cac gag tac ggc ttc ggt 4239
Ile His Pro Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly
1400 1405 1410
atc gag gcg gac ctg tct cgt gaa tgg gtt cgt aaa gcg tcc gcg 4284
Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala
1415 1420 1425
ctg ggt gtg gac tac tac gat aac gtt cgt aac gtg gaa aac gtg 4329
Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val
1430 1435 1440
atc ggt acc tcc atg aaa gac gtg ctg att ggc gac gca cag gcc 4374
Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala
1445 1450 1455
aac act ctg atg ggc cag ggc ggt gat gac acg gtt cgc ggc ggc 4419
Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly
1460 1465 1470
gac ggt gat gac ctg ctg ttc ggt ggt gac ggc aac gac atg ctg 4464
Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu
1475 1480 1485
tac ggc gac gcg ggc aac gac acc ctg tac ggc ggt ctg ggt gac 4509
Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp
1490 1495 1500
gac act ctg gaa ggt ggt gca ggt aac gac tgg ttc ggc caa acc 4554
Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr
1505 1510 1515
cag gca cgc gaa cac gac gtg ctg cgt ggt ggc gac ggc gta gac 4599
Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp
1520 1525 1530
acc gtg gat tac tcc caa act ggc gct cac gcg ggt atc gcg gcc 4644
Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala
1535 1540 1545
ggt cgt atc ggt ctg ggc att ctg gcc gat ctg ggt gcc ggc cgt 4689
Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg
1550 1555 1560
gtc gac aaa ctg ggt gag gct ggc tct agc gcc tat gat act gtt 4734
Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val
1565 1570 1575
tcc ggc atc gaa aac gtg gta ggc act gaa ctg gca gat cgt atc 4779
Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile
1580 1585 1590
acg ggt gac gcg caa gcg aac gtt ctg cgt ggt gct ggc ggt gca 4824
Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala
1595 1600 1605
gac gtg ctg gcg ggt ggt gaa ggc gac gac gta ctg ctg ggc ggt 4869
Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly
1610 1615 1620
gac ggt gac gat cag ctg agc ggt gat gcg ggt cgt gac cgt ctg 4914
Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu
1625 1630 1635
tac ggt gaa gca ggt gac gat tgg ttc ttc cag gac gct gct aac 4959
Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn
1640 1645 1650
gct ggc aac ctg ctg gac ggc ggc gat ggc cgt gac act gtt gac 5004
Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp
1655 1660 1665
ttc agc ggt ccg ggt cgc ggt ctg gac gca ggc gcg aaa ggc gtt 5049
Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val
1670 1675 1680
ttc ctg agc ctg ggt aag ggt ttc gca tct ctg atg gac gaa cca 5094
Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro
1685 1690 1695
gaa acc agc aat gtc ctg cgt aac atc gaa aac gct gtc ggt tcc 5139
Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser
1700 1705 1710
gca cgc gat gat gtt ctg att ggc gat gct ggt gcc aat gtt ctg 5184
Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu
1715 1720 1725
aac ggt ctg gcg ggt aat gat gta ctg tct ggt ggc gct ggt gat 5229
Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp
1730 1735 1740
gat gtc ctg ctg ggt gat gag ggc agc gat ctg ctg tcc ggc gat 5274
Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp
1745 1750 1755
gcc ggc aac gac gat ctg ttc ggt ggc caa ggt gat gat act tac 5319
Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr
1760 1765 1770
ctg ttc ggc gtt ggc tat ggt cat gac acc atc tat gag tct ggt 5364
Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly
1775 1780 1785
ggc ggc cac gat acg att cgt att aat gca ggt gct gac caa ctg 5409
Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu
1790 1795 1800
tgg ttt gca cgt cag ggt aac gat ctg gaa att cgc atc ctg ggt 5454
Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly
1805 1810 1815
act gat gac gct ctg acc gta cac gac tgg tac cgc gat gcg gat 5499
Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp
1820 1825 1830
cac cgc gta gaa atc atc cat gcg gct aac caa gct gta gac cag 5544
His Arg Val Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln
1835 1840 1845
gct ggt att gaa aaa ctg gta gaa gcg atg gca cag tat ccg gac 5589
Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp
1850 1855 1860
cca ggt gcg gct gct gca gca cct cca gcg gct cgt gtg ccg gat 5634
Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp
1865 1870 1875
acc ctg atg cag agc ctg gcc gtc aat tgg cgt taa 5670
Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1880 1885
<210> 58
<211> 1889
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 58
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Gly Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val
225 230 235 240
Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser
245 250 255
Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu
260 265 270
Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn
275 280 285
His Gln His Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met
290 295 300
Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu
305 310 315 320
Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr
325 330 335
Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln Gln Gly Val Ser His
340 345 350
Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu
355 360 365
Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser
370 375 380
Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu
385 390 395 400
Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr
405 410 415
Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp
420 425 430
Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro Lys Ala Thr Leu
435 440 445
Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile Pro Val Asp
450 455 460
Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg Glu Thr Leu Gln
465 470 475 480
Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp
485 490 495
Leu Leu Cys Tyr Glu Gln Leu Glu Ser Gln Met Leu Thr Arg Gly Gln
500 505 510
Leu Lys Glu Tyr Ile Gly Gln Gln Arg Gly Glu Gly Tyr Val Phe Tyr
515 520 525
Glu Asn Arg Ala Tyr Gly Val Ala Gly Lys Ser Leu Phe Asp Asp Gly
530 535 540
Leu Gly Ala Ala Pro Gly Val Pro Ser Gly Arg Ser Lys Phe Ser Pro
545 550 555 560
Asp Val Leu Glu Thr Val Pro Ala Ser Pro Gly Leu Arg Arg Pro Ser
565 570 575
Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu Asp Gly
580 585 590
Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met Ala Ala
595 600 605
Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His Ala Gly
610 615 620
Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser Ala His
625 630 635 640
Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala Ala Gln
645 650 655
Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg Ala Gly
660 665 670
Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala Val Phe
675 680 685
Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser Gly Phe
690 695 700
Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala Gly Gly
705 710 715 720
Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala Gly Met
725 730 735
Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala Gly Ala
740 745 750
Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala Ser Ser
755 760 765
Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly Leu Gln
770 775 780
Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala Ala Ala
785 790 795 800
Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His Tyr Ala
805 810 815
Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly Tyr Glu
820 825 830
Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala Ala Glu
835 840 845
Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly Ala Ala
850 855 860
Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val Ala Val
865 870 875 880
Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg Gly Val
885 890 895
Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg Lys Ile
900 905 910
Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu Gln Ala
915 920 925
Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met Leu Ala
930 935 940
Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val Gln Thr
945 950 955 960
Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr Gly Asn
965 970 975
Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe Val Gln
980 985 990
Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala Ala Gly
995 1000 1005
Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu Thr
1010 1015 1020
Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg
1025 1030 1035
Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val
1040 1045 1050
Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr
1055 1060 1065
Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn
1070 1075 1080
Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile Gly Gly Asp
1085 1090 1095
Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His Tyr Asp
1100 1105 1110
Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg
1115 1120 1125
Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
1130 1135 1140
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala
1145 1150 1155
Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr
1160 1165 1170
Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
1175 1180 1185
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp
1190 1195 1200
Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
1205 1210 1215
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val
1220 1225 1230
Gly Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp
1235 1240 1245
Val Phe Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly
1250 1255 1260
Gly Ala Gly Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser
1265 1270 1275
Glu Glu Arg Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp
1280 1285 1290
Leu Gln Lys Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe
1295 1300 1305
Ser Val Asp His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg
1310 1315 1320
Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp
1325 1330 1335
Gly His Asp Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp
1340 1345 1350
Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp
1355 1360 1365
Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp
1370 1375 1380
Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met
1385 1390 1395
Ile His Pro Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly
1400 1405 1410
Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala
1415 1420 1425
Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val
1430 1435 1440
Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala
1445 1450 1455
Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly
1460 1465 1470
Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu
1475 1480 1485
Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp
1490 1495 1500
Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr
1505 1510 1515
Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp
1520 1525 1530
Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala
1535 1540 1545
Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg
1550 1555 1560
Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val
1565 1570 1575
Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile
1580 1585 1590
Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala
1595 1600 1605
Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly
1610 1615 1620
Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu
1625 1630 1635
Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn
1640 1645 1650
Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp
1655 1660 1665
Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val
1670 1675 1680
Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro
1685 1690 1695
Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser
1700 1705 1710
Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu
1715 1720 1725
Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp
1730 1735 1740
Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp
1745 1750 1755
Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr
1760 1765 1770
Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly
1775 1780 1785
Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu
1790 1795 1800
Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly
1805 1810 1815
Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp
1820 1825 1830
His Arg Val Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln
1835 1840 1845
Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp
1850 1855 1860
Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp
1865 1870 1875
Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1880 1885
<210> 59
<211> 12000
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid comprising SEQ ID NO:57
<400> 59
atcgagatct gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 60
gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 120
tgaaatgagc tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat 180
aacaattata attttgttta actttaagaa ggagatatac atatgcagca gtcccatcag 240
gccggttacg caaacgcagc cgatcgtgaa tctggtatcc cggcagcggt tctggatggt 300
attaaggcag ttgccaaaga gaagaacgct accctgatgt tccgtctggt caacccacac 360
tctacttccc tgatcgcgga aggtgtggcg accaaaggcc tgggtgtgca cgccaaaagc 420
agcgactggg gtctgcaggc aggttatatt ccggtgaacc cgaatctgtc taaactgttc 480
ggtcgtgccc cggaggtgat cgcacgtgca gacaacgatg tcaactcttc tctggcgcat 540
ggtcacaccg cggttgatct gaccctgtcc aaagaacgcc tggattacct gcgtcaggcg 600
ggcctggtga cgggcatggc cgacggtgtt gtagcgagca accacgcggg ttatgaacaa 660
tttgagtttc gcgttaaaga gacctctgac ggtcgttacg cggtgcagta ccgccgcaaa 720
ggtggcgatg actttgaagc tgtcaaagtg atcggtaacg ctgctggaat tccgctgacc 780
gcggatatcg acatgtttgc catcatgcct cacctgtcca actttcgcga ttccgcacgc 840
agctctgtga cgtctggtga ttccgtcact gactacctgg ctcgtacccg tcgtgcggcc 900
tctggtcagg cggaaccgga tcgcgcgcac tacaacatcg ttactttttg ttgcaaatgt 960
gattccactc tgcgcctgtg tgtgcaatcc acccacgtag acattcgcac tctggaagac 1020
ctgctgatgg gtacccttgg tattgtttgt ccgatttgct cccagaagcc ggcgtctggc 1080
gttaaccacc aacacctgcc ggcgcgtcgc gcagagccgc agcgtcacac catgctgtgc 1140
atgtgctgta aatgtgaggc ccgtatcgag ctggtcgttg agtctagcgc cgacgatctg 1200
cgtgcgtttc agcagctgtt cctgaacacg ctgagcttcg tttgcccgtg gtgtgctagc 1260
cagcagggcg tgtctcacgc tcagctgccg gcacgtcgtg ctgagcctca gcgtcacaaa 1320
atcctgtgcg tgtgctgcaa atgcgatggc cgcatcgaac tgaccgtgga atctagcgca 1380
gaagacctgc gtacgctgca gcaactgttc ctgagcacgc tgtccttcgt atgcccttgg 1440
tgcgcaacta atcagatgca cggtgacacc ccgaccctgc acgaatacat gctggacctg 1500
cagccagaaa ccaccgatct gtactgttac gaacagctga acatgcatgg cccaaaagct 1560
actctgcagg atatcgtcct gcatctggaa ccacagaacg aaatcccggt agatctgctg 1620
tgccatgagc agctgatgca tggtccgcgt gaaaccctgc aggaaatcgt tctgcacctg 1680
gaaccgcaaa acgaactgga cccggttgac ctgctgtgct atgaacagct ggaatcccag 1740
atgctgactc gtggccagct gaaagaatac atcggccaac agcgtggcga aggctacgtt 1800
ttctacgaga atcgtgctta cggcgttgcg ggcaaatccc tgttcgacga tggtctgggc 1860
gctgcaccgg gcgttccgag cggccgttct aaattcagcc cggacgtact ggaaactgtg 1920
ccggcttccc cgggcctgcg ccgtccgtcc ctgggcgcag tcgaacgtca ggactccggc 1980
tacgattccc tggatggcgt tggctcccgc tccttctccc tgggcgaggt ttctgacatg 2040
gctgcggtgg aagcggcaga gctggaaatg acccgtcaag tgctgcacgc gggcgcacgt 2100
caggacgatg ctgagccggg cgtgtccggt gcgtctgcac actggggtca acgtgccctg 2160
cagggtgctc aagctgtcgc ggcagcgcag cgtctggtac atgcgatcgc actgatgacc 2220
cagttcggtc gcgcaggttc taccaacact cctcaggaag cagctagcct gtctgctgct 2280
gttttcggtc tgggcgaagc gtcttctgcg gttgcagaaa ccgtgagcgg tttcttccgt 2340
ggttctagcc gctgggcggg tggttttggt gtagcaggtg gcgctatggc cctgggtggc 2400
ggtatcgcgg ctgctgtcgg cgcaggtatg agcctgaccg acgatgctcc tgcgggccag 2460
aaagccgcag ctggcgctga aatcgcgctg cagctgactg gtggtaccgt tgaactggct 2520
agctctatcg cgctggctct ggcagcggca cgtggcgtga cttctggcct gcaagtcgcc 2580
ggtgcctctg cgggcgctgc tgcgggcgct ctggcagctg cactgtcccc catggaaatc 2640
tacggtctgg tacagcagtc tcactacgca gaccagctgg ataaactggc gcaggagtct 2700
tctgcatacg gttacgaagg cgacgcactg ctggcgcagc tgtatcgtga caaaactgct 2760
gctgaaggtg ctgtggcagg cgtttctgcg gtactgtcta ccgttggcgc tgcggtttct 2820
attgcggctg ccgcatccgt tgtaggtgcg ccggttgctg tagttacctc tctgctgact 2880
ggtgcactga acggtatcct gcgtggtgtt cagcagccta ttatcgaaaa actggcgaat 2940
gattatgccc gtaaaatcga cgaactgggc ggtccgcagg cttattttga aaaaaacctg 3000
caggcgcgcc acgaacagct ggcaaacagc gacggcctgc gcaaaatgct ggcagacctg 3060
caagctggtt ggaacgcgtc ttctgtgatc ggcgtgcaga ccaccgaaat tagcaaatct 3120
gcgctggaac tggctgcaat tactggcaac gcggataacc tgaaaagcgt tgatgttttt 3180
gtcgatcgct tcgttcaggg cgagcgcgtt gctggtcagc cggttgttct ggacgttgcg 3240
gcaggcggca tcgacatcgc tagccgcaag ggcgagcgtc cggctctgac tttcattacc 3300
ccgctggcag ctccgggtga agaacagcgt cgccgtacca agactggtaa aagcgagttc 3360
accaccttcg tggaaatcgt aggtaaacag gaccgctggc gtattcgcga cggtgcggcg 3420
gacaccacca tcgacctggc aaaagttgtt tcccaactgg tagatgctaa cggcgtgctg 3480
aaacattcta ttaaactgga tgtaatcggc ggtgacggcg atgacgttgt actggcgaac 3540
gcgtctcgta tccactatga cggcggcgca ggtaccaaca cggtttccta cgcagcgctg 3600
ggccgccagg attccatcac tgttagcgcc gatggcgaac gtttcaacgt gcgtaaacag 3660
ctgaataacg caaacgtcta tcgtgagggt gtagctaccc agaccaccgc gtacggtaag 3720
cgtaccgaaa acgttcagta tcgtcacgtg gaactggcac gtgtgggtca gctggtagag 3780
gtggatacgc tggaacacgt gcagcacatc atcggtggcg ccggtaacga ttccattact 3840
ggtaacgctc acgacaactt cctggcaggt ggttctggtg atgatcgtct ggacggtggt 3900
gcgggtaacg atacgctggt aggcggcgaa ggtcagaaca ccgtaattgg tggtgccggt 3960
gacgacgttt tcctgcagga tctgggcgtt tggagcaacc agctggatgg cggtgccggt 4020
gttgacacgg ttaagtataa cgttcaccag ccgtctgaag agcgcctgga acgtatgggt 4080
gacactggta ttcatgccga tctgcagaaa ggcactgttg aaaaatggcc tgcgctgaac 4140
ctgttctctg tggaccatgt taagaacatt gaaaacctgc atggctctcg cctgaacgac 4200
cgtatcgctg gtgacgacca ggataacgaa ctgtggggtc atgacggcaa tgataccatt 4260
cgcggtcgtg gcggcgacga tattctgcgt ggcggtctgg gcctggatac cctgtatggt 4320
gaagatggta acgatatttt cctgcaagac gatgaaacgg tatctgatga catcgacggt 4380
ggtgcaggcc tggacaccgt agattacagc gctatgatcc atccgggtcg tatcgtagct 4440
ccgcacgagt acggcttcgg tatcgaggcg gacctgtctc gtgaatgggt tcgtaaagcg 4500
tccgcgctgg gtgtggacta ctacgataac gttcgtaacg tggaaaacgt gatcggtacc 4560
tccatgaaag acgtgctgat tggcgacgca caggccaaca ctctgatggg ccagggcggt 4620
gatgacacgg ttcgcggcgg cgacggtgat gacctgctgt tcggtggtga cggcaacgac 4680
atgctgtacg gcgacgcggg caacgacacc ctgtacggcg gtctgggtga cgacactctg 4740
gaaggtggtg caggtaacga ctggttcggc caaacccagg cacgcgaaca cgacgtgctg 4800
cgtggtggcg acggcgtaga caccgtggat tactcccaaa ctggcgctca cgcgggtatc 4860
gcggccggtc gtatcggtct gggcattctg gccgatctgg gtgccggccg tgtcgacaaa 4920
ctgggtgagg ctggctctag cgcctatgat actgtttccg gcatcgaaaa cgtggtaggc 4980
actgaactgg cagatcgtat cacgggtgac gcgcaagcga acgttctgcg tggtgctggc 5040
ggtgcagacg tgctggcggg tggtgaaggc gacgacgtac tgctgggcgg tgacggtgac 5100
gatcagctga gcggtgatgc gggtcgtgac cgtctgtacg gtgaagcagg tgacgattgg 5160
ttcttccagg acgctgctaa cgctggcaac ctgctggacg gcggcgatgg ccgtgacact 5220
gttgacttca gcggtccggg tcgcggtctg gacgcaggcg cgaaaggcgt tttcctgagc 5280
ctgggtaagg gtttcgcatc tctgatggac gaaccagaaa ccagcaatgt cctgcgtaac 5340
atcgaaaacg ctgtcggttc cgcacgcgat gatgttctga ttggcgatgc tggtgccaat 5400
gttctgaacg gtctggcggg taatgatgta ctgtctggtg gcgctggtga tgatgtcctg 5460
ctgggtgatg agggcagcga tctgctgtcc ggcgatgccg gcaacgacga tctgttcggt 5520
ggccaaggtg atgatactta cctgttcggc gttggctatg gtcatgacac catctatgag 5580
tctggtggcg gccacgatac gattcgtatt aatgcaggtg ctgaccaact gtggtttgca 5640
cgtcagggta acgatctgga aattcgcatc ctgggtactg atgacgctct gaccgtacac 5700
gactggtacc gcgatgcgga tcaccgcgta gaaatcatcc atgcggctaa ccaagctgta 5760
gaccaggctg gtattgaaaa actggtagaa gcgatggcac agtatccgga cccaggtgcg 5820
gctgctgcag cacctccagc ggctcgtgtg ccggataccc tgatgcagag cctggccgtc 5880
aattggcgtt aatggatcca ggcctcttta gaaggagata taccatgctg ccgtctgcac 5940
aggcgccgtc tctgctgaat ccaactgatg acttcgctgc gctgggtaac atcgcgtggc 6000
tgtggatgaa cagcccgatg caccgtgact ggccggttca cctgctggca cgtaacacgc 6060
tggcgccgat ccagctgggt caatacatcc tgctgcgttg taacgacgtg cctgtggcgt 6120
attgctcctg ggcactgatg gatgcggata ccgagctgtc ctacgttatg gccccatcta 6180
gcctgggcgg taacgcttgg aactgcggcg atcgtctgtg gatcattgat tggattgctc 6240
cgtttagccg tgacgacaac cgtgctctgc gtcgcgcgct ggccgaacgt catccggatt 6300
ctgttggccg ttccctgcgc gtacgtcgcg gtggcgacac cgctcgcgtc aaagaatacc 6360
gtggtcgtgc tctggacgca gcggcggccc gcgctcagct ggaccgctac cacgcagaac 6420
tgattgccgg tctgcgtgca tccaatggcg gttatgctcc gcgtggccgt ggcaccgcat 6480
aatctagaat tctttaatta aagatccggc tgctaacaaa gcccgaaagg aagctgagtt 6540
ggctgctgcc accgctgagc aatccaggca tcaaataaaa cgaaaggctc agtcgaaaga 6600
ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc 6660
gccgggagcg gatttgaacg ttgcgaagca acggcccgga gggtggcggg caggacgccc 6720
gccataaact gccaggcatc aaattaagca gaaggccatc ctgacggatg gcctttttgc 6780
tagcagcacg ccatagtgac tggcgatgct gtcggaatgg acgatatccc gcaagaggcc 6840
cggcagtacc ggcataacca agcctatgcc tacagcatcc agggtgacgg tgccgaggat 6900
gacgatgagc gcattgttag atttcataca cggtgcctga ctgcgttagc aatttaactg 6960
tgataaacta ccgcattaaa gcttatcgat gataagctgt caaacatgag aattcttaga 7020
aaaactcatc gagcatcaaa tgaaactgca atttattcat atcaggatta tcaataccat 7080
atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga 7140
tggcaagatc ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta 7200
atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat 7260
ccggtgagaa tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat 7320
tacgctcgtc atcaaaatca ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct 7380
gagcgagacg aaatacgcga tcgctgttaa aaggacaatt acaaacagga atcgaatgca 7440
accggcgcag gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt 7500
ctaatacctg gaatgctgtt ttcccgggga tcgcagtggt gagtaaccat gcatcatcag 7560
gagtacggat aaaatgcttg atggtcggaa gaggcataaa ttccgtcagc cagtttagtc 7620
tgaccatctc atctgtaaca tcattggcaa cgctaccttt gccatgtttc agaaacaact 7680
ctggcgcatc gggcttccca tacaatcgat agattgtcgc acctgattgc ccgacattat 7740
cgcgagccca tttataccca tataaatcag catccatgtt ggaatttaat cgcggcctcg 7800
agcaagacgt ttcccgttga atatggctca taacacccct tgtattactg tttatgtaag 7860
cagacagttt tattgttcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 7920
tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 7980
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 8040
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc 8100
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 8160
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 8220
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 8280
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 8340
gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 8400
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 8460
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 8520
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 8580
tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 8640
attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 8700
tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc 8760
ggtatttcac accgcaatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa 8820
gccagtatac actccgctat cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc 8880
aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc 8940
tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc 9000
gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg 9060
ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc ttctgataaa 9120
gcgggccatg ttaagggcgg ttttttcctg tttggtcact gatgcctccg tgtaaggggg 9180
atttctgttc atgggggtaa tgataccgat gaaacgagag aggatgctca cgatacgggt 9240
tactgatgat gaacatgccc ggttactgga acgttgtgag ggtaaacaac tggcggtatg 9300
gatgcggcgg gaccagagaa aaatcactca gggtcaatgc cagcgcttcg ttaatacaga 9360
tgtaggtgtt ccacagggta gccagcagca tcctgcgatg cagatccgga acataatggt 9420
gcagggcgct gacttccgcg tttccagact ttacgaaaca cggaaaccga agaccattca 9480
tgttgttgct caggtcgcag acgttttgca gcagcagtcg cttcacgttc gctcgcgtat 9540
cggtgattca ttctgctaac cagtaaggca accccgccag cctagccggg tcctcaacga 9600
caggagcacg atcatgcgca cccgtggcca ggacccaacg ctgcccgaga tgcgccgcgt 9660
gcggctgctg gagatggcgg acgcgatgga tatgttctgc caagggttgg tttgcgcatt 9720
cacagttctc cgcaagaatt gattggctcc aattcttgga gtggtgaatc cgttagcgag 9780
gtgccgccgg cttccattca ggtcgaggtg gcccggctcc atgcaccgcg acgcaacgcg 9840
gggaggcaga caaggtatag ggcggcgcct acaatccatg ccaacccgtt ccatgtgctc 9900
gccgaggcgg cataaatcgc cgtgacgatc agcggtccaa tgatcgaagt taggctggta 9960
agagccgcga gcgatccttg aagctgtccc tgatggtcgt catctacctg cctggacagc 10020
atggcctgca acgcgggcat cccgatgccg ccggaagcga gaagaatcat aatggggaag 10080
gccatccagc ctcgcgtcgc gaacgccagc aagacgtagc ccagcgcgtc ggccgccatg 10140
ccggcgataa tggcctgctt ctcgccgaaa cgtttggtgg cgggaccagt gacgaaggct 10200
tgagcgaggg cgtgcaagat tccgaatacc gcaagcgaca ggccgatcat cgtcgcgctc 10260
cagcgaaagc ggtcctcgcc gaaaatgacc cagagcgctg ccggcacctg tcctacgagt 10320
tgcatgataa agaagacagt cataagtgcg gcgacgatag tcatgccccg cgcccaccgg 10380
aaggagctga ctgggttgaa ggctctcaag ggcatcggtc gactcatagc tgtttcctgt 10440
gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 10500
agcctggggt gcctaatgag tgagctaact tacattaatt gcgttgcgct cactgcccgc 10560
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 10620
aggcggtttg cgtattgggc gctagcgtgg tttttctttt caccagtgag acgggcaaca 10680
gctgattgcc cttcaccgcc tggccctgag agagttgcag caagcggtcc acgctggttt 10740
gccccagcag gcgaaaatcc tgtttgatgg tggttaacgg cgggatataa catgagctgt 10800
cttcggtatc gtcgtatccc actaccgaga tatccgcacc aacgcgcagc ccggactcgg 10860
taatggcgcg cattgcgccc agcgccatct gatcgttggc aaccagcatc gcagtgggaa 10920
cgatgccctc attcagcatt tgcatggttt gttgaaaacc ggacatggca ctccagtcgc 10980
cttcccgttc cgctatcggc tgaatttgat tgcgagtgag atatttatgc cagccagcca 11040
gacgcagacg cgccgagaca gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac 11100
ccaatgcgac cagatgctcc acgcccagtc gcgtaccgtc ttcatgggag aaaataatac 11160
tgttgatggg tgtctggtca gagacatcaa gaaataacgc cggaacatta gtgcaggcag 11220
cttccacagc aatggcatcc tggtcatcca gcggatagtt aatgatcagc ccactgacgc 11280
gttgcgcgag aagattgtgc accgccgctt tacaggcttc gacgccgctt cgttctacca 11340
tcgacaccac cacgctggca cccagttgat cggcgcgaga tttaatcgcc gcgacaattt 11400
gcgacggcgc gtgcagggcc agactggagg tggcaacgcc aatcagcaac gactgtttgc 11460
ccgccagttg ttgtgccacg cggttgggaa tgtaattcag ctccgccatc gccgcttcca 11520
ctttttcccg cgttttcgca gaaacgtggc tggcctggtt caccacgcgg gaaacggtct 11580
gataagagac accggcatac tctgcgacat cgtataacgt tactggtttc acattcacca 11640
ccctgaattg actctcttcc gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt 11700
cgatggtgtc ggaatttatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc 11760
gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gccaccccgt ggcatgcaag 11820
gagatggcgc ccaacagtcc cccggccacg gggcctgcca ccatacccac gccgaaacaa 11880
gcgctcatga gcccgaagtg gcgagcccga tcttccccat cggtgatgtc ggcgatatag 11940
gcgccagcaa ccgcacctgt ggcgccggtg atgccggcca cgatgcgtcc ggcgtagagg 12000
<210> 60
<211> 5340
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleotide encoding chimeric CyaA delta 203+ antigen HPV16, HVP18
and HPV45 acidic-deleted
<220>
<221> CDS
<222> (1)..(5340)
<400> 60
atg cag cag tcc cat cag gcc ggt tac gca aac gca gcc gat cgt gaa 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggt atc ccg gca gcg gtt ctg gat ggt att aag gca gtt gcc aaa 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gag aag aac gct acc ctg atg ttc cgt ctg gtc aac cca cac tct act 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
tcc ctg atc gcg gaa ggt gtg gcg acc aaa ggc ctg ggt gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aaa agc agc gac tgg ggt ctg cag gca ggt tat att ccg gtg aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctg tct aaa ctg ttc ggt cgt gcc ccg gag gtg atc gca cgt gca 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gat gtc aac tct tct ctg gcg cat ggt cac acc gcg gtt gat 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acc ctg tcc aaa gaa cgc ctg gat tac ctg cgt cag gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtg acg ggc atg gcc gac ggt gtt gta gcg agc aac cac gcg ggt tat 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gaa caa ttt gag ttt cgc gtt aaa gag acc tct gac ggt cgt tac gcg 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tac cgc cgc aaa ggt ggc gat gac ttt gaa gct gtc aaa gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggt aac gct gct gga att ggt cag gcg gaa ccg gat cgc gcg cac 576
Ile Gly Asn Ala Ala Gly Ile Gly Gln Ala Glu Pro Asp Arg Ala His
180 185 190
tac aac atc gtt act ttt tgt tgc aaa tgt gat tcc act ctg cgc ctg 624
Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg Leu
195 200 205
tgt gtg caa tcc acc cac gta gac att cgc act ctg gaa gac ctg ctg 672
Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu Leu
210 215 220
atg ggt acc ctt ggt att gtt tgt ccg att tgc tcc cag aag ccg gcg 720
Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro Ala
225 230 235 240
tct ggc gtt aac cac caa cac ctg ccg gcg cgt cgc gca gag ccg cag 768
Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro Gln
245 250 255
cgt cac acc atg ctg tgc atg tgc tgt aaa tgt gag gcc cgt atc gag 816
Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile Glu
260 265 270
ctg gtc gtt gag tct agc gcc gac gat ctg cgt gcg ttt cag cag ctg 864
Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln Leu
275 280 285
ttc ctg aac acg ctg agc ttc gtt tgc ccg tgg tgt gct agc cag cag 912
Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln Gln
290 295 300
ggc gtg tct cac gct cag ctg ccg gca cgt cgt gct gag cct cag cgt 960
Gly Val Ser His Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg
305 310 315 320
cac aaa atc ctg tgc gtg tgc tgc aaa tgc gat ggc cgc atc gaa ctg 1008
His Lys Ile Leu Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu
325 330 335
acc gtg gaa tct agc gca gaa gac ctg cgt acg ctg cag caa ctg ttc 1056
Thr Val Glu Ser Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe
340 345 350
ctg agc acg ctg tcc ttc gta tgc cct tgg tgc gca act aat cag atg 1104
Leu Ser Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met
355 360 365
cac ggt gac acc ccg acc ctg cac gaa tac atg ctg gac ctg cag cca 1152
His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro
370 375 380
gaa acc acc gat ctg tac tgt tac gaa cag ctg aac atg cat ggc cca 1200
Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro
385 390 395 400
aaa gct act ctg cag gat atc gtc ctg cat ctg gaa cca cag aac gaa 1248
Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu
405 410 415
atc ccg gta gat ctg ctg tgc cat gag cag ctg atg cat ggt ccg cgt 1296
Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg
420 425 430
gaa acc ctg cag gaa atc gtt ctg cac ctg gaa ccg caa aac gaa ctg 1344
Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu
435 440 445
gac ccg gtt gac ctg ctg tgc tat gaa cag ctg ccg ggc ctg cgc cgt 1392
Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu Pro Gly Leu Arg Arg
450 455 460
ccg tcc ctg ggc gca gtc gaa cgt cag gac tcc ggc tac gat tcc ctg 1440
Pro Ser Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu
465 470 475 480
gat ggc gtt ggc tcc cgc tcc ttc tcc ctg ggc gag gtt tct gac atg 1488
Asp Gly Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met
485 490 495
gct gcg gtg gaa gcg gca gag ctg gaa atg acc cgt caa gtg ctg cac 1536
Ala Ala Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His
500 505 510
gcg ggc gca cgt cag gac gat gct gag ccg ggc gtg tcc ggt gcg tct 1584
Ala Gly Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser
515 520 525
gca cac tgg ggt caa cgt gcc ctg cag ggt gct caa gct gtc gcg gca 1632
Ala His Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala
530 535 540
gcg cag cgt ctg gta cat gcg atc gca ctg atg acc cag ttc ggt cgc 1680
Ala Gln Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg
545 550 555 560
gca ggt tct acc aac act cct cag gaa gca gct agc ctg tct gct gct 1728
Ala Gly Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala
565 570 575
gtt ttc ggt ctg ggc gaa gcg tct tct gcg gtt gca gaa acc gtg agc 1776
Val Phe Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser
580 585 590
ggt ttc ttc cgt ggt tct agc cgc tgg gcg ggt ggt ttt ggt gta gca 1824
Gly Phe Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala
595 600 605
ggt ggc gct atg gcc ctg ggt ggc ggt atc gcg gct gct gtc ggc gca 1872
Gly Gly Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala
610 615 620
ggt atg agc ctg acc gac gat gct cct gcg ggc cag aaa gcc gca gct 1920
Gly Met Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala
625 630 635 640
ggc gct gaa atc gcg ctg cag ctg act ggt ggt acc gtt gaa ctg gct 1968
Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala
645 650 655
agc tct atc gcg ctg gct ctg gca gcg gca cgt ggc gtg act tct ggc 2016
Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly
660 665 670
ctg caa gtc gcc ggt gcc tct gcg ggc gct gct gcg ggc gct ctg gca 2064
Leu Gln Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala
675 680 685
gct gca ctg tcc ccc atg gaa atc tac ggt ctg gta cag cag tct cac 2112
Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His
690 695 700
tac gca gac cag ctg gat aaa ctg gcg cag gag tct tct gca tac ggt 2160
Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly
705 710 715 720
tac gaa ggc gac gca ctg ctg gcg cag ctg tat cgt gac aaa act gct 2208
Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala
725 730 735
gct gaa ggt gct gtg gca ggc gtt tct gcg gta ctg tct acc gtt ggc 2256
Ala Glu Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly
740 745 750
gct gcg gtt tct att gcg gct gcc gca tcc gtt gta ggt gcg ccg gtt 2304
Ala Ala Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val
755 760 765
gct gta gtt acc tct ctg ctg act ggt gca ctg aac ggt atc ctg cgt 2352
Ala Val Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg
770 775 780
ggt gtt cag cag cct att atc gaa aaa ctg gcg aat gat tat gcc cgt 2400
Gly Val Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg
785 790 795 800
aaa atc gac gaa ctg ggc ggt ccg cag gct tat ttt gaa aaa aac ctg 2448
Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu
805 810 815
cag gcg cgc cac gaa cag ctg gca aac agc gac ggc ctg cgc aaa atg 2496
Gln Ala Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met
820 825 830
ctg gca gac ctg caa gct ggt tgg aac gcg tct tct gtg atc ggc gtg 2544
Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val
835 840 845
cag acc acc gaa att agc aaa tct gcg ctg gaa ctg gct gca att act 2592
Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr
850 855 860
ggc aac gcg gat aac ctg aaa agc gtt gat gtt ttt gtc gat cgc ttc 2640
Gly Asn Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe
865 870 875 880
gtt cag ggc gag cgc gtt gct ggt cag ccg gtt gtt ctg gac gtt gcg 2688
Val Gln Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala
885 890 895
gca ggc ggc atc gac atc gct agc cgc aag ggc gag cgt ccg gct ctg 2736
Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu
900 905 910
act ttc att acc ccg ctg gca gct ccg ggt gaa gaa cag cgt cgc cgt 2784
Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg
915 920 925
acc aag act ggt aaa agc gag ttc acc acc ttc gtg gaa atc gta ggt 2832
Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly
930 935 940
aaa cag gac cgc tgg cgt att cgc gac ggt gcg gcg gac acc acc atc 2880
Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile
945 950 955 960
gac ctg gca aaa gtt gtt tcc caa ctg gta gat gct aac ggc gtg ctg 2928
Asp Leu Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu
965 970 975
aaa cat tct att aaa ctg gat gta atc ggc ggt gac ggc gat gac gtt 2976
Lys His Ser Ile Lys Leu Asp Val Ile Gly Gly Asp Gly Asp Asp Val
980 985 990
gta ctg gcg aac gcg tct cgt atc cac tat gac ggc ggc gca ggt acc 3024
Val Leu Ala Asn Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr
995 1000 1005
aac acg gtt tcc tac gca gcg ctg ggc cgc cag gat tcc atc act 3069
Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr
1010 1015 1020
gtt agc gcc gat ggc gaa cgt ttc aac gtg cgt aaa cag ctg aat 3114
Val Ser Ala Asp Gly Glu Arg Phe Asn Val Arg Lys Gln Leu Asn
1025 1030 1035
aac gca aac gtc tat cgt gag ggt gta gct acc cag acc acc gcg 3159
Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr Gln Thr Thr Ala
1040 1045 1050
tac ggt aag cgt acc gaa aac gtt cag tat cgt cac gtg gaa ctg 3204
Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His Val Glu Leu
1055 1060 1065
gca cgt gtg ggt cag ctg gta gag gtg gat acg ctg gaa cac gtg 3249
Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu His Val
1070 1075 1080
cag cac atc atc ggt ggc gcc ggt aac gat tcc att act ggt aac 3294
Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr Gly Asn
1085 1090 1095
gct cac gac aac ttc ctg gca ggt ggt tct ggt gat gat cgt ctg 3339
Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp Arg Leu
1100 1105 1110
gac ggt ggt gcg ggt aac gat acg ctg gta ggc ggc gaa ggt cag 3384
Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu Gly Gln
1115 1120 1125
aac acc gta att ggt ggt gcc ggt gac gac gtt ttc ctg cag gat 3429
Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu Gln Asp
1130 1135 1140
ctg ggc gtt tgg agc aac cag ctg gat ggc ggt gcc ggt gtt gac 3474
Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp
1145 1150 1155
acg gtt aag tat aac gtt cac cag ccg tct gaa gag cgc ctg gaa 3519
Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu
1160 1165 1170
cgt atg ggt gac act ggt att cat gcc gat ctg cag aaa ggc act 3564
Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr
1175 1180 1185
gtt gaa aaa tgg cct gcg ctg aac ctg ttc tct gtg gac cat gtt 3609
Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val
1190 1195 1200
aag aac att gaa aac ctg cat ggc tct cgc ctg aac gac cgt atc 3654
Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile
1205 1210 1215
gct ggt gac gac cag gat aac gaa ctg tgg ggt cat gac ggc aat 3699
Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn
1220 1225 1230
gat acc att cgc ggt cgt ggc ggc gac gat att ctg cgt ggc ggt 3744
Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly
1235 1240 1245
ctg ggc ctg gat acc ctg tat ggt gaa gat ggt aac gat att ttc 3789
Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe
1250 1255 1260
ctg caa gac gat gaa acg gta tct gat gac atc gac ggt ggt gca 3834
Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala
1265 1270 1275
ggc ctg gac acc gta gat tac agc gct atg atc cat ccg ggt cgt 3879
Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro Gly Arg
1280 1285 1290
atc gta gct ccg cac gag tac ggc ttc ggt atc gag gcg gac ctg 3924
Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu
1295 1300 1305
tct cgt gaa tgg gtt cgt aaa gcg tcc gcg ctg ggt gtg gac tac 3969
Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr
1310 1315 1320
tac gat aac gtt cgt aac gtg gaa aac gtg atc ggt acc tcc atg 4014
Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr Ser Met
1325 1330 1335
aaa gac gtg ctg att ggc gac gca cag gcc aac act ctg atg ggc 4059
Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly
1340 1345 1350
cag ggc ggt gat gac acg gtt cgc ggc ggc gac ggt gat gac ctg 4104
Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu
1355 1360 1365
ctg ttc ggt ggt gac ggc aac gac atg ctg tac ggc gac gcg ggc 4149
Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly
1370 1375 1380
aac gac acc ctg tac ggc ggt ctg ggt gac gac act ctg gaa ggt 4194
Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly
1385 1390 1395
ggt gca ggt aac gac tgg ttc ggc caa acc cag gca cgc gaa cac 4239
Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg Glu His
1400 1405 1410
gac gtg ctg cgt ggt ggc gac ggc gta gac acc gtg gat tac tcc 4284
Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp Tyr Ser
1415 1420 1425
caa act ggc gct cac gcg ggt atc gcg gcc ggt cgt atc ggt ctg 4329
Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu
1430 1435 1440
ggc att ctg gcc gat ctg ggt gcc ggc cgt gtc gac aaa ctg ggt 4374
Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly
1445 1450 1455
gag gct ggc tct agc gcc tat gat act gtt tcc ggc atc gaa aac 4419
Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn
1460 1465 1470
gtg gta ggc act gaa ctg gca gat cgt atc acg ggt gac gcg caa 4464
Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln
1475 1480 1485
gcg aac gtt ctg cgt ggt gct ggc ggt gca gac gtg ctg gcg ggt 4509
Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly
1490 1495 1500
ggt gaa ggc gac gac gta ctg ctg ggc ggt gac ggt gac gat cag 4554
Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln
1505 1510 1515
ctg agc ggt gat gcg ggt cgt gac cgt ctg tac ggt gaa gca ggt 4599
Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly
1520 1525 1530
gac gat tgg ttc ttc cag gac gct gct aac gct ggc aac ctg ctg 4644
Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu
1535 1540 1545
gac ggc ggc gat ggc cgt gac act gtt gac ttc agc ggt ccg ggt 4689
Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly Pro Gly
1550 1555 1560
cgc ggt ctg gac gca ggc gcg aaa ggc gtt ttc ctg agc ctg ggt 4734
Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly
1565 1570 1575
aag ggt ttc gca tct ctg atg gac gaa cca gaa acc agc aat gtc 4779
Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val
1580 1585 1590
ctg cgt aac atc gaa aac gct gtc ggt tcc gca cgc gat gat gtt 4824
Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp Asp Val
1595 1600 1605
ctg att ggc gat gct ggt gcc aat gtt ctg aac ggt ctg gcg ggt 4869
Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly
1610 1615 1620
aat gat gta ctg tct ggt ggc gct ggt gat gat gtc ctg ctg ggt 4914
Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly
1625 1630 1635
gat gag ggc agc gat ctg ctg tcc ggc gat gcc ggc aac gac gat 4959
Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp
1640 1645 1650
ctg ttc ggt ggc caa ggt gat gat act tac ctg ttc ggc gtt ggc 5004
Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly
1655 1660 1665
tat ggt cat gac acc atc tat gag tct ggt ggc ggc cac gat acg 5049
Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr
1670 1675 1680
att cgt att aat gca ggt gct gac caa ctg tgg ttt gca cgt cag 5094
Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln
1685 1690 1695
ggt aac gat ctg gaa att cgc atc ctg ggt act gat gac gct ctg 5139
Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu
1700 1705 1710
acc gta cac gac tgg tac cgc gat gcg gat cac cgc gta gaa atc 5184
Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ile
1715 1720 1725
atc cat gcg gct aac caa gct gta gac cag gct ggt att gaa aaa 5229
Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile Glu Lys
1730 1735 1740
ctg gta gaa gcg atg gca cag tat ccg gac cca ggt gcg gct gct 5274
Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala
1745 1750 1755
gca gca cct cca gcg gct cgt gtg ccg gat acc ctg atg cag agc 5319
Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser
1760 1765 1770
ctg gcc gtc aat tgg cgt taa 5340
Leu Ala Val Asn Trp Arg
1775
<210> 61
<211> 1779
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 61
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Gly Gln Ala Glu Pro Asp Arg Ala His
180 185 190
Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser Thr Leu Arg Leu
195 200 205
Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu Glu Asp Leu Leu
210 215 220
Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser Gln Lys Pro Ala
225 230 235 240
Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg Ala Glu Pro Gln
245 250 255
Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu Ala Arg Ile Glu
260 265 270
Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala Phe Gln Gln Leu
275 280 285
Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Ser Gln Gln
290 295 300
Gly Val Ser His Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg
305 310 315 320
His Lys Ile Leu Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu
325 330 335
Thr Val Glu Ser Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe
340 345 350
Leu Ser Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met
355 360 365
His Gly Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro
370 375 380
Glu Thr Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Met His Gly Pro
385 390 395 400
Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu
405 410 415
Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Met His Gly Pro Arg
420 425 430
Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu
435 440 445
Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu Pro Gly Leu Arg Arg
450 455 460
Pro Ser Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser Leu
465 470 475 480
Asp Gly Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp Met
485 490 495
Ala Ala Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu His
500 505 510
Ala Gly Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala Ser
515 520 525
Ala His Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala Ala
530 535 540
Ala Gln Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly Arg
545 550 555 560
Ala Gly Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala Ala
565 570 575
Val Phe Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val Ser
580 585 590
Gly Phe Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val Ala
595 600 605
Gly Gly Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly Ala
610 615 620
Gly Met Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala Ala
625 630 635 640
Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu Ala
645 650 655
Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser Gly
660 665 670
Leu Gln Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu Ala
675 680 685
Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser His
690 695 700
Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr Gly
705 710 715 720
Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr Ala
725 730 735
Ala Glu Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val Gly
740 745 750
Ala Ala Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro Val
755 760 765
Ala Val Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu Arg
770 775 780
Gly Val Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala Arg
785 790 795 800
Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn Leu
805 810 815
Gln Ala Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys Met
820 825 830
Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly Val
835 840 845
Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile Thr
850 855 860
Gly Asn Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp Arg Phe
865 870 875 880
Val Gln Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu Asp Val Ala
885 890 895
Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg Pro Ala Leu
900 905 910
Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln Arg Arg Arg
915 920 925
Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu Ile Val Gly
930 935 940
Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp Thr Thr Ile
945 950 955 960
Asp Leu Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn Gly Val Leu
965 970 975
Lys His Ser Ile Lys Leu Asp Val Ile Gly Gly Asp Gly Asp Asp Val
980 985 990
Val Leu Ala Asn Ala Ser Arg Ile His Tyr Asp Gly Gly Ala Gly Thr
995 1000 1005
Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr
1010 1015 1020
Val Ser Ala Asp Gly Glu Arg Phe Asn Val Arg Lys Gln Leu Asn
1025 1030 1035
Asn Ala Asn Val Tyr Arg Glu Gly Val Ala Thr Gln Thr Thr Ala
1040 1045 1050
Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr Arg His Val Glu Leu
1055 1060 1065
Ala Arg Val Gly Gln Leu Val Glu Val Asp Thr Leu Glu His Val
1070 1075 1080
Gln His Ile Ile Gly Gly Ala Gly Asn Asp Ser Ile Thr Gly Asn
1085 1090 1095
Ala His Asp Asn Phe Leu Ala Gly Gly Ser Gly Asp Asp Arg Leu
1100 1105 1110
Asp Gly Gly Ala Gly Asn Asp Thr Leu Val Gly Gly Glu Gly Gln
1115 1120 1125
Asn Thr Val Ile Gly Gly Ala Gly Asp Asp Val Phe Leu Gln Asp
1130 1135 1140
Leu Gly Val Trp Ser Asn Gln Leu Asp Gly Gly Ala Gly Val Asp
1145 1150 1155
Thr Val Lys Tyr Asn Val His Gln Pro Ser Glu Glu Arg Leu Glu
1160 1165 1170
Arg Met Gly Asp Thr Gly Ile His Ala Asp Leu Gln Lys Gly Thr
1175 1180 1185
Val Glu Lys Trp Pro Ala Leu Asn Leu Phe Ser Val Asp His Val
1190 1195 1200
Lys Asn Ile Glu Asn Leu His Gly Ser Arg Leu Asn Asp Arg Ile
1205 1210 1215
Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp Gly His Asp Gly Asn
1220 1225 1230
Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly
1235 1240 1245
Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe
1250 1255 1260
Leu Gln Asp Asp Glu Thr Val Ser Asp Asp Ile Asp Gly Gly Ala
1265 1270 1275
Gly Leu Asp Thr Val Asp Tyr Ser Ala Met Ile His Pro Gly Arg
1280 1285 1290
Ile Val Ala Pro His Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu
1295 1300 1305
Ser Arg Glu Trp Val Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr
1310 1315 1320
Tyr Asp Asn Val Arg Asn Val Glu Asn Val Ile Gly Thr Ser Met
1325 1330 1335
Lys Asp Val Leu Ile Gly Asp Ala Gln Ala Asn Thr Leu Met Gly
1340 1345 1350
Gln Gly Gly Asp Asp Thr Val Arg Gly Gly Asp Gly Asp Asp Leu
1355 1360 1365
Leu Phe Gly Gly Asp Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly
1370 1375 1380
Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly
1385 1390 1395
Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr Gln Ala Arg Glu His
1400 1405 1410
Asp Val Leu Arg Gly Gly Asp Gly Val Asp Thr Val Asp Tyr Ser
1415 1420 1425
Gln Thr Gly Ala His Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu
1430 1435 1440
Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg Val Asp Lys Leu Gly
1445 1450 1455
Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn
1460 1465 1470
Val Val Gly Thr Glu Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln
1475 1480 1485
Ala Asn Val Leu Arg Gly Ala Gly Gly Ala Asp Val Leu Ala Gly
1490 1495 1500
Gly Glu Gly Asp Asp Val Leu Leu Gly Gly Asp Gly Asp Asp Gln
1505 1510 1515
Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly
1520 1525 1530
Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu
1535 1540 1545
Asp Gly Gly Asp Gly Arg Asp Thr Val Asp Phe Ser Gly Pro Gly
1550 1555 1560
Arg Gly Leu Asp Ala Gly Ala Lys Gly Val Phe Leu Ser Leu Gly
1565 1570 1575
Lys Gly Phe Ala Ser Leu Met Asp Glu Pro Glu Thr Ser Asn Val
1580 1585 1590
Leu Arg Asn Ile Glu Asn Ala Val Gly Ser Ala Arg Asp Asp Val
1595 1600 1605
Leu Ile Gly Asp Ala Gly Ala Asn Val Leu Asn Gly Leu Ala Gly
1610 1615 1620
Asn Asp Val Leu Ser Gly Gly Ala Gly Asp Asp Val Leu Leu Gly
1625 1630 1635
Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp
1640 1645 1650
Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly
1655 1660 1665
Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly Gly Gly His Asp Thr
1670 1675 1680
Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln
1685 1690 1695
Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu
1700 1705 1710
Thr Val His Asp Trp Tyr Arg Asp Ala Asp His Arg Val Glu Ile
1715 1720 1725
Ile His Ala Ala Asn Gln Ala Val Asp Gln Ala Gly Ile Glu Lys
1730 1735 1740
Leu Val Glu Ala Met Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala
1745 1750 1755
Ala Ala Pro Pro Ala Ala Arg Val Pro Asp Thr Leu Met Gln Ser
1760 1765 1770
Leu Ala Val Asn Trp Arg
1775
<210> 62
<211> 11670
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid comprising SEQ ID NO:60.
<400> 62
atcgagatct gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 60
gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 120
tgaaatgagc tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat 180
aacaattata attttgttta actttaagaa ggagatatac atatgcagca gtcccatcag 240
gccggttacg caaacgcagc cgatcgtgaa tctggtatcc cggcagcggt tctggatggt 300
attaaggcag ttgccaaaga gaagaacgct accctgatgt tccgtctggt caacccacac 360
tctacttccc tgatcgcgga aggtgtggcg accaaaggcc tgggtgtgca cgccaaaagc 420
agcgactggg gtctgcaggc aggttatatt ccggtgaacc cgaatctgtc taaactgttc 480
ggtcgtgccc cggaggtgat cgcacgtgca gacaacgatg tcaactcttc tctggcgcat 540
ggtcacaccg cggttgatct gaccctgtcc aaagaacgcc tggattacct gcgtcaggcg 600
ggcctggtga cgggcatggc cgacggtgtt gtagcgagca accacgcggg ttatgaacaa 660
tttgagtttc gcgttaaaga gacctctgac ggtcgttacg cggtgcagta ccgccgcaaa 720
ggtggcgatg actttgaagc tgtcaaagtg atcggtaacg ctgctggaat tggtcaggcg 780
gaaccggatc gcgcgcacta caacatcgtt actttttgtt gcaaatgtga ttccactctg 840
cgcctgtgtg tgcaatccac ccacgtagac attcgcactc tggaagacct gctgatgggt 900
acccttggta ttgtttgtcc gatttgctcc cagaagccgg cgtctggcgt taaccaccaa 960
cacctgccgg cgcgtcgcgc agagccgcag cgtcacacca tgctgtgcat gtgctgtaaa 1020
tgtgaggccc gtatcgagct ggtcgttgag tctagcgccg acgatctgcg tgcgtttcag 1080
cagctgttcc tgaacacgct gagcttcgtt tgcccgtggt gtgctagcca gcagggcgtg 1140
tctcacgctc agctgccggc acgtcgtgct gagcctcagc gtcacaaaat cctgtgcgtg 1200
tgctgcaaat gcgatggccg catcgaactg accgtggaat ctagcgcaga agacctgcgt 1260
acgctgcagc aactgttcct gagcacgctg tccttcgtat gcccttggtg cgcaactaat 1320
cagatgcacg gtgacacccc gaccctgcac gaatacatgc tggacctgca gccagaaacc 1380
accgatctgt actgttacga acagctgaac atgcatggcc caaaagctac tctgcaggat 1440
atcgtcctgc atctggaacc acagaacgaa atcccggtag atctgctgtg ccatgagcag 1500
ctgatgcatg gtccgcgtga aaccctgcag gaaatcgttc tgcacctgga accgcaaaac 1560
gaactggacc cggttgacct gctgtgctat gaacagctgc cgggcctgcg ccgtccgtcc 1620
ctgggcgcag tcgaacgtca ggactccggc tacgattccc tggatggcgt tggctcccgc 1680
tccttctccc tgggcgaggt ttctgacatg gctgcggtgg aagcggcaga gctggaaatg 1740
acccgtcaag tgctgcacgc gggcgcacgt caggacgatg ctgagccggg cgtgtccggt 1800
gcgtctgcac actggggtca acgtgccctg cagggtgctc aagctgtcgc ggcagcgcag 1860
cgtctggtac atgcgatcgc actgatgacc cagttcggtc gcgcaggttc taccaacact 1920
cctcaggaag cagctagcct gtctgctgct gttttcggtc tgggcgaagc gtcttctgcg 1980
gttgcagaaa ccgtgagcgg tttcttccgt ggttctagcc gctgggcggg tggttttggt 2040
gtagcaggtg gcgctatggc cctgggtggc ggtatcgcgg ctgctgtcgg cgcaggtatg 2100
agcctgaccg acgatgctcc tgcgggccag aaagccgcag ctggcgctga aatcgcgctg 2160
cagctgactg gtggtaccgt tgaactggct agctctatcg cgctggctct ggcagcggca 2220
cgtggcgtga cttctggcct gcaagtcgcc ggtgcctctg cgggcgctgc tgcgggcgct 2280
ctggcagctg cactgtcccc catggaaatc tacggtctgg tacagcagtc tcactacgca 2340
gaccagctgg ataaactggc gcaggagtct tctgcatacg gttacgaagg cgacgcactg 2400
ctggcgcagc tgtatcgtga caaaactgct gctgaaggtg ctgtggcagg cgtttctgcg 2460
gtactgtcta ccgttggcgc tgcggtttct attgcggctg ccgcatccgt tgtaggtgcg 2520
ccggttgctg tagttacctc tctgctgact ggtgcactga acggtatcct gcgtggtgtt 2580
cagcagccta ttatcgaaaa actggcgaat gattatgccc gtaaaatcga cgaactgggc 2640
ggtccgcagg cttattttga aaaaaacctg caggcgcgcc acgaacagct ggcaaacagc 2700
gacggcctgc gcaaaatgct ggcagacctg caagctggtt ggaacgcgtc ttctgtgatc 2760
ggcgtgcaga ccaccgaaat tagcaaatct gcgctggaac tggctgcaat tactggcaac 2820
gcggataacc tgaaaagcgt tgatgttttt gtcgatcgct tcgttcaggg cgagcgcgtt 2880
gctggtcagc cggttgttct ggacgttgcg gcaggcggca tcgacatcgc tagccgcaag 2940
ggcgagcgtc cggctctgac tttcattacc ccgctggcag ctccgggtga agaacagcgt 3000
cgccgtacca agactggtaa aagcgagttc accaccttcg tggaaatcgt aggtaaacag 3060
gaccgctggc gtattcgcga cggtgcggcg gacaccacca tcgacctggc aaaagttgtt 3120
tcccaactgg tagatgctaa cggcgtgctg aaacattcta ttaaactgga tgtaatcggc 3180
ggtgacggcg atgacgttgt actggcgaac gcgtctcgta tccactatga cggcggcgca 3240
ggtaccaaca cggtttccta cgcagcgctg ggccgccagg attccatcac tgttagcgcc 3300
gatggcgaac gtttcaacgt gcgtaaacag ctgaataacg caaacgtcta tcgtgagggt 3360
gtagctaccc agaccaccgc gtacggtaag cgtaccgaaa acgttcagta tcgtcacgtg 3420
gaactggcac gtgtgggtca gctggtagag gtggatacgc tggaacacgt gcagcacatc 3480
atcggtggcg ccggtaacga ttccattact ggtaacgctc acgacaactt cctggcaggt 3540
ggttctggtg atgatcgtct ggacggtggt gcgggtaacg atacgctggt aggcggcgaa 3600
ggtcagaaca ccgtaattgg tggtgccggt gacgacgttt tcctgcagga tctgggcgtt 3660
tggagcaacc agctggatgg cggtgccggt gttgacacgg ttaagtataa cgttcaccag 3720
ccgtctgaag agcgcctgga acgtatgggt gacactggta ttcatgccga tctgcagaaa 3780
ggcactgttg aaaaatggcc tgcgctgaac ctgttctctg tggaccatgt taagaacatt 3840
gaaaacctgc atggctctcg cctgaacgac cgtatcgctg gtgacgacca ggataacgaa 3900
ctgtggggtc atgacggcaa tgataccatt cgcggtcgtg gcggcgacga tattctgcgt 3960
ggcggtctgg gcctggatac cctgtatggt gaagatggta acgatatttt cctgcaagac 4020
gatgaaacgg tatctgatga catcgacggt ggtgcaggcc tggacaccgt agattacagc 4080
gctatgatcc atccgggtcg tatcgtagct ccgcacgagt acggcttcgg tatcgaggcg 4140
gacctgtctc gtgaatgggt tcgtaaagcg tccgcgctgg gtgtggacta ctacgataac 4200
gttcgtaacg tggaaaacgt gatcggtacc tccatgaaag acgtgctgat tggcgacgca 4260
caggccaaca ctctgatggg ccagggcggt gatgacacgg ttcgcggcgg cgacggtgat 4320
gacctgctgt tcggtggtga cggcaacgac atgctgtacg gcgacgcggg caacgacacc 4380
ctgtacggcg gtctgggtga cgacactctg gaaggtggtg caggtaacga ctggttcggc 4440
caaacccagg cacgcgaaca cgacgtgctg cgtggtggcg acggcgtaga caccgtggat 4500
tactcccaaa ctggcgctca cgcgggtatc gcggccggtc gtatcggtct gggcattctg 4560
gccgatctgg gtgccggccg tgtcgacaaa ctgggtgagg ctggctctag cgcctatgat 4620
actgtttccg gcatcgaaaa cgtggtaggc actgaactgg cagatcgtat cacgggtgac 4680
gcgcaagcga acgttctgcg tggtgctggc ggtgcagacg tgctggcggg tggtgaaggc 4740
gacgacgtac tgctgggcgg tgacggtgac gatcagctga gcggtgatgc gggtcgtgac 4800
cgtctgtacg gtgaagcagg tgacgattgg ttcttccagg acgctgctaa cgctggcaac 4860
ctgctggacg gcggcgatgg ccgtgacact gttgacttca gcggtccggg tcgcggtctg 4920
gacgcaggcg cgaaaggcgt tttcctgagc ctgggtaagg gtttcgcatc tctgatggac 4980
gaaccagaaa ccagcaatgt cctgcgtaac atcgaaaacg ctgtcggttc cgcacgcgat 5040
gatgttctga ttggcgatgc tggtgccaat gttctgaacg gtctggcggg taatgatgta 5100
ctgtctggtg gcgctggtga tgatgtcctg ctgggtgatg agggcagcga tctgctgtcc 5160
ggcgatgccg gcaacgacga tctgttcggt ggccaaggtg atgatactta cctgttcggc 5220
gttggctatg gtcatgacac catctatgag tctggtggcg gccacgatac gattcgtatt 5280
aatgcaggtg ctgaccaact gtggtttgca cgtcagggta acgatctgga aattcgcatc 5340
ctgggtactg atgacgctct gaccgtacac gactggtacc gcgatgcgga tcaccgcgta 5400
gaaatcatcc atgcggctaa ccaagctgta gaccaggctg gtattgaaaa actggtagaa 5460
gcgatggcac agtatccgga cccaggtgcg gctgctgcag cacctccagc ggctcgtgtg 5520
ccggataccc tgatgcagag cctggccgtc aattggcgtt aatggatcca ggcctcttta 5580
gaaggagata taccatgctg ccgtctgcac aggcgccgtc tctgctgaat ccaactgatg 5640
acttcgctgc gctgggtaac atcgcgtggc tgtggatgaa cagcccgatg caccgtgact 5700
ggccggttca cctgctggca cgtaacacgc tggcgccgat ccagctgggt caatacatcc 5760
tgctgcgttg taacgacgtg cctgtggcgt attgctcctg ggcactgatg gatgcggata 5820
ccgagctgtc ctacgttatg gccccatcta gcctgggcgg taacgcttgg aactgcggcg 5880
atcgtctgtg gatcattgat tggattgctc cgtttagccg tgacgacaac cgtgctctgc 5940
gtcgcgcgct ggccgaacgt catccggatt ctgttggccg ttccctgcgc gtacgtcgcg 6000
gtggcgacac cgctcgcgtc aaagaatacc gtggtcgtgc tctggacgca gcggcggccc 6060
gcgctcagct ggaccgctac cacgcagaac tgattgccgg tctgcgtgca tccaatggcg 6120
gttatgctcc gcgtggccgt ggcaccgcat aatctagaat tctttaatta aagatccggc 6180
tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc accgctgagc aatccaggca 6240
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 6300
ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 6360
acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 6420
gaaggccatc ctgacggatg gcctttttgc tagcagcacg ccatagtgac tggcgatgct 6480
gtcggaatgg acgatatccc gcaagaggcc cggcagtacc ggcataacca agcctatgcc 6540
tacagcatcc agggtgacgg tgccgaggat gacgatgagc gcattgttag atttcataca 6600
cggtgcctga ctgcgttagc aatttaactg tgataaacta ccgcattaaa gcttatcgat 6660
gataagctgt caaacatgag aattcttaga aaaactcatc gagcatcaaa tgaaactgca 6720
atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc tgtaatgaag 6780
gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg tctgcgattc 6840
cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata aggttatcaa 6900
gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagc ttatgcattt 6960
ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca ctcgcatcaa 7020
ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga tcgctgttaa 7080
aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc agcgcatcaa 7140
caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt ttcccgggga 7200
tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg atggtcggaa 7260
gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca tcattggcaa 7320
cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca tacaatcgat 7380
agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca tataaatcag 7440
catccatgtt ggaatttaat cgcggcctcg agcaagacgt ttcccgttga atatggctca 7500
taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat gaccaaaatc 7560
ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 7620
tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 7680
ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 7740
ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac 7800
ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 7860
gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 7920
aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 7980
acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 8040
gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 8100
gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 8160
cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 8220
aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 8280
gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 8340
cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg 8400
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcaatgg tgcactctca 8460
gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat cgctacgtga 8520
ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg 8580
tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca 8640
gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg 8700
gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc 8760
cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg ttttttcctg 8820
tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa tgataccgat 8880
gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc ggttactgga 8940
acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa aaatcactca 9000
gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta gccagcagca 9060
tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg tttccagact 9120
ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag acgttttgca 9180
gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac cagtaaggca 9240
accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca cccgtggcca 9300
ggacccaacg ctgcccgaga tgcgccgcgt gcggctgctg gagatggcgg acgcgatgga 9360
tatgttctgc caagggttgg tttgcgcatt cacagttctc cgcaagaatt gattggctcc 9420
aattcttgga gtggtgaatc cgttagcgag gtgccgccgg cttccattca ggtcgaggtg 9480
gcccggctcc atgcaccgcg acgcaacgcg gggaggcaga caaggtatag ggcggcgcct 9540
acaatccatg ccaacccgtt ccatgtgctc gccgaggcgg cataaatcgc cgtgacgatc 9600
agcggtccaa tgatcgaagt taggctggta agagccgcga gcgatccttg aagctgtccc 9660
tgatggtcgt catctacctg cctggacagc atggcctgca acgcgggcat cccgatgccg 9720
ccggaagcga gaagaatcat aatggggaag gccatccagc ctcgcgtcgc gaacgccagc 9780
aagacgtagc ccagcgcgtc ggccgccatg ccggcgataa tggcctgctt ctcgccgaaa 9840
cgtttggtgg cgggaccagt gacgaaggct tgagcgaggg cgtgcaagat tccgaatacc 9900
gcaagcgaca ggccgatcat cgtcgcgctc cagcgaaagc ggtcctcgcc gaaaatgacc 9960
cagagcgctg ccggcacctg tcctacgagt tgcatgataa agaagacagt cataagtgcg 10020
gcgacgatag tcatgccccg cgcccaccgg aaggagctga ctgggttgaa ggctctcaag 10080
ggcatcggtc gactcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 10140
caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10200
tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10260
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctagcgtgg 10320
tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 10380
agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 10440
tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc actaccgaga 10500
tatccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 10560
gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 10620
gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 10680
tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 10740
ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 10800
gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 10860
gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 10920
gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 10980
tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 11040
cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 11100
tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 11160
tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 11220
tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 11280
cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 11340
atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc ggaatttatg cggtgtgaaa 11400
taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca 11460
ctgactcgct gccaccccgt ggcatgcaag gagatggcgc ccaacagtcc cccggccacg 11520
gggcctgcca ccatacccac gccgaaacaa gcgctcatga gcccgaagtg gcgagcccga 11580
tcttccccat cggtgatgtc ggcgatatag gcgccagcaa ccgcacctgt ggcgccggtg 11640
atgccggcca cgatgcgtcc ggcgtagagg 11670
<210> 63
<211> 5775
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide encoding chimeric CyaA delta 93+ antigen HPV16, HVP18
and HPV45 full
<220>
<221> CDS
<222> (1)..(5775)
<400> 63
atg cag cag tcc cat cag gcc ggt tac gca aac gca gcc gat cgt gaa 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggt atc ccg gca gcg gtt ctg gat ggt att aag gca gtt gcc aaa 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gag aag aac gct acc ctg atg ttc cgt ctg gtc aac cca cac tct act 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
tcc ctg atc gcg gaa ggt gtg gcg acc aaa ggc ctg ggt gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aaa agc agc gac tgg ggt ctg cag gca ggt tat att ccg gtg aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctg tct aaa ctg ttc ggt cgt gcc ccg gag gtg atc gca cgt gca 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gat gtc aac tct tct ctg gcg cat ggt cac acc gcg gtt gat 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acc ctg tcc aaa gaa cgc ctg gat tac ctg cgt cag gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtg acg ggc atg gcc gac ggt gtt gta gcg agc aac cac gcg ggt tat 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gaa caa ttt gag ttt cgc gtt aaa gag acc tct gac ggt cgt tac gcg 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tac cgc cgc aaa ggt ggc gat gac ttt gaa gct gtc aaa gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggt aac gct gct gga att ccg ctg acc gcg gat atc gac atg ttt 576
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
gcc atc atg cct cac ctg tcc aac ttt cgc gat tcc gca cgc agc tct 624
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
gtg acg tct ggt gat tcc gtc act gac tac ctg gct cgt acc cgt cgt 672
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
gcg gcc tct gaa gac gaa atc gac ggc cct gcg ggc cag gct gaa cca 720
Ala Ala Ser Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro
225 230 235 240
gat cgt gct cac tac aac atc gta act ttt tgc tgt aag tgc gat agc 768
Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser
245 250 255
act ctg cgt ctg tgc gta cag tct act cac gtt gat atc cgc act ctg 816
Thr Leu Arg Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu
260 265 270
gaa gat ctg ctg atg ggt acc ctg ggt atc gtc tgc cca atc tgc tct 864
Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser
275 280 285
caa aag cct gct tct ggt gtt aac cat cag cac ctg ccg gct cgt cgc 912
Gln Lys Pro Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg
290 295 300
gct gaa cca cag cgt cac acg atg ctg tgc atg tgt tgc aaa tgc gag 960
Ala Glu Pro Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu
305 310 315 320
gct cgc atc gaa ctg gtt gtt gaa tcc agc gct gac gac ctg cgt gcg 1008
Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala
325 330 335
ttt cag caa ctg ttc ctg aac acg ctg tct ttt gtt tgt ccg tgg tgt 1056
Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys
340 345 350
gcc tcc cag cag gag aac gat gaa gcg gat ggc gtg tcc cac gcg cag 1104
Ala Ser Gln Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln
355 360 365
ctg ccg gca cgt cgt gca gaa ccg cag cgc cac aag att ctg tgc gtt 1152
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val
370 375 380
tgc tgt aaa tgt gat ggc cgt atc gaa ctg act gtg gaa tcc tcc gcg 1200
Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala
385 390 395 400
gaa gat ctg cgt acg ctg cag cag ctg ttc ctg tct acc ctg tct ttc 1248
Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe
405 410 415
gtg tgc ccg tgg tgc gcc acc aat caa atg cac ggc gac acc ccg acc 1296
Val Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr Pro Thr
420 425 430
ctg cac gaa tac atg ctg gac ctg cag ccg gaa acc acg gat ctg tat 1344
Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr
435 440 445
tgt tat gaa cag ctg aac gat agc agc gag gaa atg cac ggt ccg aaa 1392
Cys Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys
450 455 460
gca act ctg cag gac att gtg ctg cat ctg gag cca cag aac gaa atc 1440
Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile
465 470 475 480
ccg gtt gat ctg ctg tgc cac gag caa ctg agc gat tcc gaa gag gaa 1488
Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu
485 490 495
aac gac gaa att gat atg cat ggt ccg cgc gag acc ctg caa gaa atc 1536
Asn Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile
500 505 510
gtc ctg cac ctg gaa ccg caa aac gaa ctg gac cct gta gac ctg ctg 1584
Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu
515 520 525
tgc tac gaa cag ctg tcc gaa tct gaa gaa gaa tcc cag atg ctg act 1632
Cys Tyr Glu Gln Leu Ser Glu Ser Glu Glu Glu Ser Gln Met Leu Thr
530 535 540
cgt ggc cag ctg aaa gaa tac atc ggc caa cag cgt ggc gaa ggc tac 1680
Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln Gln Arg Gly Glu Gly Tyr
545 550 555 560
gtt ttc tac gag aat cgt gct tac ggc gtt gcg ggc aaa tcc ctg ttc 1728
Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val Ala Gly Lys Ser Leu Phe
565 570 575
gac gat ggt ctg ggc gct gca ccg ggc gtt ccg agc ggc cgt tct aaa 1776
Asp Asp Gly Leu Gly Ala Ala Pro Gly Val Pro Ser Gly Arg Ser Lys
580 585 590
ttc agc ccg gac gta ctg gaa act gtg ccg gct tcc ccg ggc ctg cgc 1824
Phe Ser Pro Asp Val Leu Glu Thr Val Pro Ala Ser Pro Gly Leu Arg
595 600 605
cgt ccg tcc ctg ggc gca gtc gaa cgt cag gac tcc ggc tac gat tcc 1872
Arg Pro Ser Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser
610 615 620
ctg gat ggc gtt ggc tcc cgc tcc ttc tcc ctg ggc gag gtt tct gac 1920
Leu Asp Gly Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp
625 630 635 640
atg gct gcg gtg gaa gcg gca gag ctg gaa atg acc cgt caa gtg ctg 1968
Met Ala Ala Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu
645 650 655
cac gcg ggc gca cgt cag gac gat gct gag ccg ggc gtg tcc ggt gcg 2016
His Ala Gly Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala
660 665 670
tct gca cac tgg ggt caa cgt gcc ctg cag ggt gct caa gct gtc gcg 2064
Ser Ala His Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala
675 680 685
gca gcg cag cgt ctg gta cat gcg atc gca ctg atg acc cag ttc ggt 2112
Ala Ala Gln Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly
690 695 700
cgc gca ggt tct acc aac act cct cag gaa gca gct agc ctg tct gct 2160
Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala
705 710 715 720
gct gtt ttc ggt ctg ggc gaa gcg tct tct gcg gtt gca gaa acc gtg 2208
Ala Val Phe Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val
725 730 735
agc ggt ttc ttc cgt ggt tct agc cgc tgg gcg ggt ggt ttt ggt gta 2256
Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val
740 745 750
gca ggt ggc gct atg gcc ctg ggt ggc ggt atc gcg gct gct gtc ggc 2304
Ala Gly Gly Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly
755 760 765
gca ggt atg agc ctg acc gac gat gct cct gcg ggc cag aaa gcc gca 2352
Ala Gly Met Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala
770 775 780
gct ggc gct gaa atc gcg ctg cag ctg act ggt ggt acc gtt gaa ctg 2400
Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu
785 790 795 800
gct agc tct atc gcg ctg gct ctg gca gcg gca cgt ggc gtg act tct 2448
Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser
805 810 815
ggc ctg caa gtc gcc ggt gcc tct gcg ggc gct gct gcg ggc gct ctg 2496
Gly Leu Gln Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu
820 825 830
gca gct gca ctg tcc ccc atg gaa atc tac ggt ctg gta cag cag tct 2544
Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser
835 840 845
cac tac gca gac cag ctg gat aaa ctg gcg cag gag tct tct gca tac 2592
His Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr
850 855 860
ggt tac gaa ggc gac gca ctg ctg gcg cag ctg tat cgt gac aaa act 2640
Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr
865 870 875 880
gct gct gaa ggt gct gtg gca ggc gtt tct gcg gta ctg tct acc gtt 2688
Ala Ala Glu Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val
885 890 895
ggc gct gcg gtt tct att gcg gct gcc gca tcc gtt gta ggt gcg ccg 2736
Gly Ala Ala Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro
900 905 910
gtt gct gta gtt acc tct ctg ctg act ggt gca ctg aac ggt atc ctg 2784
Val Ala Val Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu
915 920 925
cgt ggt gtt cag cag cct att atc gaa aaa ctg gcg aat gat tat gcc 2832
Arg Gly Val Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala
930 935 940
cgt aaa atc gac gaa ctg ggc ggt ccg cag gct tat ttt gaa aaa aac 2880
Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn
945 950 955 960
ctg cag gcg cgc cac gaa cag ctg gca aac agc gac ggc ctg cgc aaa 2928
Leu Gln Ala Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys
965 970 975
atg ctg gca gac ctg caa gct ggt tgg aac gcg tct tct gtg atc ggc 2976
Met Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly
980 985 990
gtg cag acc acc gaa att agc aaa tct gcg ctg gaa ctg gct gca att 3024
Val Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile
995 1000 1005
act ggc aac gcg gat aac ctg aaa agc gtt gat gtt ttt gtc gat 3069
Thr Gly Asn Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp
1010 1015 1020
cgc ttc gtt cag ggc gag cgc gtt gct ggt cag ccg gtt gtt ctg 3114
Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu
1025 1030 1035
gac gtt gcg gca ggc ggc atc gac atc gct agc cgc aag ggc gag 3159
Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu
1040 1045 1050
cgt ccg gct ctg act ttc att acc ccg ctg gca gct ccg ggt gaa 3204
Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu
1055 1060 1065
gaa cag cgt cgc cgt acc aag act ggt aaa agc gag ttc acc acc 3249
Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr
1070 1075 1080
ttc gtg gaa atc gta ggt aaa cag gac cgc tgg cgt att cgc gac 3294
Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
1085 1090 1095
ggt gcg gcg gac acc acc atc gac ctg gca aaa gtt gtt tcc caa 3339
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln
1100 1105 1110
ctg gta gat gct aac ggc gtg ctg aaa cat tct att aaa ctg gat 3384
Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp
1115 1120 1125
gta atc ggc ggt gac ggc gat gac gtt gta ctg gcg aac gcg tct 3429
Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser
1130 1135 1140
cgt atc cac tat gac ggc ggc gca ggt acc aac acg gtt tcc tac 3474
Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr
1145 1150 1155
gca gcg ctg ggc cgc cag gat tcc atc act gtt agc gcc gat ggc 3519
Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly
1160 1165 1170
gaa cgt ttc aac gtg cgt aaa cag ctg aat aac gca aac gtc tat 3564
Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr
1175 1180 1185
cgt gag ggt gta gct acc cag acc acc gcg tac ggt aag cgt acc 3609
Arg Glu Gly Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr
1190 1195 1200
gaa aac gtt cag tat cgt cac gtg gaa ctg gca cgt gtg ggt cag 3654
Glu Asn Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln
1205 1210 1215
ctg gta gag gtg gat acg ctg gaa cac gtg cag cac atc atc ggt 3699
Leu Val Glu Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly
1220 1225 1230
ggc gcc ggt aac gat tcc att act ggt aac gct cac gac aac ttc 3744
Gly Ala Gly Asn Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe
1235 1240 1245
ctg gca ggt ggt tct ggt gat gat cgt ctg gac ggt ggt gcg ggt 3789
Leu Ala Gly Gly Ser Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly
1250 1255 1260
aac gat acg ctg gta ggc ggc gaa ggt cag aac acc gta att ggt 3834
Asn Asp Thr Leu Val Gly Gly Glu Gly Gln Asn Thr Val Ile Gly
1265 1270 1275
ggt gcc ggt gac gac gtt ttc ctg cag gat ctg ggc gtt tgg agc 3879
Gly Ala Gly Asp Asp Val Phe Leu Gln Asp Leu Gly Val Trp Ser
1280 1285 1290
aac cag ctg gat ggc ggt gcc ggt gtt gac acg gtt aag tat aac 3924
Asn Gln Leu Asp Gly Gly Ala Gly Val Asp Thr Val Lys Tyr Asn
1295 1300 1305
gtt cac cag ccg tct gaa gag cgc ctg gaa cgt atg ggt gac act 3969
Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg Met Gly Asp Thr
1310 1315 1320
ggt att cat gcc gat ctg cag aaa ggc act gtt gaa aaa tgg cct 4014
Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val Glu Lys Trp Pro
1325 1330 1335
gcg ctg aac ctg ttc tct gtg gac cat gtt aag aac att gaa aac 4059
Ala Leu Asn Leu Phe Ser Val Asp His Val Lys Asn Ile Glu Asn
1340 1345 1350
ctg cat ggc tct cgc ctg aac gac cgt atc gct ggt gac gac cag 4104
Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln
1355 1360 1365
gat aac gaa ctg tgg ggt cat gac ggc aat gat acc att cgc ggt 4149
Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp Thr Ile Arg Gly
1370 1375 1380
cgt ggc ggc gac gat att ctg cgt ggc ggt ctg ggc ctg gat acc 4194
Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr
1385 1390 1395
ctg tat ggt gaa gat ggt aac gat att ttc ctg caa gac gat gaa 4239
Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu
1400 1405 1410
acg gta tct gat gac atc gac ggt ggt gca ggc ctg gac acc gta 4284
Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val
1415 1420 1425
gat tac agc gct atg atc cat ccg ggt cgt atc gta gct ccg cac 4329
Asp Tyr Ser Ala Met Ile His Pro Gly Arg Ile Val Ala Pro His
1430 1435 1440
gag tac ggc ttc ggt atc gag gcg gac ctg tct cgt gaa tgg gtt 4374
Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Arg Glu Trp Val
1445 1450 1455
cgt aaa gcg tcc gcg ctg ggt gtg gac tac tac gat aac gtt cgt 4419
Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg
1460 1465 1470
aac gtg gaa aac gtg atc ggt acc tcc atg aaa gac gtg ctg att 4464
Asn Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile
1475 1480 1485
ggc gac gca cag gcc aac act ctg atg ggc cag ggc ggt gat gac 4509
Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp
1490 1495 1500
acg gtt cgc ggc ggc gac ggt gat gac ctg ctg ttc ggt ggt gac 4554
Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp
1505 1510 1515
ggc aac gac atg ctg tac ggc gac gcg ggc aac gac acc ctg tac 4599
Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr
1520 1525 1530
ggc ggt ctg ggt gac gac act ctg gaa ggt ggt gca ggt aac gac 4644
Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp
1535 1540 1545
tgg ttc ggc caa acc cag gca cgc gaa cac gac gtg ctg cgt ggt 4689
Trp Phe Gly Gln Thr Gln Ala Arg Glu His Asp Val Leu Arg Gly
1550 1555 1560
ggc gac ggc gta gac acc gtg gat tac tcc caa act ggc gct cac 4734
Gly Asp Gly Val Asp Thr Val Asp Tyr Ser Gln Thr Gly Ala His
1565 1570 1575
gcg ggt atc gcg gcc ggt cgt atc ggt ctg ggc att ctg gcc gat 4779
Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp
1580 1585 1590
ctg ggt gcc ggc cgt gtc gac aaa ctg ggt gag gct ggc tct agc 4824
Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser
1595 1600 1605
gcc tat gat act gtt tcc ggc atc gaa aac gtg gta ggc act gaa 4869
Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu
1610 1615 1620
ctg gca gat cgt atc acg ggt gac gcg caa gcg aac gtt ctg cgt 4914
Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg
1625 1630 1635
ggt gct ggc ggt gca gac gtg ctg gcg ggt ggt gaa ggc gac gac 4959
Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp
1640 1645 1650
gta ctg ctg ggc ggt gac ggt gac gat cag ctg agc ggt gat gcg 5004
Val Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala
1655 1660 1665
ggt cgt gac cgt ctg tac ggt gaa gca ggt gac gat tgg ttc ttc 5049
Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe
1670 1675 1680
cag gac gct gct aac gct ggc aac ctg ctg gac ggc ggc gat ggc 5094
Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly
1685 1690 1695
cgt gac act gtt gac ttc agc ggt ccg ggt cgc ggt ctg gac gca 5139
Arg Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala
1700 1705 1710
ggc gcg aaa ggc gtt ttc ctg agc ctg ggt aag ggt ttc gca tct 5184
Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser
1715 1720 1725
ctg atg gac gaa cca gaa acc agc aat gtc ctg cgt aac atc gaa 5229
Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg Asn Ile Glu
1730 1735 1740
aac gct gtc ggt tcc gca cgc gat gat gtt ctg att ggc gat gct 5274
Asn Ala Val Gly Ser Ala Arg Asp Asp Val Leu Ile Gly Asp Ala
1745 1750 1755
ggt gcc aat gtt ctg aac ggt ctg gcg ggt aat gat gta ctg tct 5319
Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser
1760 1765 1770
ggt ggc gct ggt gat gat gtc ctg ctg ggt gat gag ggc agc gat 5364
Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp
1775 1780 1785
ctg ctg tcc ggc gat gcc ggc aac gac gat ctg ttc ggt ggc caa 5409
Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln
1790 1795 1800
ggt gat gat act tac ctg ttc ggc gtt ggc tat ggt cat gac acc 5454
Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr Gly His Asp Thr
1805 1810 1815
atc tat gag tct ggt ggc ggc cac gat acg att cgt att aat gca 5499
Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala
1820 1825 1830
ggt gct gac caa ctg tgg ttt gca cgt cag ggt aac gat ctg gaa 5544
Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu
1835 1840 1845
att cgc atc ctg ggt act gat gac gct ctg acc gta cac gac tgg 5589
Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp
1850 1855 1860
tac cgc gat gcg gat cac cgc gta gaa atc atc cat gcg gct aac 5634
Tyr Arg Asp Ala Asp His Arg Val Glu Ile Ile His Ala Ala Asn
1865 1870 1875
caa gct gta gac cag gct ggt att gaa aaa ctg gta gaa gcg atg 5679
Gln Ala Val Asp Gln Ala Gly Ile Glu Lys Leu Val Glu Ala Met
1880 1885 1890
gca cag tat ccg gac cca ggt gcg gct gct gca gca cct cca gcg 5724
Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala
1895 1900 1905
gct cgt gtg ccg gat acc ctg atg cag agc ctg gcc gtc aat tgg 5769
Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp
1910 1915 1920
cgt taa 5775
Arg
<210> 64
<211> 1924
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 64
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Pro Leu Thr Ala Asp Ile Asp Met Phe
180 185 190
Ala Ile Met Pro His Leu Ser Asn Phe Arg Asp Ser Ala Arg Ser Ser
195 200 205
Val Thr Ser Gly Asp Ser Val Thr Asp Tyr Leu Ala Arg Thr Arg Arg
210 215 220
Ala Ala Ser Glu Asp Glu Ile Asp Gly Pro Ala Gly Gln Ala Glu Pro
225 230 235 240
Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys Lys Cys Asp Ser
245 250 255
Thr Leu Arg Leu Cys Val Gln Ser Thr His Val Asp Ile Arg Thr Leu
260 265 270
Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys Pro Ile Cys Ser
275 280 285
Gln Lys Pro Ala Ser Gly Val Asn His Gln His Leu Pro Ala Arg Arg
290 295 300
Ala Glu Pro Gln Arg His Thr Met Leu Cys Met Cys Cys Lys Cys Glu
305 310 315 320
Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala Asp Asp Leu Arg Ala
325 330 335
Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe Val Cys Pro Trp Cys
340 345 350
Ala Ser Gln Gln Glu Asn Asp Glu Ala Asp Gly Val Ser His Ala Gln
355 360 365
Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys Ile Leu Cys Val
370 375 380
Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val Glu Ser Ser Ala
385 390 395 400
Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser Thr Leu Ser Phe
405 410 415
Val Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly Asp Thr Pro Thr
420 425 430
Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu Tyr
435 440 445
Cys Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met His Gly Pro Lys
450 455 460
Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro Gln Asn Glu Ile
465 470 475 480
Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp Ser Glu Glu Glu
485 490 495
Asn Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr Leu Gln Glu Ile
500 505 510
Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro Val Asp Leu Leu
515 520 525
Cys Tyr Glu Gln Leu Ser Glu Ser Glu Glu Glu Ser Gln Met Leu Thr
530 535 540
Arg Gly Gln Leu Lys Glu Tyr Ile Gly Gln Gln Arg Gly Glu Gly Tyr
545 550 555 560
Val Phe Tyr Glu Asn Arg Ala Tyr Gly Val Ala Gly Lys Ser Leu Phe
565 570 575
Asp Asp Gly Leu Gly Ala Ala Pro Gly Val Pro Ser Gly Arg Ser Lys
580 585 590
Phe Ser Pro Asp Val Leu Glu Thr Val Pro Ala Ser Pro Gly Leu Arg
595 600 605
Arg Pro Ser Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr Asp Ser
610 615 620
Leu Asp Gly Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val Ser Asp
625 630 635 640
Met Ala Ala Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln Val Leu
645 650 655
His Ala Gly Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser Gly Ala
660 665 670
Ser Ala His Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala Val Ala
675 680 685
Ala Ala Gln Arg Leu Val His Ala Ile Ala Leu Met Thr Gln Phe Gly
690 695 700
Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu Ser Ala
705 710 715 720
Ala Val Phe Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu Thr Val
725 730 735
Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe Gly Val
740 745 750
Ala Gly Gly Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala Val Gly
755 760 765
Ala Gly Met Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys Ala Ala
770 775 780
Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val Glu Leu
785 790 795 800
Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val Thr Ser
805 810 815
Gly Leu Gln Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Leu
820 825 830
Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln Gln Ser
835 840 845
His Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser Ala Tyr
850 855 860
Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp Lys Thr
865 870 875 880
Ala Ala Glu Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser Thr Val
885 890 895
Gly Ala Ala Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly Ala Pro
900 905 910
Val Ala Val Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly Ile Leu
915 920 925
Arg Gly Val Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp Tyr Ala
930 935 940
Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu Lys Asn
945 950 955 960
Leu Gln Ala Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu Arg Lys
965 970 975
Met Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val Ile Gly
980 985 990
Val Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala Ala Ile
995 1000 1005
Thr Gly Asn Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val Asp
1010 1015 1020
Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu
1025 1030 1035
Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu
1040 1045 1050
Arg Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu
1055 1060 1065
Glu Gln Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr
1070 1075 1080
Phe Val Glu Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp
1085 1090 1095
Gly Ala Ala Asp Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln
1100 1105 1110
Leu Val Asp Ala Asn Gly Val Leu Lys His Ser Ile Lys Leu Asp
1115 1120 1125
Val Ile Gly Gly Asp Gly Asp Asp Val Val Leu Ala Asn Ala Ser
1130 1135 1140
Arg Ile His Tyr Asp Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr
1145 1150 1155
Ala Ala Leu Gly Arg Gln Asp Ser Ile Thr Val Ser Ala Asp Gly
1160 1165 1170
Glu Arg Phe Asn Val Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr
1175 1180 1185
Arg Glu Gly Val Ala Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr
1190 1195 1200
Glu Asn Val Gln Tyr Arg His Val Glu Leu Ala Arg Val Gly Gln
1205 1210 1215
Leu Val Glu Val Asp Thr Leu Glu His Val Gln His Ile Ile Gly
1220 1225 1230
Gly Ala Gly Asn Asp Ser Ile Thr Gly Asn Ala His Asp Asn Phe
1235 1240 1245
Leu Ala Gly Gly Ser Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly
1250 1255 1260
Asn Asp Thr Leu Val Gly Gly Glu Gly Gln Asn Thr Val Ile Gly
1265 1270 1275
Gly Ala Gly Asp Asp Val Phe Leu Gln Asp Leu Gly Val Trp Ser
1280 1285 1290
Asn Gln Leu Asp Gly Gly Ala Gly Val Asp Thr Val Lys Tyr Asn
1295 1300 1305
Val His Gln Pro Ser Glu Glu Arg Leu Glu Arg Met Gly Asp Thr
1310 1315 1320
Gly Ile His Ala Asp Leu Gln Lys Gly Thr Val Glu Lys Trp Pro
1325 1330 1335
Ala Leu Asn Leu Phe Ser Val Asp His Val Lys Asn Ile Glu Asn
1340 1345 1350
Leu His Gly Ser Arg Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln
1355 1360 1365
Asp Asn Glu Leu Trp Gly His Asp Gly Asn Asp Thr Ile Arg Gly
1370 1375 1380
Arg Gly Gly Asp Asp Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr
1385 1390 1395
Leu Tyr Gly Glu Asp Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu
1400 1405 1410
Thr Val Ser Asp Asp Ile Asp Gly Gly Ala Gly Leu Asp Thr Val
1415 1420 1425
Asp Tyr Ser Ala Met Ile His Pro Gly Arg Ile Val Ala Pro His
1430 1435 1440
Glu Tyr Gly Phe Gly Ile Glu Ala Asp Leu Ser Arg Glu Trp Val
1445 1450 1455
Arg Lys Ala Ser Ala Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg
1460 1465 1470
Asn Val Glu Asn Val Ile Gly Thr Ser Met Lys Asp Val Leu Ile
1475 1480 1485
Gly Asp Ala Gln Ala Asn Thr Leu Met Gly Gln Gly Gly Asp Asp
1490 1495 1500
Thr Val Arg Gly Gly Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp
1505 1510 1515
Gly Asn Asp Met Leu Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr
1520 1525 1530
Gly Gly Leu Gly Asp Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp
1535 1540 1545
Trp Phe Gly Gln Thr Gln Ala Arg Glu His Asp Val Leu Arg Gly
1550 1555 1560
Gly Asp Gly Val Asp Thr Val Asp Tyr Ser Gln Thr Gly Ala His
1565 1570 1575
Ala Gly Ile Ala Ala Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp
1580 1585 1590
Leu Gly Ala Gly Arg Val Asp Lys Leu Gly Glu Ala Gly Ser Ser
1595 1600 1605
Ala Tyr Asp Thr Val Ser Gly Ile Glu Asn Val Val Gly Thr Glu
1610 1615 1620
Leu Ala Asp Arg Ile Thr Gly Asp Ala Gln Ala Asn Val Leu Arg
1625 1630 1635
Gly Ala Gly Gly Ala Asp Val Leu Ala Gly Gly Glu Gly Asp Asp
1640 1645 1650
Val Leu Leu Gly Gly Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala
1655 1660 1665
Gly Arg Asp Arg Leu Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe
1670 1675 1680
Gln Asp Ala Ala Asn Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly
1685 1690 1695
Arg Asp Thr Val Asp Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala
1700 1705 1710
Gly Ala Lys Gly Val Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser
1715 1720 1725
Leu Met Asp Glu Pro Glu Thr Ser Asn Val Leu Arg Asn Ile Glu
1730 1735 1740
Asn Ala Val Gly Ser Ala Arg Asp Asp Val Leu Ile Gly Asp Ala
1745 1750 1755
Gly Ala Asn Val Leu Asn Gly Leu Ala Gly Asn Asp Val Leu Ser
1760 1765 1770
Gly Gly Ala Gly Asp Asp Val Leu Leu Gly Asp Glu Gly Ser Asp
1775 1780 1785
Leu Leu Ser Gly Asp Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln
1790 1795 1800
Gly Asp Asp Thr Tyr Leu Phe Gly Val Gly Tyr Gly His Asp Thr
1805 1810 1815
Ile Tyr Glu Ser Gly Gly Gly His Asp Thr Ile Arg Ile Asn Ala
1820 1825 1830
Gly Ala Asp Gln Leu Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu
1835 1840 1845
Ile Arg Ile Leu Gly Thr Asp Asp Ala Leu Thr Val His Asp Trp
1850 1855 1860
Tyr Arg Asp Ala Asp His Arg Val Glu Ile Ile His Ala Ala Asn
1865 1870 1875
Gln Ala Val Asp Gln Ala Gly Ile Glu Lys Leu Val Glu Ala Met
1880 1885 1890
Ala Gln Tyr Pro Asp Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala
1895 1900 1905
Ala Arg Val Pro Asp Thr Leu Met Gln Ser Leu Ala Val Asn Trp
1910 1915 1920
Arg
<210> 65
<211> 12105
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid comprising SEQ ID NO:63
<400> 65
atcgagatct gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 60
gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 120
tgaaatgagc tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat 180
aacaattata attttgttta actttaagaa ggagatatac atatgcagca gtcccatcag 240
gccggttacg caaacgcagc cgatcgtgaa tctggtatcc cggcagcggt tctggatggt 300
attaaggcag ttgccaaaga gaagaacgct accctgatgt tccgtctggt caacccacac 360
tctacttccc tgatcgcgga aggtgtggcg accaaaggcc tgggtgtgca cgccaaaagc 420
agcgactggg gtctgcaggc aggttatatt ccggtgaacc cgaatctgtc taaactgttc 480
ggtcgtgccc cggaggtgat cgcacgtgca gacaacgatg tcaactcttc tctggcgcat 540
ggtcacaccg cggttgatct gaccctgtcc aaagaacgcc tggattacct gcgtcaggcg 600
ggcctggtga cgggcatggc cgacggtgtt gtagcgagca accacgcggg ttatgaacaa 660
tttgagtttc gcgttaaaga gacctctgac ggtcgttacg cggtgcagta ccgccgcaaa 720
ggtggcgatg actttgaagc tgtcaaagtg atcggtaacg ctgctggaat tccgctgacc 780
gcggatatcg acatgtttgc catcatgcct cacctgtcca actttcgcga ttccgcacgc 840
agctctgtga cgtctggtga ttccgtcact gactacctgg ctcgtacccg tcgtgcggcc 900
tctgaagacg aaatcgacgg ccctgcgggc caggctgaac cagatcgtgc tcactacaac 960
atcgtaactt tttgctgtaa gtgcgatagc actctgcgtc tgtgcgtaca gtctactcac 1020
gttgatatcc gcactctgga agatctgctg atgggtaccc tgggtatcgt ctgcccaatc 1080
tgctctcaaa agcctgcttc tggtgttaac catcagcacc tgccggctcg tcgcgctgaa 1140
ccacagcgtc acacgatgct gtgcatgtgt tgcaaatgcg aggctcgcat cgaactggtt 1200
gttgaatcca gcgctgacga cctgcgtgcg tttcagcaac tgttcctgaa cacgctgtct 1260
tttgtttgtc cgtggtgtgc ctcccagcag gagaacgatg aagcggatgg cgtgtcccac 1320
gcgcagctgc cggcacgtcg tgcagaaccg cagcgccaca agattctgtg cgtttgctgt 1380
aaatgtgatg gccgtatcga actgactgtg gaatcctccg cggaagatct gcgtacgctg 1440
cagcagctgt tcctgtctac cctgtctttc gtgtgcccgt ggtgcgccac caatcaaatg 1500
cacggcgaca ccccgaccct gcacgaatac atgctggacc tgcagccgga aaccacggat 1560
ctgtattgtt atgaacagct gaacgatagc agcgaggaaa tgcacggtcc gaaagcaact 1620
ctgcaggaca ttgtgctgca tctggagcca cagaacgaaa tcccggttga tctgctgtgc 1680
cacgagcaac tgagcgattc cgaagaggaa aacgacgaaa ttgatatgca tggtccgcgc 1740
gagaccctgc aagaaatcgt cctgcacctg gaaccgcaaa acgaactgga ccctgtagac 1800
ctgctgtgct acgaacagct gtccgaatct gaagaagaat cccagatgct gactcgtggc 1860
cagctgaaag aatacatcgg ccaacagcgt ggcgaaggct acgttttcta cgagaatcgt 1920
gcttacggcg ttgcgggcaa atccctgttc gacgatggtc tgggcgctgc accgggcgtt 1980
ccgagcggcc gttctaaatt cagcccggac gtactggaaa ctgtgccggc ttccccgggc 2040
ctgcgccgtc cgtccctggg cgcagtcgaa cgtcaggact ccggctacga ttccctggat 2100
ggcgttggct cccgctcctt ctccctgggc gaggtttctg acatggctgc ggtggaagcg 2160
gcagagctgg aaatgacccg tcaagtgctg cacgcgggcg cacgtcagga cgatgctgag 2220
ccgggcgtgt ccggtgcgtc tgcacactgg ggtcaacgtg ccctgcaggg tgctcaagct 2280
gtcgcggcag cgcagcgtct ggtacatgcg atcgcactga tgacccagtt cggtcgcgca 2340
ggttctacca acactcctca ggaagcagct agcctgtctg ctgctgtttt cggtctgggc 2400
gaagcgtctt ctgcggttgc agaaaccgtg agcggtttct tccgtggttc tagccgctgg 2460
gcgggtggtt ttggtgtagc aggtggcgct atggccctgg gtggcggtat cgcggctgct 2520
gtcggcgcag gtatgagcct gaccgacgat gctcctgcgg gccagaaagc cgcagctggc 2580
gctgaaatcg cgctgcagct gactggtggt accgttgaac tggctagctc tatcgcgctg 2640
gctctggcag cggcacgtgg cgtgacttct ggcctgcaag tcgccggtgc ctctgcgggc 2700
gctgctgcgg gcgctctggc agctgcactg tcccccatgg aaatctacgg tctggtacag 2760
cagtctcact acgcagacca gctggataaa ctggcgcagg agtcttctgc atacggttac 2820
gaaggcgacg cactgctggc gcagctgtat cgtgacaaaa ctgctgctga aggtgctgtg 2880
gcaggcgttt ctgcggtact gtctaccgtt ggcgctgcgg tttctattgc ggctgccgca 2940
tccgttgtag gtgcgccggt tgctgtagtt acctctctgc tgactggtgc actgaacggt 3000
atcctgcgtg gtgttcagca gcctattatc gaaaaactgg cgaatgatta tgcccgtaaa 3060
atcgacgaac tgggcggtcc gcaggcttat tttgaaaaaa acctgcaggc gcgccacgaa 3120
cagctggcaa acagcgacgg cctgcgcaaa atgctggcag acctgcaagc tggttggaac 3180
gcgtcttctg tgatcggcgt gcagaccacc gaaattagca aatctgcgct ggaactggct 3240
gcaattactg gcaacgcgga taacctgaaa agcgttgatg tttttgtcga tcgcttcgtt 3300
cagggcgagc gcgttgctgg tcagccggtt gttctggacg ttgcggcagg cggcatcgac 3360
atcgctagcc gcaagggcga gcgtccggct ctgactttca ttaccccgct ggcagctccg 3420
ggtgaagaac agcgtcgccg taccaagact ggtaaaagcg agttcaccac cttcgtggaa 3480
atcgtaggta aacaggaccg ctggcgtatt cgcgacggtg cggcggacac caccatcgac 3540
ctggcaaaag ttgtttccca actggtagat gctaacggcg tgctgaaaca ttctattaaa 3600
ctggatgtaa tcggcggtga cggcgatgac gttgtactgg cgaacgcgtc tcgtatccac 3660
tatgacggcg gcgcaggtac caacacggtt tcctacgcag cgctgggccg ccaggattcc 3720
atcactgtta gcgccgatgg cgaacgtttc aacgtgcgta aacagctgaa taacgcaaac 3780
gtctatcgtg agggtgtagc tacccagacc accgcgtacg gtaagcgtac cgaaaacgtt 3840
cagtatcgtc acgtggaact ggcacgtgtg ggtcagctgg tagaggtgga tacgctggaa 3900
cacgtgcagc acatcatcgg tggcgccggt aacgattcca ttactggtaa cgctcacgac 3960
aacttcctgg caggtggttc tggtgatgat cgtctggacg gtggtgcggg taacgatacg 4020
ctggtaggcg gcgaaggtca gaacaccgta attggtggtg ccggtgacga cgttttcctg 4080
caggatctgg gcgtttggag caaccagctg gatggcggtg ccggtgttga cacggttaag 4140
tataacgttc accagccgtc tgaagagcgc ctggaacgta tgggtgacac tggtattcat 4200
gccgatctgc agaaaggcac tgttgaaaaa tggcctgcgc tgaacctgtt ctctgtggac 4260
catgttaaga acattgaaaa cctgcatggc tctcgcctga acgaccgtat cgctggtgac 4320
gaccaggata acgaactgtg gggtcatgac ggcaatgata ccattcgcgg tcgtggcggc 4380
gacgatattc tgcgtggcgg tctgggcctg gataccctgt atggtgaaga tggtaacgat 4440
attttcctgc aagacgatga aacggtatct gatgacatcg acggtggtgc aggcctggac 4500
accgtagatt acagcgctat gatccatccg ggtcgtatcg tagctccgca cgagtacggc 4560
ttcggtatcg aggcggacct gtctcgtgaa tgggttcgta aagcgtccgc gctgggtgtg 4620
gactactacg ataacgttcg taacgtggaa aacgtgatcg gtacctccat gaaagacgtg 4680
ctgattggcg acgcacaggc caacactctg atgggccagg gcggtgatga cacggttcgc 4740
ggcggcgacg gtgatgacct gctgttcggt ggtgacggca acgacatgct gtacggcgac 4800
gcgggcaacg acaccctgta cggcggtctg ggtgacgaca ctctggaagg tggtgcaggt 4860
aacgactggt tcggccaaac ccaggcacgc gaacacgacg tgctgcgtgg tggcgacggc 4920
gtagacaccg tggattactc ccaaactggc gctcacgcgg gtatcgcggc cggtcgtatc 4980
ggtctgggca ttctggccga tctgggtgcc ggccgtgtcg acaaactggg tgaggctggc 5040
tctagcgcct atgatactgt ttccggcatc gaaaacgtgg taggcactga actggcagat 5100
cgtatcacgg gtgacgcgca agcgaacgtt ctgcgtggtg ctggcggtgc agacgtgctg 5160
gcgggtggtg aaggcgacga cgtactgctg ggcggtgacg gtgacgatca gctgagcggt 5220
gatgcgggtc gtgaccgtct gtacggtgaa gcaggtgacg attggttctt ccaggacgct 5280
gctaacgctg gcaacctgct ggacggcggc gatggccgtg acactgttga cttcagcggt 5340
ccgggtcgcg gtctggacgc aggcgcgaaa ggcgttttcc tgagcctggg taagggtttc 5400
gcatctctga tggacgaacc agaaaccagc aatgtcctgc gtaacatcga aaacgctgtc 5460
ggttccgcac gcgatgatgt tctgattggc gatgctggtg ccaatgttct gaacggtctg 5520
gcgggtaatg atgtactgtc tggtggcgct ggtgatgatg tcctgctggg tgatgagggc 5580
agcgatctgc tgtccggcga tgccggcaac gacgatctgt tcggtggcca aggtgatgat 5640
acttacctgt tcggcgttgg ctatggtcat gacaccatct atgagtctgg tggcggccac 5700
gatacgattc gtattaatgc aggtgctgac caactgtggt ttgcacgtca gggtaacgat 5760
ctggaaattc gcatcctggg tactgatgac gctctgaccg tacacgactg gtaccgcgat 5820
gcggatcacc gcgtagaaat catccatgcg gctaaccaag ctgtagacca ggctggtatt 5880
gaaaaactgg tagaagcgat ggcacagtat ccggacccag gtgcggctgc tgcagcacct 5940
ccagcggctc gtgtgccgga taccctgatg cagagcctgg ccgtcaattg gcgttaatgg 6000
atccaggcct ctttagaagg agatatacca tgctgccgtc tgcacaggcg ccgtctctgc 6060
tgaatccaac tgatgacttc gctgcgctgg gtaacatcgc gtggctgtgg atgaacagcc 6120
cgatgcaccg tgactggccg gttcacctgc tggcacgtaa cacgctggcg ccgatccagc 6180
tgggtcaata catcctgctg cgttgtaacg acgtgcctgt ggcgtattgc tcctgggcac 6240
tgatggatgc ggataccgag ctgtcctacg ttatggcccc atctagcctg ggcggtaacg 6300
cttggaactg cggcgatcgt ctgtggatca ttgattggat tgctccgttt agccgtgacg 6360
acaaccgtgc tctgcgtcgc gcgctggccg aacgtcatcc ggattctgtt ggccgttccc 6420
tgcgcgtacg tcgcggtggc gacaccgctc gcgtcaaaga ataccgtggt cgtgctctgg 6480
acgcagcggc ggcccgcgct cagctggacc gctaccacgc agaactgatt gccggtctgc 6540
gtgcatccaa tggcggttat gctccgcgtg gccgtggcac cgcataatct agaattcttt 6600
aattaaagat ccggctgcta acaaagcccg aaaggaagct gagttggctg ctgccaccgc 6660
tgagcaatcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 6720
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg gagcggattt 6780
gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat aaactgccag 6840
gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgctagca gcacgccata 6900
gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 6960
aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 7020
gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 7080
ttaaagctta tcgatgataa gctgtcaaac atgagaattc ttagaaaaac tcatcgagca 7140
tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc 7200
gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt 7260
atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa 7320
aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca 7380
aaagcttatg catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa 7440
aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata 7500
cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca 7560
ctgccagcgc atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg 7620
ctgttttccc ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat 7680
gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg 7740
taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct 7800
tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat 7860
acccatataa atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc 7920
gttgaatatg gctcataaca ccccttgtat tactgtttat gtaagcagac agttttattg 7980
ttcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 8040
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 8100
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 8160
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg 8220
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 8280
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 8340
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 8400
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 8460
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 8520
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 8580
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 8640
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 8700
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 8760
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 8820
gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 8880
aatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc 8940
gctatcgcta cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc 9000
gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 9060
gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agctgcggta 9120
aagctcatca gcgtggtcgt gaagcgattc acagatgtct gcctgttcat ccgcgtccag 9180
ctcgttgagt ttctccagaa gcgttaatgt ctggcttctg ataaagcggg ccatgttaag 9240
ggcggttttt tcctgtttgg tcactgatgc ctccgtgtaa gggggatttc tgttcatggg 9300
ggtaatgata ccgatgaaac gagagaggat gctcacgata cgggttactg atgatgaaca 9360
tgcccggtta ctggaacgtt gtgagggtaa acaactggcg gtatggatgc ggcgggacca 9420
gagaaaaatc actcagggtc aatgccagcg cttcgttaat acagatgtag gtgttccaca 9480
gggtagccag cagcatcctg cgatgcagat ccggaacata atggtgcagg gcgctgactt 9540
ccgcgtttcc agactttacg aaacacggaa accgaagacc attcatgttg ttgctcaggt 9600
cgcagacgtt ttgcagcagc agtcgcttca cgttcgctcg cgtatcggtg attcattctg 9660
ctaaccagta aggcaacccc gccagcctag ccgggtcctc aacgacagga gcacgatcat 9720
gcgcacccgt ggccaggacc caacgctgcc cgagatgcgc cgcgtgcggc tgctggagat 9780
ggcggacgcg atggatatgt tctgccaagg gttggtttgc gcattcacag ttctccgcaa 9840
gaattgattg gctccaattc ttggagtggt gaatccgtta gcgaggtgcc gccggcttcc 9900
attcaggtcg aggtggcccg gctccatgca ccgcgacgca acgcggggag gcagacaagg 9960
tatagggcgg cgcctacaat ccatgccaac ccgttccatg tgctcgccga ggcggcataa 10020
atcgccgtga cgatcagcgg tccaatgatc gaagttaggc tggtaagagc cgcgagcgat 10080
ccttgaagct gtccctgatg gtcgtcatct acctgcctgg acagcatggc ctgcaacgcg 10140
ggcatcccga tgccgccgga agcgagaaga atcataatgg ggaaggccat ccagcctcgc 10200
gtcgcgaacg ccagcaagac gtagcccagc gcgtcggccg ccatgccggc gataatggcc 10260
tgcttctcgc cgaaacgttt ggtggcggga ccagtgacga aggcttgagc gagggcgtgc 10320
aagattccga ataccgcaag cgacaggccg atcatcgtcg cgctccagcg aaagcggtcc 10380
tcgccgaaaa tgacccagag cgctgccggc acctgtccta cgagttgcat gataaagaag 10440
acagtcataa gtgcggcgac gatagtcatg ccccgcgccc accggaagga gctgactggg 10500
ttgaaggctc tcaagggcat cggtcgactc atagctgttt cctgtgtgaa attgttatcc 10560
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 10620
atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 10680
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 10740
tgggcgctag cgtggttttt cttttcacca gtgagacggg caacagctga ttgcccttca 10800
ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc agcaggcgaa 10860
aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg gtatcgtcgt 10920
atcccactac cgagatatcc gcaccaacgc gcagcccgga ctcggtaatg gcgcgcattg 10980
cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg ccctcattca 11040
gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc cgttccgcta 11100
tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc agacgcgccg 11160
agacagaact taatgggccc gctaacagcg cgatttgctg gtgacccaat gcgaccagat 11220
gctccacgcc cagtcgcgta ccgtcttcat gggagaaaat aatactgttg atgggtgtct 11280
ggtcagagac atcaagaaat aacgccggaa cattagtgca ggcagcttcc acagcaatgg 11340
catcctggtc atccagcgga tagttaatga tcagcccact gacgcgttgc gcgagaagat 11400
tgtgcaccgc cgctttacag gcttcgacgc cgcttcgttc taccatcgac accaccacgc 11460
tggcacccag ttgatcggcg cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca 11520
gggccagact ggaggtggca acgccaatca gcaacgactg tttgcccgcc agttgttgtg 11580
ccacgcggtt gggaatgtaa ttcagctccg ccatcgccgc ttccactttt tcccgcgttt 11640
tcgcagaaac gtggctggcc tggttcacca cgcgggaaac ggtctgataa gagacaccgg 11700
catactctgc gacatcgtat aacgttactg gtttcacatt caccaccctg aattgactct 11760
cttccgggcg ctatcatgcc ataccgcgaa aggttttgcg ccattcgatg gtgtcggaat 11820
ttatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt 11880
ccgcttcctc gctcactgac tcgctgccac cccgtggcat gcaaggagat ggcgcccaac 11940
agtcccccgg ccacggggcc tgccaccata cccacgccga aacaagcgct catgagcccg 12000
aagtggcgag cccgatcttc cccatcggtg atgtcggcga tataggcgcc agcaaccgca 12060
cctgtggcgc cggtgatgcc ggccacgatg cgtccggcgt agagg 12105
<210> 66
<211> 5445
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide encoding chimeric CyaA delta 203+ antigen HPV16, HVP18
and HPV45 full
<220>
<221> CDS
<222> (1)..(5445)
<400> 66
atg cag cag tcc cat cag gcc ggt tac gca aac gca gcc gat cgt gaa 48
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
tct ggt atc ccg gca gcg gtt ctg gat ggt att aag gca gtt gcc aaa 96
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
gag aag aac gct acc ctg atg ttc cgt ctg gtc aac cca cac tct act 144
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
tcc ctg atc gcg gaa ggt gtg gcg acc aaa ggc ctg ggt gtg cac gcc 192
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
aaa agc agc gac tgg ggt ctg cag gca ggt tat att ccg gtg aac ccg 240
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
aat ctg tct aaa ctg ttc ggt cgt gcc ccg gag gtg atc gca cgt gca 288
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
gac aac gat gtc aac tct tct ctg gcg cat ggt cac acc gcg gtt gat 336
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
ctg acc ctg tcc aaa gaa cgc ctg gat tac ctg cgt cag gcg ggc ctg 384
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
gtg acg ggc atg gcc gac ggt gtt gta gcg agc aac cac gcg ggt tat 432
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
gaa caa ttt gag ttt cgc gtt aaa gag acc tct gac ggt cgt tac gcg 480
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
gtg cag tac cgc cgc aaa ggt ggc gat gac ttt gaa gct gtc aaa gtg 528
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
atc ggt aac gct gct gga att gaa gac gaa atc gac ggc cct gcg ggc 576
Ile Gly Asn Ala Ala Gly Ile Glu Asp Glu Ile Asp Gly Pro Ala Gly
180 185 190
cag gct gaa cca gat cgt gct cac tac aac atc gta act ttt tgc tgt 624
Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys
195 200 205
aag tgc gat agc act ctg cgt ctg tgc gta cag tct act cac gtt gat 672
Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val Asp
210 215 220
atc cgc act ctg gaa gat ctg ctg atg ggt acc ctg ggt atc gtc tgc 720
Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys
225 230 235 240
cca atc tgc tct caa aag cct gct tct ggt gtt aac cat cag cac ctg 768
Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His Leu
245 250 255
ccg gct cgt cgc gct gaa cca cag cgt cac acg atg ctg tgc atg tgt 816
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met Cys
260 265 270
tgc aaa tgc gag gct cgc atc gaa ctg gtt gtt gaa tcc agc gct gac 864
Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala Asp
275 280 285
gac ctg cgt gcg ttt cag caa ctg ttc ctg aac acg ctg tct ttt gtt 912
Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe Val
290 295 300
tgt ccg tgg tgt gcc tcc cag cag gag aac gat gaa gcg gat ggc gtg 960
Cys Pro Trp Cys Ala Ser Gln Gln Glu Asn Asp Glu Ala Asp Gly Val
305 310 315 320
tcc cac gcg cag ctg ccg gca cgt cgt gca gaa ccg cag cgc cac aag 1008
Ser His Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys
325 330 335
att ctg tgc gtt tgc tgt aaa tgt gat ggc cgt atc gaa ctg act gtg 1056
Ile Leu Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val
340 345 350
gaa tcc tcc gcg gaa gat ctg cgt acg ctg cag cag ctg ttc ctg tct 1104
Glu Ser Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser
355 360 365
acc ctg tct ttc gtg tgc ccg tgg tgc gcc acc aat caa atg cac ggc 1152
Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly
370 375 380
gac acc ccg acc ctg cac gaa tac atg ctg gac ctg cag ccg gaa acc 1200
Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr
385 390 395 400
acg gat ctg tat tgt tat gaa cag ctg aac gat agc agc gag gaa atg 1248
Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met
405 410 415
cac ggt ccg aaa gca act ctg cag gac att gtg ctg cat ctg gag cca 1296
His Gly Pro Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro
420 425 430
cag aac gaa atc ccg gtt gat ctg ctg tgc cac gag caa ctg agc gat 1344
Gln Asn Glu Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp
435 440 445
tcc gaa gag gaa aac gac gaa att gat atg cat ggt ccg cgc gag acc 1392
Ser Glu Glu Glu Asn Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr
450 455 460
ctg caa gaa atc gtc ctg cac ctg gaa ccg caa aac gaa ctg gac cct 1440
Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro
465 470 475 480
gta gac ctg ctg tgc tac gaa cag ctg tcc gaa tct gaa gaa ccg ggc 1488
Val Asp Leu Leu Cys Tyr Glu Gln Leu Ser Glu Ser Glu Glu Pro Gly
485 490 495
ctg cgc cgt ccg tcc ctg ggc gca gtc gaa cgt cag gac tcc ggc tac 1536
Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr
500 505 510
gat tcc ctg gat ggc gtt ggc tcc cgc tcc ttc tcc ctg ggc gag gtt 1584
Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val
515 520 525
tct gac atg gct gcg gtg gaa gcg gca gag ctg gaa atg acc cgt caa 1632
Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln
530 535 540
gtg ctg cac gcg ggc gca cgt cag gac gat gct gag ccg ggc gtg tcc 1680
Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser
545 550 555 560
ggt gcg tct gca cac tgg ggt caa cgt gcc ctg cag ggt gct caa gct 1728
Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala
565 570 575
gtc gcg gca gcg cag cgt ctg gta cat gcg atc gca ctg atg acc cag 1776
Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala Leu Met Thr Gln
580 585 590
ttc ggt cgc gca ggt tct acc aac act cct cag gaa gca gct agc ctg 1824
Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu
595 600 605
tct gct gct gtt ttc ggt ctg ggc gaa gcg tct tct gcg gtt gca gaa 1872
Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu
610 615 620
acc gtg agc ggt ttc ttc cgt ggt tct agc cgc tgg gcg ggt ggt ttt 1920
Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe
625 630 635 640
ggt gta gca ggt ggc gct atg gcc ctg ggt ggc ggt atc gcg gct gct 1968
Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala
645 650 655
gtc ggc gca ggt atg agc ctg acc gac gat gct cct gcg ggc cag aaa 2016
Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys
660 665 670
gcc gca gct ggc gct gaa atc gcg ctg cag ctg act ggt ggt acc gtt 2064
Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val
675 680 685
gaa ctg gct agc tct atc gcg ctg gct ctg gca gcg gca cgt ggc gtg 2112
Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val
690 695 700
act tct ggc ctg caa gtc gcc ggt gcc tct gcg ggc gct gct gcg ggc 2160
Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly
705 710 715 720
gct ctg gca gct gca ctg tcc ccc atg gaa atc tac ggt ctg gta cag 2208
Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln
725 730 735
cag tct cac tac gca gac cag ctg gat aaa ctg gcg cag gag tct tct 2256
Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser
740 745 750
gca tac ggt tac gaa ggc gac gca ctg ctg gcg cag ctg tat cgt gac 2304
Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp
755 760 765
aaa act gct gct gaa ggt gct gtg gca ggc gtt tct gcg gta ctg tct 2352
Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser
770 775 780
acc gtt ggc gct gcg gtt tct att gcg gct gcc gca tcc gtt gta ggt 2400
Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly
785 790 795 800
gcg ccg gtt gct gta gtt acc tct ctg ctg act ggt gca ctg aac ggt 2448
Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly
805 810 815
atc ctg cgt ggt gtt cag cag cct att atc gaa aaa ctg gcg aat gat 2496
Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp
820 825 830
tat gcc cgt aaa atc gac gaa ctg ggc ggt ccg cag gct tat ttt gaa 2544
Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu
835 840 845
aaa aac ctg cag gcg cgc cac gaa cag ctg gca aac agc gac ggc ctg 2592
Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu
850 855 860
cgc aaa atg ctg gca gac ctg caa gct ggt tgg aac gcg tct tct gtg 2640
Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val
865 870 875 880
atc ggc gtg cag acc acc gaa att agc aaa tct gcg ctg gaa ctg gct 2688
Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala
885 890 895
gca att act ggc aac gcg gat aac ctg aaa agc gtt gat gtt ttt gtc 2736
Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val
900 905 910
gat cgc ttc gtt cag ggc gag cgc gtt gct ggt cag ccg gtt gtt ctg 2784
Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu
915 920 925
gac gtt gcg gca ggc ggc atc gac atc gct agc cgc aag ggc gag cgt 2832
Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg
930 935 940
ccg gct ctg act ttc att acc ccg ctg gca gct ccg ggt gaa gaa cag 2880
Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln
945 950 955 960
cgt cgc cgt acc aag act ggt aaa agc gag ttc acc acc ttc gtg gaa 2928
Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu
965 970 975
atc gta ggt aaa cag gac cgc tgg cgt att cgc gac ggt gcg gcg gac 2976
Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp
980 985 990
acc acc atc gac ctg gca aaa gtt gtt tcc caa ctg gta gat gct aac 3024
Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn
995 1000 1005
ggc gtg ctg aaa cat tct att aaa ctg gat gta atc ggc ggt gac 3069
Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile Gly Gly Asp
1010 1015 1020
ggc gat gac gtt gta ctg gcg aac gcg tct cgt atc cac tat gac 3114
Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His Tyr Asp
1025 1030 1035
ggc ggc gca ggt acc aac acg gtt tcc tac gca gcg ctg ggc cgc 3159
Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg
1040 1045 1050
cag gat tcc atc act gtt agc gcc gat ggc gaa cgt ttc aac gtg 3204
Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
1055 1060 1065
cgt aaa cag ctg aat aac gca aac gtc tat cgt gag ggt gta gct 3249
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala
1070 1075 1080
acc cag acc acc gcg tac ggt aag cgt acc gaa aac gtt cag tat 3294
Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr
1085 1090 1095
cgt cac gtg gaa ctg gca cgt gtg ggt cag ctg gta gag gtg gat 3339
Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
1100 1105 1110
acg ctg gaa cac gtg cag cac atc atc ggt ggc gcc ggt aac gat 3384
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp
1115 1120 1125
tcc att act ggt aac gct cac gac aac ttc ctg gca ggt ggt tct 3429
Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
1130 1135 1140
ggt gat gat cgt ctg gac ggt ggt gcg ggt aac gat acg ctg gta 3474
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val
1145 1150 1155
ggc ggc gaa ggt cag aac acc gta att ggt ggt gcc ggt gac gac 3519
Gly Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp
1160 1165 1170
gtt ttc ctg cag gat ctg ggc gtt tgg agc aac cag ctg gat ggc 3564
Val Phe Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly
1175 1180 1185
ggt gcc ggt gtt gac acg gtt aag tat aac gtt cac cag ccg tct 3609
Gly Ala Gly Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser
1190 1195 1200
gaa gag cgc ctg gaa cgt atg ggt gac act ggt att cat gcc gat 3654
Glu Glu Arg Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp
1205 1210 1215
ctg cag aaa ggc act gtt gaa aaa tgg cct gcg ctg aac ctg ttc 3699
Leu Gln Lys Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe
1220 1225 1230
tct gtg gac cat gtt aag aac att gaa aac ctg cat ggc tct cgc 3744
Ser Val Asp His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg
1235 1240 1245
ctg aac gac cgt atc gct ggt gac gac cag gat aac gaa ctg tgg 3789
Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp
1250 1255 1260
ggt cat gac ggc aat gat acc att cgc ggt cgt ggc ggc gac gat 3834
Gly His Asp Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp
1265 1270 1275
att ctg cgt ggc ggt ctg ggc ctg gat acc ctg tat ggt gaa gat 3879
Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp
1280 1285 1290
ggt aac gat att ttc ctg caa gac gat gaa acg gta tct gat gac 3924
Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp
1295 1300 1305
atc gac ggt ggt gca ggc ctg gac acc gta gat tac agc gct atg 3969
Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met
1310 1315 1320
atc cat ccg ggt cgt atc gta gct ccg cac gag tac ggc ttc ggt 4014
Ile His Pro Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly
1325 1330 1335
atc gag gcg gac ctg tct cgt gaa tgg gtt cgt aaa gcg tcc gcg 4059
Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala
1340 1345 1350
ctg ggt gtg gac tac tac gat aac gtt cgt aac gtg gaa aac gtg 4104
Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val
1355 1360 1365
atc ggt acc tcc atg aaa gac gtg ctg att ggc gac gca cag gcc 4149
Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala
1370 1375 1380
aac act ctg atg ggc cag ggc ggt gat gac acg gtt cgc ggc ggc 4194
Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly
1385 1390 1395
gac ggt gat gac ctg ctg ttc ggt ggt gac ggc aac gac atg ctg 4239
Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu
1400 1405 1410
tac ggc gac gcg ggc aac gac acc ctg tac ggc ggt ctg ggt gac 4284
Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp
1415 1420 1425
gac act ctg gaa ggt ggt gca ggt aac gac tgg ttc ggc caa acc 4329
Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr
1430 1435 1440
cag gca cgc gaa cac gac gtg ctg cgt ggt ggc gac ggc gta gac 4374
Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp
1445 1450 1455
acc gtg gat tac tcc caa act ggc gct cac gcg ggt atc gcg gcc 4419
Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala
1460 1465 1470
ggt cgt atc ggt ctg ggc att ctg gcc gat ctg ggt gcc ggc cgt 4464
Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg
1475 1480 1485
gtc gac aaa ctg ggt gag gct ggc tct agc gcc tat gat act gtt 4509
Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val
1490 1495 1500
tcc ggc atc gaa aac gtg gta ggc act gaa ctg gca gat cgt atc 4554
Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile
1505 1510 1515
acg ggt gac gcg caa gcg aac gtt ctg cgt ggt gct ggc ggt gca 4599
Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala
1520 1525 1530
gac gtg ctg gcg ggt ggt gaa ggc gac gac gta ctg ctg ggc ggt 4644
Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly
1535 1540 1545
gac ggt gac gat cag ctg agc ggt gat gcg ggt cgt gac cgt ctg 4689
Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu
1550 1555 1560
tac ggt gaa gca ggt gac gat tgg ttc ttc cag gac gct gct aac 4734
Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn
1565 1570 1575
gct ggc aac ctg ctg gac ggc ggc gat ggc cgt gac act gtt gac 4779
Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp
1580 1585 1590
ttc agc ggt ccg ggt cgc ggt ctg gac gca ggc gcg aaa ggc gtt 4824
Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val
1595 1600 1605
ttc ctg agc ctg ggt aag ggt ttc gca tct ctg atg gac gaa cca 4869
Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro
1610 1615 1620
gaa acc agc aat gtc ctg cgt aac atc gaa aac gct gtc ggt tcc 4914
Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser
1625 1630 1635
gca cgc gat gat gtt ctg att ggc gat gct ggt gcc aat gtt ctg 4959
Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu
1640 1645 1650
aac ggt ctg gcg ggt aat gat gta ctg tct ggt ggc gct ggt gat 5004
Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp
1655 1660 1665
gat gtc ctg ctg ggt gat gag ggc agc gat ctg ctg tcc ggc gat 5049
Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp
1670 1675 1680
gcc ggc aac gac gat ctg ttc ggt ggc caa ggt gat gat act tac 5094
Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr
1685 1690 1695
ctg ttc ggc gtt ggc tat ggt cat gac acc atc tat gag tct ggt 5139
Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly
1700 1705 1710
ggc ggc cac gat acg att cgt att aat gca ggt gct gac caa ctg 5184
Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu
1715 1720 1725
tgg ttt gca cgt cag ggt aac gat ctg gaa att cgc atc ctg ggt 5229
Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly
1730 1735 1740
act gat gac gct ctg acc gta cac gac tgg tac cgc gat gcg gat 5274
Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp
1745 1750 1755
cac cgc gta gaa atc atc cat gcg gct aac caa gct gta gac cag 5319
His Arg Val Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln
1760 1765 1770
gct ggt att gaa aaa ctg gta gaa gcg atg gca cag tat ccg gac 5364
Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp
1775 1780 1785
cca ggt gcg gct gct gca gca cct cca gcg gct cgt gtg ccg gat 5409
Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp
1790 1795 1800
acc ctg atg cag agc ctg gcc gtc aat tgg cgt taa 5445
Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1805 1810
<210> 67
<211> 1814
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 67
Met Gln Gln Ser His Gln Ala Gly Tyr Ala Asn Ala Ala Asp Arg Glu
1 5 10 15
Ser Gly Ile Pro Ala Ala Val Leu Asp Gly Ile Lys Ala Val Ala Lys
20 25 30
Glu Lys Asn Ala Thr Leu Met Phe Arg Leu Val Asn Pro His Ser Thr
35 40 45
Ser Leu Ile Ala Glu Gly Val Ala Thr Lys Gly Leu Gly Val His Ala
50 55 60
Lys Ser Ser Asp Trp Gly Leu Gln Ala Gly Tyr Ile Pro Val Asn Pro
65 70 75 80
Asn Leu Ser Lys Leu Phe Gly Arg Ala Pro Glu Val Ile Ala Arg Ala
85 90 95
Asp Asn Asp Val Asn Ser Ser Leu Ala His Gly His Thr Ala Val Asp
100 105 110
Leu Thr Leu Ser Lys Glu Arg Leu Asp Tyr Leu Arg Gln Ala Gly Leu
115 120 125
Val Thr Gly Met Ala Asp Gly Val Val Ala Ser Asn His Ala Gly Tyr
130 135 140
Glu Gln Phe Glu Phe Arg Val Lys Glu Thr Ser Asp Gly Arg Tyr Ala
145 150 155 160
Val Gln Tyr Arg Arg Lys Gly Gly Asp Asp Phe Glu Ala Val Lys Val
165 170 175
Ile Gly Asn Ala Ala Gly Ile Glu Asp Glu Ile Asp Gly Pro Ala Gly
180 185 190
Gln Ala Glu Pro Asp Arg Ala His Tyr Asn Ile Val Thr Phe Cys Cys
195 200 205
Lys Cys Asp Ser Thr Leu Arg Leu Cys Val Gln Ser Thr His Val Asp
210 215 220
Ile Arg Thr Leu Glu Asp Leu Leu Met Gly Thr Leu Gly Ile Val Cys
225 230 235 240
Pro Ile Cys Ser Gln Lys Pro Ala Ser Gly Val Asn His Gln His Leu
245 250 255
Pro Ala Arg Arg Ala Glu Pro Gln Arg His Thr Met Leu Cys Met Cys
260 265 270
Cys Lys Cys Glu Ala Arg Ile Glu Leu Val Val Glu Ser Ser Ala Asp
275 280 285
Asp Leu Arg Ala Phe Gln Gln Leu Phe Leu Asn Thr Leu Ser Phe Val
290 295 300
Cys Pro Trp Cys Ala Ser Gln Gln Glu Asn Asp Glu Ala Asp Gly Val
305 310 315 320
Ser His Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg His Lys
325 330 335
Ile Leu Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu Thr Val
340 345 350
Glu Ser Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe Leu Ser
355 360 365
Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met His Gly
370 375 380
Asp Thr Pro Thr Leu His Glu Tyr Met Leu Asp Leu Gln Pro Glu Thr
385 390 395 400
Thr Asp Leu Tyr Cys Tyr Glu Gln Leu Asn Asp Ser Ser Glu Glu Met
405 410 415
His Gly Pro Lys Ala Thr Leu Gln Asp Ile Val Leu His Leu Glu Pro
420 425 430
Gln Asn Glu Ile Pro Val Asp Leu Leu Cys His Glu Gln Leu Ser Asp
435 440 445
Ser Glu Glu Glu Asn Asp Glu Ile Asp Met His Gly Pro Arg Glu Thr
450 455 460
Leu Gln Glu Ile Val Leu His Leu Glu Pro Gln Asn Glu Leu Asp Pro
465 470 475 480
Val Asp Leu Leu Cys Tyr Glu Gln Leu Ser Glu Ser Glu Glu Pro Gly
485 490 495
Leu Arg Arg Pro Ser Leu Gly Ala Val Glu Arg Gln Asp Ser Gly Tyr
500 505 510
Asp Ser Leu Asp Gly Val Gly Ser Arg Ser Phe Ser Leu Gly Glu Val
515 520 525
Ser Asp Met Ala Ala Val Glu Ala Ala Glu Leu Glu Met Thr Arg Gln
530 535 540
Val Leu His Ala Gly Ala Arg Gln Asp Asp Ala Glu Pro Gly Val Ser
545 550 555 560
Gly Ala Ser Ala His Trp Gly Gln Arg Ala Leu Gln Gly Ala Gln Ala
565 570 575
Val Ala Ala Ala Gln Arg Leu Val His Ala Ile Ala Leu Met Thr Gln
580 585 590
Phe Gly Arg Ala Gly Ser Thr Asn Thr Pro Gln Glu Ala Ala Ser Leu
595 600 605
Ser Ala Ala Val Phe Gly Leu Gly Glu Ala Ser Ser Ala Val Ala Glu
610 615 620
Thr Val Ser Gly Phe Phe Arg Gly Ser Ser Arg Trp Ala Gly Gly Phe
625 630 635 640
Gly Val Ala Gly Gly Ala Met Ala Leu Gly Gly Gly Ile Ala Ala Ala
645 650 655
Val Gly Ala Gly Met Ser Leu Thr Asp Asp Ala Pro Ala Gly Gln Lys
660 665 670
Ala Ala Ala Gly Ala Glu Ile Ala Leu Gln Leu Thr Gly Gly Thr Val
675 680 685
Glu Leu Ala Ser Ser Ile Ala Leu Ala Leu Ala Ala Ala Arg Gly Val
690 695 700
Thr Ser Gly Leu Gln Val Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly
705 710 715 720
Ala Leu Ala Ala Ala Leu Ser Pro Met Glu Ile Tyr Gly Leu Val Gln
725 730 735
Gln Ser His Tyr Ala Asp Gln Leu Asp Lys Leu Ala Gln Glu Ser Ser
740 745 750
Ala Tyr Gly Tyr Glu Gly Asp Ala Leu Leu Ala Gln Leu Tyr Arg Asp
755 760 765
Lys Thr Ala Ala Glu Gly Ala Val Ala Gly Val Ser Ala Val Leu Ser
770 775 780
Thr Val Gly Ala Ala Val Ser Ile Ala Ala Ala Ala Ser Val Val Gly
785 790 795 800
Ala Pro Val Ala Val Val Thr Ser Leu Leu Thr Gly Ala Leu Asn Gly
805 810 815
Ile Leu Arg Gly Val Gln Gln Pro Ile Ile Glu Lys Leu Ala Asn Asp
820 825 830
Tyr Ala Arg Lys Ile Asp Glu Leu Gly Gly Pro Gln Ala Tyr Phe Glu
835 840 845
Lys Asn Leu Gln Ala Arg His Glu Gln Leu Ala Asn Ser Asp Gly Leu
850 855 860
Arg Lys Met Leu Ala Asp Leu Gln Ala Gly Trp Asn Ala Ser Ser Val
865 870 875 880
Ile Gly Val Gln Thr Thr Glu Ile Ser Lys Ser Ala Leu Glu Leu Ala
885 890 895
Ala Ile Thr Gly Asn Ala Asp Asn Leu Lys Ser Val Asp Val Phe Val
900 905 910
Asp Arg Phe Val Gln Gly Glu Arg Val Ala Gly Gln Pro Val Val Leu
915 920 925
Asp Val Ala Ala Gly Gly Ile Asp Ile Ala Ser Arg Lys Gly Glu Arg
930 935 940
Pro Ala Leu Thr Phe Ile Thr Pro Leu Ala Ala Pro Gly Glu Glu Gln
945 950 955 960
Arg Arg Arg Thr Lys Thr Gly Lys Ser Glu Phe Thr Thr Phe Val Glu
965 970 975
Ile Val Gly Lys Gln Asp Arg Trp Arg Ile Arg Asp Gly Ala Ala Asp
980 985 990
Thr Thr Ile Asp Leu Ala Lys Val Val Ser Gln Leu Val Asp Ala Asn
995 1000 1005
Gly Val Leu Lys His Ser Ile Lys Leu Asp Val Ile Gly Gly Asp
1010 1015 1020
Gly Asp Asp Val Val Leu Ala Asn Ala Ser Arg Ile His Tyr Asp
1025 1030 1035
Gly Gly Ala Gly Thr Asn Thr Val Ser Tyr Ala Ala Leu Gly Arg
1040 1045 1050
Gln Asp Ser Ile Thr Val Ser Ala Asp Gly Glu Arg Phe Asn Val
1055 1060 1065
Arg Lys Gln Leu Asn Asn Ala Asn Val Tyr Arg Glu Gly Val Ala
1070 1075 1080
Thr Gln Thr Thr Ala Tyr Gly Lys Arg Thr Glu Asn Val Gln Tyr
1085 1090 1095
Arg His Val Glu Leu Ala Arg Val Gly Gln Leu Val Glu Val Asp
1100 1105 1110
Thr Leu Glu His Val Gln His Ile Ile Gly Gly Ala Gly Asn Asp
1115 1120 1125
Ser Ile Thr Gly Asn Ala His Asp Asn Phe Leu Ala Gly Gly Ser
1130 1135 1140
Gly Asp Asp Arg Leu Asp Gly Gly Ala Gly Asn Asp Thr Leu Val
1145 1150 1155
Gly Gly Glu Gly Gln Asn Thr Val Ile Gly Gly Ala Gly Asp Asp
1160 1165 1170
Val Phe Leu Gln Asp Leu Gly Val Trp Ser Asn Gln Leu Asp Gly
1175 1180 1185
Gly Ala Gly Val Asp Thr Val Lys Tyr Asn Val His Gln Pro Ser
1190 1195 1200
Glu Glu Arg Leu Glu Arg Met Gly Asp Thr Gly Ile His Ala Asp
1205 1210 1215
Leu Gln Lys Gly Thr Val Glu Lys Trp Pro Ala Leu Asn Leu Phe
1220 1225 1230
Ser Val Asp His Val Lys Asn Ile Glu Asn Leu His Gly Ser Arg
1235 1240 1245
Leu Asn Asp Arg Ile Ala Gly Asp Asp Gln Asp Asn Glu Leu Trp
1250 1255 1260
Gly His Asp Gly Asn Asp Thr Ile Arg Gly Arg Gly Gly Asp Asp
1265 1270 1275
Ile Leu Arg Gly Gly Leu Gly Leu Asp Thr Leu Tyr Gly Glu Asp
1280 1285 1290
Gly Asn Asp Ile Phe Leu Gln Asp Asp Glu Thr Val Ser Asp Asp
1295 1300 1305
Ile Asp Gly Gly Ala Gly Leu Asp Thr Val Asp Tyr Ser Ala Met
1310 1315 1320
Ile His Pro Gly Arg Ile Val Ala Pro His Glu Tyr Gly Phe Gly
1325 1330 1335
Ile Glu Ala Asp Leu Ser Arg Glu Trp Val Arg Lys Ala Ser Ala
1340 1345 1350
Leu Gly Val Asp Tyr Tyr Asp Asn Val Arg Asn Val Glu Asn Val
1355 1360 1365
Ile Gly Thr Ser Met Lys Asp Val Leu Ile Gly Asp Ala Gln Ala
1370 1375 1380
Asn Thr Leu Met Gly Gln Gly Gly Asp Asp Thr Val Arg Gly Gly
1385 1390 1395
Asp Gly Asp Asp Leu Leu Phe Gly Gly Asp Gly Asn Asp Met Leu
1400 1405 1410
Tyr Gly Asp Ala Gly Asn Asp Thr Leu Tyr Gly Gly Leu Gly Asp
1415 1420 1425
Asp Thr Leu Glu Gly Gly Ala Gly Asn Asp Trp Phe Gly Gln Thr
1430 1435 1440
Gln Ala Arg Glu His Asp Val Leu Arg Gly Gly Asp Gly Val Asp
1445 1450 1455
Thr Val Asp Tyr Ser Gln Thr Gly Ala His Ala Gly Ile Ala Ala
1460 1465 1470
Gly Arg Ile Gly Leu Gly Ile Leu Ala Asp Leu Gly Ala Gly Arg
1475 1480 1485
Val Asp Lys Leu Gly Glu Ala Gly Ser Ser Ala Tyr Asp Thr Val
1490 1495 1500
Ser Gly Ile Glu Asn Val Val Gly Thr Glu Leu Ala Asp Arg Ile
1505 1510 1515
Thr Gly Asp Ala Gln Ala Asn Val Leu Arg Gly Ala Gly Gly Ala
1520 1525 1530
Asp Val Leu Ala Gly Gly Glu Gly Asp Asp Val Leu Leu Gly Gly
1535 1540 1545
Asp Gly Asp Asp Gln Leu Ser Gly Asp Ala Gly Arg Asp Arg Leu
1550 1555 1560
Tyr Gly Glu Ala Gly Asp Asp Trp Phe Phe Gln Asp Ala Ala Asn
1565 1570 1575
Ala Gly Asn Leu Leu Asp Gly Gly Asp Gly Arg Asp Thr Val Asp
1580 1585 1590
Phe Ser Gly Pro Gly Arg Gly Leu Asp Ala Gly Ala Lys Gly Val
1595 1600 1605
Phe Leu Ser Leu Gly Lys Gly Phe Ala Ser Leu Met Asp Glu Pro
1610 1615 1620
Glu Thr Ser Asn Val Leu Arg Asn Ile Glu Asn Ala Val Gly Ser
1625 1630 1635
Ala Arg Asp Asp Val Leu Ile Gly Asp Ala Gly Ala Asn Val Leu
1640 1645 1650
Asn Gly Leu Ala Gly Asn Asp Val Leu Ser Gly Gly Ala Gly Asp
1655 1660 1665
Asp Val Leu Leu Gly Asp Glu Gly Ser Asp Leu Leu Ser Gly Asp
1670 1675 1680
Ala Gly Asn Asp Asp Leu Phe Gly Gly Gln Gly Asp Asp Thr Tyr
1685 1690 1695
Leu Phe Gly Val Gly Tyr Gly His Asp Thr Ile Tyr Glu Ser Gly
1700 1705 1710
Gly Gly His Asp Thr Ile Arg Ile Asn Ala Gly Ala Asp Gln Leu
1715 1720 1725
Trp Phe Ala Arg Gln Gly Asn Asp Leu Glu Ile Arg Ile Leu Gly
1730 1735 1740
Thr Asp Asp Ala Leu Thr Val His Asp Trp Tyr Arg Asp Ala Asp
1745 1750 1755
His Arg Val Glu Ile Ile His Ala Ala Asn Gln Ala Val Asp Gln
1760 1765 1770
Ala Gly Ile Glu Lys Leu Val Glu Ala Met Ala Gln Tyr Pro Asp
1775 1780 1785
Pro Gly Ala Ala Ala Ala Ala Pro Pro Ala Ala Arg Val Pro Asp
1790 1795 1800
Thr Leu Met Gln Ser Leu Ala Val Asn Trp Arg
1805 1810
<210> 68
<211> 11776
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid comprising SEQ ID NO:65
<400> 68
atcgagatct gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 60
gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 120
tgaaatgagc tgttgacaat taatcatcgg ctcgtataat gtgtggaatt gtgagcggat 180
aacaattata attttgttta actttaagaa ggagatatac atatgcagca gtcccatcag 240
gccggttacg caaacgcagc cgatcgtgaa tctggtatcc cggcagcggt tctggatggt 300
attaaggcag ttgccaaaga gaagaacgct accctgatgt tccgtctggt caacccacac 360
tctacttccc tgatcgcgga aggtgtggcg accaaaggcc tgggtgtgca cgccaaaagc 420
agcgactggg gtctgcaggc aggttatatt ccggtgaacc cgaatctgtc taaactgttc 480
ggtcgtgccc cggaggtgat cgcacgtgca gacaacgatg tcaactcttc tctggcgcat 540
ggtcacaccg cggttgatct gaccctgtcc aaagaacgcc tggattacct gcgtcaggcg 600
ggcctggtga cgggcatggc cgacggtgtt gtagcgagca accacgcggg ttatgaacaa 660
tttgagtttc gcgttaaaga gacctctgac ggtcgttacg cggtgcagta ccgccgcaaa 720
ggtggcgatg actttgaagc tgtcaaagtg atcggtaacg ctgctggaat tgaagacgaa 780
atcgacggcc ctgcgggcca ggctgaacca gatcgtgctc actacaacat cgtaactttt 840
tgctgtaagt gcgatagcac tctgcgtctg tgcgtacagt ctactcacgt tgatatccgc 900
actctggaag atctgctgat gggtaccctg ggtatcgtct gcccaatctg ctctcaaaag 960
cctgcttctg gtgttaacca tcagcacctg ccggctcgtc tgcgctgaac cacagcgtca 1020
cacgatgctg tgcatgtgtt gcaaatgcga ggctcgcatc gaactggttg ttgaatccag 1080
cgctgacgac ctgcgtgcgt ttcagcaact gttcctgaac acgctgtctt ttgtttgtcc 1140
gtggtgtgcc tcccagcagg agaacgatga agcggatggc gtgtcccacg cgcagctgcc 1200
ggcacgtcgt gcagaaccgc agcgccacaa gattctgtgc gtttgctgta aatgtgatgg 1260
ccgtatcgaa ctgactgtgg aatcctccgc ggaagatctg cgtacgctgc agcagctgtt 1320
cctgtctacc ctgtctttcg tgtgcccgtg gtgcgccacc aatcaaatgc acggcgacac 1380
cccgaccctg cacgaataca tgctggacct gcagccggaa accacggatc tgtattgtta 1440
tgaacagctg aacgatagca gcgaggaaat gcacggtccg aaagcaactc tgcaggacat 1500
tgtgctgcat ctggagccac agaacgaaat cccggttgat ctgctgtgcc acgagcaact 1560
gagcgattcc gaagaggaaa acgacgaaat tgatatgcat ggtccgcgcg agaccctgca 1620
agaaatcgtc ctgcacctgg aaccgcaaaa cgaactggac cctgtagacc tgctgtgcta 1680
cgaacagctg tccgaatctg aagaaccggg cctgcgccgt ccgtccctgg gcgcagtcga 1740
acgtcaggac tccggctacg attccctgga tggcgttggc tcccgctcct tctccctggg 1800
cgaggtttct gacatggctg cggtggaagc ggcagagctg gaaatgaccc gtcaagtgct 1860
gcacgcgggc gcacgtcagg acgatgctga gccgggcgtg tccggtgcgt ctgcacactg 1920
gggtcaacgt gccctgcagg gtgctcaagc tgtcgcggca gcgcagcgtc tggtacatgc 1980
gatcgcactg atgacccagt tcggtcgcgc aggttctacc aacactcctc aggaagcagc 2040
tagcctgtct gctgctgttt tcggtctggg cgaagcgtct tctgcggttg cagaaaccgt 2100
gagcggtttc ttccgtggtt ctagccgctg ggcgggtggt tttggtgtag caggtggcgc 2160
tatggccctg ggtggcggta tcgcggctgc tgtcggcgca ggtatgagcc tgaccgacga 2220
tgctcctgcg ggccagaaag ccgcagctgg cgctgaaatc gcgctgcagc tgactggtgg 2280
taccgttgaa ctggctagct ctatcgcgct ggctctggca gcggcacgtg gcgtgacttc 2340
tggcctgcaa gtcgccggtg cctctgcggg cgctgctgcg ggcgctctgg cagctgcact 2400
gtcccccatg gaaatctacg gtctggtaca gcagtctcac tacgcagacc agctggataa 2460
actggcgcag gagtcttctg catacggtta cgaaggcgac gcactgctgg cgcagctgta 2520
tcgtgacaaa actgctgctg aaggtgctgt ggcaggcgtt tctgcggtac tgtctaccgt 2580
tggcgctgcg gtttctattg cggctgccgc atccgttgta ggtgcgccgg ttgctgtagt 2640
tacctctctg ctgactggtg cactgaacgg tatcctgcgt ggtgttcagc agcctattat 2700
cgaaaaactg gcgaatgatt atgcccgtaa aatcgacgaa ctgggcggtc cgcaggctta 2760
ttttgaaaaa aacctgcagg cgcgccacga acagctggca aacagcgacg gcctgcgcaa 2820
aatgctggca gacctgcaag ctggttggaa cgcgtcttct gtgatcggcg tgcagaccac 2880
cgaaattagc aaatctgcgc tggaactggc tgcaattact ggcaacgcgg ataacctgaa 2940
aagcgttgat gtttttgtcg atcgcttcgt tcagggcgag cgcgttgctg gtcagccggt 3000
tgttctggac gttgcggcag gcggcatcga catcgctagc cgcaagggcg agcgtccggc 3060
tctgactttc attaccccgc tggcagctcc gggtgaagaa cagcgtcgcc gtaccaagac 3120
tggtaaaagc gagttcacca ccttcgtgga aatcgtaggt aaacaggacc gctggcgtat 3180
tcgcgacggt gcggcggaca ccaccatcga cctggcaaaa gttgtttccc aactggtaga 3240
tgctaacggc gtgctgaaac attctattaa actggatgta atcggcggtg acggcgatga 3300
cgttgtactg gcgaacgcgt ctcgtatcca ctatgacggc ggcgcaggta ccaacacggt 3360
ttcctacgca gcgctgggcc gccaggattc catcactgtt agcgccgatg gcgaacgttt 3420
caacgtgcgt aaacagctga ataacgcaaa cgtctatcgt gagggtgtag ctacccagac 3480
caccgcgtac ggtaagcgta ccgaaaacgt tcagtatcgt cacgtggaac tggcacgtgt 3540
gggtcagctg gtagaggtgg atacgctgga acacgtgcag cacatcatcg gtggcgccgg 3600
taacgattcc attactggta acgctcacga caacttcctg gcaggtggtt ctggtgatga 3660
tcgtctggac ggtggtgcgg gtaacgatac gctggtaggc ggcgaaggtc agaacaccgt 3720
aattggtggt gccggtgacg acgttttcct gcaggatctg ggcgtttgga gcaaccagct 3780
ggatggcggt gccggtgttg acacggttaa gtataacgtt caccagccgt ctgaagagcg 3840
cctggaacgt atgggtgaca ctggtattca tgccgatctg cagaaaggca ctgttgaaaa 3900
atggcctgcg ctgaacctgt tctctgtgga ccatgttaag aacattgaaa acctgcatgg 3960
ctctcgcctg aacgaccgta tcgctggtga cgaccaggat aacgaactgt ggggtcatga 4020
cggcaatgat accattcgcg gtcgtggcgg cgacgatatt ctgcgtggcg gtctgggcct 4080
ggataccctg tatggtgaag atggtaacga tattttcctg caagacgatg aaacggtatc 4140
tgatgacatc gacggtggtg caggcctgga caccgtagat tacagcgcta tgatccatcc 4200
gggtcgtatc gtagctccgc acgagtacgg cttcggtatc gaggcggacc tgtctcgtga 4260
atgggttcgt aaagcgtccg cgctgggtgt ggactactac gataacgttc gtaacgtgga 4320
aaacgtgatc ggtacctcca tgaaagacgt gctgattggc gacgcacagg ccaacactct 4380
gatgggccag ggcggtgatg acacggttcg cggcggcgac ggtgatgacc tgctgttcgg 4440
tggtgacggc aacgacatgc tgtacggcga cgcgggcaac gacaccctgt acggcggtct 4500
gggtgacgac actctggaag gtggtgcagg taacgactgg ttcggccaaa cccaggcacg 4560
cgaacacgac gtgctgcgtg gtggcgacgg cgtagacacc gtggattact cccaaactgg 4620
cgctcacgcg ggtatcgcgg ccggtcgtat cggtctgggc attctggccg atctgggtgc 4680
cggccgtgtc gacaaactgg gtgaggctgg ctctagcgcc tatgatactg tttccggcat 4740
cgaaaacgtg gtaggcactg aactggcaga tcgtatcacg ggtgacgcgc aagcgaacgt 4800
tctgcgtggt gctggcggtg cagacgtgct ggcgggtggt gaaggcgacg acgtactgct 4860
gggcggtgac ggtgacgatc agctgagcgg tgatgcgggt cgtgaccgtc tgtacggtga 4920
agcaggtgac gattggttct tccaggacgc tgctaacgct ggcaacctgc tggacggcgg 4980
cgatggccgt gacactgttg acttcagcgg tccgggtcgc ggtctggacg caggcgcgaa 5040
aggcgttttc ctgagcctgg gtaagggttt cgcatctctg atggacgaac cagaaaccag 5100
caatgtcctg cgtaacatcg aaaacgctgt cggttccgca cgcgatgatg ttctgattgg 5160
cgatgctggt gccaatgttc tgaacggtct ggcgggtaat gatgtactgt ctggtggcgc 5220
tggtgatgat gtcctgctgg gtgatgaggg cagcgatctg ctgtccggcg atgccggcaa 5280
cgacgatctg ttcggtggcc aaggtgatga tacttacctg ttcggcgttg gctatggtca 5340
tgacaccatc tatgagtctg gtggcggcca cgatacgatt cgtattaatg caggtgctga 5400
ccaactgtgg tttgcacgtc agggtaacga tctggaaatt cgcatcctgg gtactgatga 5460
cgctctgacc gtacacgact ggtaccgcga tgcggatcac cgcgtagaaa tcatccatgc 5520
ggctaaccaa gctgtagacc aggctggtat tgaaaaactg gtagaagcga tggcacagta 5580
tccggaccca ggtgcggctg ctgcagcacc tccagcggct cgtgtgccgg ataccctgat 5640
gcagagcctg gccgtcaatt ggcgttaatg gatccaggcc tctttagaag gagatatacc 5700
atgctgccgt ctgcacaggc gccgtctctg ctgaatccaa ctgatgactt cgctgcgctg 5760
ggtaacatcg cgtggctgtg gatgaacagc ccgatgcacc gtgactggcc ggttcacctg 5820
ctggcacgta acacgctggc gccgatccag ctgggtcaat acatcctgct gcgttgtaac 5880
gacgtgcctg tggcgtattg ctcctgggca ctgatggatg cggataccga gctgtcctac 5940
gttatggccc catctagcct gggcggtaac gcttggaact gcggcgatcg tctgtggatc 6000
attgattgga ttgctccgtt tagccgtgac gacaaccgtg ctctgcgtcg cgcgctggcc 6060
gaacgtcatc cggattctgt tggccgttcc ctgcgcgtac gtcgcggtgg cgacaccgct 6120
cgcgtcaaag aataccgtgg tcgtgctctg gacgcagcgg cggcccgcgc tcagctggac 6180
cgctaccacg cagaactgat tgccggtctg cgtgcatcca atggcggtta tgctccgcgt 6240
ggccgtggca ccgcataatc tagaattctt taattaaaga tccggctgct aacaaagccc 6300
gaaaggaagc tgagttggct gctgccaccg ctgagcaatc caggcatcaa ataaaacgaa 6360
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 6420
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 6480
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 6540
cggatggcct ttttgctagc agcacgccat agtgactggc gatgctgtcg gaatggacga 6600
tatcccgcaa gaggcccggc agtaccggca taaccaagcc tatgcctaca gcatccaggg 6660
tgacggtgcc gaggatgacg atgagcgcat tgttagattt catacacggt gcctgactgc 6720
gttagcaatt taactgtgat aaactaccgc attaaagctt atcgatgata agctgtcaaa 6780
catgagaatt cttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca 6840
ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg 6900
aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca 6960
tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca 7020
tgagtgacga ctgaatccgg tgagaatggc aaaagcttat gcatttcttt ccagacttgt 7080
tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc 7140
attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa 7200
acaggaatcg aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct 7260
gaatcaggat attcttctaa tacctggaat gctgttttcc cggggatcgc agtggtgagt 7320
aaccatgcat catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc 7380
gtcagccagt ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca 7440
tgtttcagaa acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct 7500
gattgcccga cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa 7560
tttaatcgcg gcctcgagca agacgtttcc cgttgaatat ggctcataac accccttgta 7620
ttactgttta tgtaagcaga cagttttatt gttcatgacc aaaatccctt aacgtgagtt 7680
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 7740
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 7800
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 7860
gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 7920
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 7980
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 8040
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 8100
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 8160
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 8220
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 8280
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 8340
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 8400
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 8460
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct 8520
ccttacgcat ctgtgcggta tttcacaccg caatggtgca ctctcagtac aatctgctct 8580
gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg gtcatggctg 8640
cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat 8700
ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt 8760
catcaccgaa acgcgcgagg cagctgcggt aaagctcatc agcgtggtcg tgaagcgatt 8820
cacagatgtc tgcctgttca tccgcgtcca gctcgttgag tttctccaga agcgttaatg 8880
tctggcttct gataaagcgg gccatgttaa gggcggtttt ttcctgtttg gtcactgatg 8940
cctccgtgta agggggattt ctgttcatgg gggtaatgat accgatgaaa cgagagagga 9000
tgctcacgat acgggttact gatgatgaac atgcccggtt actggaacgt tgtgagggta 9060
aacaactggc ggtatggatg cggcgggacc agagaaaaat cactcagggt caatgccagc 9120
gcttcgttaa tacagatgta ggtgttccac agggtagcca gcagcatcct gcgatgcaga 9180
tccggaacat aatggtgcag ggcgctgact tccgcgtttc cagactttac gaaacacgga 9240
aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag cagtcgcttc 9300
acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc cgccagccta 9360
gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac ccaacgctgc 9420
ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg ttctgccaag 9480
ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt cttggagtgg 9540
tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc ggctccatgc 9600
accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa tccatgccaa 9660
cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg gtccaatgat 9720
cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat ggtcgtcatc 9780
tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg aagcgagaag 9840
aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga cgtagcccag 9900
cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt tggtggcggg 9960
accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa gcgacaggcc 10020
gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga gcgctgccgg 10080
cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga cgatagtcat 10140
gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca tcggtcgact 10200
catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 10260
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaacttaca ttaattgcgt 10320
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 10380
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgcta gcgtggtttt tcttttcacc 10440
agtgagacgg gcaacagctg attgcccttc accgcctggc cctgagagag ttgcagcaag 10500
cggtccacgc tggtttgccc cagcaggcga aaatcctgtt tgatggtggt taacggcggg 10560
atataacatg agctgtcttc ggtatcgtcg tatcccacta ccgagatatc cgcaccaacg 10620
cgcagcccgg actcggtaat ggcgcgcatt gcgcccagcg ccatctgatc gttggcaacc 10680
agcatcgcag tgggaacgat gccctcattc agcatttgca tggtttgttg aaaaccggac 10740
atggcactcc agtcgccttc ccgttccgct atcggctgaa tttgattgcg agtgagatat 10800
ttatgccagc cagccagacg cagacgcgcc gagacagaac ttaatgggcc cgctaacagc 10860
gcgatttgct ggtgacccaa tgcgaccaga tgctccacgc ccagtcgcgt accgtcttca 10920
tgggagaaaa taatactgtt gatgggtgtc tggtcagaga catcaagaaa taacgccgga 10980
acattagtgc aggcagcttc cacagcaatg gcatcctggt catccagcgg atagttaatg 11040
atcagcccac tgacgcgttg cgcgagaaga ttgtgcaccg ccgctttaca ggcttcgacg 11100
ccgcttcgtt ctaccatcga caccaccacg ctggcaccca gttgatcggc gcgagattta 11160
atcgccgcga caatttgcga cggcgcgtgc agggccagac tggaggtggc aacgccaatc 11220
agcaacgact gtttgcccgc cagttgttgt gccacgcggt tgggaatgta attcagctcc 11280
gccatcgccg cttccacttt ttcccgcgtt ttcgcagaaa cgtggctggc ctggttcacc 11340
acgcgggaaa cggtctgata agagacaccg gcatactctg cgacatcgta taacgttact 11400
ggtttcacat tcaccaccct gaattgactc tcttccgggc gctatcatgc cataccgcga 11460
aaggttttgc gccattcgat ggtgtcggaa tttatgcggt gtgaaatacc gcacagatgc 11520
gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcca 11580
ccccgtggca tgcaaggaga tggcgcccaa cagtcccccg gccacggggc ctgccaccat 11640
acccacgccg aaacaagcgc tcatgagccc gaagtggcga gcccgatctt ccccatcggt 11700
gatgtcggcg atataggcgc cagcaaccgc acctgtggcg ccggtgatgc cggccacgat 11760
gcgtccggcg tagagg 11776
<210> 69
<211> 5121
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence encoding the wild type CyaA protein of
Bordetella pertussis, optimized for E. coli expression
<400> 69
atgcagcagt cccatcaggc cggttacgca aacgcagccg atcgtgaatc tggtatcccg 60
gcagcggttc tggatggtat taaggcagtt gccaaagaga agaacgctac cctgatgttc 120
cgtctggtca acccacactc tacttccctg atcgcggaag gtgtggcgac caaaggcctg 180
ggtgtgcacg ccaaaagcag cgactggggt ctgcaggcag gttatattcc ggtgaacccg 240
aatctgtcta aactgttcgg tcgtgccccg gaggtgatcg cacgtgcaga caacgatgtc 300
aactcttctc tggcgcatgg tcacaccgcg gttgatctga ccctgtccaa agaacgcctg 360
gattacctgc gtcaggcggg cctggtgacg ggcatggccg acggtgttgt agcgagcaac 420
cacgcgggtt atgaacaatt tgagtttcgc gttaaagaga cctctgacgg tcgttacgcg 480
gtgcagtacc gccgcaaagg tggcgatgac tttgaagctg tcaaagtgat cggtaacgct 540
gctggaattc cgctgaccgc ggatatcgac atgtttgcca tcatgcctca cctgtccaac 600
tttcgcgatt ccgcacgcag ctctgtgacg tctggtgatt ccgtcactga ctacctggct 660
cgtacccgtc gtgcggcctc tgaagccact ggtggtctgg atcgtgaacg cattgacctg 720
ctgtggaaaa tcgcccgtgc cggtgcgcgc tctgctgttg gtaccgaagc acgccgccaa 780
tttcgttacg acggcgatat gaacatcggt gtgatcacgg attttgaact ggaagttcgc 840
aatgccctga accgtcgtgc acacgcggtc ggcgcgcagg acgttgttca gcacggtacg 900
gagcagaata acccgttccc agaagcggac gaaaagatct ttgttgtgtc tgccaccggt 960
gaatcccaga tgctgactcg tggccagctg aaagaataca tcggccaaca gcgtggcgaa 1020
ggctacgttt tctacgagaa tcgtgcttac ggcgttgcgg gcaaatccct gttcgacgat 1080
ggtctgggcg ctgcaccggg cgttccgagc ggccgttcta aattcagccc ggacgtactg 1140
gaaactgtgc cggcttcccc gggcctgcgc cgtccgtccc tgggcgcagt cgaacgtcag 1200
gactccggct acgattccct ggatggcgtt ggctcccgct ccttctccct gggcgaggtt 1260
tctgacatgg ctgcggtgga agcggcagag ctggaaatga cccgtcaagt gctgcacgcg 1320
ggcgcacgtc aggacgatgc tgagccgggc gtgtccggtg cgtctgcaca ctggggtcaa 1380
cgtgccctgc agggtgctca agctgtcgcg gcagcgcagc gtctggtaca tgcgatcgca 1440
ctgatgaccc agttcggtcg cgcaggttct accaacactc ctcaggaagc agctagcctg 1500
tctgctgctg ttttcggtct gggcgaagcg tcttctgcgg ttgcagaaac cgtgagcggt 1560
ttcttccgtg gttctagccg ctgggcgggt ggttttggtg tagcaggtgg cgctatggcc 1620
ctgggtggcg gtatcgcggc tgctgtcggc gcaggtatga gcctgaccga cgatgctcct 1680
gcgggccaga aagccgcagc tggcgctgaa atcgcgctgc agctgactgg tggtaccgtt 1740
gaactggcta gctctatcgc gctggctctg gcagcggcac gtggcgtgac ttctggcctg 1800
caagtcgccg gtgcctctgc gggcgctgct gcgggcgctc tggcagctgc actgtccccc 1860
atggaaatct acggtctggt acagcagtct cactacgcag accagctgga taaactggcg 1920
caggagtctt ctgcatacgg ttacgaaggc gacgcactgc tggcgcagct gtatcgtgac 1980
aaaactgctg ctgaaggtgc tgtggcaggc gtttctgcgg tactgtctac cgttggcgct 2040
gcggtttcta ttgcggctgc cgcatccgtt gtaggtgcgc cggttgctgt agttacctct 2100
ctgctgactg gtgcactgaa cggtatcctg cgtggtgttc agcagcctat tatcgaaaaa 2160
ctggcgaatg attatgcccg taaaatcgac gaactgggcg gtccgcaggc ttattttgaa 2220
aaaaacctgc aggcgcgcca cgaacagctg gcaaacagcg acggcctgcg caaaatgctg 2280
gcagacctgc aagctggttg gaacgcgtct tctgtgatcg gcgtgcagac caccgaaatt 2340
agcaaatctg cgctggaact ggctgcaatt actggcaacg cggataacct gaaaagcgtt 2400
gatgtttttg tcgatcgctt cgttcagggc gagcgcgttg ctggtcagcc ggttgttctg 2460
gacgttgcgg caggcggcat cgacatcgct agccgcaagg gcgagcgtcc ggctctgact 2520
ttcattaccc cgctggcagc tccgggtgaa gaacagcgtc gccgtaccaa gactggtaaa 2580
agcgagttca ccaccttcgt ggaaatcgta ggtaaacagg accgctggcg tattcgcgac 2640
ggtgcggcgg acaccaccat cgacctggca aaagttgttt cccaactggt agatgctaac 2700
ggcgtgctga aacattctat taaactggat gtaatcggcg gtgacggcga tgacgttgta 2760
ctggcgaacg cgtctcgtat ccactatgac ggcggcgcag gtaccaacac ggtttcctac 2820
gcagcgctgg gccgccagga ttccatcact gttagcgccg atggcgaacg tttcaacgtg 2880
cgtaaacagc tgaataacgc aaacgtctat cgtgagggtg tagctaccca gaccaccgcg 2940
tacggtaagc gtaccgaaaa cgttcagtat cgtcacgtgg aactggcacg tgtgggtcag 3000
ctggtagagg tggatacgct ggaacacgtg cagcacatca tcggtggcgc cggtaacgat 3060
tccattactg gtaacgctca cgacaacttc ctggcaggtg gttctggtga tgatcgtctg 3120
gacggtggtg cgggtaacga tacgctggta ggcggcgaag gtcagaacac cgtaattggt 3180
ggtgccggtg acgacgtttt cctgcaggat ctgggcgttt ggagcaacca gctggatggc 3240
ggtgccggtg ttgacacggt taagtataac gttcaccagc cgtctgaaga gcgcctggaa 3300
cgtatgggtg acactggtat tcatgccgat ctgcagaaag gcactgttga aaaatggcct 3360
gcgctgaacc tgttctctgt ggaccatgtt aagaacattg aaaacctgca tggctctcgc 3420
ctgaacgacc gtatcgctgg tgacgaccag gataacgaac tgtggggtca tgacggcaat 3480
gataccattc gcggtcgtgg cggcgacgat attctgcgtg gcggtctggg cctggatacc 3540
ctgtatggtg aagatggtaa cgatattttc ctgcaagacg atgaaacggt atctgatgac 3600
atcgacggtg gtgcaggcct ggacaccgta gattacagcg ctatgatcca tccgggtcgt 3660
atcgtagctc cgcacgagta cggcttcggt atcgaggcgg acctgtctcg tgaatgggtt 3720
cgtaaagcgt ccgcgctggg tgtggactac tacgataacg ttcgtaacgt ggaaaacgtg 3780
atcggtacct ccatgaaaga cgtgctgatt ggcgacgcac aggccaacac tctgatgggc 3840
cagggcggtg atgacacggt tcgcggcggc gacggtgatg acctgctgtt cggtggtgac 3900
ggcaacgaca tgctgtacgg cgacgcgggc aacgacaccc tgtacggcgg tctgggtgac 3960
gacactctgg aaggtggtgc aggtaacgac tggttcggcc aaacccaggc acgcgaacac 4020
gacgtgctgc gtggtggcga cggcgtagac accgtggatt actcccaaac tggcgctcac 4080
gcgggtatcg cggccggtcg tatcggtctg ggcattctgg ccgatctggg tgccggccgt 4140
gtcgacaaac tgggtgaggc tggctctagc gcctatgata ctgtttccgg catcgaaaac 4200
gtggtaggca ctgaactggc agatcgtatc acgggtgacg cgcaagcgaa cgttctgcgt 4260
ggtgctggcg gtgcagacgt gctggcgggt ggtgaaggcg acgacgtact gctgggcggt 4320
gacggtgacg atcagctgag cggtgatgcg ggtcgtgacc gtctgtacgg tgaagcaggt 4380
gacgattggt tcttccagga cgctgctaac gctggcaacc tgctggacgg cggcgatggc 4440
cgtgacactg ttgacttcag cggtccgggt cgcggtctgg acgcaggcgc gaaaggcgtt 4500
ttcctgagcc tgggtaaggg tttcgcatct ctgatggacg aaccagaaac cagcaatgtc 4560
ctgcgtaaca tcgaaaacgc tgtcggttcc gcacgcgatg atgttctgat tggcgatgct 4620
ggtgccaatg ttctgaacgg tctggcgggt aatgatgtac tgtctggtgg cgctggtgat 4680
gatgtcctgc tgggtgatga gggcagcgat ctgctgtccg gcgatgccgg caacgacgat 4740
ctgttcggtg gccaaggtga tgatacttac ctgttcggcg ttggctatgg tcatgacacc 4800
atctatgagt ctggtggcgg ccacgatacg attcgtatta atgcaggtgc tgaccaactg 4860
tggtttgcac gtcagggtaa cgatctggaa attcgcatcc tgggtactga tgacgctctg 4920
accgtacacg actggtaccg cgatgcggat caccgcgtag aaatcatcca tgcggctaac 4980
caagctgtag accaggctgg tattgaaaaa ctggtagaag cgatggcaca gtatccggac 5040
ccaggtgcgg ctgctgcagc acctccagcg gctcgtgtgc cggataccct gatgcagagc 5100
ctggccgtca attggcgtta a 5121
<210> 70
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> PEP225 complete sequence 85 aa (Hpv31E742-98/1-28)
<400> 70
Ala Gly Gln Ala Lys Pro Asp Thr Ser Asn Tyr Asn Ile Val Thr Phe
1 5 10 15
Cys Cys Gln Cys Glu Ser Thr Leu Arg Leu Cys Val Gln Ser Thr Gln
20 25 30
Val Asp Ile Arg Ile Leu Gln Glu Leu Leu Met Gly Ser Phe Gly Ile
35 40 45
Val Cys Pro Asn Cys Ser Thr Arg Leu Met Arg Gly Glu Thr Pro Thr
50 55 60
Leu Gln Asp Tyr Val Leu Asp Leu Gln Pro Glu Ala Thr Asp Leu Tyr
65 70 75 80
Cys Tyr Glu Gln Leu
85
<210> 71
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> PEP226 complete sequence 84 aa (Hpv33E743-97/1-29)
<400> 71
Gly Gln Ala Gln Pro Ala Thr Ala Asp Tyr Tyr Ile Val Thr Cys Cys
1 5 10 15
His Thr Cys Asn Thr Thr Val Arg Leu Cys Val Asn Ser Thr Ala Ser
20 25 30
Asp Leu Arg Thr Ile Gln Gln Leu Leu Met Gly Thr Val Asn Ile Val
35 40 45
Cys Pro Ser Cys Ala Gln Leu Met Arg Gly His Lys Pro Thr Leu Lys
50 55 60
Glu Tyr Ile Leu Asp Leu Tyr Pro Glu Pro Thr Asp Leu Tyr Cys Tyr
65 70 75 80
Glu Gln Leu Ser
<210> 72
<211> 95
<212> PRT
<213> Artificial Sequence
<220>
<223> PEP215 complete sequence 95aa (HPV45E7 44-106/1-32)
<400> 72
Gly Val Ser His Ala Gln Leu Pro Ala Arg Arg Ala Glu Pro Gln Arg
1 5 10 15
His Lys Ile Leu Cys Val Cys Cys Lys Cys Asp Gly Arg Ile Glu Leu
20 25 30
Thr Val Glu Ser Ser Ala Glu Asp Leu Arg Thr Leu Gln Gln Leu Phe
35 40 45
Leu Ser Thr Leu Ser Phe Val Cys Pro Trp Cys Ala Thr Asn Gln Met
50 55 60
His Gly Pro Arg Glu Thr Leu Gln Glu Ile Val Leu His Leu Glu Pro
65 70 75 80
Gln Asn Glu Leu Asp Pro Val Asp Leu Leu Cys Tyr Glu Gln Leu
85 90 95
<210> 73
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> PEP235 complete sequence 84 aa (Hpv52E745-99/1-29 modified to
deleted an auto-immune antigen)
<400> 73
Gly Gln Ala Glu Gln Ala Thr Ser Asn Tyr Tyr Ile Val Thr Tyr Cys
1 5 10 15
His Ser Cys Asp Ser Thr Leu Arg Leu Cys Ile His Ser Thr Ala Thr
20 25 30
Asp Leu Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Leu Gln Val Val
35 40 45
Cys Pro Gly Cys Ala Arg Leu Met Arg Gly Asp Lys Ala Thr Ile Lys
50 55 60
Asp Tyr Ile Leu Asp Leu Gln Pro Glu Thr Thr Asp Leu His Cys Tyr
65 70 75 80
Glu Gln Leu Gly
<210> 74
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> PEP228 complete sequence 84 aa (HPV58E744-98/1-29)
<400> 74
Gly Gln Ala Gln Pro Ala Thr Ala Asn Tyr Tyr Ile Val Thr Cys Cys
1 5 10 15
Tyr Thr Cys Asp Thr Thr Val Arg Leu Cys Ile Asn Ser Thr Thr Thr
20 25 30
Asp Val Arg Thr Leu Gln Gln Leu Leu Met Gly Thr Cys Thr Ile Val
35 40 45
Cys Pro Ser Cys Ala Gln Gln Met Arg Gly Asn Asn Pro Thr Leu Arg
50 55 60
Glu Tyr Ile Leu Asp Leu His Pro Glu Pro Thr Asp Leu Phe Cys Tyr
65 70 75 80
Glu Gln Leu Cys
<210> 75
<211> 255
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA SEQUENCE OF PEP225 (Hpv31E742-98/1-28)
>pep225 complete sequence 255 bp
<400> 75
gcgggtcaag ccaaaccgga tacctccaac tacaacattg tgaccttctg ttgtcaatgc 60
gagagcacgc tgcgtctgtg tgttcaaagc acccaggttg acattcgtat cctgcaagaa 120
ctgctgatgg gctcttttgg catcgtctgc ccaaattgca gcactcgcct gatgcgtggt 180
gaaacgccga ccctgcagga ttatgtgttg gacttgcagc cggaggcaac ggacctgtac 240
tgctatgagc agctg 255
<210> 76
<211> 252
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA SEQUENCE OF PEP226 (Hpv33E743-97/1-29)
>pep226 complete sequence 252 bp
<400> 76
ggtcaggcgc aaccggccac ggcggactac tatatcgtga cctgttgcca cacctgcaac 60
actaccgttc gcttgtgtgt caatagcacc gcttccgatc tgcgtaccat tcaacaactg 120
ctgatgggta ccgttaacat cgtgtgcccg agctgcgcac agctgatgcg tggccataag 180
ccgacgctga aagagtatat tctggacctg tacccagagc cgacggattt gtactgttat 240
gaacagctga gc 252
<210> 77
<211> 285
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA SEQUENCE OF PEP215 (HPV45E7 44-106/1-32)
>pep215 complete sequence 285 bp
<400> 77
ggtgtttctc acgcacaact gccagcgcgt cgcgcggaac cgcaacgtca taagatcctg 60
tgtgtgtgct gcaaatgcga cggccgcatt gagctgactg tagaatcctc tgctgaagac 120
ctgcgtacgc tgcagcagct gtttctgagc accctgtctt tcgtctgtcc ttggtgcgcc 180
accaaccaga tgcacggtcc gcgtgagacc ctgcaggaaa tcgtgctgca cctggaaccg 240
cagaatgaac tggacccggt tgatctgctg tgttacgaac agctg 285
<210> 78
<211> 252
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA SEQUENCE OF PEP235 (Hpv52E745-99/1-29 modified to delete an
auto-immune antigen
>pep235 complete sequence 252 bp
<400> 78
ggccaggcgg agcaggcgac gagcaactac tacattgtca cgtattgcca ttcctgtgat 60
agcactctgc gtctgtgtat ccacagcacg gcaaccgatc tgcgtacctt gcaacaactg 120
ctgatgggca ccctgcaggt ggtttgtccg ggttgcgctc gcctgatgcg tggtgacaag 180
gccaccatta aagattacat cctggacttg caaccggaaa ccaccgacct gcactgctat 240
gagcagctgg gt 252
<210> 79
<211> 252
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA SEQUENCE OF PEP228 (HPV58E744-98/1-29)
>pep228 complete sequence 252 bp
<400> 79
ggccaggcgc agccagcgac ggccaattac tacatcgtta cctgttgcta tacgtgcgat 60
actaccgtcc gtctgtgcat taacagcacc accacggacg tgcgtaccct gcaacagctg 120
ctgatgggta cctgcacgat tgtttgtccg agctgtgcac aacaaatgcg cggtaataac 180
ccgaccttgc gtgagtatat cttggacctg cacccggagc cgaccgatct gttctgttac 240
gaacagctgt gc 252
Claims (26)
1) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편,에 융합된
2) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드, 에 융합된
3) 서열 번호 2에 개시된 보르데텔라 페르투시스(Bordetella pertussis) CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편
을 포함하거나 이들로 이루어지는 CyaA 유래 단백질을 코딩하는 키메라 폴리뉴클레오티드.
2) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드, 에 융합된
3) 서열 번호 2에 개시된 보르데텔라 페르투시스(Bordetella pertussis) CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편
을 포함하거나 이들로 이루어지는 CyaA 유래 단백질을 코딩하는 키메라 폴리뉴클레오티드.
제1항에 있어서, 보르데텔라 페르투시스 균주의 CyaC 단백질을 코딩하는 폴리뉴클레오티드를 3' 말단에 포함하는 키메라 폴리뉴클레오티드.
제1항에 있어서,
1) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
2) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
3) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
4) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
로 이루어지는 군으로부터 선택되는 키메라 폴리뉴클레오티드.
1) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
2) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
3) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
4) 5'에서 3'으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하는 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드로서, 상기 이종 폴리펩티드는 음의 정전하를 갖는 것인 폴리뉴클레오티드 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 폴리펩티드 단편을 코딩하는 폴리뉴클레오티드를 포함하거나 이들로 이루어지는 폴리뉴클레오티드;
로 이루어지는 군으로부터 선택되는 키메라 폴리뉴클레오티드.
제1항 내지 제3항 중 어느 한 항에 따른 키메라 폴리뉴클레오티드, 및 발현 조절 서열을 포함하고, 보르데텔라 균주의 CyaC 코딩 서열을 추가로 포함하는 벡터.
제1항 내지 제3항 중 어느 한 항에 따른 키메라 폴리뉴클레오티드를 포함하는 세포 배양물.
제1항 내지 제3항 중 어느 한 항에 따른 키메라 폴리뉴클레오티드에 의해 코딩되는 CyaA 유래 단백질.
N-말단에서 C-말단으로, (a) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 첫 번째 잔기로 시작하여 서열 번호 2의 위치 183 내지 위치 227에 위치한 잔기로 끝나는 것인 단편, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드, 및 (c) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA 단백질의 단편으로서, 상기 단편의 서열은 서열 번호 2의 위치 321 내지 위치 387에 위치한 잔기로 시작하여 서열 번호 2의 마지막 잔기로 끝나는 것인 단편을 포함하거나 이들로 이루어지는 키메라 단백질.
제7항에 있어서,
1) N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 단편, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지는 단백질;
2) N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 단편, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지는 단백질
로 이루어지는 군으로부터 선택되는 키메라 단백질.
1) N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 227로 이루어지는 단편, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 321 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지는 단백질;
2) N-말단에서 C-말단으로, (a) 서열 번호 2의 잔기 1 내지 183으로 이루어지는 단편, (b) HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 갖는 이종 폴리펩티드; 및 (c) 서열 번호 2의 잔기 387 내지 1706으로 이루어지는 단편을 포함하거나 이들로 이루어지는 단백질
로 이루어지는 군으로부터 선택되는 키메라 단백질.
제7항에 있어서, 상기 이종 폴리펩티드가 하나 이상의 에피토프를 보유하는 것인 키메라 단백질.
제9항에 있어서, 상기 이종 폴리펩티드가 하나 이상의 CD8+ 에피토프 및/또는 하나 이상의 CD4+ 에피토프를 보유하는 것인 키메라 단백질.
제7항 내지 제10항 중 어느 한 항에 있어서, 이종 폴리펩티드가 HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 9 내지 500, 또는 20 내지 500, 또는 50 내지 500, 또는 100 내지 500 개 아미노산 잔기 범위의 크기를 갖는 것인 키메라 단백질.
제7항 내지 제10항 중 어느 한 항에 있어서, 이종 폴리펩티드가 HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 서열 번호 70, 서열 번호 71, 서열 번호 72, 서열 번호 73 또는 서열 번호 74의 서열을 갖는 것인 키메라 단백질.
제7항 내지 제10항 중 어느 한 항에 따른 키메라 단백질 및 적합한 약학적 비이클과, 1종 이상의 애쥬번트를 포함하는, HPV에 대한 예방 면역 반응 또는 치료 면역 반응을 유도하기 위한 약학 조성물.
제7항 내지 제10항 중 어느 한 항에 따른 키메라 단백질을 포함하는, HPV에 의한 병원체 감염 또는 HPV에 의한 감염과 관련한 발암성 질환의 예방 또는 치료를 위한 약학 조성물.
(i) 폴리펩티드(들)에 포함된 제1 군의 에피토프에 대하여 T 세포 면역 반응을 유발함으로써, 포유동물 숙주에서 진단된 제1의 결정된 병리학적 상태(들)의 면역요법 치료에, 그리고 (ii) 상기 폴리펩티드(들)에 포함된 제2 군의 에피토프에 대하여 T 세포 기억 면역 반응을 유발함으로써, 동일한 포유동물 숙주에서 제2의 결정된 병리학적 상태(들)에 대한 예방에 사용하기 위한, 제13항에 따른 약학 조성물로서, 상기 면역 반응은 상기 키메라 단백질 또는 상기 조성물이 상기 숙주로 투여된 후 얻어지고, 제2의 결정된 병리학적 상태(들)에 대한 상기 예방은 상기 제2 군의 에피토프가 상기 투여된 벡터에 담지된 폴리펩티드(들)에 포함되지 않은 경우 관찰되지 않는 것인 약학 조성물.
(a) 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA를 코딩하는 폴리뉴클레오티드로부터, 처음 3개의 뉴클레오티드가 서열 번호 2의 잔기 184 내지 잔기 228에 위치한 아미노산 잔기를 코딩하고 마지막 3개의 뉴클레오티드가 서열 번호 2의 잔기 320 내지 잔기 386에 위치한 아미노산 잔기를 코딩하는 것인 뉴클레오티드 단편을 결실시키는 단계;
(b) (a)에서 얻어진 폴리뉴클레오티드 내 결실된 뉴클레오티드 단편 부위에 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드를 삽입하는 단계로서, 상기 이종 폴리펩티드는 HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 가지며, 여기서 단계 (a) 및 (b)는 임의의 순서로 또는 동시에 수행될 수 있고, 그에 의해 제1항에 따른 키메라 폴리뉴클레오티드를 회수하는 것인 단계,
(c) (b)에서 얻어진 폴리뉴클레오티드를 세포에서 발현시키는 단계; 및
(d) 발현된 키메라 단백질을 회수하는 단계
를 포함하는 제7항에 따른 키메라 단백질의 제조 방법.
(b) (a)에서 얻어진 폴리뉴클레오티드 내 결실된 뉴클레오티드 단편 부위에 이종 폴리펩티드를 코딩하는 폴리뉴클레오티드를 삽입하는 단계로서, 상기 이종 폴리펩티드는 HPV의 E7 항원 또는 그의 항원성 단편을 포함하고, 음의 정전하를 가지며, 여기서 단계 (a) 및 (b)는 임의의 순서로 또는 동시에 수행될 수 있고, 그에 의해 제1항에 따른 키메라 폴리뉴클레오티드를 회수하는 것인 단계,
(c) (b)에서 얻어진 폴리뉴클레오티드를 세포에서 발현시키는 단계; 및
(d) 발현된 키메라 단백질을 회수하는 단계
를 포함하는 제7항에 따른 키메라 단백질의 제조 방법.
제16항에 있어서, 키메라 폴리뉴클레오티드 구조물 내에 단계 (b)에서 얻어진 폴리뉴클레오티드 및 CyaC 단백질을 코딩하는 폴리뉴클레오티드를 통합시키는 단계를 포함하며, 여기서 키메라 폴리뉴클레오티드 구조물은, 상기 통합 후에, 얻어진 키메라 폴리뉴클레오티드가, 5' 말단에서 3' 말단으로, 단계 (b)의 폴리뉴클레오티드 구조물에 이어진 보르데텔라 페르투시스 균주의 CyaC 단백질을 코딩하는 폴리뉴클레오티드 구조물을 포함하거나 함유하도록, 단계 (b)에서 얻어진 폴리뉴클레오티드 및 CyaC 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 것인 방법.
제17항에 있어서, 상기 단계 (a)가, 서열 번호 2에 개시된 보르데텔라 페르투시스 CyaA를 코딩하는 폴리뉴클레오티드로부터, 서열 번호 2의 잔기 228 내지 320을 코딩하는 뉴클레오티드 단편, 또는 서열 번호 2의 잔기 184 내지 386을 코딩하는 뉴클레오티드 단편, 또는 서열 번호 2의 잔기 228 내지 386을 코딩하는 뉴클레오티드 단편, 또는 서열 번호 2의 잔기 184 내지 320을 코딩하는 뉴클레오티드 단편을 결실시키는 것으로 이루어지는 것인 방법.
제17항에 있어서, 상기 단계 (a)가 서열 번호 1 또는 서열 번호 69에 개시된 폴리뉴클레오티드로부터, 서열 번호 1 또는 서열 번호 69의 뉴클레오티드 682 내지 960으로 이루어지는 뉴클레오티드 단편, 또는 서열 번호 1 또는 서열 번호 69의 뉴클레오티드 550 내지 1158로 이루어지는 뉴클레오티드 단편, 또는 서열 번호 1 또는 서열 번호 69의 뉴클레오티드 682 내지 1158로 이루어지는 뉴클레오티드 단편, 또는 서열 번호 1 또는 서열 번호 69의 뉴클레오티드 550 내지 960으로 이루어지는 뉴클레오티드 단편을 결실시키는 것으로 이루어지는 것인 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12305897.6 | 2012-07-23 | ||
EP12305897.6A EP2690172A1 (en) | 2012-07-23 | 2012-07-23 | CYAA-based chimeric proteins comprising a heterologous polypeptide and their uses in the induction of immune responses |
PCT/EP2013/065546 WO2014016310A1 (en) | 2012-07-23 | 2013-07-23 | Cyaa-based chimeric proteins comprising a heterologous polypeptide and their uses in the induction of immune responses |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150032341A KR20150032341A (ko) | 2015-03-25 |
KR102148413B1 true KR102148413B1 (ko) | 2020-08-26 |
Family
ID=48832934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157004541A KR102148413B1 (ko) | 2012-07-23 | 2013-07-23 | 이종 폴리펩티드를 포함하는 CyaA에 기초한 키메라 단백질 및 면역 반응의 유도에 있어서의 그의 용도 |
Country Status (13)
Country | Link |
---|---|
US (2) | US9499809B2 (ko) |
EP (2) | EP2690172A1 (ko) |
JP (3) | JP2015524270A (ko) |
KR (1) | KR102148413B1 (ko) |
CN (1) | CN104662152B (ko) |
AU (1) | AU2013295045B2 (ko) |
BR (1) | BR112015001350A2 (ko) |
CA (1) | CA2879990C (ko) |
ES (1) | ES2780525T3 (ko) |
HK (1) | HK1208048A1 (ko) |
MX (1) | MX365560B (ko) |
RU (1) | RU2015100211A (ko) |
WO (1) | WO2014016310A1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105481953B (zh) * | 2016-02-02 | 2018-02-13 | 成都天邦生物制品有限公司 | 作为猪繁殖与呼吸综合征病毒疫苗抗原的靶细胞特异性融合蛋白和疫苗组合物 |
EP3323424A1 (en) * | 2016-11-17 | 2018-05-23 | Cyanimal IP | Cyaa polypeptides as immune enhancer |
WO2018091613A1 (en) | 2016-11-17 | 2018-05-24 | Ecole Nationale Vétérinaire de Toulouse | Immunogenic and vaccine compositions for use against bordetella bronchiseptica infection |
EP3323426A1 (en) | 2016-11-17 | 2018-05-23 | Ecole Nationale Vétérinaire de Toulouse | Immunogenic and vaccine compositions for use against bordetella bronchiseptica infection |
EP3342421A1 (en) * | 2016-12-27 | 2018-07-04 | Genticel | Immunogenic composition comprising cyaa-derived polypeptide promoting a th1/th17-oriented immune response |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01209817A (ja) | 1988-02-17 | 1989-08-23 | Yamaha Corp | 浮動少数点形ディジタル・アナログ変換器 |
ATE438409T1 (de) * | 2000-09-15 | 2009-08-15 | Pasteur Institut | Proteinhaltigen vektoren zur einführung von moleküle in cd11b exprimirende zellen |
EP1489092A1 (en) | 2003-06-18 | 2004-12-22 | Institut Pasteur | Modified Bordetella adenylate cyclase comprising or lacking CD11b/CD18 interaction domain and uses thereof |
PL1684801T3 (pl) | 2003-11-21 | 2010-07-30 | Pasteur Institut | Rekombinowana toksyna cyklazy adenylanowej indukuje odpowiedzi komórek T przeciwko antygenom nowotworowym |
ES2293178T3 (es) * | 2004-03-18 | 2008-03-16 | Institut Pasteur | Proteina recombinante que contiene epitopos del papilomavirus humano insertados en un proteina adenilato ciclasa o un fragmento de la misma y usos terapeuticos de la misma. |
EP1894941A1 (en) | 2006-09-01 | 2008-03-05 | Institut Pasteur | Treatment of cervical carcinoma with a recombinant adenylate cyclase carrying HPV antigens |
RU2448729C2 (ru) | 2006-09-01 | 2012-04-27 | Жантисель | Композиции, вызывающие специфический ответ цитотоксических т-лимфоцитов, включающие лимфо-аблативное соединение и молекулу, содержащую антигенные последовательности и нацеленную на специализированные антиген-презентирующие клетки |
EP2326953B1 (en) | 2008-07-22 | 2018-03-21 | Promega Corporation | Adp detection based luminescent phosphotransferase or atp hydrolase assay |
WO2010136231A1 (en) * | 2009-03-23 | 2010-12-02 | Institut Pasteur | MUTANT CyaA POLYPEPTIDES AND POLYPEPTIDE DERIVATIVES SUITABLE FOR THE DELIVERY OF IMMUNOGENIC MOLECULES INTO A CELL |
EP2478915A1 (en) * | 2011-01-24 | 2012-07-25 | Genticel | CyaA-carried polypeptide(s) and use to induce both therapeutic and prophylactic immune responses |
EP2689786A1 (en) * | 2012-07-23 | 2014-01-29 | Genticel | HPV/CYAA-based chimeric proteins and their uses in the induction of immune responses against HPV infection and HPV-induced disorders |
-
2012
- 2012-07-23 EP EP12305897.6A patent/EP2690172A1/en not_active Withdrawn
-
2013
- 2013-07-23 AU AU2013295045A patent/AU2013295045B2/en active Active
- 2013-07-23 CN CN201380049494.6A patent/CN104662152B/zh not_active Expired - Fee Related
- 2013-07-23 MX MX2015001018A patent/MX365560B/es active IP Right Grant
- 2013-07-23 BR BR112015001350A patent/BR112015001350A2/pt not_active Application Discontinuation
- 2013-07-23 KR KR1020157004541A patent/KR102148413B1/ko active IP Right Grant
- 2013-07-23 US US14/416,569 patent/US9499809B2/en active Active
- 2013-07-23 EP EP13739724.6A patent/EP2875130B1/en active Active
- 2013-07-23 RU RU2015100211A patent/RU2015100211A/ru unknown
- 2013-07-23 ES ES13739724T patent/ES2780525T3/es active Active
- 2013-07-23 WO PCT/EP2013/065546 patent/WO2014016310A1/en active Application Filing
- 2013-07-23 JP JP2015523535A patent/JP2015524270A/ja active Pending
- 2013-07-23 CA CA2879990A patent/CA2879990C/en active Active
-
2015
- 2015-09-02 HK HK15108580.2A patent/HK1208048A1/xx unknown
-
2016
- 2016-10-12 US US15/291,517 patent/US9982024B2/en active Active
-
2018
- 2018-09-06 JP JP2018166486A patent/JP2019013229A/ja active Pending
-
2021
- 2021-12-23 JP JP2021208859A patent/JP2022046617A/ja active Pending
Non-Patent Citations (2)
Title |
---|
J. Holubova 등, Infection and Immunity, Vol.80, NO.3, p.1181-1192(2012.01.03.)* |
X. Preville et al., Cancer Research, Vol.65, p.641-649 (2005) |
Also Published As
Publication number | Publication date |
---|---|
CN104662152B (zh) | 2020-06-12 |
EP2875130A1 (en) | 2015-05-27 |
ES2780525T3 (es) | 2020-08-26 |
WO2014016310A1 (en) | 2014-01-30 |
AU2013295045A1 (en) | 2015-02-05 |
BR112015001350A2 (pt) | 2017-08-01 |
JP2019013229A (ja) | 2019-01-31 |
MX365560B (es) | 2019-06-07 |
US20150184143A1 (en) | 2015-07-02 |
CA2879990C (en) | 2021-11-16 |
KR20150032341A (ko) | 2015-03-25 |
JP2022046617A (ja) | 2022-03-23 |
CA2879990A1 (en) | 2014-01-30 |
JP2015524270A (ja) | 2015-08-24 |
EP2690172A1 (en) | 2014-01-29 |
RU2015100211A3 (ko) | 2018-12-20 |
US20170096458A1 (en) | 2017-04-06 |
RU2015100211A (ru) | 2018-12-20 |
EP2875130B1 (en) | 2020-01-01 |
US9499809B2 (en) | 2016-11-22 |
US9982024B2 (en) | 2018-05-29 |
HK1208048A1 (en) | 2016-02-19 |
MX2015001018A (es) | 2015-07-14 |
AU2013295045B2 (en) | 2019-05-02 |
CN104662152A (zh) | 2015-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102148413B1 (ko) | 이종 폴리펩티드를 포함하는 CyaA에 기초한 키메라 단백질 및 면역 반응의 유도에 있어서의 그의 용도 | |
CZ298347B6 (cs) | Fúzní protein z rodiny MAGE, kódová sekvence nukleové kyseliny, vektor, hostitelská bunka, vakcina a použití fúzního proteinu pro výrobu vakciny | |
CA2674552A1 (en) | Vaccine | |
EP1943344A2 (en) | Methods for stimulating an immune response using bacterial antigen delivery system | |
AU2013295047B2 (en) | HPV/CyaA-based chimeric proteins and their uses in the induction of immune responses against HPV infection and HPV-induced disorders | |
JP2010532656A (ja) | 癌退縮抗原ny−eso−1およびlage−1を含む融合タンパク質 | |
US8309096B2 (en) | Fusion protein | |
Hu et al. | Japanese flounder (Paralichthys olivaceus) Hsp70: adjuvant effect and its dependence on the intrinsic ATPase activity | |
WO2016091912A1 (en) | Neisseria meningitidis trypsin-like serine protease polypeptides and compositions thereof | |
KR101713635B1 (ko) | 비브리오 패혈증균의 시스테인 단백질 분해효소 도메인 유래 재조합 단백질 및 이의 용도 | |
AU2008206463B2 (en) | Fusion proteins comprising the tumor rejection antigens NY-ESO-1 and LAGE-1 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |