KR20210110800A - 이종성 페이로드의 경구 전달용 콜릭스-유래 담체 - Google Patents
이종성 페이로드의 경구 전달용 콜릭스-유래 담체 Download PDFInfo
- Publication number
- KR20210110800A KR20210110800A KR1020217017372A KR20217017372A KR20210110800A KR 20210110800 A KR20210110800 A KR 20210110800A KR 1020217017372 A KR1020217017372 A KR 1020217017372A KR 20217017372 A KR20217017372 A KR 20217017372A KR 20210110800 A KR20210110800 A KR 20210110800A
- Authority
- KR
- South Korea
- Prior art keywords
- carrier
- payload
- seq
- payload complex
- complex
- Prior art date
Links
- 238000012384 transportation and delivery Methods 0.000 title claims abstract description 286
- 239000000969 carrier Substances 0.000 title description 171
- 210000002919 epithelial cell Anatomy 0.000 claims abstract description 311
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 65
- 210000002490 intestinal epithelial cell Anatomy 0.000 claims abstract description 30
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 257
- 229920001184 polypeptide Polymers 0.000 claims description 255
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 254
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 183
- 230000028023 exocytosis Effects 0.000 claims description 153
- 108020003175 receptors Proteins 0.000 claims description 143
- 102000005962 receptors Human genes 0.000 claims description 143
- 125000000539 amino acid group Chemical group 0.000 claims description 128
- 238000000034 method Methods 0.000 claims description 110
- 210000004027 cell Anatomy 0.000 claims description 99
- 210000004400 mucous membrane Anatomy 0.000 claims description 85
- 210000004899 c-terminal region Anatomy 0.000 claims description 75
- 239000012634 fragment Substances 0.000 claims description 75
- 125000006850 spacer group Chemical group 0.000 claims description 73
- 102000003814 Interleukin-10 Human genes 0.000 claims description 62
- 108090000174 Interleukin-10 Proteins 0.000 claims description 62
- 235000001014 amino acid Nutrition 0.000 claims description 61
- 102100030703 Interleukin-22 Human genes 0.000 claims description 57
- 210000000981 epithelium Anatomy 0.000 claims description 57
- 108010074109 interleukin-22 Proteins 0.000 claims description 56
- 230000012202 endocytosis Effects 0.000 claims description 55
- 108010017007 glucose-regulated proteins Proteins 0.000 claims description 45
- 238000003776 cleavage reaction Methods 0.000 claims description 43
- 230000007017 scission Effects 0.000 claims description 43
- 102100036597 Basement membrane-specific heparan sulfate proteoglycan core protein Human genes 0.000 claims description 41
- 150000001413 amino acids Chemical class 0.000 claims description 41
- 108010049224 perlecan Proteins 0.000 claims description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 37
- 101001038300 Homo sapiens Protein ERGIC-53 Proteins 0.000 claims description 36
- 102100040252 Protein ERGIC-53 Human genes 0.000 claims description 36
- 201000010099 disease Diseases 0.000 claims description 36
- 239000012528 membrane Substances 0.000 claims description 35
- 210000004379 membrane Anatomy 0.000 claims description 34
- 101150060955 RAB11A gene Proteins 0.000 claims description 33
- 230000008045 co-localization Effects 0.000 claims description 29
- 239000002105 nanoparticle Substances 0.000 claims description 29
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 25
- 102000015696 Interleukins Human genes 0.000 claims description 25
- 108010063738 Interleukins Proteins 0.000 claims description 25
- 229930182817 methionine Natural products 0.000 claims description 19
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 17
- 101150030875 RAB7A gene Proteins 0.000 claims description 15
- 208000011231 Crohn disease Diseases 0.000 claims description 14
- 229940088597 hormone Drugs 0.000 claims description 14
- 239000005556 hormone Substances 0.000 claims description 14
- 102000004127 Cytokines Human genes 0.000 claims description 13
- 108090000695 Cytokines Proteins 0.000 claims description 13
- 239000003814 drug Substances 0.000 claims description 13
- 206010009900 Colitis ulcerative Diseases 0.000 claims description 12
- 201000006704 Ulcerative Colitis Diseases 0.000 claims description 12
- 239000003795 chemical substances by application Substances 0.000 claims description 12
- 102000002265 Human Growth Hormone Human genes 0.000 claims description 11
- 108010000521 Human Growth Hormone Proteins 0.000 claims description 11
- 239000000854 Human Growth Hormone Substances 0.000 claims description 11
- 230000010837 receptor-mediated endocytosis Effects 0.000 claims description 11
- 230000002496 gastric effect Effects 0.000 claims description 9
- 235000013922 glutamic acid Nutrition 0.000 claims description 9
- 239000004220 glutamic acid Substances 0.000 claims description 9
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims description 9
- 235000004279 alanine Nutrition 0.000 claims description 8
- 230000010030 glucose lowering effect Effects 0.000 claims description 8
- 231100000252 nontoxic Toxicity 0.000 claims description 8
- 230000003000 nontoxic effect Effects 0.000 claims description 8
- 201000000596 systemic lupus erythematosus Diseases 0.000 claims description 8
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 7
- 201000006417 multiple sclerosis Diseases 0.000 claims description 7
- 108020004707 nucleic acids Proteins 0.000 claims description 7
- 102000039446 nucleic acids Human genes 0.000 claims description 7
- 150000007523 nucleic acids Chemical class 0.000 claims description 7
- 108020004459 Small interfering RNA Proteins 0.000 claims description 6
- 208000024908 graft versus host disease Diseases 0.000 claims description 6
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims description 5
- 102000018697 Membrane Proteins Human genes 0.000 claims description 5
- 108010052285 Membrane Proteins Proteins 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 230000001839 systemic circulation Effects 0.000 claims description 5
- 206010036774 Proctitis Diseases 0.000 claims description 4
- 201000004681 Psoriasis Diseases 0.000 claims description 4
- 230000035772 mutation Effects 0.000 claims description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 4
- 102000040430 polynucleotide Human genes 0.000 claims description 4
- 239000002157 polynucleotide Substances 0.000 claims description 4
- 206010039073 rheumatoid arthritis Diseases 0.000 claims description 4
- 101100449539 Arabidopsis thaliana GRP17 gene Proteins 0.000 claims description 3
- 101100411820 Arabidopsis thaliana RBG7 gene Proteins 0.000 claims description 3
- 208000002389 Pouchitis Diseases 0.000 claims description 2
- 239000013598 vector Substances 0.000 claims description 2
- 102000016726 Coat Protein Complex I Human genes 0.000 claims 1
- 108010092897 Coat Protein Complex I Proteins 0.000 claims 1
- 102100023078 Early endosome antigen 1 Human genes 0.000 claims 1
- 101001050162 Homo sapiens Early endosome antigen 1 Proteins 0.000 claims 1
- 102100022760 Stress-70 protein, mitochondrial Human genes 0.000 claims 1
- 208000027866 inflammatory disease Diseases 0.000 abstract description 3
- 239000008194 pharmaceutical composition Substances 0.000 abstract description 3
- 208000023275 Autoimmune disease Diseases 0.000 abstract description 2
- 238000002560 therapeutic procedure Methods 0.000 abstract 1
- 230000032258 transport Effects 0.000 description 178
- 108090000623 proteins and genes Proteins 0.000 description 133
- 102000004169 proteins and genes Human genes 0.000 description 131
- 235000018102 proteins Nutrition 0.000 description 129
- 230000004807 localization Effects 0.000 description 111
- 230000003993 interaction Effects 0.000 description 97
- 238000002347 injection Methods 0.000 description 91
- 239000007924 injection Substances 0.000 description 91
- 241000700159 Rattus Species 0.000 description 54
- 229940024606 amino acid Drugs 0.000 description 43
- 230000002132 lysosomal effect Effects 0.000 description 42
- 230000006870 function Effects 0.000 description 39
- 210000001630 jejunum Anatomy 0.000 description 38
- 238000000116 DAPI staining Methods 0.000 description 32
- 239000000427 antigen Substances 0.000 description 29
- 108091007433 antigens Proteins 0.000 description 29
- 102000036639 antigens Human genes 0.000 description 29
- 229960001519 exenatide Drugs 0.000 description 28
- 241000282414 Homo sapiens Species 0.000 description 23
- 238000001727 in vivo Methods 0.000 description 23
- 210000001519 tissue Anatomy 0.000 description 23
- 108090000054 Syndecan-2 Proteins 0.000 description 22
- 102000003711 Syndecan-2 Human genes 0.000 description 22
- 230000000968 intestinal effect Effects 0.000 description 21
- 210000004347 intestinal mucosa Anatomy 0.000 description 21
- 230000002121 endocytic effect Effects 0.000 description 20
- 230000037361 pathway Effects 0.000 description 20
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 18
- 238000002474 experimental method Methods 0.000 description 18
- 239000002953 phosphate buffered saline Substances 0.000 description 18
- 230000001965 increasing effect Effects 0.000 description 17
- 238000004064 recycling Methods 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- 210000002469 basement membrane Anatomy 0.000 description 16
- 108010011459 Exenatide Proteins 0.000 description 15
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 15
- 239000013553 cell monolayer Substances 0.000 description 15
- -1 ERGIC-53 Proteins 0.000 description 14
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 description 14
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 14
- 101000640721 Homo sapiens Transmembrane protein 132A Proteins 0.000 description 14
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 14
- 241000519995 Stachys sylvatica Species 0.000 description 14
- 238000001514 detection method Methods 0.000 description 14
- 210000001035 gastrointestinal tract Anatomy 0.000 description 14
- 108010009254 Lysosomal-Associated Membrane Protein 1 Proteins 0.000 description 13
- 102100033852 Transmembrane protein 132A Human genes 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 13
- 210000003712 lysosome Anatomy 0.000 description 13
- 230000001868 lysosomic effect Effects 0.000 description 13
- 108010070643 prolylglutamic acid Proteins 0.000 description 13
- 239000002356 single layer Substances 0.000 description 13
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 12
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 12
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 12
- 241001465754 Metazoa Species 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 238000010820 immunofluorescence microscopy Methods 0.000 description 12
- 238000000338 in vitro Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- 230000004913 activation Effects 0.000 description 11
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 11
- 238000006471 dimerization reaction Methods 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 11
- 241000880493 Leptailurus serval Species 0.000 description 10
- 241000124008 Mammalia Species 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 10
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 108091035707 Consensus sequence Proteins 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- 108010065920 Insulin Lispro Proteins 0.000 description 9
- 241000607626 Vibrio cholerae Species 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 9
- 210000001163 endosome Anatomy 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 108010064235 lysylglycine Proteins 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 101001010626 Homo sapiens Interleukin-22 Proteins 0.000 description 8
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 8
- 241000283973 Oryctolagus cuniculus Species 0.000 description 8
- 210000004369 blood Anatomy 0.000 description 8
- 239000008280 blood Substances 0.000 description 8
- 210000001072 colon Anatomy 0.000 description 8
- 229940079593 drug Drugs 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 210000004185 liver Anatomy 0.000 description 8
- 108010015796 prolylisoleucine Proteins 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 108010080629 tryptophan-leucine Proteins 0.000 description 8
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 7
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 7
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 7
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 7
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 7
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 7
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 7
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 7
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 7
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 7
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 7
- HJRBIWRXULGMOA-ACZMJKKPSA-N Asn-Gln-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJRBIWRXULGMOA-ACZMJKKPSA-N 0.000 description 7
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 7
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 7
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 7
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 7
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 7
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 7
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 7
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 7
- MIQCYAJSDGNCNK-BPUTZDHNSA-N Glu-Gln-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MIQCYAJSDGNCNK-BPUTZDHNSA-N 0.000 description 7
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 7
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 7
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 7
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 7
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 7
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 7
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 7
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 7
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 7
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 7
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 7
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 7
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 7
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 7
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 7
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 7
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 7
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 7
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 7
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 7
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 7
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 7
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 7
- PQEQXWRVHQAAKS-SRVKXCTJSA-N Ser-Tyr-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=C(O)C=C1 PQEQXWRVHQAAKS-SRVKXCTJSA-N 0.000 description 7
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 7
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 230000004888 barrier function Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 229940047122 interleukins Drugs 0.000 description 7
- 239000010410 layer Substances 0.000 description 7
- 108010012058 leucyltyrosine Proteins 0.000 description 7
- 230000005012 migration Effects 0.000 description 7
- 238000013508 migration Methods 0.000 description 7
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 7
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 7
- 108010071207 serylmethionine Proteins 0.000 description 7
- 108010005652 splenotritin Proteins 0.000 description 7
- 238000011191 terminal modification Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 229940118696 vibrio cholerae Drugs 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- GRIFPSOFWFIICX-GOPGUHFVSA-N Ala-His-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRIFPSOFWFIICX-GOPGUHFVSA-N 0.000 description 6
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 6
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 6
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 6
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 6
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 6
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 6
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 6
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 6
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 6
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 6
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 6
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 6
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 6
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 6
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 6
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 6
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 6
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 6
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 6
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 6
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 6
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 6
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 6
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 6
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 6
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 6
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 6
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 6
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 6
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 6
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 6
- ACGIVBXINJFALS-HKUYNNGSSA-N Trp-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N ACGIVBXINJFALS-HKUYNNGSSA-N 0.000 description 6
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 6
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 6
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 108010054813 diprotin B Proteins 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 125000000524 functional group Chemical group 0.000 description 6
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 6
- 108010040030 histidinoalanine Proteins 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 108010004914 prolylarginine Proteins 0.000 description 6
- 108010090894 prolylleucine Proteins 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 210000002966 serum Anatomy 0.000 description 6
- 239000011734 sodium Substances 0.000 description 6
- 108010029384 tryptophyl-histidine Proteins 0.000 description 6
- 229940046728 tumor necrosis factor alpha inhibitor Drugs 0.000 description 6
- 239000002452 tumor necrosis factor alpha inhibitor Substances 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 5
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 5
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 5
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 5
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 5
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 5
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 5
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 5
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 5
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 5
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 5
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 5
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 5
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 5
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 5
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 5
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 5
- 108010056891 Calnexin Proteins 0.000 description 5
- 102000034342 Calnexin Human genes 0.000 description 5
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 5
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 5
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 5
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 5
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 5
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 5
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 5
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 5
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 5
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 5
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 5
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 5
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 5
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 5
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 5
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 5
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 5
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 5
- 208000009329 Graft vs Host Disease Diseases 0.000 description 5
- 101000837849 Homo sapiens Trans-Golgi network integral membrane protein 2 Proteins 0.000 description 5
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 5
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 5
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 5
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 5
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 5
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 5
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 5
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 5
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 5
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 5
- 102100040918 Pro-glucagon Human genes 0.000 description 5
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 5
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 5
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 5
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 5
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 5
- 102100028621 Trans-Golgi network integral membrane protein 2 Human genes 0.000 description 5
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 5
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 5
- OEVJGIHPQOXYFE-SRVKXCTJSA-N Tyr-Asn-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O OEVJGIHPQOXYFE-SRVKXCTJSA-N 0.000 description 5
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 5
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 5
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 5
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 5
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 5
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 5
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 5
- 108010084389 glycyltryptophan Proteins 0.000 description 5
- 108010036413 histidylglycine Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 5
- 230000006674 lysosomal degradation Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical group C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 4
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 4
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 4
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 4
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 4
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 4
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 4
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 4
- 108010004460 Gastric Inhibitory Polypeptide Proteins 0.000 description 4
- 102100039994 Gastric inhibitory polypeptide Human genes 0.000 description 4
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 4
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 4
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 4
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 4
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 4
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 4
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 4
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 4
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 4
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 4
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 4
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 4
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 4
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 4
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 4
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 4
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 4
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 108010003201 RGH 0205 Proteins 0.000 description 4
- 102100022873 Ras-related protein Rab-11A Human genes 0.000 description 4
- 241000283984 Rodentia Species 0.000 description 4
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 4
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 4
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 4
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 4
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 4
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 4
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 239000012131 assay buffer Substances 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- 239000011248 coating agent Substances 0.000 description 4
- 238000000576 coating method Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 238000000799 fluorescence microscopy Methods 0.000 description 4
- 210000002175 goblet cell Anatomy 0.000 description 4
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 239000010931 gold Substances 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010027445 interleukin-22 receptor Proteins 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 210000000713 mesentery Anatomy 0.000 description 4
- 239000002858 neurotransmitter agent Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010014186 ras Proteins Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- VUFNRPJNRFOTGK-UHFFFAOYSA-M sodium;1-[4-[(2,5-dioxopyrrol-1-yl)methyl]cyclohexanecarbonyl]oxy-2,5-dioxopyrrolidine-3-sulfonate Chemical compound [Na+].O=C1C(S(=O)(=O)[O-])CC(=O)N1OC(=O)C1CCC(CN2C(C=CC2=O)=O)CC1 VUFNRPJNRFOTGK-UHFFFAOYSA-M 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 4
- 230000028973 vesicle-mediated transport Effects 0.000 description 4
- 108010036211 5-HT-moduline Proteins 0.000 description 3
- 230000005730 ADP ribosylation Effects 0.000 description 3
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 3
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 3
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 3
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 101710151712 Basement membrane-specific heparan sulfate proteoglycan core protein Proteins 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- AIRYAONNMGRCGJ-FHFVDXKLSA-N CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@H]2C(=O)N[C@@H]([C@@H](C)O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC Chemical compound CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@H]2C(=O)N[C@@H]([C@@H](C)O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC AIRYAONNMGRCGJ-FHFVDXKLSA-N 0.000 description 3
- 102000005853 Clathrin Human genes 0.000 description 3
- 108010019874 Clathrin Proteins 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 3
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 3
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 3
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 3
- 101001069607 Homo sapiens Probable G-protein coupled receptor 75 Proteins 0.000 description 3
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 3
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 3
- 108090001061 Insulin Proteins 0.000 description 3
- 102000004877 Insulin Human genes 0.000 description 3
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 3
- 102000011782 Keratins Human genes 0.000 description 3
- 108010076876 Keratins Proteins 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 3
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 3
- 108010019598 Liraglutide Proteins 0.000 description 3
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 description 3
- XVVOERDUTLJJHN-UHFFFAOYSA-N Lixisenatide Chemical compound C=1NC2=CC=CC=C2C=1CC(C(=O)NC(CC(C)C)C(=O)NC(CCCCN)C(=O)NC(CC(N)=O)C(=O)NCC(=O)NCC(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CO)C(=O)NCC(=O)NC(C)C(=O)N1C(CCC1)C(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)CC)NC(=O)C(NC(=O)C(CC(C)C)NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCSC)NC(=O)C(CCC(N)=O)NC(=O)C(CCCCN)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC=1C=CC=CC=1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)CNC(=O)C(N)CC=1NC=NC=1)C(C)O)C(C)O)C(C)C)CC1=CC=CC=C1 XVVOERDUTLJJHN-UHFFFAOYSA-N 0.000 description 3
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 3
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 3
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 3
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 3
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 3
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 3
- NTXFLJULRHQMDC-GUBZILKMSA-N Pro-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 NTXFLJULRHQMDC-GUBZILKMSA-N 0.000 description 3
- UIUWGMRJTWHIJZ-ULQDDVLXSA-N Pro-Tyr-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O UIUWGMRJTWHIJZ-ULQDDVLXSA-N 0.000 description 3
- 102100033860 Probable G-protein coupled receptor 75 Human genes 0.000 description 3
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 3
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 3
- 229930193282 clathrin Natural products 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 3
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 3
- 230000001159 endocytotic effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 229940125396 insulin Drugs 0.000 description 3
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 3
- 210000000936 intestine Anatomy 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 108010004367 lixisenatide Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 230000035699 permeability Effects 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000012453 sprague-dawley rat model Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000036962 time dependent Effects 0.000 description 3
- KWGRBVOPPLSCSI-WPRPVWTQSA-N (-)-ephedrine Chemical compound CN[C@@H](C)[C@H](O)C1=CC=CC=C1 KWGRBVOPPLSCSI-WPRPVWTQSA-N 0.000 description 2
- BJFIDCADFRDPIO-DZCXQCEKSA-N (2S)-N-[(2S)-6-amino-1-[(2-amino-2-oxoethyl)amino]-1-oxohexan-2-yl]-1-[[(4R,7S,10S,13S,16S,19R)-19-amino-7-(2-amino-2-oxoethyl)-10-(3-amino-3-oxopropyl)-16-[(4-hydroxyphenyl)methyl]-6,9,12,15,18-pentaoxo-13-(phenylmethyl)-1,2-dithia-5,8,11,14,17-pentazacycloeicos-4-yl]-oxomethyl]-2-pyrrolidinecarboxamide Chemical compound NCCCC[C@@H](C(=O)NCC(N)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](N)CSSC1 BJFIDCADFRDPIO-DZCXQCEKSA-N 0.000 description 2
- YKFCISHFRZHKHY-NGQGLHOPSA-N (2s)-2-amino-3-(3,4-dihydroxyphenyl)-2-methylpropanoic acid;trihydrate Chemical compound O.O.O.OC(=O)[C@](N)(C)CC1=CC=C(O)C(O)=C1.OC(=O)[C@](N)(C)CC1=CC=C(O)C(O)=C1 YKFCISHFRZHKHY-NGQGLHOPSA-N 0.000 description 2
- 229930182837 (R)-adrenaline Natural products 0.000 description 2
- UCTWMZQNUQWSLP-VIFPVBQESA-N (R)-adrenaline Chemical compound CNC[C@H](O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-VIFPVBQESA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 208000004998 Abdominal Pain Diseases 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 2
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 2
- 206010002091 Anaesthesia Diseases 0.000 description 2
- 102100034613 Annexin A2 Human genes 0.000 description 2
- 108090000668 Annexin A2 Proteins 0.000 description 2
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 208000002881 Colic Diseases 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 238000008157 ELISA kit Methods 0.000 description 2
- 102100031334 Elongation factor 2 Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108010008165 Etanercept Proteins 0.000 description 2
- 206010016717 Fistula Diseases 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- 208000002705 Glucose Intolerance Diseases 0.000 description 2
- 102100041033 Golgin subfamily B member 1 Human genes 0.000 description 2
- 206010056438 Growth hormone deficiency Diseases 0.000 description 2
- NTYJJOPFIAHURM-UHFFFAOYSA-N Histamine Chemical compound NCCC1=CN=CN1 NTYJJOPFIAHURM-UHFFFAOYSA-N 0.000 description 2
- 101000903318 Homo sapiens Stress-70 protein, mitochondrial Proteins 0.000 description 2
- 108010003272 Hyaluronate lyase Proteins 0.000 description 2
- 102000001974 Hyaluronidases Human genes 0.000 description 2
- 206010060378 Hyperinsulinaemia Diseases 0.000 description 2
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 2
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 2
- 108010057186 Insulin Glargine Proteins 0.000 description 2
- PIWKPBJCKXDKJR-UHFFFAOYSA-N Isoflurane Chemical compound FC(F)OC(Cl)C(F)(F)F PIWKPBJCKXDKJR-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 108010048179 Lypressin Proteins 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 2
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 2
- AFVFQIVMOAPDHO-UHFFFAOYSA-N Methanesulfonic acid Chemical compound CS(O)(=O)=O AFVFQIVMOAPDHO-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- 108010077519 Peptide Elongation Factor 2 Proteins 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000700157 Rattus norvegicus Species 0.000 description 2
- 230000010799 Receptor Interactions Effects 0.000 description 2
- 208000001647 Renal Insufficiency Diseases 0.000 description 2
- DLSWIYLPEUIQAV-UHFFFAOYSA-N Semaglutide Chemical compound CCC(C)C(NC(=O)C(Cc1ccccc1)NC(=O)C(CCC(O)=O)NC(=O)C(CCCCNC(=O)COCCOCCNC(=O)COCCOCCNC(=O)CCC(NC(=O)CCCCCCCCCCCCCCCCC(O)=O)C(O)=O)NC(=O)C(C)NC(=O)C(C)NC(=O)C(CCC(N)=O)NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)C(CC(C)C)NC(=O)C(Cc1ccc(O)cc1)NC(=O)C(CO)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(Cc1ccccc1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)C(C)(C)NC(=O)C(N)Cc1cnc[nH]1)C(C)O)C(C)O)C(C)C)C(=O)NC(C)C(=O)NC(Cc1c[nH]c2ccccc12)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CCCNC(N)=N)C(=O)NCC(O)=O DLSWIYLPEUIQAV-UHFFFAOYSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- 108010023197 Streptokinase Proteins 0.000 description 2
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 208000026928 Turner syndrome Diseases 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 2
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- GXBMIBRIOWHPDT-UHFFFAOYSA-N Vasopressin Natural products N1C(=O)C(CC=2C=C(O)C=CC=2)NC(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CCCN=C(N)N)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C1CC1=CC=CC=C1 GXBMIBRIOWHPDT-UHFFFAOYSA-N 0.000 description 2
- 108010004977 Vasopressins Proteins 0.000 description 2
- 102000002852 Vasopressins Human genes 0.000 description 2
- 210000001015 abdomen Anatomy 0.000 description 2
- 210000000683 abdominal cavity Anatomy 0.000 description 2
- 230000003187 abdominal effect Effects 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- OIPILFWXSMYKGL-UHFFFAOYSA-N acetylcholine Chemical compound CC(=O)OCC[N+](C)(C)C OIPILFWXSMYKGL-UHFFFAOYSA-N 0.000 description 2
- 229960004373 acetylcholine Drugs 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- OGWAVGNOAMXIIM-UHFFFAOYSA-N albiglutide Chemical compound O=C(O)C(NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)CNC(=O)C(NC(=O)CNC(=O)C(N)CC=1(N=CNC=1))CCC(=O)O)C(O)C)CC2(=CC=CC=C2))C(O)C)CO)CC(=O)O)C(C)C)CO)CO)CC3(=CC=C(O)C=C3))CC(C)C)CCC(=O)O)CCC(=O)N)C)C)CCCCN)CCC(=O)O)CC4(=CC=CC=C4))C(CC)C)C)CC=6(C5(=C(C=CC=C5)NC=6)))CC(C)C)C(C)C)CCCCN)CCCNC(=N)N OGWAVGNOAMXIIM-UHFFFAOYSA-N 0.000 description 2
- 230000037005 anaesthesia Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 210000004082 barrier epithelial cell Anatomy 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 229960004424 carbon dioxide Drugs 0.000 description 2
- 235000011089 carbon dioxide Nutrition 0.000 description 2
- 238000012754 cardiac puncture Methods 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 229940083181 centrally acting adntiadrenergic agent methyldopa Drugs 0.000 description 2
- JUFFVKRROAPVBI-PVOYSMBESA-N chembl1210015 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N[C@H]1[C@@H]([C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@]3(O[C@@H](C[C@H](O)[C@H](O)CO)[C@H](NC(C)=O)[C@@H](O)C3)C(O)=O)O2)O)[C@@H](CO)O1)NC(C)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 JUFFVKRROAPVBI-PVOYSMBESA-N 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 210000002314 coated vesicle Anatomy 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 201000003146 cystitis Diseases 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 229960003638 dopamine Drugs 0.000 description 2
- 108010005794 dulaglutide Proteins 0.000 description 2
- 229960000972 enoximone Drugs 0.000 description 2
- ZJKNESGOIKRXQY-UHFFFAOYSA-N enoximone Chemical compound C1=CC(SC)=CC=C1C(=O)C1=C(C)NC(=O)N1 ZJKNESGOIKRXQY-UHFFFAOYSA-N 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 229960005139 epinephrine Drugs 0.000 description 2
- 230000004890 epithelial barrier function Effects 0.000 description 2
- 210000004955 epithelial membrane Anatomy 0.000 description 2
- 230000003890 fistula Effects 0.000 description 2
- 238000002073 fluorescence micrograph Methods 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 102000044978 human HSPA9 Human genes 0.000 description 2
- 229960002773 hyaluronidase Drugs 0.000 description 2
- 230000003451 hyperinsulinaemic effect Effects 0.000 description 2
- 201000008980 hyperinsulinism Diseases 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 238000010874 in vitro model Methods 0.000 description 2
- 210000003000 inclusion body Anatomy 0.000 description 2
- 239000000859 incretin Substances 0.000 description 2
- MGXWVYUBJRZYPE-YUGYIWNOSA-N incretin Chemical class C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=C(O)C=C1 MGXWVYUBJRZYPE-YUGYIWNOSA-N 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 229960002725 isoflurane Drugs 0.000 description 2
- 201000006370 kidney failure Diseases 0.000 description 2
- UGOZVNFCFYTPAZ-IOXYNQHNSA-N levemir Chemical compound CCCCCCCCCCCCCC(=O)NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=2C=CC=CC=2)C(C)C)CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(C)C)CSSC[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC2=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 UGOZVNFCFYTPAZ-IOXYNQHNSA-N 0.000 description 2
- 229960002701 liraglutide Drugs 0.000 description 2
- 229960001093 lixisenatide Drugs 0.000 description 2
- 229960003837 lypressin Drugs 0.000 description 2
- 238000002803 maceration Methods 0.000 description 2
- 108010053687 macrogolgin Proteins 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 238000007431 microscopic evaluation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 229940125395 oral insulin Drugs 0.000 description 2
- 238000003068 pathway analysis Methods 0.000 description 2
- 239000000813 peptide hormone Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 201000009104 prediabetes syndrome Diseases 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 108700027806 rGLP-1 Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000009834 selective interaction Effects 0.000 description 2
- 108010060325 semaglutide Proteins 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- QZAYGJVTTNCVMB-UHFFFAOYSA-N serotonin Chemical compound C1=C(O)C=C2C(CCN)=CNC2=C1 QZAYGJVTTNCVMB-UHFFFAOYSA-N 0.000 description 2
- 238000001542 size-exclusion chromatography Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 229960005202 streptokinase Drugs 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 2
- 229960000187 tissue plasminogen activator Drugs 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 238000002834 transmittance Methods 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- DZGWFCGJZKJUFP-UHFFFAOYSA-N tyramine Chemical compound NCCC1=CC=C(O)C=C1 DZGWFCGJZKJUFP-UHFFFAOYSA-N 0.000 description 2
- 229960005356 urokinase Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229940124549 vasodilator Drugs 0.000 description 2
- 239000003071 vasodilator agent Substances 0.000 description 2
- 229960003726 vasopressin Drugs 0.000 description 2
- DBGIVFWFUFKIQN-UHFFFAOYSA-N (+-)-Fenfluramine Chemical compound CCNC(C)CC1=CC=CC(C(F)(F)F)=C1 DBGIVFWFUFKIQN-UHFFFAOYSA-N 0.000 description 1
- SFLSHLFXELFNJZ-QMMMGPOBSA-N (-)-norepinephrine Chemical compound NC[C@H](O)C1=CC=C(O)C(O)=C1 SFLSHLFXELFNJZ-QMMMGPOBSA-N 0.000 description 1
- YLXIPWWIOISBDD-NDAAPVSOSA-N (2r,3r)-2,3-dihydroxybutanedioic acid;4-[(1r)-1-hydroxy-2-(methylamino)ethyl]benzene-1,2-diol Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O.CNC[C@H](O)C1=CC=C(O)C(O)=C1 YLXIPWWIOISBDD-NDAAPVSOSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- LJRDOKAZOAKLDU-UDXJMMFXSA-N (2s,3s,4r,5r,6r)-5-amino-2-(aminomethyl)-6-[(2r,3s,4r,5s)-5-[(1r,2r,3s,5r,6s)-3,5-diamino-2-[(2s,3r,4r,5s,6r)-3-amino-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-hydroxycyclohexyl]oxy-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl]oxyoxane-3,4-diol;sulfuric ac Chemical compound OS(O)(=O)=O.N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)N)O[C@@H]1CO LJRDOKAZOAKLDU-UDXJMMFXSA-N 0.000 description 1
- FDKXTQMXEQVLRF-ZHACJKMWSA-N (E)-dacarbazine Chemical compound CN(C)\N=N\c1[nH]cnc1C(N)=O FDKXTQMXEQVLRF-ZHACJKMWSA-N 0.000 description 1
- METKIMKYRPQLGS-GFCCVEGCSA-N (R)-atenolol Chemical compound CC(C)NC[C@@H](O)COC1=CC=C(CC(N)=O)C=C1 METKIMKYRPQLGS-GFCCVEGCSA-N 0.000 description 1
- QHGUCRYDKWKLMG-QMMMGPOBSA-N (R)-octopamine Chemical compound NC[C@H](O)C1=CC=C(O)C=C1 QHGUCRYDKWKLMG-QMMMGPOBSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- SGUAFYQXFOLMHL-UHFFFAOYSA-N 2-hydroxy-5-{1-hydroxy-2-[(4-phenylbutan-2-yl)amino]ethyl}benzamide Chemical compound C=1C=C(O)C(C(N)=O)=CC=1C(O)CNC(C)CCC1=CC=CC=C1 SGUAFYQXFOLMHL-UHFFFAOYSA-N 0.000 description 1
- VXMYWVMXSWJFCV-UHFFFAOYSA-N 3-(4-imidazol-1-ylphenyl)-4,5-dihydro-1h-pyridazin-6-one Chemical compound N1C(=O)CCC(C=2C=CC(=CC=2)N2C=NC=C2)=N1 VXMYWVMXSWJFCV-UHFFFAOYSA-N 0.000 description 1
- RCFLBBHULHAKQU-UHFFFAOYSA-N 3-[1-[4-(4-fluorophenyl)-4-oxobutyl]-3,6-dihydro-2h-pyridin-4-yl]-1h-benzimidazol-2-one;2-hydroxypropane-1,2,3-tricarboxylic acid;n-phenyl-n-[1-(2-phenylethyl)piperidin-4-yl]propanamide Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O.C=1C=CC=CC=1N(C(=O)CC)C(CC1)CCN1CCC1=CC=CC=C1.C1=CC(F)=CC=C1C(=O)CCCN1CC=C(N2C(NC3=CC=CC=C32)=O)CC1 RCFLBBHULHAKQU-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- IOVGROKTTNBUGK-UHFFFAOYSA-N 4-[2-[[1-hydroxy-1-(4-hydroxyphenyl)propan-2-yl]amino]ethyl]phenol Chemical compound C=1C=C(O)C=CC=1C(O)C(C)NCCC1=CC=C(O)C=C1 IOVGROKTTNBUGK-UHFFFAOYSA-N 0.000 description 1
- LVRVABPNVHYXRT-BQWXUCBYSA-N 52906-92-0 Chemical compound C([C@H](N)C(=O)N[C@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)C(C)C)C1=CC=CC=C1 LVRVABPNVHYXRT-BQWXUCBYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- 208000004611 Abdominal Obesity Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- 101710145634 Antigen 1 Proteins 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003210 Arteriosclerosis Diseases 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- UYXXMIZGHYKYAT-NHCYSSNCSA-N Asn-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N UYXXMIZGHYKYAT-NHCYSSNCSA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- YQKYLDVPCOGIRB-SEKJGCFDSA-N Asp-Leu-Thr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YQKYLDVPCOGIRB-SEKJGCFDSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 229930003347 Atropine Natural products 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- KPYSYYIEGFHWSV-UHFFFAOYSA-N Baclofen Chemical compound OC(=O)CC(CN)C1=CC=C(Cl)C=C1 KPYSYYIEGFHWSV-UHFFFAOYSA-N 0.000 description 1
- 208000023328 Basedow disease Diseases 0.000 description 1
- 208000027496 Behcet disease Diseases 0.000 description 1
- 208000009137 Behcet syndrome Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-M Bromide Chemical compound [Br-] CPELXLSAUQHCOX-UHFFFAOYSA-M 0.000 description 1
- YNXLOPYTAAFMTN-SBUIBGKBSA-N C([C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)C1=CC=C(O)C=C1 Chemical compound C([C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)C1=CC=C(O)C=C1 YNXLOPYTAAFMTN-SBUIBGKBSA-N 0.000 description 1
- FVLVBPDQNARYJU-XAHDHGMMSA-N C[C@H]1CCC(CC1)NC(=O)N(CCCl)N=O Chemical compound C[C@H]1CCC(CC1)NC(=O)N(CCCl)N=O FVLVBPDQNARYJU-XAHDHGMMSA-N 0.000 description 1
- 108010001789 Calcitonin Receptors Proteins 0.000 description 1
- 102100038520 Calcitonin receptor Human genes 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- DLGOEMSEDOSKAD-UHFFFAOYSA-N Carmustine Chemical compound ClCCNC(=O)N(N=O)CCCl DLGOEMSEDOSKAD-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 206010065941 Central obesity Diseases 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 1
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 1
- 241000909426 Clinidium Species 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 206010009895 Colitis ischaemic Diseases 0.000 description 1
- 206010056979 Colitis microscopic Diseases 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108010091893 Cosyntropin Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- KKZHXOOZHFABQQ-UWJYBYFXSA-N Cys-Ala-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKZHXOOZHFABQQ-UWJYBYFXSA-N 0.000 description 1
- IROWCYIEJAOFOW-UHFFFAOYSA-N DL-Isoprenaline hydrochloride Chemical compound Cl.CC(C)NCC(O)C1=CC=C(O)C(O)=C1 IROWCYIEJAOFOW-UHFFFAOYSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102100022874 Dexamethasone-induced Ras-related protein 1 Human genes 0.000 description 1
- 208000001380 Diabetic Ketoacidosis Diseases 0.000 description 1
- 208000007342 Diabetic Nephropathies Diseases 0.000 description 1
- 208000032131 Diabetic Neuropathies Diseases 0.000 description 1
- 208000002230 Diabetic coma Diseases 0.000 description 1
- 206010070901 Diabetic dyslipidaemia Diseases 0.000 description 1
- 206010012689 Diabetic retinopathy Diseases 0.000 description 1
- JRWZLRBJNMZMFE-UHFFFAOYSA-N Dobutamine Chemical compound C=1C=C(O)C(O)=CC=1CCNC(C)CCC1=CC=C(O)C=C1 JRWZLRBJNMZMFE-UHFFFAOYSA-N 0.000 description 1
- 208000032928 Dyslipidaemia Diseases 0.000 description 1
- 206010014486 Elevated triglycerides Diseases 0.000 description 1
- 102000009024 Epidermal Growth Factor Human genes 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 108010043222 Exubera Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 102400000921 Gastrin Human genes 0.000 description 1
- 108090001053 Gastrin releasing peptide Proteins 0.000 description 1
- 102000004862 Gastrin releasing peptide Human genes 0.000 description 1
- 108010052343 Gastrins Proteins 0.000 description 1
- 101800001226 Glicentin-related polypeptide Proteins 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- MINZLORERLNSPP-ACZMJKKPSA-N Gln-Asn-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N MINZLORERLNSPP-ACZMJKKPSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- 102000051325 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 108010088406 Glucagon-Like Peptides Proteins 0.000 description 1
- 108010053070 Glutathione Disulfide Proteins 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- VPNYRYCIDCJBOM-UHFFFAOYSA-M Glycopyrronium bromide Chemical compound [Br-].C1[N+](C)(C)CCC1OC(=O)C(O)(C=1C=CC=CC=1)C1CCCC1 VPNYRYCIDCJBOM-UHFFFAOYSA-M 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 208000001204 Hashimoto Disease Diseases 0.000 description 1
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- RPTUSVTUFVMDQK-UHFFFAOYSA-N Hidralazin Chemical compound C1=CC=C2C(NN)=NN=CC2=C1 RPTUSVTUFVMDQK-UHFFFAOYSA-N 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- XSEAJSPAOTZXJE-IHPCNDPISA-N His-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CC4=CN=CN4)N XSEAJSPAOTZXJE-IHPCNDPISA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000620808 Homo sapiens Dexamethasone-induced Ras-related protein 1 Proteins 0.000 description 1
- 101001040734 Homo sapiens Golgi phosphoprotein 3 Proteins 0.000 description 1
- 101001002470 Homo sapiens Interferon lambda-1 Proteins 0.000 description 1
- 101001003149 Homo sapiens Interleukin-10 receptor subunit beta Proteins 0.000 description 1
- 101001044883 Homo sapiens Interleukin-22 receptor subunit alpha-1 Proteins 0.000 description 1
- 101000853000 Homo sapiens Interleukin-26 Proteins 0.000 description 1
- 101000998139 Homo sapiens Interleukin-32 Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 108010090613 Human Regular Insulin Proteins 0.000 description 1
- 102000013266 Human Regular Insulin Human genes 0.000 description 1
- 102100021102 Hyaluronidase PH-20 Human genes 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- RKUNBYITZUJHSG-UHFFFAOYSA-N Hyosciamin-hydrochlorid Natural products CN1C(C2)CCC1CC2OC(=O)C(CO)C1=CC=CC=C1 RKUNBYITZUJHSG-UHFFFAOYSA-N 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 206010020710 Hyperphagia Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- RWYCOSAAAJBJQL-KCTSRDHCSA-N Ile-Gly-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RWYCOSAAAJBJQL-KCTSRDHCSA-N 0.000 description 1
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- JDCQDJVYUXNCGF-SPOWBLRKSA-N Ile-Ser-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JDCQDJVYUXNCGF-SPOWBLRKSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 206010056997 Impaired fasting glucose Diseases 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- 108010089308 Insulin Detemir Proteins 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102000000589 Interleukin-1 Human genes 0.000 description 1
- 102100020788 Interleukin-10 receptor subunit beta Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108090000176 Interleukin-13 Proteins 0.000 description 1
- 108090000172 Interleukin-15 Proteins 0.000 description 1
- 101800003050 Interleukin-16 Proteins 0.000 description 1
- 108050003558 Interleukin-17 Proteins 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 108090000171 Interleukin-18 Proteins 0.000 description 1
- 108050009288 Interleukin-19 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102100022723 Interleukin-22 receptor subunit alpha-1 Human genes 0.000 description 1
- 108010065637 Interleukin-23 Proteins 0.000 description 1
- 108010066979 Interleukin-27 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 101710181613 Interleukin-31 Proteins 0.000 description 1
- 108010067003 Interleukin-33 Proteins 0.000 description 1
- 101710181549 Interleukin-34 Proteins 0.000 description 1
- 108091007973 Interleukin-36 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108010041872 Islet Amyloid Polypeptide Proteins 0.000 description 1
- 102000036770 Islet Amyloid Polypeptide Human genes 0.000 description 1
- YQEZLKZALYSWHR-UHFFFAOYSA-N Ketamine Chemical compound C=1C=CC=C(Cl)C=1C1(NC)CCCCC1=O YQEZLKZALYSWHR-UHFFFAOYSA-N 0.000 description 1
- 208000007976 Ketosis Diseases 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- 229930064664 L-arginine Natural products 0.000 description 1
- 235000014852 L-arginine Nutrition 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 238000008214 LDL Cholesterol Methods 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- HQPHMEPBNUHPKD-XIRDDKMYSA-N Leu-Cys-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N HQPHMEPBNUHPKD-XIRDDKMYSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- HLFSDGLLUJUHTE-SNVBAGLBSA-N Levamisole Chemical compound C1([C@H]2CN3CCSC3=N2)=CC=CC=C1 HLFSDGLLUJUHTE-SNVBAGLBSA-N 0.000 description 1
- 208000017170 Lipid metabolism disease Diseases 0.000 description 1
- GQYIWUVLTXOXAJ-UHFFFAOYSA-N Lomustine Chemical compound ClCCN(N=O)C(=O)NC1CCCCC1 GQYIWUVLTXOXAJ-UHFFFAOYSA-N 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- CFOLERIRBUAYAD-HOCLYGCPSA-N Lys-Trp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O CFOLERIRBUAYAD-HOCLYGCPSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101710116782 Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 1
- 101710151321 Melanostatin Proteins 0.000 description 1
- 108010057021 Menotropins Proteins 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- WJAJPNHVVFWKKL-UHFFFAOYSA-N Methoxamine Chemical compound COC1=CC=C(OC)C(C(O)C(C)N)=C1 WJAJPNHVVFWKKL-UHFFFAOYSA-N 0.000 description 1
- NZXKDOXHBHYTKP-UHFFFAOYSA-N Metohexital Chemical compound CCC#CC(C)C1(CC=C)C(=O)NC(=O)N(C)C1=O NZXKDOXHBHYTKP-UHFFFAOYSA-N 0.000 description 1
- 101800002372 Motilin Proteins 0.000 description 1
- 102400001357 Motilin Human genes 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 102400000064 Neuropeptide Y Human genes 0.000 description 1
- 102000003797 Neuropeptides Human genes 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 206010029748 Noonan syndrome Diseases 0.000 description 1
- 108010036875 ORMD-0801 Proteins 0.000 description 1
- QHGUCRYDKWKLMG-MRVPVSSYSA-N Octopamine Natural products NC[C@@H](O)C1=CC=C(O)C=C1 QHGUCRYDKWKLMG-MRVPVSSYSA-N 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- VQASKUSHBVDKGU-UHFFFAOYSA-N Paramethadione Chemical compound CCC1(C)OC(=O)N(C)C1=O VQASKUSHBVDKGU-UHFFFAOYSA-N 0.000 description 1
- 201000011152 Pemphigus Diseases 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108010079943 Pentagastrin Proteins 0.000 description 1
- 102000015731 Peptide Hormones Human genes 0.000 description 1
- 108010038988 Peptide Hormones Proteins 0.000 description 1
- 102100029909 Peptide YY Human genes 0.000 description 1
- 108010088847 Peptide YY Proteins 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- 102000006877 Pituitary Hormones Human genes 0.000 description 1
- 108010047386 Pituitary Hormones Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- CYLWJCABXYDINA-UHFFFAOYSA-N Polythiazide Polymers ClC1=C(S(N)(=O)=O)C=C2S(=O)(=O)N(C)C(CSCC(F)(F)F)NC2=C1 CYLWJCABXYDINA-UHFFFAOYSA-N 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- OZAPWFHRPINHND-GUBZILKMSA-N Pro-Cys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O OZAPWFHRPINHND-GUBZILKMSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- IWUCXVSUMQZMFG-AFCXAGJDSA-N Ribavirin Chemical compound N1=C(C(=O)N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 IWUCXVSUMQZMFG-AFCXAGJDSA-N 0.000 description 1
- 101150055528 SPAM1 gene Proteins 0.000 description 1
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- 108010086019 Secretin Proteins 0.000 description 1
- 102100037505 Secretin Human genes 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 208000020221 Short stature Diseases 0.000 description 1
- 108010026951 Short-Acting Insulin Proteins 0.000 description 1
- 229940123958 Short-acting insulin Drugs 0.000 description 1
- 206010049416 Short-bowel syndrome Diseases 0.000 description 1
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 1
- 108010087230 Sincalide Proteins 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 239000000150 Sympathomimetic Substances 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108010012944 Tetragastrin Proteins 0.000 description 1
- IUJDSEJGGMCXSG-UHFFFAOYSA-N Thiopental Chemical compound CCCC(C)C1(CC)C(=O)NC(=S)NC1=O IUJDSEJGGMCXSG-UHFFFAOYSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 206010043561 Thrombocytopenic purpura Diseases 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 101800004623 Thyrotropin-releasing hormone Proteins 0.000 description 1
- 102400000336 Thyrotropin-releasing hormone Human genes 0.000 description 1
- 102100033121 Transcription factor 21 Human genes 0.000 description 1
- 101710119687 Transcription factor 21 Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- WTRQBSSQBKRNKV-MNSWYVGCSA-N Trp-Thr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)[C@H](O)C)C(O)=O)C1=CC=C(O)C=C1 WTRQBSSQBKRNKV-MNSWYVGCSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- NIHNMOSRSAYZIT-BPNCWPANSA-N Tyr-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NIHNMOSRSAYZIT-BPNCWPANSA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- NIJJYAXOARWZEE-UHFFFAOYSA-N Valproic acid Chemical compound CCCC(C(O)=O)CCC NIJJYAXOARWZEE-UHFFFAOYSA-N 0.000 description 1
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 description 1
- 102400000015 Vasoactive intestinal peptide Human genes 0.000 description 1
- 229960002122 acebutolol Drugs 0.000 description 1
- GOEMGAFJFRBGGG-UHFFFAOYSA-N acebutolol Chemical compound CCCC(=O)NC1=CC=C(OCC(O)CNC(C)C)C(C(C)=O)=C1 GOEMGAFJFRBGGG-UHFFFAOYSA-N 0.000 description 1
- 229960004150 aciclovir Drugs 0.000 description 1
- MKUXAQIIEYXACX-UHFFFAOYSA-N aciclovir Chemical compound N1C(N)=NC(=O)C2=C1N(COCCO)C=N2 MKUXAQIIEYXACX-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 229960001456 adenosine triphosphate Drugs 0.000 description 1
- 229940049445 adlyxin Drugs 0.000 description 1
- 230000001800 adrenalinergic effect Effects 0.000 description 1
- 239000000464 adrenergic agent Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 229940078883 afrezza Drugs 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 229960004733 albiglutide Drugs 0.000 description 1
- NDAUXUAQIAJITI-UHFFFAOYSA-N albuterol Chemical compound CC(C)(C)NCC(O)C1=CC=C(O)C(CO)=C1 NDAUXUAQIAJITI-UHFFFAOYSA-N 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 239000003282 amino acid receptor affecting agent Substances 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 229960002105 amrinone Drugs 0.000 description 1
- RNLQIBCLLYYYFJ-UHFFFAOYSA-N amrinone Chemical compound N1C(=O)C(N)=CC(C=2C=CN=CC=2)=C1 RNLQIBCLLYYYFJ-UHFFFAOYSA-N 0.000 description 1
- 239000003098 androgen Substances 0.000 description 1
- 229940030486 androgens Drugs 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 230000000507 anthelmentic effect Effects 0.000 description 1
- 229940124339 anthelmintic agent Drugs 0.000 description 1
- 239000000921 anthelmintic agent Substances 0.000 description 1
- 230000001466 anti-adreneric effect Effects 0.000 description 1
- 239000004004 anti-anginal agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000003531 anti-dysrhythmic effect Effects 0.000 description 1
- 230000003556 anti-epileptic effect Effects 0.000 description 1
- 230000003276 anti-hypertensive effect Effects 0.000 description 1
- 230000000078 anti-malarial effect Effects 0.000 description 1
- 230000001022 anti-muscarinic effect Effects 0.000 description 1
- 229940035678 anti-parkinson drug Drugs 0.000 description 1
- 229940055075 anticholinesterase parasympathomimetics Drugs 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000001961 anticonvulsive agent Substances 0.000 description 1
- 229960003965 antiepileptics Drugs 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 239000002220 antihypertensive agent Substances 0.000 description 1
- 229940127088 antihypertensive drug Drugs 0.000 description 1
- 239000003430 antimalarial agent Substances 0.000 description 1
- 229940124433 antimigraine drug Drugs 0.000 description 1
- 229940034982 antineoplastic agent Drugs 0.000 description 1
- 229940045719 antineoplastic alkylating agent nitrosoureas Drugs 0.000 description 1
- 229940045984 antineoplastic methylhydrazine Drugs 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 229940112930 apidra Drugs 0.000 description 1
- RCHHVVGSTHAVPF-ZPHPLDECSA-N apidra Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3N=CNC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CNC=N1 RCHHVVGSTHAVPF-ZPHPLDECSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009697 arginine Nutrition 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 208000011775 arteriosclerosis disease Diseases 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 229960002274 atenolol Drugs 0.000 description 1
- RKUNBYITZUJHSG-SPUOUPEWSA-N atropine Chemical compound O([C@H]1C[C@H]2CC[C@@H](C1)N2C)C(=O)C(CO)C1=CC=CC=C1 RKUNBYITZUJHSG-SPUOUPEWSA-N 0.000 description 1
- 229960000396 atropine Drugs 0.000 description 1
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 1
- 229960002170 azathioprine Drugs 0.000 description 1
- WZPBZJONDBGPKJ-VEHQQRBSSA-N aztreonam Chemical compound O=C1N(S([O-])(=O)=O)[C@@H](C)[C@@H]1NC(=O)C(=N/OC(C)(C)C(O)=O)\C1=CSC([NH3+])=N1 WZPBZJONDBGPKJ-VEHQQRBSSA-N 0.000 description 1
- 229960003644 aztreonam Drugs 0.000 description 1
- 229960000794 baclofen Drugs 0.000 description 1
- 201000005008 bacterial sepsis Diseases 0.000 description 1
- 230000008955 bacterial trafficking Effects 0.000 description 1
- 210000000270 basal cell Anatomy 0.000 description 1
- 229960003515 bendroflumethiazide Drugs 0.000 description 1
- HDWIHXWEUNVBIY-UHFFFAOYSA-N bendroflumethiazidum Chemical compound C1=C(C(F)(F)F)C(S(=O)(=O)N)=CC(S(N2)(=O)=O)=C1NC2CC1=CC=CC=C1 HDWIHXWEUNVBIY-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- CPFJLLXFNPCTDW-BWSPSPBFSA-N benzatropine mesylate Chemical compound CS([O-])(=O)=O.O([C@H]1C[C@H]2CC[C@@H](C1)[NH+]2C)C(C=1C=CC=CC=1)C1=CC=CC=C1 CPFJLLXFNPCTDW-BWSPSPBFSA-N 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-M benzenesulfonate Chemical compound [O-]S(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-M 0.000 description 1
- 229940024774 benztropine mesylate Drugs 0.000 description 1
- 239000003781 beta lactamase inhibitor Substances 0.000 description 1
- 229940126813 beta-lactamase inhibitor Drugs 0.000 description 1
- 230000000035 biogenic effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960000585 bitolterol mesylate Drugs 0.000 description 1
- HODFCFXCOMKRCG-UHFFFAOYSA-N bitolterol mesylate Chemical compound CS([O-])(=O)=O.C1=CC(C)=CC=C1C(=O)OC1=CC=C(C(O)C[NH2+]C(C)(C)C)C=C1OC(=O)C1=CC=C(C)C=C1 HODFCFXCOMKRCG-UHFFFAOYSA-N 0.000 description 1
- 230000023555 blood coagulation Effects 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- GJPICJJJRGTNOD-UHFFFAOYSA-N bosentan Chemical compound COC1=CC=CC=C1OC(C(=NC(=N1)C=2N=CC=CN=2)OCCO)=C1NS(=O)(=O)C1=CC=C(C(C)(C)C)C=C1 GJPICJJJRGTNOD-UHFFFAOYSA-N 0.000 description 1
- 229960003065 bosentan Drugs 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 230000003185 calcium uptake Effects 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 229960000623 carbamazepine Drugs 0.000 description 1
- FFGPTBGBLSHEPO-UHFFFAOYSA-N carbamazepine Chemical compound C1=CC2=CC=CC=C2N(C(=O)N)C2=CC=CC=C21 FFGPTBGBLSHEPO-UHFFFAOYSA-N 0.000 description 1
- 229960004205 carbidopa Drugs 0.000 description 1
- TZFNLOMSOLWIDK-JTQLQIEISA-N carbidopa (anhydrous) Chemical compound NN[C@@](C(O)=O)(C)CC1=CC=C(O)C(O)=C1 TZFNLOMSOLWIDK-JTQLQIEISA-N 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 229960005296 carboprost tromethamine Drugs 0.000 description 1
- UMMADZJLZAPZAW-OVXHCKHTSA-N carboprost tromethamine Chemical compound OCC([NH3+])(CO)CO.CCCCC[C@](C)(O)\C=C\[C@H]1[C@@H](O)C[C@H](O)[C@@H]1C\C=C/CCCC([O-])=O UMMADZJLZAPZAW-OVXHCKHTSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000002368 cardiac glycoside Substances 0.000 description 1
- 229940097217 cardiac glycoside Drugs 0.000 description 1
- 239000002327 cardiovascular agent Substances 0.000 description 1
- 229940125692 cardiovascular agent Drugs 0.000 description 1
- 229960005243 carmustine Drugs 0.000 description 1
- 239000012876 carrier material Substances 0.000 description 1
- 230000005779 cell damage Effects 0.000 description 1
- 208000037887 cell injury Diseases 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- XGGHHHBGPSNXFE-ZSHCYNCHSA-N chembl1186610 Chemical compound C1[C@H](OC(=O)C(CCC)CCC)C[C@@H]2CC[C@H]1[N+]2(C)C XGGHHHBGPSNXFE-ZSHCYNCHSA-N 0.000 description 1
- AOXOCDRNSPFDPE-UKEONUMOSA-N chembl413654 Chemical compound C([C@H](C(=O)NCC(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](C)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@@H](N)CCC(O)=O)C1=CC=C(O)C=C1 AOXOCDRNSPFDPE-UKEONUMOSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 239000000544 cholinesterase inhibitor Substances 0.000 description 1
- 239000002779 cholinesterase reactivator Substances 0.000 description 1
- 229940015047 chorionic gonadotropin Drugs 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 230000006395 clathrin-mediated endocytosis Effects 0.000 description 1
- DGBIGWXXNGSACT-UHFFFAOYSA-N clonazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1Cl DGBIGWXXNGSACT-UHFFFAOYSA-N 0.000 description 1
- 229960003120 clonazepam Drugs 0.000 description 1
- FDJOLVPMNUYSCM-WZHZPDAFSA-L cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+3].N#[C-].N([C@@H]([C@]1(C)[N-]\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C(\C)/C1=N/C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO FDJOLVPMNUYSCM-WZHZPDAFSA-L 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 208000008609 collagenous colitis Diseases 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- ZOEFCCMDUURGSE-SQKVDDBVSA-N cosyntropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 ZOEFCCMDUURGSE-SQKVDDBVSA-N 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 238000002784 cytotoxicity assay Methods 0.000 description 1
- 231100000263 cytotoxicity test Toxicity 0.000 description 1
- KWGRBVOPPLSCSI-UHFFFAOYSA-N d-ephedrine Natural products CNC(C)C(O)C1=CC=CC=C1 KWGRBVOPPLSCSI-UHFFFAOYSA-N 0.000 description 1
- 229960003901 dacarbazine Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 230000002999 depolarising effect Effects 0.000 description 1
- 201000001981 dermatomyositis Diseases 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 208000033679 diabetic kidney disease Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- GDLBFKVLRPITMI-UHFFFAOYSA-N diazoxide Chemical compound ClC1=CC=C2NC(C)=NS(=O)(=O)C2=C1 GDLBFKVLRPITMI-UHFFFAOYSA-N 0.000 description 1
- 229960004042 diazoxide Drugs 0.000 description 1
- GJQPMPFPNINLKP-UHFFFAOYSA-N diclofenamide Chemical compound NS(=O)(=O)C1=CC(Cl)=C(Cl)C(S(N)(=O)=O)=C1 GJQPMPFPNINLKP-UHFFFAOYSA-N 0.000 description 1
- 229960005081 diclofenamide Drugs 0.000 description 1
- DOBMPNYZJYQDGZ-UHFFFAOYSA-N dicoumarol Chemical compound C1=CC=CC2=C1OC(=O)C(CC=1C(OC3=CC=CC=C3C=1O)=O)=C2O DOBMPNYZJYQDGZ-UHFFFAOYSA-N 0.000 description 1
- 229960001912 dicoumarol Drugs 0.000 description 1
- HIZKPJUTKKJDGA-UHFFFAOYSA-N dicumarol Natural products O=C1OC2=CC=CC=C2C(=O)C1CC1C(=O)C2=CC=CC=C2OC1=O HIZKPJUTKKJDGA-UHFFFAOYSA-N 0.000 description 1
- 229940116901 diethyldithiocarbamate Drugs 0.000 description 1
- LMBWSYZSUOEYSN-UHFFFAOYSA-N diethyldithiocarbamic acid Chemical compound CCN(CC)C(S)=S LMBWSYZSUOEYSN-UHFFFAOYSA-N 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000002934 diuretic Substances 0.000 description 1
- 229940030606 diuretics Drugs 0.000 description 1
- 201000008243 diversion colitis Diseases 0.000 description 1
- 229960001089 dobutamine Drugs 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 229960005175 dulaglutide Drugs 0.000 description 1
- 229960002406 edrophonium chloride Drugs 0.000 description 1
- BXKDSDJJOVIHMX-UHFFFAOYSA-N edrophonium chloride Chemical compound [Cl-].CC[N+](C)(C)C1=CC=CC(O)=C1 BXKDSDJJOVIHMX-UHFFFAOYSA-N 0.000 description 1
- 229940073621 enbrel Drugs 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 229960002179 ephedrine Drugs 0.000 description 1
- 229960003157 epinephrine bitartrate Drugs 0.000 description 1
- 210000005081 epithelial layer Anatomy 0.000 description 1
- 229960003745 esmolol Drugs 0.000 description 1
- AQNDDEOPVVGCPG-UHFFFAOYSA-N esmolol Chemical compound COC(=O)CCC1=CC=C(OCC(O)CNC(C)C)C=C1 AQNDDEOPVVGCPG-UHFFFAOYSA-N 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 229960000403 etanercept Drugs 0.000 description 1
- 229960002767 ethosuximide Drugs 0.000 description 1
- HAPOVYFOVVWLRS-UHFFFAOYSA-N ethosuximide Chemical compound CCC1(C)CC(=O)NC1=O HAPOVYFOVVWLRS-UHFFFAOYSA-N 0.000 description 1
- NPUKDXXFDDZOKR-LLVKDONJSA-N etomidate Chemical compound CCOC(=O)C1=CN=CN1[C@H](C)C1=CC=CC=C1 NPUKDXXFDDZOKR-LLVKDONJSA-N 0.000 description 1
- 229960001690 etomidate Drugs 0.000 description 1
- 230000002461 excitatory amino acid Effects 0.000 description 1
- 239000003257 excitatory amino acid Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 108010015174 exendin 3 Proteins 0.000 description 1
- LMHMJYMCGJNXRS-IOPUOMRJSA-N exendin-3 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@H](C)O)[C@H](C)O)C(C)C)C1=CC=CC=C1 LMHMJYMCGJNXRS-IOPUOMRJSA-N 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 229940012151 exubera Drugs 0.000 description 1
- 208000010706 fatty liver disease Diseases 0.000 description 1
- 229960001582 fenfluramine Drugs 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 description 1
- PUBCCFNQJQKCNC-XKNFJVFFSA-N gastrin-releasingpeptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(C)C)[C@@H](C)O)C(C)C)C1=CNC=N1 PUBCCFNQJQKCNC-XKNFJVFFSA-N 0.000 description 1
- 239000003629 gastrointestinal hormone Substances 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 239000003877 glucagon like peptide 1 receptor agonist Substances 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- YPZRWBKMTBYPTK-BJDJZHNGSA-N glutathione disulfide Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@H](C(=O)NCC(O)=O)CSSC[C@@H](C(=O)NCC(O)=O)NC(=O)CC[C@H](N)C(O)=O YPZRWBKMTBYPTK-BJDJZHNGSA-N 0.000 description 1
- 230000004116 glycogenolysis Effects 0.000 description 1
- 229940015042 glycopyrrolate Drugs 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000007475 hemolytic anemia Diseases 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 229940060251 hexafluorenium Drugs 0.000 description 1
- HDZAQYPYABGTCL-UHFFFAOYSA-N hexafluronium Chemical compound C12=CC=CC=C2C2=CC=CC=C2C1[N+](C)(C)CCCCCC[N+](C)(C)C1C2=CC=CC=C2C2=CC=CC=C21 HDZAQYPYABGTCL-UHFFFAOYSA-N 0.000 description 1
- 229960002456 hexobarbital Drugs 0.000 description 1
- UYXAWHWODHRRMR-UHFFFAOYSA-N hexobarbital Chemical compound O=C1N(C)C(=O)NC(=O)C1(C)C1=CCCCC1 UYXAWHWODHRRMR-UHFFFAOYSA-N 0.000 description 1
- 229960001340 histamine Drugs 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 229940038661 humalog Drugs 0.000 description 1
- 102000051523 human TMEM132A Human genes 0.000 description 1
- 229940048921 humira Drugs 0.000 description 1
- 229940103471 humulin Drugs 0.000 description 1
- 229960002474 hydralazine Drugs 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 208000006575 hypertriglyceridemia Diseases 0.000 description 1
- 239000000960 hypophysis hormone Substances 0.000 description 1
- 229960004716 idoxuridine Drugs 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 229950000254 imazodan Drugs 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 208000027138 indeterminate colitis Diseases 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229960003948 insulin detemir Drugs 0.000 description 1
- 229960002869 insulin glargine Drugs 0.000 description 1
- 108700039926 insulin glulisine Proteins 0.000 description 1
- 229960002068 insulin lispro Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 108090000681 interleukin 20 Proteins 0.000 description 1
- 108010074108 interleukin-21 Proteins 0.000 description 1
- 108090000237 interleukin-24 Proteins 0.000 description 1
- 239000002869 intravenous anesthetic agent Substances 0.000 description 1
- VBUWHHLIZKOSMS-RIWXPGAOSA-N invicorp Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 VBUWHHLIZKOSMS-RIWXPGAOSA-N 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- OEXHQOGQTVQTAT-JRNQLAHRSA-N ipratropium Chemical compound O([C@H]1C[C@H]2CC[C@@H](C1)[N@@+]2(C)C(C)C)C(=O)C(CO)C1=CC=CC=C1 OEXHQOGQTVQTAT-JRNQLAHRSA-N 0.000 description 1
- 229960001888 ipratropium Drugs 0.000 description 1
- 201000008222 ischemic colitis Diseases 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229960003299 ketamine Drugs 0.000 description 1
- 230000004140 ketosis Effects 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 229960001632 labetalol Drugs 0.000 description 1
- 229940060975 lantus Drugs 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 229960001614 levamisole Drugs 0.000 description 1
- 229940102988 levemir Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 208000018191 liver inflammation Diseases 0.000 description 1
- 229960002247 lomustine Drugs 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000004341 lymphocytic colitis Diseases 0.000 description 1
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 1
- 239000003120 macrolide antibiotic agent Substances 0.000 description 1
- 229940041033 macrolides Drugs 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002082 metal nanoparticle Substances 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- FLOSMHQXBMRNHR-DAXSKMNVSA-N methazolamide Chemical compound CC(=O)\N=C1/SC(S(N)(=O)=O)=NN1C FLOSMHQXBMRNHR-DAXSKMNVSA-N 0.000 description 1
- 229960004083 methazolamide Drugs 0.000 description 1
- 229960002683 methohexital Drugs 0.000 description 1
- 229960005192 methoxamine Drugs 0.000 description 1
- 229960002237 metoprolol Drugs 0.000 description 1
- IUBSYMUCCVWXPE-UHFFFAOYSA-N metoprolol Chemical compound COCCC1=CC=C(OCC(O)CNC(C)C)C=C1 IUBSYMUCCVWXPE-UHFFFAOYSA-N 0.000 description 1
- 229960003574 milrinone Drugs 0.000 description 1
- PZRHRDRVRGEVNW-UHFFFAOYSA-N milrinone Chemical compound N1C(=O)C(C#N)=CC(C=2C=CN=CC=2)=C1C PZRHRDRVRGEVNW-UHFFFAOYSA-N 0.000 description 1
- HDZGCSFEDULWCS-UHFFFAOYSA-N monomethylhydrazine Chemical class CNN HDZGCSFEDULWCS-UHFFFAOYSA-N 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 239000003158 myorelaxant agent Substances 0.000 description 1
- 229960004255 nadolol Drugs 0.000 description 1
- VWPOSFSPZNDTMJ-UCWKZMIHSA-N nadolol Chemical compound C1[C@@H](O)[C@@H](O)CC2=C1C=CC=C2OCC(O)CNC(C)(C)C VWPOSFSPZNDTMJ-UCWKZMIHSA-N 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 230000002232 neuromuscular Effects 0.000 description 1
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 description 1
- 206010053219 non-alcoholic steatohepatitis Diseases 0.000 description 1
- 229960002748 norepinephrine Drugs 0.000 description 1
- SFLSHLFXELFNJZ-UHFFFAOYSA-N norepinephrine Natural products NCC(O)C1=CC=C(O)C(O)=C1 SFLSHLFXELFNJZ-UHFFFAOYSA-N 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- URPYMXQQVHTUDU-OFGSCBOVSA-N nucleopeptide y Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 URPYMXQQVHTUDU-OFGSCBOVSA-N 0.000 description 1
- 229950005306 octatropine methylbromide Drugs 0.000 description 1
- 229960001576 octopamine Drugs 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 229960003274 paramethadione Drugs 0.000 description 1
- 230000000590 parasiticidal effect Effects 0.000 description 1
- 239000002297 parasiticide Substances 0.000 description 1
- 229940127242 parasympathomimetic drug Drugs 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 201000001976 pemphigus vulgaris Diseases 0.000 description 1
- 229960001639 penicillamine Drugs 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 150000002960 penicillins Chemical class 0.000 description 1
- 229960000444 pentagastrin Drugs 0.000 description 1
- ANRIQLNBZQLTFV-DZUOILHNSA-N pentagastrin Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1[C]2C=CC=CC2=NC=1)NC(=O)CCNC(=O)OC(C)(C)C)CCSC)C(N)=O)C1=CC=CC=C1 ANRIQLNBZQLTFV-DZUOILHNSA-N 0.000 description 1
- FPVKHBSQESCIEP-JQCXWYLXSA-N pentostatin Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC[C@H]2O)=C2N=C1 FPVKHBSQESCIEP-JQCXWYLXSA-N 0.000 description 1
- 208000030613 peripheral artery disease Diseases 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000000810 peripheral vasodilating agent Substances 0.000 description 1
- 229960002116 peripheral vasodilator Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 229960001802 phenylephrine Drugs 0.000 description 1
- SONNWYBIRXJNDC-VIFPVBQESA-N phenylephrine Chemical compound CNC[C@H](O)C1=CC=CC(O)=C1 SONNWYBIRXJNDC-VIFPVBQESA-N 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 208000005987 polymyositis Diseases 0.000 description 1
- 229960005483 polythiazide Drugs 0.000 description 1
- 229920000046 polythiazide Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 210000004258 portal system Anatomy 0.000 description 1
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 1
- DQMZLTXERSFNPB-UHFFFAOYSA-N primidone Chemical compound C=1C=CC=CC=1C1(CC)C(=O)NCNC1=O DQMZLTXERSFNPB-UHFFFAOYSA-N 0.000 description 1
- 229960002393 primidone Drugs 0.000 description 1
- 229960000624 procarbazine Drugs 0.000 description 1
- CPTBDICYNRMXFX-UHFFFAOYSA-N procarbazine Chemical compound CNNCC1=CC=C(C(=O)NC(C)C)C=C1 CPTBDICYNRMXFX-UHFFFAOYSA-N 0.000 description 1
- 239000000583 progesterone congener Substances 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- AQHHHDLHHXJYJD-UHFFFAOYSA-N propranolol Chemical compound C1=CC=C2C(OCC(O)CNC(C)C)=CC=CC2=C1 AQHHHDLHHXJYJD-UHFFFAOYSA-N 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 229940024790 prothrombin complex concentrate Drugs 0.000 description 1
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 1
- WKSAUQYGYAYLPV-UHFFFAOYSA-N pyrimethamine Chemical compound CCC1=NC(N)=NC(N)=C1C1=CC=C(Cl)C=C1 WKSAUQYGYAYLPV-UHFFFAOYSA-N 0.000 description 1
- 229960000611 pyrimethamine Drugs 0.000 description 1
- 229940121896 radiopharmaceutical Drugs 0.000 description 1
- 239000012217 radiopharmaceutical Substances 0.000 description 1
- 230000002799 radiopharmaceutical effect Effects 0.000 description 1
- VMXUWOKSQNHOCA-LCYFTJDESA-N ranitidine Chemical compound [O-][N+](=O)/C=C(/NC)NCCSCC1=CC=C(CN(C)C)O1 VMXUWOKSQNHOCA-LCYFTJDESA-N 0.000 description 1
- 229960000620 ranitidine Drugs 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 229940044601 receptor agonist Drugs 0.000 description 1
- 239000000018 receptor agonist Substances 0.000 description 1
- 230000003134 recirculating effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 229940116176 remicade Drugs 0.000 description 1
- 230000036454 renin-angiotensin system Effects 0.000 description 1
- 210000004994 reproductive system Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229960000329 ribavirin Drugs 0.000 description 1
- HZCAHMRRMINHDJ-DBRKOABJSA-N ribavirin Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1N=CN=C1 HZCAHMRRMINHDJ-DBRKOABJSA-N 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 229960002052 salbutamol Drugs 0.000 description 1
- LACQPOBCQQPVIT-SEYKEWMNSA-N scopolamine hydrobromide trihydrate Chemical compound O.O.O.Br.C1([C@@H](CO)C(=O)O[C@H]2C[C@@H]3N([C@H](C2)[C@@H]2[C@H]3O2)C)=CC=CC=C1 LACQPOBCQQPVIT-SEYKEWMNSA-N 0.000 description 1
- 229960002101 secretin Drugs 0.000 description 1
- OWMZNFCDEHGFEP-NFBCVYDUSA-N secretin human Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(N)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)C1=CC=CC=C1 OWMZNFCDEHGFEP-NFBCVYDUSA-N 0.000 description 1
- 229950011186 semaglutide Drugs 0.000 description 1
- 229960003440 semustine Drugs 0.000 description 1
- 229940076279 serotonin Drugs 0.000 description 1
- 229960002959 sincalide Drugs 0.000 description 1
- IZTQOLKUZKXIRV-YRVFCXMDSA-N sincalide Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](N)CC(O)=O)C1=CC=C(OS(O)(=O)=O)C=C1 IZTQOLKUZKXIRV-YRVFCXMDSA-N 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 229930002534 steroid glycoside Natural products 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 150000008143 steroidal glycosides Chemical class 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- AXOIZCJOOAYSMI-UHFFFAOYSA-N succinylcholine Chemical compound C[N+](C)(C)CCOC(=O)CCC(=O)OCC[N+](C)(C)C AXOIZCJOOAYSMI-UHFFFAOYSA-N 0.000 description 1
- 229940032712 succinylcholine Drugs 0.000 description 1
- 229950006153 sulmazole Drugs 0.000 description 1
- XMFCOYRWYYXZMY-UHFFFAOYSA-N sulmazole Chemical compound COC1=CC(S(C)=O)=CC=C1C1=NC2=NC=CC=C2N1 XMFCOYRWYYXZMY-UHFFFAOYSA-N 0.000 description 1
- 229940127230 sympathomimetic drug Drugs 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229940037128 systemic glucocorticoids Drugs 0.000 description 1
- 229940035447 tanzeum Drugs 0.000 description 1
- 239000000647 testicular hormone Substances 0.000 description 1
- 229960001423 tetracosactide Drugs 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- RGYLYUZOGHTBRF-BIHRQFPBSA-N tetragastrin Chemical compound C([C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CCSC)C(N)=O)C1=CC=CC=C1 RGYLYUZOGHTBRF-BIHRQFPBSA-N 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- XLOMZPUITCYLMJ-UHFFFAOYSA-N thiamylal Chemical compound CCCC(C)C1(CC=C)C(=O)NC(=S)NC1=O XLOMZPUITCYLMJ-UHFFFAOYSA-N 0.000 description 1
- 229960001166 thiamylal Drugs 0.000 description 1
- 229960003279 thiopental Drugs 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 229960000874 thyrotropin Drugs 0.000 description 1
- 230000001748 thyrotropin Effects 0.000 description 1
- 229940034199 thyrotropin-releasing hormone Drugs 0.000 description 1
- 210000001578 tight junction Anatomy 0.000 description 1
- 108091004331 tirzepatide Proteins 0.000 description 1
- BTSOGEDATSQOAF-SMAAHMJQSA-N tirzepatide Chemical compound CC[C@H](C)[C@@H](C(N[C@@H](C)C(N[C@@H](CCC(N)=O)C(N[C@@H](CCCCNC(COCCOCCNC(COCCOCCNC(CC[C@H](C(O)=O)NC(CCCCCCCCCCCCCCCCCCC(O)=O)=O)=O)=O)=O)C(N[C@@H](C)C(N[C@@H](CC1=CC=CC=C1)C(N[C@@H](C(C)C)C(N[C@@H](CCC(N)=O)C(N[C@@H](CC1=CNC2=C1C=CC=C2)C(N[C@@H](CC(C)C)C(N[C@@H]([C@@H](C)CC)C(N[C@@H](C)C(NCC(NCC(N(CCC1)[C@@H]1C(N[C@@H](CO)C(N[C@@H](CO)C(NCC(N[C@@H](C)C(N(CCC1)[C@@H]1C(N(CCC1)[C@@H]1C(N(CCC1)[C@@H]1C(N[C@@H](CO)C(N)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)NC([C@H](CCCCN)NC([C@H](CC(O)=O)NC([C@H](CC(C)C)NC(C(C)(C)NC([C@H]([C@@H](C)CC)NC([C@H](CO)NC([C@H](CC(C=C1)=CC=C1O)NC([C@H](CC(O)=O)NC([C@H](CO)NC([C@H]([C@@H](C)O)NC([C@H](CC1=CC=CC=C1)NC([C@H]([C@@H](C)O)NC(CNC([C@H](CCC(O)=O)NC(C(C)(C)NC([C@H](CC(C=C1)=CC=C1O)N)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O)=O BTSOGEDATSQOAF-SMAAHMJQSA-N 0.000 description 1
- 229940121512 tirzepatide Drugs 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 229940110253 toujeo Drugs 0.000 description 1
- GYDJEQRTZSCIOI-LJGSYFOKSA-N tranexamic acid Chemical compound NC[C@H]1CC[C@H](C(O)=O)CC1 GYDJEQRTZSCIOI-LJGSYFOKSA-N 0.000 description 1
- 229960000401 tranexamic acid Drugs 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 210000003412 trans-golgi network Anatomy 0.000 description 1
- 230000031998 transcytosis Effects 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000018889 transepithelial transport Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- VSQQQLOSPVPRAZ-RRKCRQDMSA-N trifluridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C(F)(F)F)=C1 VSQQQLOSPVPRAZ-RRKCRQDMSA-N 0.000 description 1
- 229960003962 trifluridine Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 229940013051 trulicity Drugs 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- JFJZZMVDLULRGK-URLMMPGGSA-O tubocurarine Chemical compound C([C@H]1[N+](C)(C)CCC=2C=C(C(=C(OC3=CC=C(C=C3)C[C@H]3C=4C=C(C(=CC=4CCN3C)OC)O3)C=21)O)OC)C1=CC=C(O)C3=C1 JFJZZMVDLULRGK-URLMMPGGSA-O 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 229960003732 tyramine Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 229960000604 valproic acid Drugs 0.000 description 1
- 208000019553 vascular disease Diseases 0.000 description 1
- BGSZAXLLHYERSY-XQIGCQGXSA-N vecuronium Chemical compound N1([C@@H]2[C@@H](OC(C)=O)C[C@@H]3CC[C@H]4[C@@H]5C[C@@H]([C@@H]([C@]5(CC[C@@H]4[C@@]3(C)C2)C)OC(=O)C)[N+]2(C)CCCCC2)CCCCC1 BGSZAXLLHYERSY-XQIGCQGXSA-N 0.000 description 1
- 229960003819 vecuronium Drugs 0.000 description 1
- 229940007428 victoza Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 150000003952 β-lactams Chemical class 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
- A61K47/6415—Toxins or lectins, e.g. clostridial toxins or Pseudomonas exotoxins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K17/00—Carrier-bound or immobilised peptides; Preparation thereof
- C07K17/02—Peptides being immobilised on, or in, an organic carrier
- C07K17/06—Peptides being immobilised on, or in, an organic carrier attached to the carrier via a bridging agent
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/19—Cytokines; Lymphokines; Interferons
- A61K38/20—Interleukins [IL]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/19—Cytokines; Lymphokines; Interferons
- A61K38/20—Interleukins [IL]
- A61K38/2066—IL-10
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/22—Hormones
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/107—Vibrio
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/65—Peptidic linkers, binders or spacers, e.g. peptidic enzyme-labile linkers
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0053—Mouth and digestive tract, i.e. intraoral and peroral administration
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/28—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Vibrionaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/24—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
- C07K16/241—Tumor Necrosis Factors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/505—Medicinal preparations containing antigens or antibodies comprising antibodies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/395—Antibodies; Immunoglobulins; Immune serum, e.g. antilymphocytic serum
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/55—Fusion polypeptide containing a fusion with a toxin, e.g. diphteria toxin
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Biochemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Zoology (AREA)
- Toxicology (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Endocrinology (AREA)
- Physiology (AREA)
- Nutrition Science (AREA)
- Pain & Pain Management (AREA)
- Rheumatology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicinal Preparation (AREA)
- Biomedical Technology (AREA)
- Neurology (AREA)
- Cell Biology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
본 발명은 이종성 페이로드에 결합된 담체를 포함하는 전달 구조체를 제공하여, 여기서 페이로드에 담체의 결합은 온전한 편광 상피 세포 (예를 들어, 포유류의 장 상피 세포) 내로 및/또는 이를 가로질러 페이로드 (예를 들어, 치료용 페이로드)의 수송을 야기할 수 있다. 전달 구조체는 예를 들어, 염증성 질환 또는 자가면역 질환의 치료를 위한 개선되고 효과적인 요법을 제공하기 위해 피험자에게 경구 투여될 수 있는 약학 조성물의 일부일 수 있다.
Description
상호 참조
본 출원은 2019년 3월 8일에 출원된 PCT 출원 번호 PCT/US2019/021474, 및 2019년 8월 16일에 출원된 미국 가출원 번호 제 62/888,144호; 2019년 8월 16일에 출원된 제 62/888,400호; 2019년 8월 16일에 출원된 제 62/888,133호; 2019년 3월 8일에 출원된 제 62/816,022호; 및 2018년 11월 7일에 출원된 제 62/756,889호의 이익을 주장하고, 본 출원은 모든 목적을 위해 전체 참조로 본 명세서에 포함된다.
본 발명은 이종성 페이로드의 경구 전달용 콜릭스-유래 담체에 관한 것이다.
단백질은 온전한(intact) 상피 장벽을 가로지르거나 또는 융합막(tight junctions)을 통해 장벽을 가로질러 확산할 수 없기 때문에, 장 상피(gut epithelium)는 단백질과 같은 큰 치료용 분자를 경구 투여하려는 노력을 좌절시켰다. 일단 상피 세포에 의해 흡수되면, 치료용 단백질은 파괴적인 리소좀 트래피킹 경로(trafficking pathway)로 들어가거나 또는 장 내강(intestinal lumen)으로 다시 방출된다. 장 상피를 가로질러 쉽게 수송될 수 없는 이러한 불능은 특히 폴리펩티드-기반 치료제를 위한 상업적으로 실행 가능한 경구 제형을 개발하는데 제한 요인(limiting factor)이 될 수 있다. 일반적인 해결책은 정맥 또는 피하 투여와 같은 비경구 투여를 사용하는 것이나, 이러한 투여 경로는 종종 상당한 부작용을 일으키고, 치료 효능을 낮추며, 순응도에 부정적인 영향을 미칠 수 있는 환자 편의를 감소시킬 수 있다. 상피, 예를 들어, 장 상피 내로 또는 장 상피를 가로질러 치료제를 수송하기 위한 개선된 조성물 및 방법이 필요하다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별 간행물, 특허, 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 나타낸 것과 동일한 정도로, 본 명세서에 참조로 포함된다.
하나의 측면에서, 본 발명은 편광 상피 세포로 세포내이입(endocytosing)하고 세포의 영역에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 제공하며, 여기서 페이로드는 담체에 대해 이종성이다. 일 실시예에서, 영역은 정점 구획, 핵상(supranuclear) 구획, 또는 기저 구획이다. 일 실시예에서, 담체는 영역에서 적어도 5분, 10분, 또는 15분 동안 영역에서 유지된다. 일 실시예에서, 담체는 콜릭스 폴리펩티드로부터 유래된다. 일 실시예에서, 담체는 위치 150-195 중 어느 하나에서 C-말단이 있는 콜릭스 서열을 갖는 폴리펩티드이다. 일 실시예에서, 담체는 위치 1-41 중 어느 하나에서 N-말단이 있는 콜릭스 서열을 갖는 폴리펩티드이다. 일 실시예에서, 담체는 위치 35-40 중 어느 하나에서 N-말단 절단이 있는 콜릭스 서열을 갖는 폴리펩티드이다. 일 실시예에서, 담체는 위치 150-205 중 어느 하나에서 C-말단이 있는 콜릭스 서열을 갖는 폴리펩티드이다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 N-말단 위치 40에서 C-말단 위치 150-205 중 어느 하나까지의 아미노산 잔기로 이루어진다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 위치 150 또는 187에서 C-말단을 가진다. 일 실시예에서, 담체는 서열번호: 137에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, 담체는 서열번호: 137-139 중 어느 하나에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, 위치 번호매김(numbering)은 서열번호: 130에 제시된 서열에 대한 콜릭스 폴리펩티드의 정렬을 기반으로 하며, 여기서 위치는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김된다. 일 실시예에서, 담체는 편광 상피 세포를 가로질러 통과세포외배출할 수 있는 담체보다 편광 상피 세포로 담체의 세포내이입 후에 더 오래 정점 진입 수용체와 결합된 상태로 남아있을 수 있다. 일 실시예에서, 정점 진입 수용체는 TMEM132 수용체이다. 일 실시예에서, 편광 상피 세포는 위장 (gastrointestinal) 편광 상피 세포를 포함한다.
하나의 측면에서, 본 발명은 (ii) 이종성 페이로드에 결합된, (i) 위치 195-347 중 어느 하나에서 C-말단을 갖고 편광 상피 세포를 가로질러 통과세포외배출할 수 있는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체를 제공한다. 일 실시예에서, 위치 번호매김은 서열번호: 130에 제시된 서열에 대한 콜릭스 폴리펩티드의 정렬을 기반으로 하며, 여기서 위치는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김된다. 일 실시예에서, C-말단은 위치 195-266 중 어느 하나에 있다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 195-266 중 어느 하나에 있다. 일 실시예에서, C-말단은 서열번호: 130에 제시된 서열의 위치 206, 245, 251, 또는 266 중 어느 하나에 있다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78의 위치 206, 245, 251, 또는 266 중 어느 하나에 있다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78 중 어느 하나의 위치 206에 있다. 일 실시예에서, 담체는 서열번호: 131 또는 184에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78 중 어느 하나의 위치 245에 있다. 일 실시예에서, 담체는 서열번호: 132 또는 183에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78의 위치 251에 있다. 일 실시예에서, 담체는 서열번호: 133 또는 182에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78의 위치 266에 있다. 일 실시예에서, 담체는 서열번호: 134 또는 181에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, 담체는 위치 195-347 중 어느 하나에서 절단이 있는 서열번호: 1-2, 또는 4-78에 제시된 서열로 이루어지며, 서열번호: 1-2, 또는 4-78의 위치 1-40, 133-151, 152-187, 또는 188-206 중 어느 하나에서 5, 4, 3, 2, 또는 1 이하의 아미노산 변이를 가진다.
하나의 측면에서, 본 발명은 (ii) 이종성 페이로드에 결합된, (i) 편광 상피 세포로 세포내이입 또는 편광 상피 세포의 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 포함하는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체를 제공한다. 일 실시예에서, 담체는 위치 3에서 글루탐산 및 위치 4에서 알라닌을 포함한다. 일 실시예에서, 담체는 비-독성이다. 일 실시예에서, 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있다. 일 실시예에서, 담체는 편광 상피 세포의 통과세포외배출할 수 있는 단편을 포함하며, 여기서 담체는 서열번호: 1-2, 또는 4-78 중 어느 하나에 제시된 서열의 C-말단 잔기에 대한 위치 195 중 어느 하나에서 C-말단을 가진다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78 중 어느 하나에 제시된 서열의 위치 195-386 중 어느 하나에 있다. 일 실시예에서, C-말단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, C-말단은 서열번호: 1-2에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, 담체는 서열번호: 135에 제시된 아미노산 서열로 이루어진다.
하나의 측면에서, 본 발명은 (ii) 이종성 페이로드와 복합체화된, (i) 서열번호: 179를 포함하지 않고, 서열번호: 126으로 이루어지지 않은 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체를 제공하며, 여기서 담체는 (a) 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있거나; 또는 (b) 편광 상피 세포로 이종성 페이로드를 수송할 수 있다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열, 또는 이의 단편과 적어도 75% 서열 동일성을 포함한다. 일 실시예에서, 담체는 서열번호: 130에 제시된 콜릭스 변이체, 또는 이의 단편과 적어도 90% 서열 동일성을 포함한다. 일 실시예에서, 콜릭스 폴리펩티드는 서열번호: 130에 제시된 서열, 또는 이의 단편이다. 일 실시예에서, 담체는 위치 3에서 글루탐산 및 위치 4에서 알라닌을 포함한다. 일 실시예에서, 담체는 비-독성이다. 일 실시예에서, 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 위치 195-633 중 어느 하나에서 C-말단 절단을 가진다. 일 실시예에서, C-말단 절단은 서열번호: 130에 제시된 서열의 위치 195-386 중 어느 하나에 있다. 일 실시예에서, 담체는 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 195-386 중 어느 하나에서 C-말단 절단을 가진다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, C-말단 절단은 서열번호: 1-2에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, 담체-페이로드 복합체는 N-말단 메티오닌을 포함한다. 일 실시예에서, 담체는 이종성 페이로드에 합성적으로 결합된다. 일 실시예에서, 담체는 이종성 페이로드에 유전적으로 융합된다. 일 실시예에서, 이종성 페이로드는 치료용 페이로드이다. 일 실시예에서, 치료용 페이로드는 사이토카인, 항체, 호르몬, 또는 핵산이다. 일 실시예에서, 치료용 페이로드는 사이토카인이다. 일 실시예에서, 사이토카인은 인터루킨이다. 일 실시예에서, 인터루킨은 IL-10이다. 일 실시예에서, IL-10은 서열번호: 145에 제시된 아미노산 서열과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일 실시예에서, 인터루킨은 IL-22이다. 일 실시예에서, IL-22는 서열번호: 142에 제시된 아미노산 서열과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일 실시예에서, 치료용 페이로드는 항체이다. 일 실시예에서, 항체는 항-TNF 항체이다. 일 실시예에서, 치료용 페이로드는 호르몬이다. 일 실시예에서, 치료용 페이로드는 인간 성장 호르몬이다. 일 실시예에서, 이종성 페이로드는 담체에 공유 결합된다. 일 실시예에서, 이종성 페이로드는 담체의 C-말단에 결합된다. 일 실시예에서, 이종성 페이로드는 담체의 N-말단에 결합된다. 일 실시예에서, 담체는 스페이서를 통해 이종성 페이로드에 결합된다. 일 실시예에서, 스페이서는 비-절단형 스페이서이다. 일 실시예에서, 스페이서는 1 내지 100 아미노산 잔기를 포함한다. 일 실시예에서, 스페이서는 GS, GGS, GGGS, GGGGS, GGGGGS, 또는 이들의 조합의 최대 15 반복을 포함한다. 일 실시예에서, 스페이서는 서열번호: 175에 제시된 아미노산 서열을 포함한다. 일 실시예에서, 스페이서는 서열번호: 176에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, 이종성 페이로드는 담체에 비-공유 결합된다. 일 실시예에서, 이종성 페이로드는 나노입자를 통해 담체에 복합체화된다.
하나의 측면에서, 본 발명은 (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및 (b) 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계를 포함하는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출하는 방법을 제공하며, 여기서 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다. 일 실시예에서, 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계는 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계를 포함한다. 일 실시예에서, 담체와 막 단백질 TMEM132의 상호작용하는 단계는 담체-페이로드 복합체의 수용체-매개 세포내이입을 야기한다. 일 실시예에서, TMEM132와 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 135-151, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계는 담체와 GRP75, ERGIC-53, 및 페를레칸(perlecan) 중 어느 하나 또는 그 이상의 상호작용하는 단계를 포함한다. 일 실시예에서, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계는 담체-페이로드 복합체와 상피 세포의 정점 측면에서 COPI, EEA1 및 Rab7 중 어느 하나 또는 그 이상, 및 상피 세포의 기저 측면에서 Rab11a의 공동-국소화를 더 포함한다. 일 실시예에서, GRP7 또는 ERGIC-53과 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 1-40 및 152-187, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 페를레칸과 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 188-205, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 방법은 (b) 이후에, 담체-페이로드 복합체를 고유판 (lamina propria)으로 전달하는 단계를 더 포함할 수 있다. 일 실시예에서, 편광 상피 세포는 편광 장 상피 세포이다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는, 피험자에게 이종성 페이로드를 경구 전달하는 방법을 제공하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에게 이종성 페이로드를 전달할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에게 이종성 페이로드를 경구 전달하기 위한 담체-페이로드 복합체를 제공하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에게 이종성 페이로드를 경구 전달하기 위한 담체-페이로드 복합체의 용도를 제공하며; 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는, 피험자에서 질환의 치료 방법을 제공하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에서 질환의 치료에 사용하기 위한 담체-페이로드 복합체를 제공하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에서 질환을 치료하기 위한 약제의 제조에서 담체-페이로드 복합체의 용도를 제공하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다. 일 실시예에서, 방법은 고유판의 수용체에 이종성 페이로드를 결합하는 단계를 더 포함한다. 일 실시예에서, 방법은 이종성 페이로드를 전신 순환으로 전달하는 단계를 더 포함한다. 일 실시예에서, 담체는 콜릭스 유래 폴리펩티드이다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 또는 1-386을 포함한다. 일 실시예에서, 담체는 서열번호: 1-2에 제시된 서열의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 또는 1-386을 포함한다. 일 실시예에서, 담체는 서열번호: 131-135 또는 180-184에 제시된 아미노산 서열 중 어느 하나를 포함한다. 일 실시예에서, 편광 상피는 편광 장 상피이다. 일 실시예에서, 질환은 궤양성 대장염, 주머니염(pouchitis), 직장염(proctitis), 크론병, 다발성 경화증(MS), 전신 홍반성 루푸스(systemic lupus erythematosus, SLE), 이식편 대 숙주 질환(graft versus host disease, GVHD), 류마티스 관절염 또는 건선이다. 일 실시예에서, 질환은 궤양성 대장염이다. 일 실시예에서, 궤양성 대장염은 경증에서 중등도(mild-to-moderate) 또는 중등도에서 중증(moderate-to-severe)이다. 일 실시예에서, 질환은 크론병이다. 일 실시예에서, 크론병은 누공성 크론병(fistulizing Crohn's disease)이다. 일 실시예에서, 페이로드는 인터루킨이다. 일 실시예에서, 인터루킨은 서열번호: 142 또는 145의 아미노산 서열을 포함한다.
하나의 측면에서, 본 발명은 (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및 (b) 편광 상피 세포로 담체-페이로드 복합체를 수송하는 단계를 포함하는 편광 상피 세포로 이종성 페이로드를 수송하는 방법을 제공하며, 여기서 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피 세포로 담체-페이로드 복합체를 수송할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다. 일 실시예에서, 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계는 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계를 포함한다. 일 실시예에서, 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계는 담체-페이로드 복합체의 수용체-매개 세포내이입을 야기한다. 일 실시예에서, 방법은 정점 구획 또는 기저 구획으로 이종성 페이로드를 수송하는 단계를 더 포함한다. 일 실시예에서, 담체-페이로드 복합체의 담체는 세포내이입 후 TMEM132와 결합된 상태로 남아있다. 일 실시예에서, TMEM132와 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 135-151, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 담체는 콜릭스 유래 폴리펩티드이다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 아미노산 잔기 1-151, 1-187, 41-187, 또는 40-205로 이루어진다. 일 실시예에서, 담체는 서열번호: 1-2에 제시된 서열의 아미노산 잔기 1-151, 1-187, 41-187, 또는 40-205로 이루어진다. 일 실시예에서, 담체는 서열번호: 136-139에 제시된 아미노산 서열 중 어느 하나로 이루어진다. 일 실시예에서, 담체는 나노입자를 통해 이종성 페이로드에 비-공유 결합된다. 일 실시예에서, 나노입자 상에서 이종성 페이로드 대 담체의 비는 적어도 15,000:1 이다. 일 실시예에서, 이종성 페이로드는 글로코오스-저하제이다. 일 실시예에서, 글로코오스-저하제는 나노입자와 비-공유 결합된다. 일 실시예에서, 이종성 페이로드는 siRNA 이다. 일 실시예에서, siRNA는 나노입자와 비-공유 결합된다. 일 실시예에서, 담체는 나노입자에 공유 결합되거나 또는 나노입자 상에서 분무-건조된다.
하나의 측면에서, 본 발명은 (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및 (b) 편광 상피 세포로 담체-페이로드 복합체를 수송하는 단계를 포함하는 편광 상피 세포로 이종성 페이로드를 수송하는 방법을 제공하며, 여기서 담체-페이로드 복합체는 본 명세서에서 세포내이입 담체들 중 어느 하나를 포함하는 담체-페이로드 복합체이다.
하나의 측면에서, 본 발명은 이종성 페이로드에 결합된, 담체의 세포내이입 후 적어도 5분에 편광 상피 세포의 정점 구획에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 담체의 세포내이입 후 적어도 10분에 편광 상피 세포의 정점 구획에 축적할 수 있다. 일 실시예에서, 담체는 담체의 세포내이입 후 적어도 15분에 편광 상피 세포의 정점 구획에 축적할 수 있다.
일 실시예에서, 편광 상피 세포는 위장 편광 상피 세포를 포함한다. 일 실시예에서, 편광 상피 세포는 랫트 위장 편광 상피 세포를 포함한다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 포유류의 위장관에 담체의 내강내(intraluminal) 적용 후 적어도 5분에 편광 상피 세포의 정점 구획에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 포유류의 위장관에 담체의 내강내 적용 후 적어도 10분에 편광 상피 세포의 정점 구획에 축적할 수 있다. 일 실시예에서, 담체는 포유류의 위장관에 담체의 내강내 적용 후 적어도 15분에 편광 상피 세포의 정점 구획에 축적할 수 있다.
일 실시예에서, 내강내 적용은 랫트 공장(jejunum)으로 내강내 주사를 포함한다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 담체의 세포내이입 후 적어도 5분에 편광 상피 세포의 핵상 구획에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 담체의 세포내이입 후 적어도 10분에 편광 상피 세포의 핵상 구획에 축적할 수 있다. 일 실시예에서, 담체는 담체의 세포내이입 후 적어도 15분에 편광 상피 세포의 핵상 구획에 축적할 수 있다.
일 실시예에서, 편광 상피 세포는 위장 편광 상피 세포를 포함한다. 일 실시예에서, 편광 상피 세포는 랫트 위장 편광 상피 세포를 포함한다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 포유류의 위장관에 담체의 내강내 적용 후 적어도 5분에 편광 상피 세포의 핵상 구획에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 포유류의 위장관에 담체의 내강내 적용 후 적어도 10분에 편광 상피 세포의 핵상 구획에 축적할 수 있다. 일 실시예에서, 담체는 포유류의 위장관에 담체의 내강내 적용 후 적어도 15분에 편광 상피 세포의 핵상 구획에 축적할 수 있다.
일 실시예에서, 내강내 적용은 랫트 공장으로 내강내 주사를 포함한다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 담체의 세포내이입 후 적어도 5분에 편광 상피 세포의 기저 구획에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 담체의 세포내이입 후 적어도 10분에 편광 상피 세포의 기저 구획에 축적할 수 있다. 일 실시예에서, 담체는 담체의 세포내이입 후 적어도 15분에 편광 상피 세포의 기저 구획에 축적할 수 있다.
일 실시예에서, 편광 상피 세포는 위장 편광 상피 세포를 포함한다. 일 실시예에서, 편광 상피 세포는 랫트 위장 편광 상피 세포를 포함한다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 포유류의 위장관에 담체의 내강내 적용 후 적어도 5분에 편광 상피 세포의 기저 구획에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 포유류의 위장관에 담체의 내강내 적용 후 적어도 10분에 편광 상피 세포의 기저 구획에 축적할 수 있다. 일 실시예에서, 담체는 포유류의 위장관에 담체의 내강내 적용 후 적어도 15분에 편광 상피 세포의 기저 구획에 축적할 수 있다.
일 실시예에서, 내강내 적용은 랫트 공장으로 내강내 주사를 포함한다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 위치 195-347 중 어느 하나에서 C-말단을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체를 포함한다. 일 실시예에서, 위치 번호매김은 서열번호: 130에 제시된 서열에 대한 콜릭스 폴리펩티드의 정렬을 기반으로 하며, 여기서 위치는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김된다.
일 실시예에서, C-말단 절단은 서열번호: 130에 제시된 서열의 위치 195-266 중 어느 하나에 있다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 195-266 중 어느 하나에 있다. 일 실시예에서, C-말단 절단은 서열번호: 130에 제시된 서열의 위치 206, 245, 251, 또는 266 중 어느 하나에 있다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78의 위치 206, 245, 251, 또는 266 중 어느 하나에 있다.
일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78 중 어느 하나의 위치 206에 있다. 일 실시예에서, 담체는 서열번호: 131 또는 184에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78 중 어느 하나의 위치 245에 있다. 일 실시예에서, 담체는 서열번호: 132 또는 183에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78의 위치 251에 있다. 일 실시예에서, 담체는 서열번호: 133 또는 182에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78의 위치 266에 있다. 일 실시예에서, 담체는 서열번호: 134 또는 181에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, 담체는 위치 195-347 중 어느 하나에서 절단이 있는 서열번호: 1-2, 또는 4-78에 제시된 서열로 이루어지며, 서열번호: 1-2, 또는 4-78의 위치 1-40, 133-151, 152-187, 또는 188-206 중 어느 하나에서 5, 4, 3, 2, 또는 1 이하의 아미노산 변이를 가진다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 서열번호: 130에 제시된 서열의 위치 1-41에서 N-말단 및 위치 150-195에서 C-말단을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는, 또는 N-말단 위치 35-40 중 어느 하나에서 C-말단 위치 150-205 중 어느 하나까지의 아미노산 잔기로 이루어진, 담체-페이로드 복합체를 포함한다. 일 실시예에서, 위치 번호매김은 서열번호: 130에 제시된 서열에 대한 콜릭스 폴리펩티드의 정렬을 기반으로 하며, 여기서 위치는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김된다.
일 실시예에서, 담체는 편광 상피 세포로 담체의 세포내이입 후에 정점 진입 수용체와 결합된 상태로 남아있을 수 있다. 일 실시예에서, 정점 진입 수용체는 TMEM132 수용체 (예를 들어, TMEM132A) 이다.
일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 N-말단 위치 40에서 C-말단 위치 150-205 중 어느 하나까지의 아미노산 잔기로 이루어진다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 위치 150 또는 186에서 C-말단 절단을 가진다.
일 실시예에서, 담체는 편광 상피 세포의 기저 구획 또는 핵상 구획으로 페이로드를 수송할 수 있다. 일 실시예에서, 담체는 서열번호: 136에 제시된 아미노산 서열로 이루어진다. 일 실시예에서, 담체는 편광 상피 세포의 정점 구획으로 페이로드를 수송할 수 있다.
일 실시예에서, 담체는 서열번호: 137-139 중 어느 하나에 제시된 아미노산 서열로 이루어진다.
또 다른 측면에서, 본 발명은 이종성 페이로드에 결합된, 편광 상피 세포로 세포내이입 또는 편광 상피 세포의 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 포함하는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체를 포함한다.
일 실시예에서, 담체는 위치 3에서 글루탐산 및 위치 4에서 알라닌을 포함한다.
일 실시예에서, 담체는 비-독성이다.
일 실시예에서, 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있다.
일 실시예에서, 담체는 편광 상피 세포의 통과세포외배출할 수 있는 단편을 포함하며, 여기서 담체는 서열번호: 1-2, 또는 4-78 중 어느 하나에 제시된 서열의 C-말단 잔기에 대한 위치 195 중 어느 하나에서 C-말단 절단을 가진다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78 중 어느 하나에 제시된 서열의 위치 195-386 중 어느 하나에 있다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, C-말단 절단은 서열번호: 1-2에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, 담체는 서열번호: 135에 제시된 아미노산 서열로 이루어진다.
또 다른 측면에서, 본 발명은 이종성 페이로드와 복합체화된, 서열번호: 179를 포함하지 않고, 서열번호: 126으로 이루어지지 않은 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체를 포함하며, 여기서 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있거나; 또는 편광 상피 세포로 이종성 페이로드를 수송할 수 있다.
일 실시예에서, 담체는 서열번호: 130에 제시된 서열, 또는 이의 단편과 적어도 75% 서열 동일성을 포함한다. 일 실시예에서, 담체는 서열번호: 130에 제시된 콜릭스 변이체, 또는 이의 단편과 적어도 90% 서열 동일성을 포함한다. 일 실시예에서, 콜릭스 폴리펩티드는 서열번호: 130에 제시된 서열, 또는 이의 단편이다. 일 실시예에서, 담체는 위치 3에서 글루탐산 및 위치 4에서 알라닌을 포함한다.
일 실시예에서, 담체는 비-독성이다.
일 실시예에서, 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있다.
일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 위치 195-633 중 어느 하나에서 C-말단 절단을 가진다. 일 실시예에서, C-말단 절단은 서열번호: 130에 제시된 서열의 위치 195-386 중 어느 하나에 있다. 일 실시예에서, 담체는 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 195-386 중 어느 하나에서 C-말단 절단을 가진다. 일 실시예에서, C-말단 절단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, C-말단 절단은 서열번호: 1-2에 제시된 서열 중 어느 하나의 위치 386에 있다. 일 실시예에서, 담체-페이로드 복합체는 N-말단 메티오닌을 포함한다.
일 실시예에서, 담체는 이종성 페이로드에 합성적으로 결합된다. 일 실시예에서, 담체는 이종성 페이로드에 유전적으로 융합된다.
일 실시예에서, 이종성 페이로드는 치료용 페이로드이다. 일 실시예에서, 치료용 페이로드는 사이토카인, 항체, 호르몬, 또는 핵산이다. 일 실시예에서, 치료용 페이로드는 사이토카인이다. 일 실시예에서, 사이토카인은 인터루킨이다.
일 실시예에서, 인터루킨은 IL-10이다. 일 실시예에서, IL-10은 서열번호: 145에 제시된 아미노산 서열과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일 실시예에서, 인터루킨은 IL-22이다. 일 실시예에서, IL-22는 서열번호: 142에 제시된 아미노산 서열과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함한다.
일 실시예에서, 치료용 페이로드는 항체이다. 일 실시예에서, 항체는 항-TNF 항체이다. 일 실시예에서, 치료용 페이로드는 호르몬이다. 일 실시예에서, 치료용 페이로드는 인간 성장 호르몬이다.
일 실시예에서, 이종성 페이로드는 담체에 공유 결합된다. 일 실시예에서, 이종성 페이로드는 담체의 C-말단에 결합된다. 일 실시예에서, 이종성 페이로드는 담체의 N-말단에 결합된다. 일 실시예에서, 담체는 스페이서를 통해 이종성 페이로드에 결합된다.
일 실시예에서, 스페이서는 비-절단형 스페이서이다. 일 실시예에서, 스페이서는 1 내지 100 아미노산 잔기를 포함한다. 일 실시예에서, 스페이서는 GS, GGS, GGGS, GGGGS, GGGGGS, 또는 이들의 조합의 최대 15 반복을 포함한다. 일 실시예에서, 스페이서는 서열번호: 175에 제시된 아미노산 서열을 포함한다. 일 실시예에서, 스페이서는 서열번호: 176에 제시된 아미노산 서열로 이루어진다.
일 실시예에서, 이종성 페이로드는 담체에 비-공유 결합된다. 일 실시예에서, 이종성 페이로드는 나노입자를 통해 담체에 복합체화된다.
하나의 측면에서, 본 발명은 본 명세서에 기재된 담체-페이로드 복합체 (예를 들어, 전달 구조체), 예를 들어, 서열번호: 147-150, 152-159 또는 188에 제시된 아미노산 서열 중 어느 하나를 포함하는, 본질적으로 이루어진, 또는 이루어진 것들 중 어느 하나를 인코딩하는 폴리뉴클레오티드를 포함한다.
하나의 측면에서, 본 발명은 본 발명의 담체-페이로드 복합체 (예를 들어, 전달 구조체)를 인코딩하는 이러한 폴리뉴클레오티드 중 어느 하나를 포함하는 벡터를 포함한다.
하나의 측면에서, 본 발명은 (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및 (b) 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계를 포함하는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출하는 방법을 포함하며, 여기서 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다. 일 실시예에서, 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계는 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계를 포함한다. 일 실시예에서, 담체와 막 단백질 TMEM132의 상호작용하는 단계는 담체-페이로드 복합체의 수용체-매개 세포내이입을 야기한다. 일 실시예에서, TMEM132와 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 135-151, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계는 담체와 GRP75 (예를 들어, GRP75B), ERGIC-53, 및 페를레칸 중 어느 하나 또는 그 이상의 상호작용하는 단계를 포함한다. 일 실시예에서, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계는 담체-페이로드 복합체와 상피 세포의 정점 측면에서 COPI, EEA1 및 Rab7 중 어느 하나 또는 그 이상, 및 상피 세포의 기저 측면에서 Rab11a의 공동-국소화를 더 포함한다. 일 실시예에서, GRP7 또는 ERGIC-53과 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 1-40 및 152-187, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 페를레칸과 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 188-205, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 방법은 (b) 이후에, 담체-페이로드 복합체를 고유판으로 전달하는 단계를 더 포함한다. 일 실시예에서, 편광 상피 세포는 편광 장 상피 세포이다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는, 피험자에게 이종성 페이로드를 경구 전달하는 방법을 포함하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에게 이종성 페이로드를 전달할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에게 이종성 페이로드를 경구 전달하기 위한 담체-페이로드 복합체를 포함하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에게 이종성 페이로드를 경구 전달하기 위한 담체-페이로드 복합체의 용도를 포함하며; 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는, 피험자에서 질환의 치료 방법을 포함하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에서 질환의 치료에 사용하기 위한 담체-페이로드 복합체를 포함하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다.
하나의 측면에서, 본 발명은 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에서 질환을 치료하기 위한 약제의 제조에서 담체-페이로드 복합체의 용도를 포함하며, 여기서 담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다. 일 실시예에서, 방법은 고유판의 수용체에 이종성 페이로드를 결합하는 단계를 더 포함한다. 일 실시예에서, 방법은 이종성 페이로드를 전신 순환으로 전달하는 단계를 더 포함한다. 일 실시예에서, 담체는 콜릭스 유래 폴리펩티드이다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 또는 1-386을 포함한다. 일 실시예에서, 담체는 서열번호: 1-2 중 어느 하나에 제시된 서열의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 또는 1-386을 포함한다. 일 실시예에서, 담체는 서열번호: 131-135 또는 180-184에 제시된 아미노산 서열 중 어느 하나를 포함한다. 일 실시예에서, 편광 상피는 편광 장 상피이다. 일 실시예에서, 질환은 궤양성 대장염, 주머니염, 직장염, 크론병, 다발성 경화증 (MS), 전신 홍반성 루푸스 (SLE), 이식편 대 숙주 질환 (GVHD), 류마티스 관절염 또는 건선이다. 일 실시예에서, 질환은 궤양성 대장염이다. 일 실시예에서, 궤양성 대장염은 경증에서 중등도 또는 중등도에서 중증이다. 일 실시예에서, 질환은 크론병이다. 일 실시예에서, 크론병은 누공성 크론병이다. 일 실시예에서, 페이로드는 인터루킨이다. 일 실시예에서, 인터루킨은 서열번호: 142 또는 145의 아미노산 서열을 포함한다.
하나의 측면에서, 본 발명은 (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및 (b) 편광 상피 세포로 담체-페이로드 복합체를 수송하는 단계를 포함하는 편광 상피 세포로 이종성 페이로드를 수송하는 방법을 포함하며, 여기서 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피 세포로 담체-페이로드 복합체를 수송할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함한다. 일 실시예에서, 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계는 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계를 포함한다. 일 실시예에서, 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계는 담체-페이로드 복합체의 수용체-매개 세포내이입을 야기한다. 일 실시예에서, 방법은 정점 구획 또는 기저 구획으로 이종성 페이로드를 수송하는 단계를 더 포함한다. 일 실시예에서, 담체-페이로드 복합체의 담체는 세포내이입 후 TMEM132와 결합된 상태로 남아있다. 일 실시예에서, TMEM132와 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 135-151, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함한다. 일 실시예에서, 담체는 콜릭스 유래 폴리펩티드이다. 일 실시예에서, 담체는 서열번호: 130에 제시된 서열의 아미노산 잔기 1-151, 1-187, 41-187, 또는 40-205로 이루어진다. 일 실시예에서, 담체는 서열번호: 1-2에 제시된 서열의 아미노산 잔기 1-151, 1-187, 41-187, 또는 40-205로 이루어진다. 일 실시예에서, 담체는 서열번호: 136-139에 제시된 아미노산 서열 중 어느 하나로 이루어진다. 일 실시예에서, 담체는 나노입자를 통해 이종성 페이로드에 비-공유 결합된다. 일 실시예에서, 나노입자 상에서 이종성 페이로드 대 담체의 비는 적어도 15,000:1 이다. 일 실시예에서, 이종성 페이로드는 글로코오스-저하제이다. 일 실시예에서, 글로코오스-저하제는 나노입자와 비-공유 결합된다. 일 실시예에서, 이종성 페이로드는 siRNA 이다. 일 실시예에서, siRNA는 나노입자와 비-공유 결합된다. 일 실시예에서, 담체는 나노입자에 공유 결합되거나 또는 나노입자 상에서 분무-건조된다.
I. 서론
특정 실시예에서, 예를 들어, 세포내이입에 의해, 또는 예를 들어 통과세포외배출에 의해 상피 세포 (예를 들어, 편광 장 상피 세포)를 가로질러, 하나 이상의 이종성 페이로드 분자 (예를 들어, 하나 이상의 치료용 페이로드)를 상피 세포 (예를 들어, 편광 장 상피 세포)로 수송할 수 있는 전달 구조체 (예를 들어, 담체-페이로드 복합체)가 본 명세서에 제공된다. 전달 구조체는 이종성 페이로드에 결합된 담체를 포함할 수 있다. 담체는 내인성 트래피킹 경로를 이용하여 상피 세포 내로 또는 상피 세포를 가로질러 이종성 페이로드를 수송할 수 있다. 수동적 확산의 사용과는 대조적으로, 내인성 트래피킹 경로의 이용은 담체가 이들 세포의 장벽 기능 또는 이종성 페이로드의 생물학적 활성을 손상시키지 않고 상피 세포 내로 또는 상피 세포를 가로질러, 빠르게 (예를 들어, 적어도 10-6 cm/sec, 10-5 cm/sec) 효율적으로 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 이종성 페이로드를 왕복할 수 있도록 한다.
II. 담체
본 명세서에서 제공되는 전달 구조체의 담체 부분은 상피 내로 및/또는 상피를 가로질러 전달된 이종성 페이로드 (예를 들어, 치료용 페이로드)의 속도 및/또는 양을 증가시킬 수 있는 임의의 분자 (예를 들어, 소분자, 폴리펩티드, 핵산 등) 일 수 있다.
본 명세서에서 담체는 다양한 속성을 가질 수 있다. 일 실시예에서, 본 명세서에서 담체는 서열번호: 3과 같은 자연적으로 발생하는 콜릭스 폴리펩티드에 비해 감소된 (예를 들어, 적어도 50% 감소) 또는 제거된 ADP 리보실화 활성 (예를 들어, 신장 인자(elongation factor) 2의 리보실화)을 가질 수 있다.
일 실시예에서, 본 명세서에서 담체는 내인성 트래피킹 경로를 이용하여 편광 상피 세포를 가로질러 이에 결합된 이종성 페이로드를 수송한다. 이러한 담체는 본 명세서에서 통과세포외배출 담체라고 할 수 있다. 일 예에서, 본 명세서에서 담체는 내인성 트래피킹 경로를 이용하여 편광 상피 세포 내로 이에 결합된 이종성 페이로드를 수송할 수 있다. 이러한 담체는 본 명세서에서 세포내이입 담체라고 할 수 있다. 세포내이입 담체 내에는, 정점 구획, 핵상 구획 또는 기저 구획과 같은 편광 상피 세포 내의 특정 영역으로 이에 결합된 페이로드를 전달하는 담체가 있을 수 있다.
본 명세서에서 담체 중 어느 하나는 이러한 상피의 하나 이상의 내인성 단백질과 상호작용 및/또는 공동-국소화함으로써 이에 결합된 분자를 수송할 수 있다. 하나 이상의 내인성 단백질은 상피 세포 내로 또는 상피 세포를 가로질러 담체를 이동시킬 수 있는 수용체 또는 효소일 수 있다. 상피 세포의 하나 이상의 내인성 단백질과 상호작용 및/또는 공동 국소화는 상피 세포로의 세포내이입, 리소좀 파괴 경로의 회피, 정점 구획에서 기저 구획으로의 트래피킹, 및/또는 상피 세포의 기저막에서 고유판과 같은 점막하(submucosal) 구획으로의 세포외배출(exocytosis)을 포함하는, 하나 이상의 기능을 가진 담체를 제공할 수 있다.
이러한 담체와 내인성 단백질의 상호작용은 선택적 상호작용일 수 있다. 이러한 선택적 상호작용은 pH-의존적 상호작용일 수 있다. 담체가 2 이상의 내인성 단백질과 상호작용하는 경우, 이러한 상호작용은 제 1 상호작용 단백질이 제 2 상호작용 단백질로 담체를 전달하는 순차적 상호작용일 수 있다. 이러한 순차적 상호작용은 상이한 pH (예를 들어, pH 5.5, 7.0, 7.5 등)에서 발생할 수 있다. 담체와 내인성 단백질 간의 상호작용은 공유 또는 비-공유 상호작용일 수 있다. 비-공유 상호작용은 수소 결합, 반데르발스 상호작용, 이온 결합, π-π 상호작용 등을 포함한다.
일 예에서, 담체가 상호작용할 수 있는 내인성 단백질 중 하나는 정점 진입 수용체일 수 있다. 이러한 정점 진입 수용체는 막관통(transmembrane) 단백질 132 (TMEM132) 일 수 있다. 담체와 이러한 정점 진입 수용체의 상호작용은 담체가 수용체-매개 세포내이입을 통해 상피 세포로 들어갈 수 있게 한다.
또한, 담체는 리소좀 회피 수용체와 상호작용할 수 있다. 리소좀 회피 수용체와의 이러한 상호작용은 상피 세포 내부에서 및 세포내이입 이후에 발생할 수 있다. 리소좀 회피 수용체는 글루코오스-조절 단백질 75 (GRP75, 예를 들어, GRP75B) 일 수 있다. 담체와 이러한 리소좀 회피 수용체의 상호작용은 담체가 리소좀 분해를 피하거나 또는 우회할 수 있게 한다. 이러한 능력은 담체가 세포의 리소좀에 도달하는 담체에 결합된 페이로드의 양을 상당히 감소시킬 수 있게 하며, 이는 대부분의 치료용 단백질이 일단 장 상피에 흡수되면 직면하는 운명이다.
또한, 담체는 정점에서 기저로의 트래피킹 단백질과 상호작용할 수 있다. 이러한 상호작용은 상피 세포 내부에서 및 세포내이입 이후에 발생할 수 있다. 이러한 정점에서 기저로의 트래피킹 단백질은 소포체 골지 중간 구획 (ERGIC) 단백질, 예를 들어 ERGIC-53 일 수 있다. 담체와 ERGIC 단백질의 상호작용은 담체가 정점 구획에서 핵상 구획 또는 기저 구획으로 이동할 수 있게 한다.
또한, 통과세포외배출 담체는 상피 세포의 기저 부위로부터 담체의 세포외배출을 촉진할 수 있는 기저 방출 단백질과 상호작용할 수 있다. 이러한 상호작용은 상피 세포의 기저 부위에서 및 정점 구획에서 기저 구획으로 이동한 이후에 발생할 수 있다. 이러한 기저 방출 단백질은 페를레칸 (본 명세서에서 기저막-특이적 헤파란 설페이트 프로테오글리칸 코어 단백질 또는 HSPG 라고도 함) 일 수 있다. 담체와 페를레칸의 상호작용은 담체가 기저 구획에서 고유판과 같은 점막하 구획으로의 담체의 방출을 허용하는 기저 재순환 시스템에 접근할 수 있게 한다.
따라서, 본 명세서에서 통과세포외배출 담체는 내인성 단백질 TMEM132 (예를 들어, TMEM132A), GRP75 (예를 들어, GRP75B), ERGIC (예를 들어, ERGIC-53), 및 페를레칸 (HSPG)과 상호작용할 수 있는 분자일 수 있으며, 이는 이러한 담체가 편광 상피, 예를 들어, 편광 장 상피를 가로질러 이에 결합된 페이로드 분자를 수송할 수 있게 한다.
본 명세서에서 세포내이입 담체는 내인성 단백질 TMEM132와 상호작용할 수 있는 분자일 수 있으며, 이는 이러한 담체의 정점 진입을 허용한다. 세포내이입 담체는 세포내이입 후 세포 (예를 들어, 편광 상피 세포)의 정점 영역 및 구획 내에서 TMEM132와 결합된 상태로 남아있을 수 있다 (예를 들어, 세포내이입 후 TMEM132로부터 해리하여 GRP75 또는 ERGIC 단백질과 상호작용할 수 있는 통과세포외배출 담체와 비교). 일부 경우에, 이러한 세포내이입 담체는 GRP75와 상호작용할 수도 있다. TMEM132 및/또는 GRP75와의 이러한 상호작용은 담체 및 이에 결합된 페이로드가 리소좀 분해를 피하거나 또는 적어도 상당히 감소시킬 수 있게 한다 (예를 들어, 담체에 결합되지 않은 경우 페이로드 분자에 비해 약 50% 미만). 일 예에서, 세포내이입 담체는 정점 구획에 남아있을 수 있으며, 예를 들어, 정점 (예를 들어, 내강) 적용 후 약 5, 10, 15 또는 30분에 거의 모든 정점에 적용된 분자의 완전한 통과세포외배출을 나타낼 수 있는 통과세포외배출 담체에 비해, 예를 들어, 담체의 정점 (예를 들어, 내강) 적용 후 적어도 약 5, 10, 15, 30, 60 또는 120분에 기저 구획으로의 상당한 전위(translocation)를 나타내지 않는다. 일 예에서, 담체 분자의 적어도 약 50%, 75%, 또는 90%는 담체의 내강 적용 후 5분에 정점 구획에 남아있다. 일 예에서, 담체 분자의 적어도 약 50%, 75%, 또는 90%는 담체의 내강 적용 후 10분에 정점 구획에 남아있다. 일 예에서, 담체 분자의 적어도 약 50%, 75%, 또는 90%는 담체의 내강 적용 후 15분에 정점 구획에 남아있다. 일 예에서, 담체 분자의 적어도 약 50%, 75%, 또는 90%는 담체의 내강 적용 후 30분에 정점 구획에 남아있다. 상피 세포의 정점 구획에 남아있는 담체 분자의 백분율은 세포의 기저 구획에서 측정된 형광 신호의 강도를 각 시점에서 세포의 정점 구획에서 측정된 형광 신호의 강도로 나눔으로써 결정될 수 있다.
다른 예에서, 페이로드를 핵상 또는 기저 구획으로 수송할 수 있는 세포내이입 담체는 ERGIC 단백질 및/또는 담체가 상피 세포 내부의 이러한 구획에 접근할 수 있게 하는 또 다른 ER-Golgi 트래피킹 단백질 복합체와 상호작용할 수 있다.
세포내이입 또는 통과세포외배출 담체는 폴리펩티드일 수 있다. 이러한 담체는 박테리아, 예를 들어 비브리오 콜레라(Vibrio cholerae) (본 명세서에서 콜릭스 유래 폴리펩티드)에 의해 분비되는 폴리펩티드로부터 유래될 수 있다. 담체는 2 이상의 상이한 박테리아 폴리펩티드로부터 유래된 키메라 폴리펩티드일 수 있다. 이러한 2 이상의 상이한 박테리아 폴리펩티드는 2 이상의 상이한 박테리아 (예를 들어, 비브리오 콜레라, 녹농균(Pseudomonas aeruginosa) 등)로부터 유래될 수 있으며, 및/또는 2 이상의 상이한 박테리아 균주 (예를 들어, 2 이상의 상이한 비브리오 콜레라, 녹농균 등)로부터 유래될 수 있다.
담체는 이러한 박테리아에 의해 분비되는 폴리펩티드의 자연적으로 또는 비-자연적으로 발생하는 폴리펩티드일 수 있다.
비-자연적으로 발생하는 폴리펩티드는 C- 및/또는 N-말단 변형을 갖는 폴리펩티드를 포함할 수 있다.
하나의 예에서, 폴리펩티드는 자연적으로 발생하는 폴리펩티드 (예를 들어, 서열번호: 3)와의 서열 정렬에 대해 또는 공통 서열 (예를 들어, 서열번호: 130)과의 서열 정렬에 대해, 하나 이상의 아미노산 치환, 및/또는 하나 이상의 아미노산 결실, 및/또는 하나 이상의 아미노산 첨가를 포함한다.
본 명세서에서 고려되는 치환의 예는 하나 이상의 아미노산의 보존적 치환을 포함한다. 하기의 6개 군은 각각 서로에 대해 보존적 치환인 아미노산을 함유한다: (1) 알라닌 (A), 세린 (S) 및 트레오닌 (T); (2) 아스파르트산 (D) 및 글루탐산 (E); (3) 아스파라긴 (N) 및 글루타민 (Q); (4) 아르기닌 (R) 및 리신 (K); (5) 이소류신 (I), 류신 (L), 메티오닌 (M) 및 발린 (V); 및 (6) 페닐알라닌 (F), 티로신 (Y) 및 트립토판 (W).
추가적으로 또는 대안적으로, 본 명세서에서 고려되는 담체에서의 돌연변이는, 예를 들어, 서열변호: 1, 2, 또는 130에 제시된 서열에 대해, V1L, L1V, D3E, E4A, E581A 등 중 하나 이상을 포함한다 (숫자는 아미노산 위치를 나타내며, 숫자 앞의 문자는 변형된 아미노산을 나타내고, 숫자 뒤의 문자는 치환된 아미노산을 나타낸다). 일부 경우에, 담체는 위치 1에서 발린, 위치 1에서 류신, 위치 3에서 아스파르트산, 위치 3에서 글루탐산, 위치 4에서 글루탐산, 또는 위치 4에 알라닌을 포함한다 (서열번호: 1에서 위치에 대해 번호 매기기).
결실의 예는 N-말단 절단 및 C-말단 절단을 포함한다.
본 명세서에서 사용된 바와 같이, C-말단 절단이 아미노산 위치"에서(at)" 발생하는 것으로 언급될 때, 이러한 아미노산은 절단된 폴리펩티드에 포함된다. N-말단 절단이 아미노산 위치"에서" 발생하는 것으로 언급될 때, 이러한 아미노산은 절단된 폴리펩티드에서 제외된다. 예를 들어, 하나의 예에서, 담체는 위치 386에서 C-말단 절단이 있는 서열번호: 1을 포함한다. 이러한 담체는 이의 C-말단에서 서열번호: 1의 아미노산 386 (A)에서 끝난다. 추가적으로, 상기 담체는 이의 N-말단의 위치 20에서 더 절단될 수 있으며, 이에 의해 프롤린 (P)의 N-말단 아미노산 (서열번호: 1의 기준 서열에서 위치 21 임)을 가질 수 있다.
N-말단 절단은 본 명세서에서 콜릭스 서열 (예를 들어, 서열번호: 1-3 또는 130 중 어느 하나)의 N-말단에서 최대 10, 20, 30, 39, 또는 40의 아미노산을 제거하는 것을 포함한다. C-말단 절단은 본 명세서에 기재된 것일 수 있다. 이러한 N- 및/또는 C-말단 절단은 상이한 기능을 야기할 수 있다. 절단은 야생형 서열 (예를 들어, 서열번호: 3)에 대해, 비-자연적으로 발생하는 서열 (예를 들어, 서열번호: 1)에 대해, 또는 공통 서열 (예를 들어, 서열번호: 130)에 대해 기재될 수 있으며, 여기서 잔기는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김된다. 예를 들어, 서열번호: 1에 대해 위치 266에서 C-말단 절단이 있는 담체는 서열번호: 1의 아미노산 잔기 1-266을 포함한다.
첨가의 예는 신호 펩티드 서열, 정제 펩티드 서열, 또는 기타 N-말단 변형을 포함한다. 신호 펩티드 서열은 1 내지 약 40의 아미노산을 포함할 수 있다. 일부 경우에, 담체는 N-말단 메티오닌을 포함한다. 달리 명시되지 않는 한, 수치 (numerical value) 또는 범위와 관련하여 본 명세서에서 사용된 용어 "약"은 일반적으로 인용되거나 또는 청구된 수치 또는 범위의 ±10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1%를 나타낸다.
담체는 자연적으로 발생하는 폴리펩티드 (예를 들어, 서열번호: 3), 비-자연적으로 발생하는 폴리펩티드 (예를 들어, 서열번호: 1-2), 또는 본 명세서에 기재된 기능적 단편 중 어느 하나 (예를 들어, 서열번호: 160-168)와 실질적인 서열 동일성 (예를 들어, 약 50%, 60%, 70%, 80%, 90%, 95%, 98% 또는 99%, 또는 그 이상의 서열 동일성, 또는 100% 서열 동일성)을 가질 수 있다.
본 명세서에서 사용된 용어 "서열 동일성" 또는 퍼센트 (%)의 서열 동일성은, 서열을 정렬하고 필요한 경우 갭을 도입한 후 최대 퍼센트 서열 동일성을 달성하고, 임의의 보존적 치환을 서열 동일성의 일부로 고려하지 않는, 선택된 서열의 잔기와 동일한 후보 서열의 잔기의 백분율이다. 퍼센트 아미노산 서열 동일성을 결정하기 위한 정렬은 당해 기술분야의 기술 내에 있는 다양한 방식, 예를 들어, BLAST, BLAST-2, ALIGN, ALIGN-2 또는 Megalign (DNASTAR) 소프트웨어와 같은 공공용(publicly available) 컴퓨터 소프트웨어를 이용하여 달성될 수 있다. 통상의 기술자는 비교되는 서열의 전장(full-length)에 걸쳐 최대 정렬을 달성하는데 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적당한 매개변수를 결정할 수 있다.
본 명세서에서 담체 (예를 들어, 세포내이입 또는 통과세포외배출 담체)는 비브리오 콜레라 박테리아 (예를 들어, 서열번호: 3-125 또는 127-129 중 어느 하나의 서열을 포함하는 것들)로부터 분비된 폴리펩티드로부터 유래될 수 있다. 이러한 담체는 콜릭스 유래 폴리펩티드라고 할 수 있다. 콜릭스 폴리펩티드로부터 유래된 담체는 자연적으로 및 비-자연적으로 발생하는 콜릭스 폴리펩티드 서열, 및 본 명세서에 기재된 자연적으로 (예를 들어, 서열번호: 3-78) 또는 비-자연적으로 (예를 들어, 서열번호: 1-2) 발생하는 콜릭스 폴리펩티드와 적어도 약 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100% 서열 동일성을 갖는 폴리펩티드 서열을 포함할 수 있다. 또한, 콜릭스 폴리펩티드 유래 담체는 자연적으로 및 비-자연적으로 발생하는 콜릭스 폴리펩티드 서열의 세포내이입 및/또는 통과세포외배출 단편 (예를 들어, 콜릭스 폴리펩티드의 N- 및/또는 C-말단 절단)을 포함할 수 있으며, 여기서 이러한 세포내이입 및/또는 통과세포외배출 단편은 이러한 자연적으로 또는 비-자연적으로 발생하는 콜릭스 폴리펩티드 서열 중 어느 하나와 적어도 약 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100% 서열 동일성을 가질 수 있다.
표 1은 예시적인 전장 콜릭스 및 콜릭스 유래 서열을 제공한다.
서열번호 | 아미노산 서열 | 설명 |
서열번호: 1 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 비-자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 2 | LEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 비- 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 3 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 4 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAKQSIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 5 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIMDEGKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 6 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYERLTPAEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 7 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYERLTPAEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 8 | VEDELNIFDECRSPCSLTPEPGKQIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEKKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 9 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 10 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVSTHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 11 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEKKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 12 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIHRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 13 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASDNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 14 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLIPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 15 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLIPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 16 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRMLFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLIPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 17 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARLKKGTGNAELPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITHVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPSTIPGNAYEVLAIDEEAVAEEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 18 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVFFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVTERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIHRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 19 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 20 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVALNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 21 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQAPEVAERLSALRQINENNPGVVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 22 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITDVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 23 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAIMVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRYLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISPKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 24 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKDGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSAIRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASDNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 25 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKDGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKHCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 26 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWRTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 27 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSNGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 28 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLLENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 29 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQKNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 30 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIYAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 31 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 32 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIYAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 33 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQKNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 34 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 35 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITDVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 36 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAIHWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 37 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATIRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 38 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITFGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 39 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 40 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 41 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASDNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 42 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQNIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 43 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDIAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 44 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 45 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMETLAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 46 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 47 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMETLAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 48 | VEDELNIFDECRSPCLLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 49 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVIPGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMETLAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 50 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 51 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSQKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 52 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 53 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 54 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 55 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGIPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 56 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGIPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 57 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPEVVLCFFEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 58 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSFNRKEGEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAQKDGARHKRWAHWHTGLALCWLVPLDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGMEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARGRKPRDLTDDLQCAYQAQNIVSLFLATRILFSHLDSVFTLNLDEQEPEVAERLTDLRRINENNPGMVTQVLTIARQIYNDYVTEHPGLTPEQTSAGAQAADILSLFCPDADESCVASNSDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEAKHQTLTREGYVFVGYHGTNHVAAQSIVNRITPVPRGNNTEKEEEWGGVYVATHAELAHRYARIKEGTGENGLPTTEEKKSRGVMLRVYLPRASLERFYRTNIPLENADEHVTQVIGHPLPLRNEAFTGPESAGGEDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEHDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 59 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSFNRKEGEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAQKDGARHKRWAHWHTGLALCWLVPLDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGMEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARGRKPRDLTDDLQCAYQAQNIVSLFLATRILFSHLDSVFTLNLDEQEPEVAERLTDLRRINENNPGMVTQVLTIARQIYNDYVTEHPGLTPEQTSAGAQAADILSLFCPDADESCVASNSDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEAKHQTLTREGYVFVGYHGTNHVAAQSIVNRITPVPRGNNTEKEEEWGGVYVATHAEVNHRYARIKEGTGENGLPTTEEKKSRGVMLRVYLPRASLERFYRTNIPLENADEHVTQVIGHPLPLRNEAFTGPESAGGEDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEHDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 60 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSFNRKEGEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAQKDGARHKRWAHWHTGLALCWLVPLDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGMEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARGRKPRDLTDDLQCAYQAQNIVSLFLATRILFSHLDSVFTLNLDEQEPEVAERLTDLRRINENNPGMVTQVLTIARQIYNDYVTEHPGLTPEQTSAGAQAADILSLFCPDADESCVASNSDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEAKHQTLTREGYVFVGYHGTNHVAAQSIVNRITPVPRGNNTEKEEEWGGVYVATHAELAHRYARIKEGTGENGLPTTEKKKSRGVMLKVYLPRASLERFYRTNIPLENADEHVTQVIGHPLPLRNEAFTGPESAGGENETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEHDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 61 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 62 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVIPGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEGLTTDEEAVVKEAIAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 63 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSFNRKEGEFAINWLVIPGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAQKDGARHKRWAHWHTGLALCWLVPLDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGMEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARGRKPRDLTDDLQCAYQAQNIVSLFLATRILFSHLDSVFTLNLDEQEPEVAERLTDLRRINENNPGMVTQVLTIARQIYNDYVTEHPGLTPEQTSAGAQAADILSLFCPDADESCVASNSDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEAKHQTLTREGYVFVGYHGTNHVAAQSIVNRITPVPRGNNTEKEEEWGGVYVATHAELAHRYARIKEGTGENGLPTTEEKKSRGVMLRVYLPRASLERFYRTNIPLENADEHVTQVIGHPLPLRNEAFTGPESAGGEDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEHDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 64 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 65 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 66 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEQSIAISWPSVSYNAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 67 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 68 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 69 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKMYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 70 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQKRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEEPELCTYGEDWHGGAYKTVAGTPEAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLQDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 71 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPEVVLCFFEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 72 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPEVVLCFFEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPLLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 73 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPEVVLCFFEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 74 | VEDELNIFDECRSPCSLTPEPGKPIQSKLFIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAIEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 75 | VEDELNIFDECRSPCSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWYGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDTDKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 76 | VEDELKIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 77 | VEDELKIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQAPEVAERLSDLRRINEDNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELETTHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 78 | VEDELKIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKAVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIYAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 79 | TPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPSTIPGNSYAQLPIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 80 | SIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 81 | MTINDEQNDIMDEGKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 82 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIMDEGKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFTINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETIIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 83 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIMDEGKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 84 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIMDEGKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 85 | MTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKAVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIYAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKEQKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 86 | MTINDEQNDIKDEDKGESIITIGDFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 87 | CSLTPEPGKPIQSQLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 88 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 89 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 90 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLIPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 91 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITDVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 92 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVALNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 93 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAIMVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRYLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 94 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKDGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSAIRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASDNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 95 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKDGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASDNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYLTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 96 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 97 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYTRIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 98 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFYPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 99 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 100 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQKNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 101 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 102 | CSLTPELGKPIQSKLSISSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 103 | CSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 104 | CSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLEEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 105 | CSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASDNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 106 | CSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINVESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEREARGVMLRVYIPRASLERFYRTNTPLENAERHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 107 | CSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPERVDGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 108 | CSLTPELGKPIQSKLSIPSDVVLDEGVLYYSMTINDDQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKPCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQNIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 109 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIMDEGKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAKQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFFEDPELCTYGEDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTLLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 110 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 111 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHAAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 112 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 113 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQAPEVAERLSDLRRINEDNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELETTHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 114 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGNGGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIYAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 115 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEIDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWFTTSPKVTLCFYEDPAQCTYGDDWHGGAYKTVAGIPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAEQETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 116 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEEPELCTYGEDWHGGAYKTVAGTPGAITVKQGIEQKTVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 117 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQKRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEEPELCTYGEDWHGGAYKTVAGTPEAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 118 | CSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIIIIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRVVITPQGVTNWTYQELDATHQALTREDYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERETRGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 119 | CSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPEVVLCFFEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 120 | CSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPEVVLCFFEDPELCTYGDDWHGGAYKTVAGTPKAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSASAQAADILSLFCPDADKSCVASNSDQANINIESRSGRSYLPENRAVITQQGVTNWTYQELEATHQALTQEGYVFVGYHGTNHVAAQSIVNRISPVPRGSDTESERAWGGLYVSTDASVAYGYARIQEGTADGGGLTPAERKARGVMLRVYLPQASLERFYRINADLEKERNLVERVIGHPLPLRNEAFTGTDAEEGSDETAIGWDMAIHGVAIPS | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 121 | VEDELNIFDECRSPCSLTPEPGKQIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVINLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLTDDLSCVYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEKKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRV | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 122 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKEGEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAEKDGARHKRWAHWHTGLALCWLVPLDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGMEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARGRKPRDLTDDLQCAYQAQNIVSLFLATRILFSHLDSVFTLNLDEQEPEVAERLTDLRRINENNPGMVTQVLTIARQIYNDYVTEHPGLTPEQTSAGAQAADILSLLCPDADGSCVASNSDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEAKHQTLTREGYVFVGYHGTNHVAAQSIVNRITPVPRGNNTEKEEEWGG | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 123 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSFNRKEGEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWETQGNVSFAVTRPEQSIAISWPSVSYKAAEKDGARHKRWAHWHTGLALCWLVPLDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGMEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARGRKPRDLTDDLQCAYQAQNIVSLFLATRILFSHLDSVFTLNLDEQEPEVAERLTDLRRINENNPGMVTQVLTIARQIYNDYVTEHPGLTPEQTSAGAQAADILSLFCPDADESCVASNSDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEAKHQTLTREGYVFVGYHGTNHVAAQSIVNRITPVPRGNNTEKEEEWGG | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 124 | YSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSNGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 125 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQKRNIIEVPKLYSIDLDNQTLEQWENQGNVSFAVTRPEQSIAISWPSVSYKAAHKNGSRHKRWANWLTTLPKVVLCFYEEPELCTYGEDWHGGAYKTVAGTPEAITVKQGIEQKTVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLQDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHV | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 126 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPGDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVSQDAPFGVINLDITTENGTKTYSFNRKESEFAINWLVPIGEDSPASIKISIDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPIDAIYNYITQQNCTLGDNWFGGSYETVAGTPKAITVKQGIEQKPVEQRIHFSKKNAMEALAAHRVCGVPLETLARSRKPRDLPDDLSCAYNAQQIVSLFLATRILFTHIDSIFTLNLDGQEPEVAERLDDLRRINENNPGMVIQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNSDQANINIES | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 127 | LFSHLDSVFTLNLHEQEPAVAERLSALRQINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISAKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 128 | AVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK | 자연적으로 발생하는 콜릭스 폴리펩티드 |
서열번호: 129 | AVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDEL | 자연적으로 발생하는 콜릭스 폴리펩티드 |
표 2는 본 명세서에서 담체로 사용될 수 있는 콜릭스 유래 폴리펩티드의 공통 서열 (서열번호: 130, FORMULA I)을 제공한다.
[표 2]
FORMULA I
담체는 서열번호: 3의 서열을 갖는 것과 같은 자연적으로 발생하는 콜릭스 폴리펩티드에 비해 감소된 또는 제거된 ADP 리보실화 활성 (예를 들어, 신장 인자 2의 리보실화)을 갖는 모든 콜릭스 유래 폴리펩티드를 포함할 수 있다. 이러한 담체는 비-독성 담체라고 할 수 있다. 이러한 콜릭스 유래 폴리펩티드의 예는 위치 581에서 결실 (예를 들어, 서열번호: 189에서 E581 결실), 위치 581에서 치환 (예를 들어, E581A 치환), 또는 담체를 비-독성으로 만드는 대체(alternative) 결실 또는 치환을 가질 수 있는 서열번호: 1-10 중 어느 하나에 제시된 서열을 갖는 폴리펩티드 중 어느 하나를 포함한다.
일 예에서, 담체는 C-말단 결실, 치환 및/또는 첨가를 갖는 표 1 또는 표 2 중 어느 하나의 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어지며, 이에 의해 감소된 또는 제거된 ADP 리보실화 활성을 야기한다. 이러한 결실, 치환 및/또는 첨가는 통과세포외배출 또는 세포내이입과 같은 수송 기능을 유지한다. 이와 같이, 본 명세서에서 담체 중 일부는 단독으로 또는 이종성 페이로드와 함께 통과세포외배출하는 반면, 본 명세서에서 담체 중 일부는 단독으로 또는 이종성 페이로드와 함께 세포내이입한다.
일 예에서, 제 1 콜릭스 폴리펩티드로부터 유래된 제 1 담체는 제 2 콜릭스 폴리펩티드로부터 유래된 제 2 담체에 비해 개선된 특성을 가질 수 있다. 이러한 특성은 편광 상피 세포 (또는 세포층)을 가로질러 이종성 페이로드를 수송하는 담체의 능력, 담체의 안정성 (예를 들어, in vivo 안정성 또는 저장 수명(shelf-life)과 같은 ex vivo 안정성), E. coli 또는 CHO 세포와 같은 발현 시스템에서 기능적으로 발현되는 담체의 능력, 크로마토그래피 방법을 이용하여 정제되는 담체의 능력, 및 이종성 페이로드와 결합 (예를 들어, 연결)될 때 다중화 (예를 들어, 이량체화)하는 능력을 포함할 수 있다. 놀랍게도, 서열번호: 1의 서열을 갖는 콜릭스 폴리펩티드로부터 유래된 제 1 담체는 서열번호: 3 및/또는 126의 서열을 갖는 콜릭스 폴리펩티드로부터 유래된 제 2 담체에 비해 하기의 특성 중 하나 이상을 가질 수 있음을 알 수 있다: (i) 향상된 통과세포외배출 기능 (예를 들어, 상피 세포를 가로질러 페이로드를 수송하기 위한 증가된 수송 속도); (ii) E. coli 및/또는 CHO 세포에서 개선된 기능적 발현 (예를 들어, 더 높은 생산 수율); (iii) 개선된 정제 특성 (예를 들어, 더 높은 순도 및/또는 회수율); 및 (iv) 향상된 in vivo 안정성 (예를 들어, 증가된 프로테아제 및/또는 pH 안정성, 용융 온도). 이러한 in vivo 안정성은 담체를 예를 들어 Caco-2 세포와 함께 배양하거나 또는 담체를 포유류 (예를 들어, 설치류 또는 인간)에게 투여 (예를 들어, 내강으로 주사)함으로써 결정될 수 있다. 향상된 통과세포외배출 기능, 예를 들어, 수송성의 속력 또는 속도는 예를 들어, 특정 시점 (예를 들어, 담체 또는 전달 구조체의 정점 적용 후 1, 5, 10, 15, 20 또는 30분)에 기저측 챔버에서 수송된 담체 및/또는 페이로드의 양을 결정함으로써 실시예 1에 기재된 바와 같이 결정될 수 있다. 일부 경우에, 프로테아제에 대한 담체의 안정성은 특정 몰비 (예를 들어, 1:1) 및 주위 온도에서 담체를 프로테아제 (예를 들어, 트립신)와 함께 배양하고, 크기-배제 크로마토그래피를 이용하여 다양한 시점 (예를 들어, 5, 10, 15, 30 또는 45분)에서 온전한 담체의 양을 측정하여 결정될 수 있다. 특정 pH에서 담체의 안정성은 담체를 적당한 pH (예를 들어, pH 5.5, 6, 6.5, 7 등)를 갖는 완충액과 함께 배양하고, 크기-배제 크로마토그래피를 이용하여 다양한 시점 (예를 들어, 5, 10, 15, 30분)에서 온전한 담체의 양을 측정하여 결정될 수 있다.
통과세포외배출 담체는 상피 세포를 가로질러 이에 결합된 페이로드를 수송할 수 있다. 이러한 수송은 Caco-2 또는 SMI-100 세포 단층과 같은 상피 세포 단층을 이용하여 in vitro에서 발생할 수 있다. 다른 예에서, 이러한 수송은 피험자 (예를 들어, 설치류 또는 인간)의 장 상피를 가로질러 고유판과 같은 점막하 구획으로 in vivo에서 발생할 수 있다.
통과세포외배출 담체의 작용 메커니즘은 TMEM132, LMAN1 및/또는 GPR75와의 상호작용을 통해 편광 상피 세포로의 수용체-매개 세포내이입, GRP75와의 상호작용을 통해 리소좀 파괴 경로의 회피, ERGIC 수용체 (예를 들어, ERGIC-53)와의 상호작용을 통해 정점에서 기저로의 수송, 및 페를레칸 (HSPG)과의 상호작용을 통해 기저막에서 고유판과 같은 점막하 구획으로의 방출 중 하나 이상을 포함할 수 있다.
통과세포외배출 담체는 실시예 10 및 12에 나타낸 바와 같이 하기의 내인성 단백질: TMEM132A, GPR75, ERGIC 단백질 및 페를레칸 (HSPG) 중 하나 이상과 상호작용하는 것일 수 있다. 통과세포외배출 담체와 TMEM132A와 같은 정점 진입 수용체의 상호작용은 편광 상피 세포로 담체의 정점 진입을 가능하게 할 수 있다. 통과세포외배출 담체와 GRP75와 같은 리소좀 회피 수용체의 상호작용은 담체 및 이에 결합된 페이로드가 리소좀 분해를 피할 수 있게 하여, 변하지 않고 기능적으로 온전한 담체 및 페이로드의 수송을 허용할 수 있다. 통과세포외배출 담체와 ERGIC 단백질 (예를 들어, ERGIC-53)과 같은 정점에서 기저로의 수송 단백질의 상호작용은 일단 세포내이입되면 담체가 상피 세포의 기저 부위로 이동하도록 허용할 수 있다. 통과세포외배출 담체와 페를레칸과 같은 기저 방출 단백질의 상호작용은 담체가 기저 재순환 시스템에 들어가고, 점막하 구획 (예를 들어, 고유판)과 같은 기저측 구획으로 담체의 세포외배출을 가능하게 할 수 있다.
또한, 통과세포외배출 담체는 내인성 정점에서 기저로의 수송 기계를 강탈하기 위한 코팅 단백질 I (COPI) 초기 엔도좀 항원 1 (EEA1) 중 하나 이상, 및 실시예 10에 나타낸 바와 같이 기저 분비 시스템에 들어가기 위한 상피 세포의 기저 측면에서 Ras-관련 단백질 11a (Rab11a)와 공동-국소화 할 수 있다.
일 예에서, 통과세포외배출 담체는 이러한 상피 세포를 가로질러 수송 동안 Ras-관련 단백질 7 (Rab7) 및/또는 리소좀-관련 막 단백질 1 (LAMP1)과 공동-국소화하지 않으며, 이는 이러한 담체가 실시예 10에 나타낸 바와 같이 리소좀 분해를 피할 수 있게 한다.
통과세포외배출 담체의 예는 서열번호: 1-78 또는 130 중 어느 하나의 C-말단 절단을 갖는 것들을 포함하며, 여기서 C-말단 절단은 위치 195에서 C-말단 잔기 뒤의 임의의 아미노산 위치에서 폴리펩티드의 C-말단에서 발생할 수 있다 (예를 들어, 서열번호: 1-2의 위치 195-634 중 어느 하나에서 절단). 절단을 위한 아미노산 위치는 공통 서열 서열번호: 130 또는 기준 서열 서열번호: 1, 2 또는 3 중 어느 하나에 대한 서열 정렬을 이용하여 결정될 수 있다. 하기 표 3은 이러한 담체의 다양한 아미노산 잔기 서열 및 서열번호: 1-78 또는 130이 절단될 수 있는 C-말단 위치를 확인함으로써 예시적인 담체를 나타낸다. 일 예에서, 통과세포외배출 담체는 서열번호: 1-2 또는 4-78 중 어느 하나의 C- 말단 절단을 갖는 것들을 포함한다.
AA 잔기 | AA 잔기 | AA 잔기 |
1-195 | 1-246 | 1-297 |
1-196 | 1-247 | 1-298 |
1-197 | 1-248 | 1-299 |
1-198 | 1-249 | 1-300 |
1-199 | 1-250 | 1-301 |
1-200 | 1-251 | 1-302 |
1-201 | 1-252 | 1-303 |
1-202 | 1-253 | 1-304 |
1-203 | 1-254 | 1-305 |
1-204 | 1-255 | 1-306 |
1-205 | 1-256 | 1-307 |
1-206 | 1-257 | 1-308 |
1-207 | 1-258 | 1-309 |
1-208 | 1-259 | 1-310 |
1-209 | 1-260 | 1-311 |
1-210 | 1-261 | 1-312 |
1-211 | 1-262 | 1-313 |
1-212 | 1-263 | 1-314 |
1-213 | 1-264 | 1-315 |
1-214 | 1-265 | 1-316 |
1-215 | 1-266 | 1-317 |
1-216 | 1-267 | 1-318 |
1-217 | 1-268 | 1-319 |
1-218 | 1-269 | 1-320 |
1-219 | 1-270 | 1-321 |
1-220 | 1-271 | 1-322 |
1-221 | 1-272 | 1-323 |
1-222 | 1-273 | 1-324 |
1-223 | 1-274 | 1-325 |
1-224 | 1-275 | 1-326 |
1-225 | 1-276 | 1-327 |
1-226 | 1-277 | 1-328 |
1-227 | 1-278 | 1-329 |
1-228 | 1-279 | 1-330 |
1-229 | 1-280 | 1-331 |
1-230 | 1-281 | 1-332 |
1-231 | 1-282 | 1-333 |
1-232 | 1-283 | 1-334 |
1-233 | 1-284 | 1-335 |
1-234 | 1-285 | 1-336 |
1-235 | 1-286 | 1-337 |
1-236 | 1-287 | 1-338 |
1-237 | 1-288 | 1-339 |
1-238 | 1-289 | 1-340 |
1-239 | 1-290 | 1-341 |
1-240 | 1-291 | 1-342 |
1-241 | 1-292 | 1-343 |
1-242 | 1-293 | 1-344 |
1-243 | 1-294 | 1-345 |
1-244 | 1-295 | 1-346 |
1-245 | 1-296 | 1-347 |
이러한 통과세포외배출 담체는 아미노산 위치의 이의 N-말단에서 최대 N-말단 위치 20에서 더 절단될 수 있다 (예를 들어, N-말단 위치 17 (위치 18에서 시작)에서 절단되는 서열번호: 79).
또한, 표 3에 나타낸 담체 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 통과세포외배출 담체가 본 명세서에서 고려된다.
하나의 예에서, 담체는 위치 386에서 C-말단 절단이 있는 서열번호: 1을 포함한다. 하나의 예에서, 담체는 위치 386에서 C-말단 절단이 있는 서열번호: 2를 포함한다. 하나의 예에서, 담체는 위치 386에서 C-말단 절단이 있는 서열번호: 4-79를 포함한다. 하나의 예에서, 담체는 위치 386에서 C-말단 절단이 있는 서열번호: 130을 포함한다. 이러한 예에서, 담체는 위치 386에서 C-말단 절단이 있는 서열번호: 3을 포함하지 않는다. 이러한 예에서, 서열은 서열번호: 126을 포함하지 않는다.
콜릭스 유래 담체가 위치 386에서 C-말단 절단을 갖는 경우, 본 명세서에서 Cholix386 이라고 할 수 있다. "386"은 서열이 서열번호: 130의 일부이거나 또는 이와 정렬될 때 위치 386과 가장 가깝게 정렬되는 아미노산 뒤의 C-말단 절단을 나타낸다. Cholix386은 폴리펩티드가 386 아미노산을 가지고 있을 필요가 없다. 예를 들어, 위치 386에서 서열번호: 79의 절단은 386 아미노산 잔기보다 짧은 담체를 야기한다. 서열번호: 130과 가장 높은 서열 동일성을 위해 정렬되거나 또는 아미노산 잔기 "AQA"로 끝나는 가장 높은 서열 동일성을 위해 서열번호: 1-3 중 어느 하나와 정렬되기 때문에, Cholix386 담체 분자의 예는 위치 386에서 절단된 서열번호: 1-79 또는 130 중 어느 하나를 포함한다.
또한, Cholix386은 서열번호: 180과 실질적으로 동일한 기능을 유지하나 하나 이상의 첨가/결실/치환을 갖고, 본 명세서에 기재된 Cholix386 분자와 적어도 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 폴리펩티드를 포함할 수 있다.
통과세포외배출 콜릭스 유래 담체의 또 다른 예는 Cholix266 이다. 하나의 예에서, Cholix266은 서열번호: 181의 아미노산 서열로 이루어진다. 서열번호: 130과 가장 높은 서열 동일성을 위해 정렬되거나 또는 가장 높은 서열 동일성을 위해 서열번호: 1-3 중 어느 하나와 정렬되기 때문에, 다른 Cholix266 단편은 아미노산 위치 266에서 절단된 서열번호: 1-78 중 어느 하나의 것을 포함할 수 있다. 대안적으로, 담체는 위치 266에서 C-말단에서 절단된 FORMULA I (서열번호: 130)의 임의의 서열을 가질 수 있다.
통과세포외배출 콜릭스 유래 담체의 또 다른 예는 Cholix251 이다. 하나의 예에서, Cholix251은 서열번호: 182의 아미노산 서열로 이루어진다. 서열번호: 130과 가장 높은 서열 동일성을 위해 정렬되거나 또는 가장 높은 서열 동일성을 위해 서열번호: 1-3 중 어느 하나와 정렬되기 때문에, 다른 Cholix251 단편은 아미노산 위치 251에서 절단된 서열번호: 1-78 중 어느 하나의 것을 포함할 수 있다. 대안적으로, 담체는 위치 251에서 C-말단에서 절단된 FORMULA I (서열번호: 130)의 임의의 서열을 가질 수 있다.
통과세포외배출 콜릭스 유래 담체의 또 다른 예는 Cholix245 이다. 하나의 예에서, Cholix245은 서열번호: 183의 아미노산 서열로 이루어진다. 서열번호: 130과 가장 높은 서열 동일성을 위해 정렬되거나 또는 가장 높은 서열 동일성을 위해 서열번호: 1-3 중 어느 하나와 정렬되기 때문에, 다른 Cholix245 단편은 아미노산 위치 245에서 절단된 서열번호: 1-79 중 어느 하나의 것을 포함할 수 있다. 대안적으로, 담체는 위치 245에서 C-말단에서 절단된 FORMULA I (서열번호: 130)의 임의의 서열을 가질 수 있다.
통과세포외배출 콜릭스 유래 담체의 또 다른 예는 Cholix206 이다. 하나의 예에서, Cholix206은 서열번호: 184의 아미노산 서열로 이루어진다. 서열번호: 130과 가장 높은 서열 동일성을 위해 정렬되거나 또는 가장 높은 서열 동일성을 위해 서열번호: 1-3 중 어느 하나와 정렬되기 때문에, 다른 Cholix206 단편은 아미노산 위치 206에서 절단된 서열번호: 1-78 중 어느 하나의 것을 포함할 수 있다. 대안적으로, 담체는 위치 206에서 C-말단에서 절단된 FORMULA I (서열번호: 130)의 임의의 서열을 가질 수 있다.
담체의 다른 예는 FORMULA I (서열번호: 130)에 제시된 서열의 아미노산 위치 195-634 중 어느 하나에서 C-말단 절단을 갖는 것들을 포함한다. 바람직하게는, 이러한 절단은 FORMULA I (서열번호: 130)에 제시된 서열의 195-347 중 어느 하나의 아미노산 위치에 있다.
N-말단에서, 통과세포외배출 담체는 서열번호: 1-78 또는 130의 아미노산 1-20 중 어느 하나를 가질 수 있다. 일 실시예에서, 담체의 N-말단은 서열번호: 1 또는 2의 아미노산 잔기 1-20 (위치 1-20에서 100% 서열 동일성), 또는 서열번호: 1 또는 2의 아미노산 잔기 1-20과 적어도 약 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 가진다. 일 실시예에서, N-말단에서 처음 4개의 아미노산은 VEEA (서열번호: 185)이다. 일 실시예에서, 이러한 담체는 서열번호: 126을 포함하지 않는다. 일 실시예에서, 담체의 N-말단은 FORMULA I (서열번호: 130)의 아미노산 잔기 1-20을 가진다. 임의의 이러한 담체는 임의로 본 명세서에 기재된 N-말단 변형을 가질 수 있다. 이러한 N-말단 변형은 N-말단 메티오닌일 수 있다. 이러한 담체의 예는 서열번호: 131-135 중 어느 하나에 제시된 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 것들이다.
이와 같이, 통과세포외배출 담체는 FORMULA I (서열번호: 130)에 제시된 아미노산 서열의 위치 1의 아미노산 잔기와 또는 위치 205-275 중 어느 하나에서 아미노산 잔기 중 어느 하나와, 적어도 약 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다.
이러한 예에서, 통과세포외배출 담체는 FORMULA I (서열번호: 130)에 제시된 아미노산 잔기 중 아미노산 잔기 1-275, 1-266, 1-265, 2-265, 3-265, 4-265, 5-265, 1-251, 1-250, 2-250, 3-250, 4-250, 5-250, 1-245, 2-245, 3-245, 4-245, 5-245, 1-206, 1-205, 2-205, 3-205, 4-205, 또는 5-205로 이루어지거나, 본질적으로 이루어지거나, 또는 포함한다. 다양한 예에서, 이러한 담체는 서열번호: 1-78 중 어느 하나에 제시된 동일한 아미노산 잔기 중 아미노산 잔기 1-275, 1-266, 1-265, 2-265, 3-265, 4-265, 5-265, 1-251, 1-250, 2-250, 3-250, 4-250, 5-250, 1-245, 2-245, 3-245, 4-245, 5-245, 1-206, 1-205, 2-205, 3-205, 4-205, 또는 5-205로 이루어지거나 또는 본질적으로 이루어질 수 있다.
구체적으로, 일 예에서, 이러한 통과세포외배출 담체는 서열번호: 1에 제시된 아미노산 서열 중 아미노산 잔기 1-275, 1-266, 1-265, 2-265, 3-265, 4-265, 5-265, 1-251, 1-250, 2-250, 3-250, 4-250, 5-250, 1-245, 2-245, 3-245, 4-245, 5-245, 1-206, 1-205, 2-205, 3-205, 4-205, 또는 5-205를 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다.
대안적으로, 일 예에서, 이러한 통과세포외배출 담체는 서열번호: 2에 제시된 아미노산 서열 중 아미노산 잔기 1-275, 1-266, 1-265, 2-265, 3-265, 4-265, 5-265, 1-251, 1-250, 2-250, 3-250, 4-250, 5-250, 1-245, 2-245, 3-245, 4-245, 5-245, 1-206, 1-205, 2-205, 3-205, 4-205, 또는 5-205를 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다.
담체는 이의 N-말단에서 더 변형될 수 있다. 이러한 N-말단 변형은 폴리펩티드의 발현 및/또는 안정성을 향상시킬 수 있는 작용기를 포함한다. 이러한 말단 변형은 하기의 명칭 "FG-담체"로 나타낼 수 있으며, 여기서 FG는 담체의 N-말단에 부착된 작용기이다. 본 명세서에서 고려되는 작용기의 예는 박테리아 발현을 위한 메티오닌 및 CHO 세포 또는 HEK-293 세포에서 발현을 위한 기타 신호 서열을 포함한다. N-말단 메티오닌을 갖는 통과세포외배출 담체의 예는 서열번호: 131-135 중 어느 하나에 제시된 아미노산 서열을 갖는 것들을 포함한다 (표 4). 작용기는 담체의 C-말단에 결합될 수도 있다는 점에 유의해야 한다.
서열번호 | 서열 |
서열번호: 131 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLA |
서열번호: 132 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKV |
서열번호: 133 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQG |
서열번호: 134 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKG |
서열번호: 135 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQA |
서열번호: 184 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLA |
서열번호: 183 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKV |
서열번호: 182 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQG |
서열번호: 181 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKG |
서열번호: 180 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQA |
서열번호: 178 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSK |
서열번호: 191 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESCENLFQ |
서열번호: 192 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQACENLFQ |
서열번호: 193 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESCENLFQSGTCHHHHHH |
서열번호: 194 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQACENLFQSGTCHHHHHH |
서열번호: 178의 아미노산 서열을 갖는 콜릭스 유래 담체의 결정 구조 정보를 이용하여, 세포내이입 및 통과세포외배출에서 역할을 할 수 있는 소수의 영역을 확인하였다. 이러한 영역은 본 명세서에서 X1, X2, X3, X4, X5 라고 한다. X1은 아미노산 잔기 17 - 25에 걸쳐 있고, 서열번호: 160의 아미노산 서열을 가지며, 담체와 ERGIC 단백질 (예를 들어, ERGIC-53)의 상호작용을 허용함으로써 담체의 정점에서 기저로의 수송에서 역할을 할 수 있다. X2는 아미노산 잔기 170 - 176에 걸쳐 있고, 서열번호: 161의 아미노산 서열을 가지며, 담체와 ERGIC 단백질의 상호작용을 허용함으로써 핵상 구획에 대한 담체 접근 및 상피 세포의 정점에서 기저 부위로의 이동에서 역할을 할 수 있다. X3은 아미노산 잔기 186 - 202에 걸쳐 있고, 서열번호: 162의 아미노산 서열을 가지며, 담체와 페룰레칸과 같은 기저 방출 단백질의 상호작용을 허용함으로써 기저측 구획으로 담체의 기저 방출에서 역할을 할 수 있다. X4는 아미노산 잔기 31 - 39에 걸쳐 있고, 서열번호: 163의 아미노산 서열을 가지며, 담체와 ERGIC 단백질의 상호작용을 허용함으로써 상피 세포의 정점 부위에서 기저 부위로의 담체 이동에서 역할을 할 수 있다. X5는 아미노산 잔기 135 - 139에 걸쳐 있고, 서열번호: 164의 아미노산 서열을 가지며, 담체와 TMEM132와 같은 정점 진입 수용체의 상호작용을 허용함으로써 상피 세포로의 담체의 정점 진입에서 역할을 할 수 있다.
따라서, 일 실시예에서, 통과세포외배출 담체는 X1, X2, X3, X4, 및/또는 X5에서 서열번호: 1-78 또는 130 중 어느 하나의 아미노산 잔기를 포함한다. 예를 들어, 본 명세서에서 담체는 서열번호: 1 또는 2의 아미노산 1-266, 또는 이와 실질적인 서열 동일성을 갖는 서열을 가질 수 있으나; X1, X2, X3, X4, 및 X5 중 어느 하나 또는 그 이상은 서열번호: 1 또는 2의 것과 동일하다. 일 실시예에서, 모든 X1, X2, X3, X4, X5는 서열번호: 1 또는 2의 것과 동일하다. 표 3 또는 표 4에 제공된 것과 같이, 본 명세서에 기재된 다른 모든 담체 및 콜릭스-유래 담체에 대해서도 동일하게 말할 수 있다.
일 실시예에서, 통과세포외배출 담체는 서열번호: 1-78 또는 130에 제시된 콜릭스 서열 폴리펩티드 중 어느 하나 또는 그 이상의 서열을 갖는 것들을 제외한다. 일 예에서, 서열번호: 3에 제시된 서열 또는 잔기 425-348, 291, 266, 265, 251, 250, 245, 244, 234, 206, 205, 187, 186, 151, 150, 134, 133에서 C-말단 절단이 있는 절단된 서열번호: 3 및 서열번호: 3의 잔기 40-187로 이루어진 단편을 갖는 폴리펩티드는 제외된다. 일 실시예에서, 통과세포외배출 담체는 서열번호: 126의 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 것들을 제외한다.
놀랍게도, 통과세포외배출 담체보다 짧은 담체가 상피 세포를 가로질러 이러한 페이로드의 상당한 수송없이 이종성 페이로드를 편광 상피 세포로 수송할 수 있다는 것도 확인되었다. 이러한 담체는 본 명세서에서 "세포내이입 담체"라고 할 수 있다. 통과세포외배출 담체는 상피 세포의 세포내 소포 또는 세포질로 끝날 수 있다.
세포내이입 담체의 예는 FORMULA I (서열번호: 130)의 위치 1-40 중 어느 하나에서 위치 145-194 중 어느 하나까지의 아미노산 잔기를 갖는 것들을 포함한다 (서열 번호 : 130). 일 실시예에서, 세포내이입 담체는 145-194의 아미노산 위치 중 어느 하나에서 C-말단 절단을 갖는 서열번호: 1-80 또는 82-120 중 어느 하나의 아미노산 서열을 가진다.
또한, 세포내이입 담체 중 어느 하나는 N-말단 절단을 더 가질 수 있다. 이러한 N-말단 절단은 담체의 N-말단에서 최대 40 아미노산을 제거할 수 있다. 예를 들어, 서열번호: 130의 아미노산 위치 41-44 및 40-44를 나타내는 N-말단에서 각각 아미노산 VLYY (서열번호: 186) 또는 GVLYY (서열번호: 187)를 갖는 담체가 본 명세서에서 고려된다. 일 예에서, 담체는 서열번호: 1-80 또는 82-120, 또는 서열번호: 130 중 어느 하나에 제시된 아미노산 서열의 C 말단 (예를 들어, 위치 145-194로부터 선택된 아미노산 잔기에서 C-말단)에 대한 아미노산 41에 비해 위치 1-40에서 더 높은 정도의 서열 불일치를 포함한다. 가장 바람직하게는, 담체는 FORMULA I (서열번호: 130)에 제시된 아미노산 서열의 위치 1-20 중 어느 하나 내지 위치 150-187 중 어느 하나의 아미노산 잔기, 또는 위치 21-41에서 아미노산 잔기 중 어느 하나 내지 위치 187 또는 205에서 아미노산 잔기를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 표 5는 세포내이입 담체가 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있는 예시적인 아미노산 잔기를 제공한다.
콜릭스 AA 잔기 | 콜릭스 AA 잔기 |
1-150 | 1-178 |
1-151 | 1-179 |
1-152 | 1-180 |
1-153 | 1-181 |
1-154 | 1-182 |
1-155 | 1-183 |
1-156 | 1-184 |
1-157 | 1-185 |
1-158 | 1-186 |
1-159 | 1-187 |
1-160 | 22-187 |
1-161 | 23-187 |
1-162 | 24-187 |
1-163 | 25-187 |
1-164 | 26-187 |
1-165 | 27-187 |
1-166 | 28-187 |
1-167 | 29-187 |
1-168 | 30-187 |
1-169 | 31-187 |
1-170 | 32-187 |
1-171 | 33-187 |
1-172 | 34-187 |
1-173 | 35-187 |
1-174 | 38-187 |
1-175 | 39-187 |
1-176 | 40-187 |
1-177 | 41-187 |
일 예에서, 이러한 담체는 FORMULA I (서열번호: 130)의 위치 39에서 N-말단 절단을 가진다. 다른 예에서, 이러한 담체는 FORMULA I (서열번호: 130)의 위치 40에서 N-말단 절단을 가진다. 또한 이러한 담체가 FORMULA I (서열번호: 130)에 제시된 서열의 위치 145-206 (즉, 잔기 145-206 중 어느 하나의 C-말단 잔기를 가짐)에서 아미노산 잔기 중 어느 하나에서 이의 C-말단에서 절단될 때, 이러한 담체는 페이로드의 상피 세포로의 세포내이입 및 이러한 페이로드를 이러한 상피 세포의 정점 구획 (들)으로 수송하는데 사용될 수 있다 (예를 들어, 실시예 4 참조). 또한, 본 명세서에 기재된 이들 세포내이입 담체 중 어느 하나는 N-말단 메티오닌과 같은 N-말단 변형을 포함할 수 있다. 이러한 담체의 예는 서열번호: 1 (서열번호: 137)의 아미노산 잔기 41-187, 또는 서열번호: 1 (서열번호: 138)의 아미노산 잔기 40-205를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 것들이다.
일 실시예에서, 세포내이입 담체는 서열번호: 1-78, 또는 130에 제시된 서열 중 어느 하나의 아미노산 잔기 1-150을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 일 실시예에서, 세포내이입 담체는 서열번호: 1-78, 또는 130에 제시된 서열 중 어느 하나의 아미노산 잔기 1-151을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 일 실시예에서, 세포내이입 담체는 서열번호: 1-78, 또는 130에 제시된 서열 중 어느 하나의 아미노산 잔기 1-186을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 일 실시예에서, 세포내이입 담체는 서열번호: 1-78, 또는 130에 제시된 서열 중 어느 하나의 아미노산 잔기 1-187을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 하나의 예에서, 담체는 서열번호: 1의 아미노산 1-150, 1-151, 1-186, 또는 1-187을 가진다. 또 다른 예에서, 담체는 서열번호: 2의 아미노산 1-150, 1-151, 1-186, 또는 1-187을 가진다.
본 명세서에서 세포내이입 담체 중 어느 하나는 이의 N-말단에 부착된 작용기 (예를 들어, 메티오닌)를 가질 수 있다. N-말단 메티오닌을 갖는 세포내이입 담체의 예는 서열번호: 136 또는 139 중 어느 하나에 제시된 서열을 갖는 것들을 포함한다.
다른 경우에, 이러한 세포내이입 담체는 FORMULA I (서열번호: 130)에 제시된 아미노산 서열의 위치 40 또는 41에서 위치 187-206에서 아미노산 잔기 중 어느 하나까지의 아미노산 잔기를 포함한다.
이러한 예에서, 세포내이입 담체는 서열번호: 1-80, 82-120, 또는 130에 제시된 서열 중 어느 하나의 아미노산 잔기 40-187 또는 41-187을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 다른 예에서, 이종성 페이로드를 편광 상피 세포로 수송할 수 있는 담체는 서열번호: 1-80, 82-120, 또는 130에 제시된 서열 중 어느 하나의 아미노산 잔기 40-205 또는 41-205를 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다.
이러한 담체는 서열번호: 1의 아미노산 잔기 40-187, 41-187, 40-205, 또는 41-205를 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 이러한 담체의 예시적인 아미노산 서열은 서열번호: 137 및 138에 제시된 아미노산 서열로 이루어지거나, 본질적으로 이루어지거나, 또는 포함하는 것들을 포함한다. 이러한 담체는 편광 상피 세포의 정점 구획으로 페이로드를 수송할 수 있으나, 이러한 담체는 정점에서 기저로의 수송에서 역할을 할 수 있는 아미노산 잔기 1-39가 없기 때문에 기저 구획으로는 수송할 수 없다.
세포내이입 담체는 Formula I (서열번호: 130)에 제시된 아미노산 서열의 위치 134에서 위치 151까지의 아미노산 잔기로 이루어진 세포내이입 단편을 포함할 수 있다. 일부 경우에, 이러한 기능적 단편은 서열번호: 165에 제시된 서열, 또는 이와 높은 (예를 들어, >90%) 서열 동일성을 가진다. 예시적인 담체는 서열번호: 136-139 중 어느 하나에 제시된 아미노산 서열로 이루어지거나, 본질적으로 이루어지거나, 또는 포함할 수 있는 것들을 포함한다 (표 6). 서열번호: 166-167의 하나 또는 둘 다의 기능적 단편이 결여된 담체 (표 11)는 이종성 페이로드를 정점 소포, 세포의 정점 세포질, 및/또는 정점 재순환 엔도좀과 같은 정점 재순환 시스템에서 위치를 포함할 수 있는 상피 세포의 정점 구획으로 수송할 수 있다. 이러한 담체는 TMEM132와 같은 정점 진입 수용체 (예를 들어, TMEM132A)와 상호작용할 수 있으나, 기저 트래피킹 단백질 또는 페를레칸 (HSPG)과는 상호작용하지 않거나 또는 상당히 상호작용하지 않으며, 세포내이입 후에 상피 세포의 정점 구획에서 Rab11a와 공동-국소화할 수 있다. 일 예에서, 이러한 담체는 서열번호: 137-139 중 어느 하나에 제시된 아미노산 서열로 이루어지거나, 본질적으로 이루어지거나, 또는 포함할 수 있다 (표 6).
서열번호 | 서열 |
서열번호: 136 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKA |
서열번호: 137 | MVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKA |
서열번호: 138 | MGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGL |
서열번호: 139 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDL |
다른 실시예에서, 세포내이입 담체는 FORMULA I (서열번호: 130)에 제시된 아미노산 서열의 각각 위치 1 내지 위치 40 및 위치 152 내지 위치 187의 아미노산 잔기로 이루어진 기능적 단편을 포함할 수 있다. 일부 경우에, 이러한 단편은 각각 서열번호: 166 및 167에 제시된 아미노산 서열, 또는 이러한 기능적 단편 중 하나 또는 둘 다와 높은 (예를 들어, >90%) 서열 동일성을 가진다. 이러한 담체는 정점에서 기저로의 기저 트래피킹 수용체와 상호작용할 수 있으나, 페를레칸과는 상당히 상호작용하지 않는다. 이러한 트래피킹 수용체는 이러한 담체가 페이로드를 편광 상피 세포의 핵상 및/또는 기저 구획으로 수송할 수 있게 한다. 이러한 담체는 서열번호: 130의 아미노산 1-187로 이루어지거나, 본질적으로 이루어지거나, 또는 포함할 수 있다 이러한 담체의 예는 서열번호: 136에 제시된 서열을 갖는 것이다.
일 예에서, 세포내이입 담체는 서열번호: 3에 제시된 서열의 단편이 아니다. 일 예에서, 이러한 담체는 서열번호: 4-80, 또는 82-120에 제시된 서열 중 어느 하나의 단편이 아니다. 이러한 예에서, 담체는 서열번호: 3의 아미노산 잔기 1-151, 1-187, 또는 40-187을 포함하지 않거나 또는 이루어지지 않는다.
D. 담체의 기능적 서열 영역
본 명세서에서 실시예 중 어느 하나에서, 담체 서열 내의 하나 이상의 기능적 서열 영역(들)은 수많은 폴리펩티드 및 실시예를 가로질러 기능을 유지하기 위하여 FORMULA I (서열번호: 130)의 이러한 영역에서 발견되는 아미노산 잔기와 국소화된 높은 (예를 들어, >90%) 서열 동일성을 가질 수 있다. 일부 경우에, 이러한 영역(들)에서 아미노산 잔기는 서열번호: 1-80 또는 82-120 중 어느 하나에 제시된 서열을 갖는 것과 같은 자연적으로 발생하는 콜릭스 폴리펩티드에서 발견되는 것들로 제한될 수 있다.
1. 세포내이입 도메인
일 예에서, 담체는 담체가 정점 부위의 상피 세포 (예를 들어, 편광 상피 세포)에 들어갈 수 있게 하는 도메인을 포함한다. 일 예에서, 이러한 도메인은 담체가 정점 진입 수용체와 상호작용할 수 있도록 한다. 이러한 정점 진입 수용체는 TMEM132 또는 TMEM132A 일 수 있다. 이러한 TMEM132 상호작용 도메인은 FORMULA I (서열번호: 130)의 아미노산 잔기 135-151 또는 서열번호: 1-120 중 어느 하나의 위치 135-151의 아미노산 잔기의 공통 서열을 가질 수 있다. TMEM132A는 상피 세포로 담체의 정점 진입을 담당하는 막관통 단백질이다. TMEM132A와 담체 상호작용을 유지하기 위하여, 일 실시예에서, 본 명세서에서 담체는 TMEM132A 상호작용 도메인에 대한 공통 서열을 제시하는 서열번호: 165를 포함한다. 대안적으로, 본 명세서에서 담체는 이의 TMEM132 상호작용 도메인으로서 서열번호: 1-120, 또는 130 중 어느 하나 또는 그 이상의 아미노산 잔기 135-151을 포함할 수 있다.
또한, 놀랍게도 TMEM132 상호작용 도메인 내의 하위영역(subregions)이 담체의 정점 진입에 특히 관련될 수 있다고 가정한다. 따라서, 본 명세서에서 담체는 서열번호: 130의 아미노산 잔기 135-139를 갖는 아미노산 모티프와 상호작용 영역을 통해 TMEM132와 같은 정점 진입 수용체와 상호작용할 수 있다 (예를 들어, 서열번호: 1의 "DQQRN"; 서열번호: 164). 따라서, 본 명세서에서 담체 (이의 폴리펩티드 포함) 중 어느 하나는 정점 측면에서 상피 세포로의 진입을 제공하기 위하여 이러한 모티프 또는 전체 TMEM132 상호작용 도메인 (예를 들어, 서열번호: 165)을 포함할 수 있다. 이러한 영역은 담체 내에서 기능을 가질 수 있으므로, 이러한 영역의 아미노산 서열은 보존될 수 있거나, 또는 치환, 삽입 및/또는 결실인 아미노산 잔기를 최대 1, 2, 또는 3개를 가질 수 있다.
본 명세서에서 담체 중 어느 하나는 상피 세포에 들어가기 위하여 TMEM132 상호작용 도메인 또는 수용체 상호작용 영역을 포함할 수 있다. 예를 들어, 서열번호: 165의 TMEM132 상호작용 도메인을 포함하는 서열번호: 1의 아미노산 잔기 1-151을 포함하는 담체는 정점 측면에서 상피 세포에 들어갈 수 있다. 유사하게, Cholix266 담체, 예를 들어 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체 (예를 들어, 서열번호: 181)는 TMEM132 도메인을 포함하며, TMEM132 도메인을 통해 상피 세포의 정점 측면으로 들어가고 편광 상피 세포를 가로질러 이종성 페이로드를 수송할 수 있다. TMEM132 상호작용 도메인을 포함하는 다른 예시적인 담체는 Cholix187, Cholix206, Cholix245, Cholix251, 및 Cholix386 (예를 들어, 서열번호: 136, 및 180-184) 이다. 일 예에서, 담체는 서열번호: 1의 아미노산 잔기 1-187, 1-206, 1-245, 1-251, 1-266, 또는 1-386을 갖는 것이다.
다른 한편으로는, 서열번호: 140을 갖는 M-Cholix134와 같은 TMEM132 상호작용 도메인이 결여된 담체는 장 내강에 남아있을 수 있으며, 남아있지 않거나 또는 상당히 남아있지 않고 (예를 들어, 정점 표면에 적용된 담체 물질의 10% 미만), 상피 세포로 들어간다 (예를 들어, 실시예 6 참조).
2. 핵상 및 기저 구획 표적 도메인
일 예에서, 담체는 FORMULA I (서열번호: 130)에 제시된 서열의 N-말단 아미노산 잔기 1-40을 포함한다. 이러한 담체는 세포 내로 담체의 세포내이입 후에 상피 세포의 정점에서 핵상 또는 기저 구획으로 (및 이러한 담체가 페를레칸과 같은 기저 방출 단백질과 상호작용할 수도 있는 경우, 점막하 구획으로) 이종성 페이로드를 수송하는데 사용될 수 있다. 이러한 담체의 예는 서열번호: 131-135에 제시된 아미노산 서열을 포함하는 것들을 포함한다 (표 4).
일 예에서, 담체는 FORMULA I (서열번호: 130)에 제시된 서열의 아미노산 잔기 17-25 및/또는 31-39를 포함한다. 이러한 영역은 자연적으로 발생하는 콜릭스 폴리펩티드에서 발견되는 아미노산 잔기로 제한되거나 또는 최대 1, 2, 3 또는 4의 아미노산 치환, 삽입 및/또는 결실을 포함할 수 있다. 치환(들)은 하나 이상의 보존적 또는 비-보존적 치환일 수 있다. 1, 2, 3 또는 4의 아미노산 치환, 삽입 및/또는 결실은 아미노산 17-25 및/또는 31-39의 기능을 보존할 수 있다. 일 예에서, 담체는 17-25 및/또는 31-39에서 자연적으로 발생하는 서열을 가진다. 이러한 예에서, 담체의 아미노산 17-25는 서열번호: 160의 서열을 가질 수 있으며, 및/또는 담체의 아미노산 31-39는 서열번호: 163의 서열을 가질 수 있다. 아미노산 17-25 및 31-39의 기능은 정점에서 기저로의 수송일 수 있다. 이러한 기능은 예를 들어, 이러한 잔기에서 N-말단 절단을 포함하는 담체를 생성하고, N-말단 절단을 갖지 않는 것들과 이들 담체의 정점에서 기저로의 수송 능력을 비교함으로써, 본 명세서의 다른 곳에서 기재된 바와 같이 결정될 수 있다 (예를 들어, 실시예 5 및 6 참조). 이러한 영역을 포함하고 정점에서 핵상 및/또는 기저로의 수송을 할 수 있는 예시적인 담체는 서열번호: 1에 제시된 서열의 아미노산 잔기 1-187, 1-206, 1-245, 1-251, 1-266, 및 1-386을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 이러한 경우, 담체는 서열번호: 131-136 중 어느 하나에 제시된 아미노산 서열로 이루어질 수 있다.
일 예에서, 담체는 추가 도메인을 사용하여 핵상 및/또는 기저 구획에 접근한다. 이러한 도메인은 FORMULA I (서열번호: 130)의 아미노산 잔기 152-187 또는 서열번호: 1-120 중 어느 하나의 위치 152-187의 아미노산 잔기의 공통 서열을 가질 수 있다. 이 도메인의 기능은 상피 세포 내의 핵상 영역에 접근하며, 상피 세포 내의 기저 구획에 도달하고, 및/또는 코팅 단백질 I (COPI)와 같은 트랜스-골지망 (trans-Golgi network)의 요소와 담체의 공동-국소화를 위한 것일 수 있다.
예를 들어, Cholix187 또는 Cholix206과 같은 담체, 예를 들어 이러한 핵상 및 기저 표적 영역을 포함하는, 각각 서열번호: 136 및 131에 제시된 서열을 갖는 담체는, 상피 세포 내의 핵상 영역 및 기저 구획에 접근할 수 있는 반면, 이러한 도메인이 없는 담체, 예를 들어 Cholix151 (예를 들어, 서열번호: 139)은 상피 세포의 정점 측면에 남아있으며 핵상 영역 또는 기저 구획에 상당히 접근하지 않는다 (예를 들어, 실시예 6 참조).
서열번호: 130의 아미노산 잔기 170-176의 서열 (예를 들어, "TRPEHNI", 서열번호: 161)은 담체가 이러한 핵상 및 기저 구획에 접근하고 COPI와 공동-국소화하는데 특히 관련이 있을 수 있다고 여겨진다.
따라서, 일 예에서, 담체는 핵상 및 기저 표적 도메인, 또는 Formula I (서열번호: 130)의 아미노산 잔기 170-176, 또는 서열번호: 161 (서열번호: 1의 아미노산 잔기 170-176에 해당)의 공통 서열을 포함한다. 또한, 이러한 담체는 상기 기재된 TMEM132A 상호작용 도메인을 포함할 수 있다.
핵상 및 기저 표적 도메인은 최소한의 서열 변이를 가질 수 있는 도메인이다. 이와 같이, 본 명세서에서 담체는 서열번호: 3-120을 갖는 것과 같은 자연적으로 발생하는 폴리펩티드의 아미노산 잔기를 갖는 핵상 및 기저 표적 도메인을 포함할 수 있거나, 또는 서열번호: 3-120을 갖는 것과 같은 자연적으로 발생하는 폴리펩티드의 잔기에 비해 치환, 삽입 및/또는 결실인 최대 1, 2 또는 3의 아미노산 잔기를 포함할 수 있다.
핵상 표적 도메인을 포함하는 예시적인 담체는 Cholix187, Cholix206, Cholix245, Cholix251, Cholix266 및 Cholix386 이다. 일 예에서, 담체는 서열번호: 1의 아미노산 잔기 1-187, 1-206, 1-245, 1-251, 1-266, 또는 1-386을 갖는 것이다.
3. 통과세포외배출 도메인
일 예에서, 담체는 통과세포외배출 도메인을 포함한다. 이러한 도메인은 바람직하게는 FORMULA I (서열번호: 130)의 아미노산 잔기 188-206 또는 서열번호: 1-120 중 어느 하나의 위치 188-206의 아미노산 잔기의 공통 서열을 포함할 수 있다. 아미노산 잔기 188-206의 기능은 다 배수(multifold)일 수 있으며, 통과세포외배출에서 역할을 할 수 있다. 통과세포외배출 영역은 pH-의존적 및/또는 순차적 방식으로 담체와 수송 수용체 유사 상호작용 파트너 (본 명세서에서 "TRIPs"라고도 함), 소포체 골지 중간 구획 53 (ERGIC-53, 본 명세서에서 LMAN1이라고도 함), 글루코오스-조절 단백질 75 (GRP75), 및 페를레칸의 상호작용을 허용할 수 있다. 이러한 상호작용은 담체가 상피 세포의 기저막에서 기저측 구획 (예를 들어, 고유판)으로 담체 (이에 결합된 임의의 이종성 페이로드와 함께)를 방출하는 기저 재순환 시스템에 접근할 수 있게 한다.
통과세포외배출할 수 있는 담체의 예는 Cholix206, Cholix245, Cholix251, Cholix266, 및 Cholix386과 같은 콜릭스 유래 담체를 포함한다. 일 예에, 이러한 담체는 서열번호: 130의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 및 1-386을 갖는 것들의 아미노산 서열을 가진다. 일 예에, 이러한 담체는 서열번호: 1의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 및 1-386을 갖는 것들의 아미노산 서열을 가진다. 일 예에, 이러한 담체는 서열번호: 2의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 및 1-386을 갖는 것들의 아미노산 서열을 가진다. 작용기인 N-말단 메티오닌을 갖는 이러한 담체의 예는 서열번호: 131 - 서열번호: 135에 제공된다. 이러한 담체 (예를 들어, Cholix206, Cholix245, Cholix251, Cholix266, 및 Cholix386)는 상피 세포를 가로질러 페이로드의 빠르고 (예를 들어, 적어도 10-6 cm/sec, 10-5 cm/sec) 효율적인 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 수송에 사용될 수 있다 (예를 들어, 실시예 5 참조).
하나 이상의 히스티딘 잔기를 갖는 아미노산 잔기 188-206의 서열 (예를 들어, "AQKEGSRHKRWAHWHTGLA", 서열번호: 168)은 pH-스위치로 작용하여, 담체가 순차적 및/또는 pH-의존적 방식으로 TMEM132, LMAN1, GRP75, 및 페를레칸과 같은 TRIPs와 상호작용할 수 있게 한다고 가정한다.
하기의 표 7은 본 명세서에 기재된 추가의 콜릭스 유래 폴리펩티드 서열을 나타낸다.
서열번호 | 서열 |
서열번호: 140 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDEL |
서열번호: 179 | VEDELNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINE |
서열번호: 189 | VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAADILSLFCPDADKSCVASNNDQANINIESRSGRSYLPENRAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDTVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDELK |
III. 이종성 페이로드
본 명세서에서 고려되는 이종성 페이로드는 치료, 진단 및 영상을 포함하는 임의의 특성일 수 있다. 페이로드는 전달 구조체의 일부일 수 있다. 전달 구조체는 이종성 페이로드에 결합된 담체를 포함할 수 있다. 페이로드는 담체에 직접 또는 간접적으로, 공유 또는 비-공유 결합될 수 있다. 공유 결합시, 페이로드는 담체에 직접 또는 스페이서를 통해 부착될 수 있다.
이종성 페이로드는 소분자, 핵산, 폴리펩티드, 단백질, 나노입자, 또는 이들의 조합일 수 있다.
치료용 페이로드
일 예에서, 치료용 페이로드는 예를 들어 사이토카인, 호르몬, 성장 인자, 치료용 항체, 핵산, 항원, 효소, 응고 인자, 신경전달물질, 또는 고분자와 같은 폴리펩티드이다.
본 명세서에서 제공되는 사이토카인은 케모카인 및 인터루킨 (본 명세서에서 "ILs"로도 약칭됨)을 포함한다. 인터루킨은 IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IL-34, IL-35, IL-36, IL-37, IL-38, IL-39, 또는 IL-40 일 수 있다.
일 예에서, 인터루킨은 IL-10 또는 IL-22 이다. 인터루킨은 임의의 종 (예를 들어, 인간 또는 설치류)로부터 유래될 수 있으며, 바람직하게는 페이로드 또는 이러한 페이로드를 포함하는 전달 구조체를 투여하기 위한 유기체로부터 유래된다. 따라서, 일 예에서, 인터루킨은 인간 인터루킨이다. 본 명세서에서 제공되는 인터루킨은 성숙한, 분비된 인터루킨의 전구체일 수 있다. 이러한 전구체 인터루킨은 신호 펩티드 서열을 포함할 수 있다. 예를 들어, 일 예에서, 치료용 페이로드는 성숙한, 분비된 단백질의 전구체일 수 있다. 다른 예에서, 치료용 페이로드는 분비된 단백질이다. 예를 들어, 일 예에서, 페이로드는 IL-22의 전장 전구체인 서열번호: 141을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 다른 예에서, 페이로드는 IL-22의 분비된 형태인 서열번호: 142를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 또 다른 예에서, 페이로드는 IL-10의 전장 전구체인 서열번호: 144를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 다른 예에서, 페이로드는 IL-10의 분비된 형태인 서열번호: 145를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
이종성 페이로드는 N-말단 메티오닌을 포함할 수 있다. 예를 들어, IL-22 페이로드는 N-말단 메티오닌을 포함할 수 있다. 이러한 예에서, IL-22는 서열번호: 143의 서열을 가질 수 있다.
일 실시예에서, 치료용 페이로드는 IL-22 이다. IL-22는 서열번호: 141 또는 서열번호: 142에 제시된 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열, 또는 이의 기능적 단편을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 일 실시예에서, 치료용 페이로드는 서열번호: 142에 제시된 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다.
일 실시예에서, 치료용 페이로드는 IL-10 이다. IL-10은 서열번호: 144 또는 서열번호: 145에 제시된 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열, 또는 이의 기능적 단편을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 일 실시예에서, 치료용 페이로드는 서열번호: 145에 제시된 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다.
본 명세서에서 제공되는 호르몬은 펩티드 및 폴리펩티드 호르몬을 포함할 수 있다. 이러한 호르몬은 성장 호르몬, 예를 들어, 인간 성장 호르몬 (본 명세서에서 hGH 또는 소마토트로핀(somatotropin)이라고도 함); 뇌하수체 호르몬, 예를 들어, 융모성 생식선 자극 호르몬(chorionic gonadotropin), 코신트로핀(cosyntropin), 메노트로핀(menotropins), 이오르티코트로핀(iorticotropin), 프로티렐린 (protirelin), 티로트로핀(thyrotropin), 바소프레신(vasopressin), 리프레신 (lypressin); 부갑상선 호르몬(parathyroid hormones); 갑상선 호르몬(thyroid hormones); 고환 호르몬(testicular hormones); 위장 호르몬(gastrointestinal hormones), 예를 들어, 위산 저해 폴리펩티드(gastric inhibitory polypeptide), 표피 성장 인자-유로가스트론(epidermal growth factor-urogastrone), 가스트린 (gastrin)-방출 펩티드, 가스트린, 펜타가스트린, 테트라가스트린, 모틸린 (motilin), 뉴로펩티드(neuropeptide) Y, 펩티드 YY, 세크레틴(secretin), 혈관 활성 장 펩티드(vasoactive intestinal peptide), 신칼리드(sincalide); 인크레틴 호르몬(incretin hormones), 예를 들어, 글루카곤-유사 펩티드-1 (GLP-1) 및 글루코오스-의존적 인슐린분비성 폴리펩티드(glucose-dependent insulinotropic polypeptide, GIP); 대사성 호르몬(metabolic hormones), 예를 들어, 인슐린; 및 이의 임의의 유도체 또는 단편을 포함할 수 있다.
일 실시예에서, 호르몬은 서열번호: 146 또는 190에 제시된 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열, 또는 이의 단편을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 인간 성장 호르몬이다.
일 실시예에서, 치료용 페이로드는 글루코오스-저하제이다. 이러한 예에서, 페이로드는 GLP-1 제제 또는 GLP-1 작용제일 수 있다. 이러한 작용제는 엑세나티드 (Exenatide) 또는 리라글루티드(Liraglutide) 일 수 있다. 다른 예에서, 글루코오스-저하제는 인크레틴, 글루카곤 전구단백질(glucagon proprotein), 글루카곤-유사 펩티드 (예를 들어, GLP-1 이외), 글리센틴(glicentin)-관련 폴리펩티드, 엑센딘 (exendin)-3, 엑센딘-4, 릭시세나티드(lixisenatide) (상표명 Adlyxin®, 및 Lyxumia®, 사노피), 리라글루티드(liraglutide) (상표명 Victoza®, 노보 노르디스크 A/S), 세마글루티드(semaglutide) (상표명 Ozempic®, 노보 노르디스크 A/S), 알비글루티드(albiglutide) (상표명 Tanzeum®, 글락소스미스클라인; 알부민에 융합된 GLP-1 이량체), 둘라글루티드(dulaglutide) (상표명 Trulicity®, 일라이 릴리), 글루코오스-의존적 인슐린분비성 폴리펩티드, 티르제파티드(Tirzepatide) (일라이 릴리), 이중 아밀린 칼시토닌 수용체 작용제(Dual Amylin Calcitonin Receptor Agonist) DACRA-089, 글라진(Glargine)/Lantus®, 글루리신 (Glulisin)/Apidra®, 글라린(Glarine)/Toujeo®, Insuman®, 데테미르 (Detemir)/Levemir®, 리스프로(Lispro)/Humalog®/Liprolog®, Humulin®, 린제타 (Linjeta), SuliXen®, NN1045, 인슐린 플러스 SymlinTM, PE0139, 급속-작용(fast-acting) 및 단기-작용(short-acting) 인슐린 (예를 들어, 린제타, PH20, NN1218, HinsBet), (APC-002) 히드로겔, 경구, 흡입성(inhalable), 경피 및 설하 (sublingual) 인슐린 (예를 들어, Exubera®, Nasulin®, Afrezza®, Tregopil®, TPM 02, 캡슐린(Capsulin), Oral-lyn®, Cobalamin®, 경구 인슐린, ORMD-0801, NN1953, NN1954, NN1956, VIAtab, 및 Oshadi 경구 인슐린일 수 있다.
일 예에서, 치료용 페이로드는 치료용 항체 또는 이의 결합 단편이다. 치료용 항체는 항-TNFα 항체를 포함할 수 있다. 이러한 항-TNFα 항체는 인간화 또는 인간 항체일 수 있다. 항-TNFα 제제는 인플릭시맙 (Remicade®), 아달리무맙 (Humira®), 또는 에타너셉트(etanercept) (ENBREL®)를 포함할 수 있다.
일 예에서, 페이로드는 항종양제(antineoplastic agent) 이다. 항종양제는 니트로소우레아, 예를 들어, 카르무스틴, 로무스틴, 세무스틴, 스트렙조토신; 메틸히드라진, 예를 들어, 프로카바진, 다카바진; 스테로이드 호르몬, 예를 들어, 글루코코르티코이드, 에스트로겐, 프로게스틴, 안드로겐, 테트라히드로데스옥시카리코스테론(tetrahydrodesoxycaricosterone); 면역억제제 (예를 들어, 피리메타민, 트리메토프테린, 페니실라민, 시클로스포린, 아자티오프린), 및 면역자극제 (예를 들어, 레바미솔, 디에틸 디티오카바메이트, 엔케팔린, 엔돌핀)와 같은 면역활성 화합물; 항생제와 같은 항균성 화합물, 예를 들어, 베타-락탐, 페니실린, 세팔로스포린, 카바페님 및 모노박탐, 베타-락타마제 저해제, 아미노글리코시드, 마크로라이드(macrolides), 테트라사이클린, 스펙티노마이신; 항말라리아제, 항아메바제; 항원생동물제(antiprotazoals); 항진균제, 예를 들어, 암포테리신-베타, 항바이러스제, 예를 들어, 아시클로버, 이독수리딘, 리바비린, 트리플루리딘, 비다르빈 (vidarbine), 간시클로버(gancyclovir); 구충제(parasiticides); 장내 구충제 (antihalmintics); 방사성 의약품; 위장 약물; 혈액학적 화합물(hematologic compounds); 면역글로불린; 혈액 응고 단백질, 예를 들어, 항혈우병 인자 (anti-hemophilic factor), 제9인자 복합체(factor IX complex); 항응고제, 예를 들어, 디쿠마롤(dicumarol), 헤파린 Na; 피브로리신 저해제, 예를 들어, 트라넥사민산 (tranexamic acid); 심장혈관 약물(cardiovascular drugs); 말초 항-아드레날린 약물(anti-adrenergic drugs); 중추작용 항고혈압 약물, 예를 들어, 메틸도파, 메틸도파 HCl; 항고혈압 직접 혈관확장제(antihypertensive direct vasodilators), 예를 들어, 디아족사이드(diazoxide), 히드랄라진 HCl; 레닌-안지오텐신 시스템에 영향을 미치는 약물; 말초 혈관확장제, 예를 들어, 펜토라민; 항-협심증 약물(anti-anginal drugs); 심장 글리코시드(cardiac glycosides); 심근수축 혈관확장제 (inodilators), 예를 들어, 암리논(amrinone), 밀리논(milrinone), 에녹시몬 (enoximone), 페녹시몬(fenoximone), 이마조단(imazodan), 술마졸(sulmazole); 항부정맥제(antidysrhythmics); 칼슘 진입 차단제(calcium entry blockers); 혈액 지질에 영향을 미치는 약물, 예를 들어, 라니티딘, 보센탄, 레줄린; 호흡기계 약물 (respiratory drugs); 교감신경유사 약물(sypathomimetic drugs), 예를 들어, 알부테롤, 비톨테롤 메실레이트, 도부타민 HCl, 도파민 HCl, 에페드린 나트륨 (So), 에피네프린, 펜플루라민 HCl, 이소프로테레놀 HCl, 메톡사민 HCl, 노르에피네프린 비타르트레이트(norepinephrine bitartrate), 페닐에프린 HCl, 리토드린 HCl; 콜린유사 약물(cholinomimetic drugs), 예를 들어, 아세틸콜린 Cl; 항콜린에스터라제, 예를 들어, 에드로포늄(edrophonium) 클로라이드 (Cl); 콜린에스터라제 재활성제 (cholinesterase reactivators); 아드레날린 차단 약물(adrenergic blocking drugs), 예를 들어, 아세부톨롤 HCl, 아테놀롤, 에스몰롤 HCl, 라베탈롤 HCl, 메토프롤롤, 나돌롤, 펜토라민 메실레이트, 프로파놀롤 HCl; 항무스카린 약물 (antimuscarinic drugs), 예를 들어, 아니소트로핀 메틸브로마이드, 아트로핀, 클리니듐 브로마이드 (Br), 글리코피롤레이트, 이프라트로피움 Br, 스코폴라민 HBr; 신경근 차단 약물(neuromuscular blocking drugs); 탈편광 약물(depolarizing drugs), 예를 들어, 아트라큐리움 베실레이트, 헥사플루오레늄 Br, 메토큐린 요오드, 석시닐콜린 Cl, 투보큐라린 Cl, 베큐로늄 Br; 중추작용 근육이완제, 예를 들어, 바클로펜; 신경전달물질 및 신경전달물질 제제, 예를 들어, 아세틸콜린, 아데노신, 아데노신 트리포스페이트; 아미노산 신경전달물질, 예를 들어, 흥분성 (excitatory) 아미노산, GABA, 글리신; 생체아민(biogenic amine) 신경전달물질, 예를 들어, 도파민, 에피네프린, 히스타민, 노르에피네프린, 옥토파민, 세로토닌, 티라민; 신경펩티드, 산화질소; 항파킨슨 약물, 예를 들어, 아말티딘 HCl, 벤즈트로핀 메실레이트, 카르비도파; 이뇨제, 예를 들어, 디클로르펜아미드, 메타졸아미드, 벤드로플루메티아지드, 폴리티아지드; 항편두통 약물, 예를 들어, 카르보프로스트 트로메타민 메실레이트, 또는 메틸세르지드 말레에이트, 또는 이의 기능적 유도체를 포함할 수 있다.
일 예에서, 페이로드는 히알루로니다제, 스트렙토키나제, 조직 플라스미노겐 활성제(tissue plasminogen activator), 유로키나제(urokinase), PGE-아데노신 데아미나제(adenosine deaminase)와 같은 효소; 드로페리돌(droperidol), 에토미데이트(etomidate), 펜타닐 시트레이트(fentanyl citrate)/드로페리돌, 헥소바비탈 (hexobarbital), 케타민 HCl, 메토헥시탈(methohexital) Na, 티아밀랄(thiamylal) Na, 티오펜탈(thiopental) Na와 같은 정맥 마취제; 항간질제(antiepileptics), 예를 들어, 카바마제핀(carbamazepine), 클로나제팜(clonazepam), 디발프로엑스 (divalproex) Na, 에토숙시미드(ethosuximide), 메페닐로인(mephenyloin), 파라메타디온(paramethadione), 페닐로인(phenyloin), 프리미돈(primidone) 이다. 다양한 실시예에서, 생물학적 활성 페이로드는 히알루로니다제, 스트렙토키나제, 조직 플라스미노겐 활성제, 유로키나제, 또는 PGE-아데노신 데아미나제로부터 선택된 효소이다.
표 8은 본 명세서에서 제공되는 예시적인 치료용 페이로드의 아미노산 서열을 나타낸다.
서열번호 | 서열 |
서열번호: 141 | MAALQKSVSSFLMGTLATSCLLLLALLVQGGAAAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 142 | APISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 143 | MAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 144 | MHSSALLCCLVLLTGVRASPGQGTQSENSCTHFPGNLPNMLRDLRDAFSRVKTFFQMKDQLDNLLLKESLLEDFKGYLGCQALSEMIQFYLEEVMPQAENQDPDIKAHVNSLGENLKTLRLRLRRCHRFLPCENKSKAVEQVKNAFNKLQEKGIYKAMSEFDIFINYIEAYMTMKIRN |
서열번호: 145 | SPGQGTQSENSCTHFPGNLPNMLRDLRDAFSRVKTFFQMKDQLDNLLLKESLLEDFKGYLGCQALSEMIQFYLEEVMPQAENQDPDIKAHVNSLGENLKTLRLRLRRCHRFLPCENKSKAVEQVKNAFNKLQEKGIYKAMSEFDIFINYIEAYMTMKIRN |
서열번호: 146 | FPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 190 | MFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 195 | H-HisGlyGluGlyThrPheThrSerAspLeuSerLysGlnMetGluGluGlu AlaValArgLeuPheIleGluTrpLeuLysAsnGlyGlyProSerSerGlyAla ProProProSer-NH2 |
IV. 스페이서
담체는 스페이서를 통해 이종성 페이로드에 결합될 수 있다. 본 명세서에서 제공되는 스페이서는 입체적 유연성(steric flexibility), 정확한 접힘, 및/또는 담체 및 페이로드의 적당한 생물학적 활성 및 기능을 제공할 수 있다.
스페이서는 하나 이상의 아미노산 잔기를 포함할 수 있다. 일 예에서, 스페이서는 아미노산-기반 스페이서이다. 이러한 스페이서는 적어도 약 5, 10, 15, 20, 25, 35, 50, 75, 또는 100 아미노산 잔기를 포함하거나, 본질적으로 이루어지거나, 또는 이루어질 수 있다. 일 예에서, 스페이서는 최대 약 30, 25, 20, 15, 또는 10 아미노산 잔기를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 일 예에서, 이들 아미노산 잔기의 대부분 (예를 들어, 90% 이상)은 글리신 및/또는 세린 잔기이다.
스페이서는 절단형 또는 비-절단형 스페이서일 수 있다. 일 예에서, 절단형 스페이서는 효소, 예를 들어, 프로테아제에 의해 절단될 수 있다. 비-절단형 스페이서는 이러한 효소에 의해 절단되지 않을 수 있다. 예를 들어, 비-절단형 스페이서는 더 높은 전신 농도의 페이로드가 목표인 경우에 사용될 수 있다.
스페이서는 글리신-세린 올리고펩티드 서열의 하나 이상의 반복을 포함할 수 있다. 따라서, 일 예에서, 담체는 아미노산 서열 (GS)x (서열번호: 169), (GGS)x (서열번호: 170), (GGGS)x (서열번호: 171), (GGGGS)x (서열번호: 172), 또는 (GGGGGS)x (서열번호: 173)를 포함하거나, 본질적으로 이루어지거나, 또는 이루어지며, 여기서, x = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 이다. 일부 경우에, 스페이서는 아미노산 서열 (GGGGS)x (서열번호: 174) (여기서, x = 1, 2, 3, 4 또는 5)를 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 이러한 예에서, 스페이서는 5, 10, 15, 20, 또는 25 아미노산으로 이루어질 수 있다.
본 명세서에서 제공되는 스페이서의 예는 GGGGSGGGGSGGGGS (서열번호: 175), GGGGSGGGGSGGGG (서열번호: 176), 또는 GGGGSNLQGGLRQPR (서열번호: 177)과 적어도 50%, 75%, 90%, 또는 99% 서열 동일성을 갖는 아미노산 서열, 상기 중 어느 하나의 단편, 또는 상기 중 어느 하나의 조합을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 것들이다. 일 예에서, 스페이서는 서열번호: 196 (GGGGS) 또는 서열번호: 197 (GGGGSGGGGSGGGGSGGGGSGGGGS) 중 어느 하나에 제시된 아미노산 서열로 이루어진다. 일 예에서, 상기 스페이서 중 어느 하나는 N- 및/또는 C-말단에서 추가 글리신 또는 세린 잔기를 포함할 수 있다.
일 실시예에서, 담체를 치료용 페이로드에 결합하는 스페이서는 서열번호: 175-176과 적어도 50%, 75%, 90%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다.
V. 전달 구조체
이종성 페이로드에 결합된 담체를 포함할 수 있는 전달 구조체 (예를 들어, 담체-페이로드 복합체)가 본 명세서에서 제공된다. 담체는 (예를 들어, 이온 상호작용, 반데르발스 상호작용, π-π 상호작용 등을 통해) 이러한 페이로드에 공유 또는 비-공유 결합될 수 있다. 담체는 이종성 페이로드에 직접 또는 간접적으로 결합될 수 있다.
이종성 페이로드는 담체의 N- 및/또는 C-말단에 결합될 수 있다. 일 예에서, 이종성 페이로드는 담체의 C-말단 카복실 기와 이종성 페이로드의 N-말단 아민 사이에 공유 아미드 결합을 형성함으로써 담체의 C-말단에 직접 공유 결합된다. 일 예에서, 이종성 페이로드는 스페이서를 통해 담체에 간접적으로 공유 결합된다.
따라서, 일 예에서, 담체가 페이로드에 공유 결합될 때, 전달 구조체는 Formula II: C-S-P 또는 Formula III: P-S-C에 따라 표시될 수 있으며, 여기서 C는 담체이고, S는 스페이서이거나, 또는 임의로 결합이며, P는 이종성 페이로드이다. 전달 구조체는 이의 N-말단 및/또는 C-말단에 하나 이상의 변형을 더 포함할 수 있다. 이러한 변형(들)은 N-말단 메티오닌 잔기를 포함할 수 있다. 따라서, Formula II 및 Formula III는 N-말단 메티오닌 (예를 들어, M+C-S-P) 또는 (예를 들어, M+P-S-C)도 포함할 수 있다.
담체는 화학적/합성 접합을 통해 (예를 들어, 아미드 결합 반응 이용) 또는 융합 단백질로서 박테리아 (예를 들어, E. coli) 또는 포유류 (예를 들어, 차이니즈 햄스터 난소 (CHO)) 세포에서 재조합 발현에 의해 이종성 페이로드에 결합될 수 있다.
전달 구조체 또는 이의 일부 (예를 들어, 담체 및/또는 스페이서)는 폴리펩티드일 수 있다. 본 명세서에서 사용된 바와 같이, 용어 "폴리펩티드"는 천연 및 비천연 아미노산 둘 다를 포함할 수 있다.
본 명세서에서 제공되는 전달 구조체는 하나 이상의 중간-친화도, 고용량 동적 및/또는 담체와 하나 이상의 수송 수용체-유사 상호작용 파트너 (TRIPs)의 pH-의존적 상호작용을 통해 높은 유속으로 편광 상피 세포를 가로질러 통과세포외배출할 수 있다. 이러한 TRIPs는 내인성 트래피킹 경로의 요소일 수 있으며, 따라서, 담체가 장벽 자체를 손상시키지 않고, 담체 또는 페이로드를 상당히 변화 (예를 들어, 화학적/효소적 변형)시키지 않고 상피 세포 장벽을 가로질러 이종성 페이로드를 수송할 수 있다.
또한, TRIPs와의 상호작용은 담체가 적어도 약 10-6 cm/sec, 10-5 cm/sec, 또는 10-4 cm/sec의 수송 속도로 온전한 상피 (예를 들어, 편광 장 상피)를 가로질러 페이로드를 수송할 수 있게 한다.
일 예에서, 담체는 페이로드에 간접적으로 비-공유 결합된다. 이러한 예에서, 나노입자 (예를 들어, 리포좀, 금속 나노입자, 고분자-기반 나노입자 등)는 페이로드 분자 (예를 들어, IL-10, IL-22, GLP-1 등)로 (예를 들어, 입자의 내부 및/또는 표면에) 로딩될 수 있으며, 콜릭스 유래 담체 분자(들)는 이러한 나노입자에 (예를 들어, 이의 표면에) 결합될 수 있다.
일 예에서, 페이로드 대 담체의 비는 적어도 약 15000:1, 10000:1, 5000:1, 2500:1, 1000:1, 500:1, 250:1, 100:1, 50:1, 25:1, 10:1, 5:1, 2.5:1, 1:1 일 수 있다. 이는 표면에 부착된 콜릭스 유래 담체를 이용하여 편광 상피 세포 (예를 들어, 편광 장 상피 세포) 내로 또는 이를 가로질러 이러한 페이로드-함유 나노입자의 수송을 허용할 수 있다. 일부 경우에, 나노입자는 통과세포외배출 또는 세포내이입 후에 페이로드를 방출할 수 있다. 나노입자가 상피 세포를 가로질러 수송되는 경우, 방출된 페이로드는 점막하 조직 (예를 들어, 고유판) 내의 수용체에 결합할 수 있으며 및/또는 전신 순환에 들어갈 수 있으므로 전신적으로 특정 기능 (예를 들어, 치료 또는 진단 기능)을 제공할 수 있다. 다른 경우에, 나노입자가 상피 세포 내부에 페이로드를 방출하는 경우, 페이로드 (예를 들어, 핵산)는 특정 세포내 기능, 예를 들어, 이러한 세포 내에서 형질전화 유전자(transgenes)의 생산, 유전자 발현의 조절 등을 제공할 수 있다.
예시적인 전달 구조체
다양한 실시예에서, 전달 구조체 또는 담체-페이로드 복합체는 (b) 이종성 페이로드와 복합체화된, (a) 서열번호: 179를 포함하지 않고, 서열번호: 126으로 이루어지지 않은 콜릭스 폴리펩티드를 포함하는 담체를 포함하며, 여기서 담체는 (i) 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있거나; 또는 (ii) 편광 상피 세포로 이종성 페이로드를 수송할 수 있다.
일 실시예에서, 전달 구조체는 서열번호: 1 또는 2에 제시된 아미노산 서열의 아미노산 잔기 1-386과 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 콜릭스 유래 담체를 포함한다.
일 실시예에서, 전달 구조체는 서열번호: 1에 제시된 아미노산 서열의 위치 1-40 중 어느 하나에서 위치 150-347에서의 아미노산 잔기 중 어느 하나까지의 아미노산 잔기와 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 콜릭스 유래 담체를 포함한다. 일 예에서, 이러한 담체는 서열번호: 1에 제시된 아미노산 서열의 위치 1-151, 1-187, 41-187, 1-206, 1-245, 1-251, 또는 1-266의 아미노산 잔기와 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다. 다른 예에서, 담체는 서열번호: 2에 제시된 아미노산 서열의 위치 1-151, 1-187, 41-187, 1-206, 1-245, 1-251, 또는 1-266의 아미노산 잔기와 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
이러한 담체 중 어느 하나는 서열번호: 141, 142, 144, 145, 및 146에 제시된 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 치료용 페이로드에 결합될 수 있다.
이러한 치료용 페이로드는 아미노산 서열 GGGGSGGGGSGGGGS (서열번호: 175)와 적어도 66%, 73%, 80%, 86%, 93%, 또는 100% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 스페이서를 통해 콜릭스 유래 담체에 결합될 수 있다.
따라서, 일 예에서, 전달 구조체는 서열번호: 142와 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 치료용 페이로드에 스페이서를 통해 결합된 서열번호: 134와 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 담체를 포함한다. 일 예에서, 스페이서는 서열번호: 175와 적어도 66%, 73%, 80%, 86%, 93%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
다른 예에서, 전달 구조체는 서열번호: 142와 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 치료용 페이로드에 스페이서를 통해 결합된 서열번호: 135와 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 담체를 포함한다. 일 예에서, 스페이서는 서열번호: 175와 적어도 66%, 73%, 80%, 86%, 93%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
일 예에서, 전달 구조체는 치료용 페이로드에 결합된, 서열번호: 175와 적어도 66%, 73%, 80%, 86%, 93%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 스페이서를 통해 서열번호: 134와 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 담체를 포함한다. 이러한 치료용 페이로드는 사이토카인, 호르몬, 또는 치료용 항체 또는 이의 기능적 결합 단편일 수 있다. 일 예에서, 치료용 페이로드는 서열번호: 142, 서열번호: 145, 또는 서열번호: 146과 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
일 예에서, 전달 구조체는 치료용 페이로드에 결합된, 서열번호: 176과 적어도 66%, 73%, 80%, 86%, 93%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 스페이서를 통해 서열번호: 135와 적어도 80%, 85%, 90%, 95%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진 담체를 포함한다. 이러한 치료용 페이로드는 사이토카인, 호르몬, 또는 치료용 항체 또는 이의 기능적 결합 단편일 수 있다. 일 예에서, 치료용 페이로드는 서열번호: 145와 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
일 예에서, 전달 구조체는 서열번호: 147-150, 152-159, 또는 188 중 어느 하나에 제시된 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 포함하거나, 본질적으로 이루어지거나, 또는 이루어진다.
일 실시예에서, 전달 구조체는 서열번호: 147에 제시된 아미노산 서열로 이루어진다.
일 실시예에서, 전달 구조체는 서열번호: 149에 제시된 아미노산 서열로 이루어진다.
일 실시예에서, 전달 구조체는 서열번호: 188에 제시된 아미노산 서열로 이루어진다.
본 명세서에서 예시적인 전달 구조체의 아미노산 서열은 표 9에 나타낸다.
서열번호 | 서열 |
서열번호: 147 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGGGGGSGGGGSGGGGSAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 148 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAGGGGSGGGGSGGGGSAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 149 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAGGGGSGGGGSGGGGSPGQGTQSENSCTHFPGNLPNMLRDLRDAFSRVKTFFQMKDQLDNLLLKESLLEDFKGYLGCQALSEMIQFYLEEVMPQAENQDPDIKAHVNSLGENLKTLRLRLRRCHRFLPCENKSKAVEQVKNAFNKLQEKGIYKAMSEFDIFINYIEAYMTMKIRN |
서열번호: 150 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGGGGGSNLQGGLRQPRFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 151 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 152 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 153 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 154 | MVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 155 |
MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLAGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 156 | MGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGFHHHHHH |
서열번호: 157 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 158 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 159 |
MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGGGGGSGGGGSGGGGSFPTIPLSRLFDNAMLRAHRLHQLAFDTYQEFEEAYIPKEQKYSFLQNPQTSLCFSESIPTPSNREETQQKSNLELLRISLLLIQSWLEPVQFLRSVFANSLVYGASDSNVYDLLKDLEEGIQTLMGRLEDGSPRTGQIFKQTYSKFDTNSHNDDALLKNYGLLYCFRKDMDKVETFLRIVQCRSVEGSCGF |
서열번호: 188 |
MLEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGGGGGSGGGGSGGGGSAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 198 |
MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGGGGGSAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 199 |
MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGGGGGSGGGGSGGGGSGGGGSGGGGSAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
서열번호: 200 |
MAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACIGGGGSVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKG |
서열번호: 201 | MVEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEGVLYYSMTINDEQNDIKDEDKGESIITIGEFATVRATRHYVNQDAPFGVIHLDITTENGTKTYSYNRKEGEFAINWLVPIGEDSPASIKISVDELDQQRNIIEVPKLYSIDLDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKAAQKEGSRHKRWAHWHTGLALCWLVPMDAIYNYITQQNCTLGDNWFGGSYETVAGTPKVITVKQGIEQKPVEQRIHFSKGNAMSALAAHRVCGVPLETLARSRKPRDLTDDLSCAYQAQNIVSLFVATRILFSHLDSVFTLNLDEQEPEVAERLSDLRRINENNPGMVTQVLTVARQIYNDYVTHHPGLTPEQTSAGAQAGGGGSAPISSHCRLDKSNFQQPYITNRTFMLAKEASLADNNTDVRLIGEKLFHGVSMSERCYLMKQVLNFTLEEVLFPQSDRFQPYMQEVVPFLARLSNRLSTCHIEGDDLHIQRNVQKLKDTVKKLGESGEIKAIGELDLLFMSLRNACI |
VI. 사용 방법
일 실시예에서, 이종성 페이로드에 결합된 담체를 포함하는 전달 구조체가 본 명세서에서 제공된다. 본 명세서에서 제공되는 담체는 이러한 페이로드 (예를 들어, 치료용 페이로드)를 정점 측면 (예를 들어, 정점 재순환 시스템), 기저 측면, 및/또는 핵상 구획(들)과 같은 상피 세포 내부의 다양한 위치로 수송하는데 사용될 수 있다. 편광 장 상피를 가로지르는 전달은 점막하 구획 (예를 들어, 고유판 및/또는 다른 점막하 장 구획) 및/또는 (예를 들어, 간문맥계(hepatic portal system)를 통해) 전신 순환으로의 전달을 포함할 수 있다.
A. 치료 방법
온전한 상피 장벽 (예를 들어, 편광 장 상피)을 가로질러 본 명세서에서 제공되는 담체의 고유량 수송 용량(high flux transport capacities)은 치료용 및/또는 진단용 페이로드 분자를 이를 필요로 하는 피험자 (예를 들어, 인간 또는 설치류)에게 전달하는데 사용될 수 있다. 예를 들어, 점막하 구획, 예를 들어, 고유판으로 치료용 페이로드의 전달은 GI 관에서 이러한 위치에 위치하고 및/또는 이러한 위치로부터 유래된 질환 또는 질병의 치료 및/또는 진단을 허용할 수 있는 반면, 페이로드의 전신 전달은 유기체 내의 다양한 세포(들), 조직(들), 또는 기관(들)에서 치료적 유효 농도를 제공하는데 사용될 수 있다.
본 발명의 전달 구조체를 이용하여 치료될 수 있는 질환은 염증성 질환, 자가면역 질환, 암, 대사성 질환, 신경퇴행성 질환 및 신경 질환, 바이러스성 질환 또는 감염, 및 심혈관 질환을 포함할 수 있다.
일 예에서, 염증성 질환은 염증성 장 질환, 건선, 세균성 패혈증, 크론병 (예를 들어, 누공성 크론병), 궤양성 대장염 (예를 들어, 중등도에서 중증 궤양성 대장염 또는 경증에서 중등도 궤양성 대장염), 콜라겐성 대장염, 림프성 대장염, 허혈성 대장염, 전환 대장염(diversion colitis), 베체트 증후군(Behcet's syndrome), 불확정 대장염(indeterminate colitis), 췌장염, 간 염증 (예를 들어, 간염), 주머니염, 직장염, 및 상피 세포 손상을 포함할 수 있다.
일 예에서, 전신 홍반성 루푸스 (SLE), 심상성 천포창(pemphigus vulgaris), 중증 근무력증(myasthenia gravis), 용혈성 빈혈(hemolytic anemia), 혈소판감소성 자반병(thrombocytopenia purpura), 그레이브스병, 쇼그렌병, 피부근염 (dermatomyositis), 하시모토병, 다발성근염, 다발성 경화증, 당뇨병, 류마티스 관절염, 및 피부 경화증(scleroderma)을 포함할 수 있다.
일 예에서, 암은 비-호지킨 림프종 (NHL), 호지킨 림프종, 만성 림프구성 백혈병(chronic lymphocytic leukemia), 털세포 백혈병, 급성 림프모구성 백혈병 (acute lymphoblastic leukemia), 다발성 골수종, 방광암, 신장암, 난소암, 자궁경부암, 유방암, 폐암, 비인두암, 악성 흑색종, 리툭시맙 내성 NHL, 및 백혈병을 포함할 수 있다.
일 예에서, 대사성 질환은 당뇨병, 비만으로 인한 당뇨병, 고혈당증, 이상지질혈증, 고중성지방혈증, X 증후군, 인슐린 저항성, 내당능 장애 (IGT), 당뇨병성 이상지질혈증, 고지혈증, 지방간 질환, 비알콜성 지방간염(nonalcoholic steatohepatitis), 비만, 공복 혈당 상승, 요로 알부민 분비(urinary albumin secretion), 중심성 비만(central obesity), 고혈압, 중성지방 상승, LDL 콜레스테롤 상승 및/또는 HDL 콜레스테롤 감소, 고인슐린혈증(hyperinsulinemia), 케톤증 (ketosis), 공복 혈당 장애(impaired fasting glucose), 글루코오스신생합성 (gluconeogenesis), 과잉 글리코겐분해(excess glycogenolysis), 당뇨병성 케톤산증(diabetic ketoacidosis), 당뇨병성 신증(diabetic nephropathy), 신기능부전 (renal insufficiency), 신부전(renal failure), 과식증(hyperphagia), 근육 소모, 당뇨병성 신경병증(diabetic neuropathy), 당뇨병성 망막증(diabetic retinopathy), 당뇨병성 혼수(diabetic coma), 동맥경화증, 관상 동맥성 심장 질환 (coronary heart disease), 및 말초 동맥 질환(peripheral artery disease)을 포함할 수 있다.
일 예에서, 심혈관 질환은 혈관 질환, 심장 질환 및 뇌졸중을 포함할 수 있다.
본 발명의 전달 구조체를 이용하여 치료될 수 있는 기타 질환 및 질병은 성장 호르몬 결핍증 (GHD), 터너 증후군 (TS), 누난 증후군, 프라더-윌리 증후군 (Prader-Willi syndrome), 저신장증 호메오박스-함유 유전자 (SHOX) 결핍증, 만성 신기능부전, 특발성 저신장증, 단장 증후군(short bowel syndrome), 알러지, 이식편 대 숙주 질환, 빈혈, 조혈 세포 장애, 및 내분비계 또는 생식계의 질환을 포함할 수 있다.
또한, 전달 구조체는 이를 필요로 하는 피험자에게 약학 조성물로서 투여될 수 있다. 본 명세서에서 전달 구조체는 치료 효능을 증가시키기 위해 약학 조성물로 제형화될 수 있다. 예를 들어, 전달 구조체는 피험자의 GI 관 내 또는 주위의 특정 위치(들)에서 방출되도록 제형화될 수 있다. 일 예에서, 전달 구조체는 회장 (ileum)과 같은 GI 관 내 또는 주위의 다양한 부분에서 면역 세포와 결합하기 위한 이의 생물학적 활성을 증가시키도록 제형화될 수 있다.
전달 구조체는 다양한 투여 경로를 통해 투여될 수 있다. 일부 경우에, 투여는 전달 구조체의 경구 투여를 포함한다. 일 예에서, 전달 구조체는 정제 또는 캡슐로 경구 투여된다.
B. 실험 방법
콜릭스 담체 상호작용 단백질 (예를 들어, TRIPs)의 통과세포외배출 시험 및 평가를 위한 방법이 본 명세서에서 제공된다.
1. 통과세포외배출 시험
분리된 전달 구조체의 통과세포외배출 기능은 통과세포외배출을 통해 상피 막 (예를 들어, 편광 장 상피)을 통과하는 전달 구조체의 능력의 기능으로 시험될 수 있다. 전달 구조체의 통과세포외배출 활성은 제한 없이 통상의 기술자에게 알려진 임의의 방법으로 시험될 수 있다. 다양한 실시예에서, 통과세포외배출 활성은 전달 구조체가 결합하는 비-편광 세포에 들어가는 능력을 평가함으로써 시험될 수 있다. 콜릭스 유래 담체의 경우, 및 임의의 특정 이론 또는 작용 메커니즘에 얽매이지 않고, 전달 구조체가 편광 상피 세포를 통과하도록 허용하는 통과세포외배출 기능 및 비-편광 세포로 들어가는 기능이 동일한 도메인 또는 영역, 즉, 서열번호: 1의 아미노산 잔기 1-266에 존재하는 것이 본 명세서에 기재되어 있다. 따라서, 전달 구조체가 세포에 들어가는 능력은 예를 들어, 세포의 내부에서 구조체의 물리적 존재를 검출함으로써 평가될 수 있다. 예를 들어, 전달 구조체는 형광 마커로 표지될 수 있으며, 전달 구조체는 세포에 노출될 수 있다. 그 다음, 세포를 세척하고, 세포에 들어가지 않은 임의의 전달 구조체를 제거하고, 세포(들)에 남아있는 표지의 양을 결정할 수 있다. 현미경을 이용하여 이러한 세포 내에서 표지의 검출은 전달 구조체가 세포에 들어갔음을 나타낸다.
전달 구조체의 통과세포외배출 능력은 편광 상피 세포를 통과하는 전달 구조체의 능력을 평가함으로써 시험될 수 있다. 예를 들어, 전달 구조체는 형광 마커 (예를 들어, RFP)로 표지될 수 있으며, 상피 세포층의 정점 막에 접촉될 수 있다. 또 다른 예에서, 전달 구조체는 전달 구조체에 대한 항체 (예를 들어, 단일클론 및/또는 다클론 항체), 또는 콜릭스 유래 담체 또는 페이로드와 같은 이의 일부를 이용하여 검출될 수 있다. 상피 세포에 의해 형성된 막의 기저측 측면 (예를 들어, 도 1에 나타낸 기저측 챔버 또는 in vivo 실험에서 고유판)에서 검출된 형광은 담체의 통과세포외배출 능력이 온전함을 나타낸다.
수컷 비스타(Wistar) 랫트를 이용하여 In vivo 통과세포외배출을 시험할 수 있다. 수컷 비스타 랫트는 12/12 h의 명/암 주기로 케이지(cage) 당 3-5 마리가 수용될 수 있으며, 연구에 배치될 때 225-275g (약 6-8 주령)일 수 있다. 연속 이소플루란 마취를 사용하는 비-회수 프로토콜을 이용하여 광 단계(light phase)에서 실험을 수행할 수 있다. 중간-공장(mid-jejunum) 영역을 노출하는 4-5 cm 중간선 복부 절개를 수행할 수 있다. 3.86x10-5 M의 시험 물품에 대한 저장 용액을 인산염 완충 식염수 (PBS)에서 제조할 수 있으며, (250 g 랫트 당) 50 μL를 29-게이지 바늘을 이용하여 내강내 주사 (ILI)로 투여한다. 그 다음, 주사 부위 장간막 (mesentery)을 영구 마커로 표시할 수 있다. 연구 종료시, 현미경 평가를 위해 표시된 장 부분을 포획한 3-5 mm 영역을 분리하고 처리할 수 있다. In vivo 실험은 1986년 영국 동물 (과학적 절차) 법, 1986년 유럽 공동체 위원회 지침(European Communities Council Directive) (86/609/EEC), 및 바스 대학의 윤리 검토 절차에 따라 수행될 수 있다.
2. 콜릭스 담체 상호작용 단백질 (즉, TRIPs)의 평가
콜릭스 상호작용 파트너 (예를 들어, 수용체, 효소 등)를 확인하고 이들이 콜릭스 폴리펩티드 (예를 들어, 콜릭스 서열 또는 이의 절단된 버전의 잔기 1-266)와 상호작용하는 소포성 구획을 확립하기 위하여, 일련의 풀-다운(pull-downs) 분석을 수행하여 표면 플라즈몬 공명을 이용한 in silico 결합, 특정 표적의 유전적 녹다운이 달성될 수 있는 편광 Caco-2 인간 장 상피 세포를 이용한 in vitro 통과세포외배출 연구, 및 콜릭스 요소와 특정 수용체가 확립된 소포성 구조에서 공동-국소화될 수 있는 in vivo 통과세포외배출 연구가 뒤따를 수 있는 잠재적 상호작용 파트너를 확인할 수 있다. 어떠한 이론에 얽매이지 않고, 통과세포외배출 과정은 일반적으로 편광 장 상피 세포의 특정 소포성 요소 내에서 제한되는 요소를 포함할 수 있으나, 콜릭스 유래 담체에 의해 모집되거나(recruited) 또는 "강탈되어 (hijacked)", 후기 엔도좀을 떠날 수 있고 (예를 들어, 정점 재순환 메커니즘, 정점 수용체-매개 세포외배출 등을 통해) 세포에서 기저측 구획으로 방출된 후에 리소좀 분해를 피할 수 있다고 가정한다.
3.
담체와
세포 단백질의 공동-국소화 측정
본 명세서에 기재된 담체 또는 담체-페이로드 복합체와 하나 이상의 세포 단백질의 공동-국소화는 형광 현미경에 의해 결정될 수 있다. 예를 들어, 콜릭스 유래 담체는 편광 상피 세포(들) (예를 들어, Caco-2)의 정점 막 또는 장 상피 조직에 적용될 수 있다. 수용체-매개 세포내이입 후에, 세포로의 담체의 업데이트는 예를 들어, 표지된 항-콜릭스 담체 항체 또는 염료-표지된 담체를 이용하거나 또는 항-페이로드 항체를 이용하여 형광 현미경에 의해 결정될 수 있다. 시료 또는 조직 절편은 예를 들어, 실시예 7에 기재된 바와 같이 Rab7, Rab11과 같은 세포 단백질에 특이적인 마커로 더 염색될 수 있다. 다양한 영상 분석 기법을 사용하여 세포 단백질에 대한 담체의 상대적 위치를 결정할 수 있다 (예를 들어, 실시예 6 참조).
본 발명의 다양한 특징은 첨부된 청구범위에서 구체적으로 설명된다. 특허 또는 출원 파일은 컬러로 작성된 적어도 하나의 도면을 함유한다. 컬러 도면(들)이 있는 이 특허 또는 특허 출원 간행물의 사본은 요청 및 필요한 비용 지불시 특허청에 의해 제공될 것이다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 이용되는 예시적인 측면을 설명하는 하기의 상세한 설명, 및 첨부 도면 (또한, 본 명세서에서 "도(Figure)" 및 "도.(FIG.)")을 참조하여 얻어질 것이다:
도 1은 상피 세포 단층 위의 정점 챔버(apical chamber) 및 이러한 상피 세포 단층 아래의 기저 챔버(basal chamber)를 포함하는 장치를 개략적으로 나타낸다. 정점에서 기저측(basolateral) 투과도 (예를 들어, 통과세포외배출)의 경우, 시험 물품 (예를 들어, 담체, 전달 구조체, 페이로드 등)을 정점 (A) 측면에 적용하고, 투과된 (예를 들어, 통과세포외배출된) 물질의 양을 기저측 (B) 측면에서 (예를 들어, 웨스턴 블로팅, 크로마토그래피 등을 이용하여) 결정하였다.
도 2는 담체 (서열번호: 134) 및 IL-22 페이로드 (서열번호: 142)를 포함하는 서열번호: 147의 전달 구조체가 시간-의존적 방식으로 온전한 편광 Caco-2 장 상피 세포 단층을 가로질러 IL-22 페이로드를 수송하였음을 나타낸다 (도 1에서 상기 기재된 바와 같이, 기저측 부위의 단백질의 양은 전달 구조체를 단층의 정점 막에 적용한 후 15분, 30분 및 45분에 측정하였다). 자료는 서열번호: 134의 담체 및 서열번호: 142의 IL-22 페이로드를 포함하는 전달 구조체 (서열번호: 147)가 Caco-2 상피 세포에 적용될 때, 담체에 결합되지 않은 IL-22 (서열번호: 143)가 Caco-2 상피 세포에 적용된 경우에 비해 약 2-3 배 더 많은 IL-22가 Caco-2 상피 세포 단층을 통과하였음을 더 나타낸다.
도 3은 담체 (서열번호: 134) 및 IL-22 페이로드 (서열번호: 142)를 포함하는 서열번호: 147의 전달 구조체가 시간-의존적 방식으로 온전한 편광 SMI-100 장 상피 세포 단층을 가로질러 IL-22 페이로드를 수송하였음을 나타낸다 (기저측 챔버 내의 단백질의 양은 전달 구조체를 단층의 정점 막에 적용한 후 15분, 30분 및 45분에 측정하였다). 자료는 서열번호: 142의 IL-22 페이로드에 결합된 서열번호: 134의 담체를 포함하는 전달 구조체가 SMI-100 상피 세포에 적용될 때, 담체에 결합되지 않은 IL-22 (서열번호: 143)가 SMI-100 상피 세포에 적용된 경우에 비해 약 2-3 배 더 많은 IL-22가 SMI-100 상피 세포 단층을 통과하였음을 더 나타낸다.
도 4는 서열번호: 147의 전달 구조체가 in vivo에서 온전한 편광 장 상피를 가로질러 IL-22 (서열번호: 142)를 상당한 양으로 수송하였음을 나타낸다. 장 상피의 정점 부위는 백색 화살표 #1로 강조된다. 고유판(lamina propria)은 "l.p."로 약칭된다. 편광 상피의 외부 기저막은 백색 화살표 #2로 강조된다. IL-22 국소화는 백색 화살표 및 녹색 형광 (예를 들어, 백색 화살표 #3)으로 나타내고, 청색 형광은 DAPI 염색을 나타낸다.
도 5는 제 1 전달 구조체 (서열번호: 147) 및 제 2 전달 구조체 (서열번호: 148)가 Caco-2 단층을 가로질러 IL-22 페이로드를 수송하였음을 나타낸다 ("수송 후"는 Caco-2 단층을 가로질러 수송 후 기저측 구획에 위치한 단백질을 나타낸다). 웨스턴 블롯 자료는, 예를 들어 저분자량 분해 산물의 부재에 의해 나타난 바와 같이, 전달 구조체가 수송 후 온전하였음을 더 나타낸다. 전달 구조체 서열번호: 147 및 서열번호: 148를 사용한 IL-22 페이로드의 수송은 담체의 부재 하에 IL-22 대조군 단백질 (서열번호: 143)의 수송에 대하여 나타낸다. 대조군 단백질 IL-22는 서열번호: 143에 제시된 아미노산 서열로 이루어졌다.
도 6은 통과세포외배출 후에 Caco-2 상피 세포 단층의 기저측 구획에서 검출된 전달 구조체 (서열번호: 147) 및 IL-22 (서열번호: 143)의 양을 나타낸다. 단백질 양은 정규화되었다. 자료는 편광 상피 세포를 가로질러 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 147)의 수송이 글루코오스-조절 단백질 75 (GRP75, 예를 들어, GRP75B)에 의존적이었음을 나타낸다. GRP75의 녹다운을 갖는 Caco-2 세포 (Caco-2GRP75-로 나타냄)는 GRP75를 발현하는 세포 (Caco-2로 나타냄)에 비해 상당히 감소된 전달 구조체 (서열번호: 147)의 수송을 나타내었다. GRP75에 대한 수송의 의존은 GRP75를 발현하는 세포에 비해 GRP75 녹다운 세포의 기저측 구획에서 검출된 전달 구조체의 감소된 양으로 나타낸다. IL-22 (서열번호: 143) 단독의 수송은 GRP75 녹다운에 의해 영향을 받지 않았다.
도 7은 편광 상피 세포를 가로질러 전달 구조체 (서열번호: 147)의 수송이 기저막-특이적 헤파란 설페이트 프로테오글리칸 코어 단백질 (HSPG)에 의존적이었음을 나타낸다. 이 단백질의 녹다운을 갖는 Caco-2 세포 (Caco-2HSPG-로 나타냄)는 HSPG를 발현하는 세포 (Caco-2로 나타냄)에 비해 상당히 감소된 전달 구조체 (서열번호: 147)의 수송을 나타내었다. HSPG에 대한 수송의 의존은 HSPG를 발현하는 세포에 비해 HSPG 녹다운 세포의 기저측 구획에서 검출된 전달 구조체의 감소된 양으로 나타낸다. IL-22 (서열번호: 143) 단독 (즉, 담체에 결합되지 않음)의 수송은 HSPG에 의존적이지 않았다.
도 8은 랫트 내강내 주사 모델을 이용하여 내강내 주사 후 15분에 상피 세포 내의 정점 구획 (백색 화살표 #2로 강조됨)에서 전달 구조체 (서열번호: 154)의 형광 현미경 검출을 나타낸다 (백색 화살표 #1은 정점 표면을 강조하고, 백색 화살표 #3은 기저막을 강조하며, 백색 화살표 #4는 고유판을 강조한다). 자료는 Cholix41-187 (예를 들어, 서열번호: 137)의 예로부터 유래된 담체가 상피 세포의 정점 구획으로 페이로드를 수송할 수 있으나, 상피 세포를 가로질러 수송할 수 없음을 나타낸다. 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다.
도 9는 랫트 내강내 주사 모델을 이용하여 내강내 주사 후 15분에 상피 세포의 정점 구획 (백색 화살표 #2로 강조됨)에서 전달 구조체 (서열번호: 156)의 형광 현미경 검출을 나타낸다 (백색 화살표 #1은 정점 표면을 강조하고, 백색 화살표 #3은 기저막을 강조하며, 백색 화살표 #4는 고유판을 강조한다). 자료는 Cholix40-205 (예를 들어, 서열번호: 138)의 예로부터 유래된 담체가 상피 세포의 정점 구획으로 페이로드 (예를 들어, hGH)를 수송할 수 있으나, 상피 세포를 가로질러 고유판으로 수송할 수 없음을 나타낸다. 이들 자료는 서열번호: 1의 잔기 1-39가 통과세포외배출에서 역할을 할 수 있으나, 콜릭스 담체의 세포내이입에는 필요하지 않을 수 있음을 더 시사한다. 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다.
도 10a는 랫트 공장으로 전달 구조체의 내강내 주사 후 5분에 상피 세포 내부의 정점 구획에서 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 도 10a-10c에서, 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다: 백색 화살표 #1은 정점 구획을 강조하고, 백색 화살표 #2는 핵상 구획을 강조한다.
도 10b는 내강내 주사 후 10분에 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 자료는 담체가 시간이 지남에 따라 정점 구획에서 핵상 및 기저 구획으로 hGH 페이로드를 수송하였음을 나타낸다.
도 10c는 내강내 주사 후 15분에 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 자료는 담체가 시간이 지남에 따라 정점 구획에서 핵상 및 기저 구획으로 페이로드를 수송하였음을 나타낸다.
도 11a-11b는 담체에 결합된 hGH (서열번호: 146)에 비해 인간 성장 호르몬 (hGH, 서열번호: 190) 단독의 정점에서 기저로의 수송을 나타낸다. 담체 길이는 기준 서열번호: 1에 대한 C-말단 절단으로 나타낸다 (예를 들어, "134"는 서열번호: 1의 잔기 1-134를 갖는 담체를 나타낸다). 모든 담체는 N-말단 메티오닌을 더 포함하였다. hGH에 대한 웨스턴 블로팅은 2 h 후 in vitro에서 1차 인간 소장 상피 세포의 편광 단층을 가로질러 정점에서 기저로 수송하는 이들 단백질의 용량 (capacity)을 정성적으로 평가하였다. 정점에서-적용된 물질의 양은 hGH 함량에 대해 몰 기준으로 동등하였으며, 기저 수집물은 분석 전에 ~10배 농축시켰다.
도 11a는 각각 위치 134, 151, 187, 41-187, 및 266에서 절단이 있는 서열번호: 151 - 서열번호: 154 및 서열번호: 159에 제시된 서열을 갖는 전달 구조체에 대해 측정된 것에 대하여 hGH (서열번호: 190) 단독의 정점에서 기저로의 수송의 비교를 나타낸다. 자료는 서열번호: 1의 위치 134, 151, 187에서 C-말단 절단, 또는 서열번호: 1의 위치 41에서 N-말단 절단 및 위치 187에서 C-말단 절단이 있는 콜릭스 담체가 위치 266에서 C-말단 절단이 있는 콜릭스 담체 (서열번호: 159)를 갖는 구조체에 비해 결합된 hGH의 정점에서 기저로의 수송이 상당히 더 낮음을 나타내었음을 나타낸다.
도 11b는 서열번호: 1에 비해 각각 위치 206 (서열번호: 131), 245 (서열번호: 132), 251 (서열번호: 133), 및 266 (서열번호: 134)에서 C-말단 절단이 있는 콜릭스 담체를 포함하는 서열번호: 155 및 서열번호: 157 - 서열번호: 159의 전달 구조체가 결합된 hGH (서열번호: 146)의 효율적인 정점에서 기저로의 수송을 나타내었음을 나타낸다. 위치 245 및 251에서 콜릭스 C-말단 절단이 있는 담체는 위치 266에서 C-말단 절단이 있는 담체의 것과 비슷한 결합된 hGH (서열번호: 146)의 정점에서 기저로의 수송을 나타내었지만, 위치 206에서 콜릭스 C-말단 절단이 있는 담체는 위치 245, 251 및 266에서 C-말단 절단이 있는 담체에 비해 hGH의 정점에서 기저로의 수송의 상당한 향상을 나타내었다.
도 12a-12f는 각각 상이한 콜릭스 담체를 포함하는 6개의 전달 구조체의 랫트 공장에서 편광 장 상피 세포를 가로질러 정점에서 기저로의 수송 정도를 나타낸다. 콜릭스 담체 (적색 형광) 및 hGH (녹색 형광)의 국소화는 각각 다클론 항-콜릭스 및 단일클론 항-hGH 항체를 이용한 면역형광 현미경으로 나타낸다. 백색 화살표는 정점 막을 나타내고, "l-p"는 고유판을 나타내며, "GC"는 배상 세포(goblet cells)를 나타내고, 열린 화살표는 고유판에 존재하는 전달 구조체를 나타낸다.
도 12a는 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 140)를 포함하는 전달 구조체 (서열번호: 151)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12a는 담체가 전달 구조체가 상피 세포로 들어가는 것을 가능하게 하지 않았음을 나타내며, 이는 서열번호: 1의 아미노산 잔기 135-151을 갖는 기능적 서열 단편이 편광 상피 세포로의 세포내이입에서 역할을 할 수 있음을 시사한다 (반대로, 도 12b는 서열번호: 139의 담체가 세포내이입을 통해 각각의 전달 구조체의 세포 진입을 가능하게 함을 나타낸다).
도 12b는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 139)를 포함하는 전달 구조체 (서열번호: 152)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12b는 이 구조체가 상피 세포로 들어갔으나 (도 12a에 기재된 서열번호: 151의 구조체와는 대조적으로), 주로 정점에 남아있고, 어느 정도는 기저 소포성 풀(vesicular pools)에 남아있으나 고유판에는 들어가지 않았음을 나타내며, 이에 의해 상피 세포의 정점 및 기저 구획으로 페이로드의 전달을 가능하게 한다.
도 12c는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 136)를 포함하는 전달 구조체 (서열번호: 153)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12c는 이 구조체가 상피 세포에 들어갔으며, 정점 및 기저 구획에 도달하였고, 세포의 핵상 영역에도 도달하였지만, 여전히 상피 세포 내부에 남아있음을 나타내며, 이는 서열번호: 1의 아미노산 잔기 152-187로 이루어진 서열 단편이 핵상 영역에 대한 접근 및 전달을 허용할 수 있을뿐만 아니라, 기저 구획에서 국소화를 허용할 수 있음을 시사한다.
도 12d는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 137)를 포함하는 전달 구조체 (서열번호: 154)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12d는 이 구조체가 상피 세포에 들어갔으나, 정점 구획에 남아있었고, 기저 또는 핵상 구획에 도달하지 않는 것으로 나타났음을 나타낸다.
도 12e는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 131)를 포함하는 전달 구조체 (서열번호: 155)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12e는 이 구조체가 고유판에 도달하는 전달 구조체에 의해 나타낸 바와 같이 통과세포외배출 과정을 완료하였음을 나타내며 (열린 화살표 참조), 이는 서열번호: 1에 제시된 서열의 아미노산 잔기 188-206으로 이루어진 서열 단편이 담체 (및 이러한 담체를 포함하는 구조체)가 상피 세포에서 기저측 구획 (예를 들어, 고유판)으로 담체 또는 각각의 구조체의 방출을 허용하는 기저 재순환 과정에 관여할 수 있게 함을 시사한다.
도 12f는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강내 주사 후 15분에 in vivo에서 랫트 공장 상피 단층을 가로지르는 수송을 나타낸다. 도 12f는 이 구조체가 고유판에 도달하는 전달 구조체에 의해 나타낸 바와 같이 통과세포외배출 과정을 완료하였음을 나타낸다 (열린 화살표 참조).
도 13a, 도 13b 및 도 13c는 각각 서열번호: 154, 서열번호: 152, 및 서열번호: 153의 전달 구조체가 상피 세포의 정점 측면에서 Rab11a와 공동-국소화됨을 나타낸다. 또한, 자료는 서열번호: 152 및 서열번호: 154의 구조체가 기저 측면에서 상당히 국소화되지 않았으나, 주로 정점 측면에 남아있었음을 나타낸다. 서열번호: 153의 구조체는 정점 및 기저 측면 둘 다에서 국소화되었으나, 기저 측면이 아닌 정점 측면에서만 Rab11a와 공동-국소화되었다 (도 13c의 하위-영상(sub-images) 3a 및 3b). 종합하면, 이러한 결과는 통과세포외배출할 수 없는 담체가 상피 세포의 정점 재순환 시스템에 들어갈 수 있음을 시사한다. 내강내 주사 후 15분에 측정을 수행하였다. 녹색 형광은 hGH의 국소화를 나타내며, 적색 형광은 Rab11a (또는 Rab11)의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다 (실험 설명은 도 13d를 포함한다).
도 13d는 서열번호: 159의 전달 구조체가 편광 상피 세포의 기저 측면에서 Rab11a와 공동-국소화되었으나, 정점 측면에서는 상당히 공동-국소화되지 않았음을 나타낸다. 이는 통과세포외배출할 수 있는 담체가 상피 세포로부터 고유판으로 이의 방출을 위해 기저 재순환 시스템을 이용할 수 있음을 시사한다 (도 13d의 하위-영상 4a 및 4b 참조).
도 14a-14c는 hGH 단독 (서열번호: 190)에 비해, 서열이 서열번호: 177에 제시된 스페이서를 통해 hGH에 결합된 서열번호: 134에 제시된 서열을 갖는 콜릭스 유래 담체를 포함하는 서열번호: 150의 전달 구조체의 통과세포외배출 기능에 대한 K8, HSPG (페를레칸) 및 GRP75 각각의 녹아웃 효과를 나타낸다. 특정 후보 단백질 K8 (Caco-2K8-), HSPG (Caco-2HSPG-), 및 GRP75 (Caco-2GRP75-)의 발현이 결여된 Caco-2 세포의 안정된 세포주를 in vitro에서 단층으로 사용하여, 활성 및 선택적 내인성 수송 메커니즘을 통해 담체 (예를 들어, 콜릭스 담체) 통과세포외배출에 이들의 관여를 확인하였다.
도 14a는 K8 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시키지 않았음을 나타낸다.
도 14b는 HSPG (페를레칸) 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시켰음을 나타낸다.
도 14c는 GRP75 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시켰음을 나타낸다.
도 15a는 콜릭스 담체-GRP75 상호작용의 pH-의존성을 확인하기 위해 사용된 Biacore™ 결합 상호작용을 나타낸다. 이를 위해, 비오틴을 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질의 C-말단에 결합하였으며, 이어서 비오틴-스트렙타비딘 생체접합을 이용하여 표면 (예를 들어, 칩 표면, 플라스틱 96-웰 플레이트 등)에 부착하였고, 각각 pH 5.5, 6.5 및 7.5의 완충 용액에서 정제된 GRP75 단백질과 함께 배양하였다. 이 상호작용에 대한 가장 높은 결합 친화도는 pH 6.5에서 측정되었다.
도 15b는 콜릭스-유래 담체 (서열번호: 189, 위치 581에서 글루탐산 잔기가 결실된 서열번호: 1의 전장 콜릭스 서열)와 정점 수용체 (예를 들어, TMEM132A와 같은 TMEM132), 리소좀 회피(avoidance) 수용체 (예를 들어, GRP75), 트래픽 수용체 (예를 들어, ERGIC-53), 및 기저 수용체 (예를 들어, 페를레칸)의 상호작용의 pH-의존성을 나타낸다. 플라즈몬 공명 분석에서 결정된 수용체 상호작용의 이 pH 의존성은 콜릭스-유래 담체가 그 위치에 따라 순차적으로 특정 수용체와 상호작용할 수 있음을 나타낸다. 예를 들어, 이러한 자료는 콜릭스-유래 담체가 pH 7.5에서 세포내이입, 및 정점 진입 수용체 및 리소좀 회피 수용체와 같은 초기 트래피킹 수용체에 대해 상당히 높은 친화도를 가짐을 나타낸다. 일단 pH가 약 5.5로 떨어지면, 이러한 초기 트래피킹 수용체에 대한 콜릭스 담체의 친화도는 감소하는 반면, 정점-기저 트래피킹 수용체 ERGIC-53 및 기저 방출 단백질 페를레칸에 대한 이의 친화도는 그 pH에서 상당히 증가하여, 콜릭스 담체가 소포성 통과세포외배출 과정 동안 트래피킹 및 기저 방출 수용체로 "전달"될 수 있도록 한다.
도 16은 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질과 페를레칸 및 GRP75의 상당한 Biacore™ 결합 상호작용을 나타낸다.
도 17은 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질과 GRP75, 페를레칸 및 TMEM132A의 상당한 Biacore™ 결합 상호작용을 나타낸다.
도 18a-18d는 in vivo에서 랫트 공장으로 내강내 주사 (ILI, 내강 표면은 도 18a-도 18f에서 백색 화살표로 나타냄)에 의해 투여된 인간 성장 호르몬 (hGH, 서열번호: 190)의 운명이 세포 흡수 후 리소좀으로의 수송을 기대하는 음성 대조군으로 먼저 평가되었음을 나타낸다.
도 18a는 주사 (ILI) 후 15분에 hGH (서열번호: 190)의 국소화가 녹색 면역형광 검출에 의해 나타낸 바와 같이 상피 세포의 정점 영역 내 소포(vesicles)의 소집단으로 제한되었음을 나타낸다.
도 18b, 도 18c, 및 도 18d는 ILI 후 15분에, hGH (서열번호: 190)가 내재하는(resident) LAMP1+, Rab7+ 리소좀과 거의 동일한 빈도 및 특성으로 (도 18d), 리소좀-관련 막 단백질 1 (LAMP1, 적색 형광) (도 18b) 및 Ras-관련 단백질 (Rab7, 자주색 형광) (도 18c)과 공동-국소화되었음을 나타내며, 이는 hGH가 상피 세포로 흡수된 직후 리소좀 파괴 (예를 들어, 재순환) 경로로 유도되었음을 나타낸다.
도 18e 및 도 18f는 스페이서 (서열번호: 175)를 통해 hGH (서열번호: 146)에 결합된 콜릭스 유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)가 리소좀 경로로부터 멀어졌으므로, LAMP1 (도 18e) 또는 Rab7 (도 18f)과 공동-국소화를 나타내지 않았으며, 이에 의해 편광 상피 세포를 가로질러 고유판으로 기능적 페이로드의 통과세포외배출을 가능하게 함을 나타낸다.
도 19a는 스페이서 (서열번호: 175)를 통해 hGH (서열번호: 146)에 결합된 콜릭스 유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 전에, 코팅 단백질 I (COPI, 적색 형광) 분포가 상피 세포의 내강 정점 막 및 정점 소포성 구획으로 제한되었음을 나타낸다. 이에 비해, 전달 구조체 (서열번호: 159)의 정점 내강내 주사 (ILI, 내강 표면은 도 19a-도 19d에서 백색 화살표로 나타냄) 후에, 도 19b는 COPI가 핵상 위치로 재분포되었음을 나타내며, 이는 서열번호: 159의 전달 구조체 및 COPI 둘 다를 함유하는 소포의 공동-국소화를 나타낸다. 청색 형광은 DAPI 염색을 나타낸다. ILI 후 15분에, 도 19a-19d의 측정을 수행하였다.
도 19c는 전달 구조체 (서열번호: 159)의 주사 전에, LMAN1 (녹색 형광)이 편광 상피 세포의 정점 영역 (백색 화살표로 강조됨)에서 COPI (적색 형광)와 공동-국소화되었음을 나타낸다.
도 19d는 전달 구조체 (서열번호: 159)의 정점 ILI (백색 화살표로 강조됨) 후에, LMAN1이 전달 구조체와 상호작용하여 고유판 ("l-p"로 나타냄)에 인접한 상피 세포의 기저 영역으로 분포하였음을 나타낸다. 따라서, LMAN1 재분포 메커니즘은 상피 세포의 정점 측면에서 기저 구획으로 이동하기 위해 콜릭스 담체에 의해 사용되는 것으로 보인다.
도 19e-19h는 랫트 공장에서 hGH (서열번호: 146)에 결합된 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 후 5분 (도 19f), 10분 (도 19g), 및 15분 (도 19h)에 상피 세포의 정점 구획 (백색 화살표 #1으로 나타냄)에서 기저 구획 (백색 화살표 #2로 나타냄)으로의 콜릭스 담체 (서열번호: 134)의 트래피킹을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, ERGIC 수용체 국소화는 적색 형광으로 나타내고, 정점에서 기저 트래피킹 (본 명세서에서 ER-골지 트래피킹 단백질 복합체라고도 함)에서 역할을 할 수 있는 ERGIC의 다른 마커의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 ER-골지 트래피킹 단백질 복합체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, ERGIC 수용체 및 ER-골지 트래피킹 단백질 복합체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩(overlay))으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 19e는 미처리된 편광 장 상피 세포를 나타낸다.
도 19f는 정점 구획에서 분홍색 형광 신호로 나타낸 바와 같이 정점 구획에서 내강 주사 후 5분에 콜릭스 담체 (서열번호: 134)와 ER-골지 트래피킹 단백질 복합체의 국소화 및 상호작용을 나타낸다.
도 19g는 내강 주사 후 10분에 기저막으로 ERGIG-53과 결합된 콜릭스 담체 (서열번호: 134)의 트래피킹에 이어 고유판 (금색 화살표)으로 담체 (및 구조체)의 기저 방출을 나타낸다. 이러한 자료는 콜릭스-유래 담체가 ERGIC 단백질 (예를 들어, ERGIC-53)과의 특이적 상호작용을 이용하여 편광 상피 세포의 정점 구획에서 기저 구획으로 소포성 트래피킹을 "강탈(hijack)"할 수 있음을 나타낸다.
도 19h는 내강 주사 후 15분에 고유판에 존재하는 콜릭스 담체 (서열번호: 134)의 증가된 양을 나타낸다.
도 19i-19k는 콜릭스 담체 (서열번호: 134)가 기저 단백질 분비 메커니즘을 이용하여 편광 상피 세포를 통해 고유판으로 이동하였음을 나타낸다. 랫트 공장에서 hGH (서열번호: 146)에 결합된 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 후 15분에 형광 현미경 영상을 얻었으며, 이는 기저 소포 (상이한 상피 세포에서 백색 원과 숫자 "1-3"으로 강조됨)가 콜릭스 담체 및 ERGIC-53 수용체, 콜릭스 담체 및 기저 분비 단백질, 또는 콜릭스 담체, ERGIC 수용체 및 기저 분비 단백질의 3개 모두를 함유할 수 있음을 나타낸다. 콜릭스 담체 국소화는 (항-콜릭스 담체 항체를 이용하여) 녹색 형광으로 나타내며, ERGIC-53 수용체 국소화는 적색 형광으로 나타내고, 기저 분비 단백질의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC-53 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 기저 분비 단백질 페를레칸의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, ERGIC-53 수용체 및 페를레칸의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 19i는 황색 형광으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134) 및 ERGIC-53 수용체를 함유하였음을 나타낸다.
도 19j는 분홍색 형광으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134) 및 페를레칸을 함유하였음을 나타낸다.
도 19k는 백색 반점 (예를 들어, 녹색, 적색 및 자주색 형광의 중첩)으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134), ERGIC-53 수용체 및 페를레칸을 함유하였음을 나타낸다.
도 20a는 전달 구조체 (서열번호: 159)의 부재 하에, 또 다른 소포체-골지-중간 구획 (endoplasmic reticulum-Golgi-intermediate compartment, ERGIC) 요소인 SEC22b의 분포를 나타낸다. 미처리된 (즉, 전달 구조체의 주입 없음) 조직에서, SEC22b 및 LMAN1은 정점 구획에서 광범위하게 공동-국소화되는 반면, LMAN1 단독은 정점 원형질막 가까이에서 별도로 관찰되었다. 도 20a-20d에서, 적색 형광은 LMAN1의 국소화를 나타내며, 자주색 형광은 SEC22b의 국소화를 나타내고, 녹색 형광은 hGH의 국소화를 나타내며, 백색 화살표는 정점 표면을 나타내고, "G"는 배상 세포를 나타낸다.
도 20b는 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 ILI 후 5분에, LMAN1, SEC22b, 및 hGH는 상피 세포의 정점 구획에서 공동-국소화되었으나, 상피 세포의 기저 구획에서는 상당히 공동-국소화되지 않았음을 나타낸다.
도 20c는 ILI 후 10분에, 전달 구조체 (서열번호: 159) 및 LMAN1이 SEC22b 없이 상피 세포의 기저 구획에서 공동-국소화되는 것으로 관찰되었음을 나타내며, 이는 LMAN1이 상피 세포의 정점에서 기저 소포성 구획으로 소포 내부의 전달 구조체와 상호작용하고 이동하였음을 확인한다.
도 20d는 ILI 후 15분에, 기저 구획에서 공동-국소화하는 전달 구조체 (서열번호: 159) 및 LMAN1의 정도가 증가하였으며, 증가하는 양의 hGH가 시간이 지남에 따라 고유판에 도달함을 나타낸다.
도 20e-도 20h는 도 20a-도 20d에서 상기 기재되고 나타낸 것과 동일한 조직 부문을 나타내나, LMAN1 및 SEC22b 신호만을 나타낸다 (hGH 신호 없음). 이는 전달 구조체 (서열번호: 159)의 정점 적용에 대한 반응으로 SEC22b의 재분포없이 기저 구획으로 LMAN1의 완전한 재분포를 나타낸다. 이러한 자료는 콜릭스 유래 담체를 포함하는 전달 구조체가 페이로드를 담체에 결합함으로써 장 상피를 가로질러 페이로드의 빠르고 효율적인 수송을 허용하는 내인성 콜릭스 트래피킹 경로를 이용할 수 있음을 나타낸다.
도 21a-21e는 단백질 표면에서 이들의 상대적 위치 및 근접성뿐만 아니라, 정점에서 기저로의 통과세포외배출과 관련된 특정 기능에서 역할을 할 수 있는 선택된 관심 영역을 강조하는데 사용된 서열번호: 178 (서열번호: 1의 아미노산 잔기 1-265 및 N-말단 메티오닌을 포함)로 이루어진 콜릭스 유래 담체의 예시적인 표면 모델을 나타낸다. 잔기 V1 및 E39 내에 위치한 아미노산 영역은 표면 노출된 아미노산 D150-K186 및 K186-L205에 인접해 있다. 구체적으로, L17-I25 (영역 X1, 서열번호: 160) 및 T170-I176 (영역 X2, 서열번호: 161)은 여러 개의 음전하로 둘러싸인 주머니를 형성하도록 조정된다. 유사하게, K186-H202 (영역 X3, 서열번호: 162)는 I31-E39 (영역 X4, 서열번호: 163)와 조정하여 연속 능선(ridge) 구조를 형성한다. 또한, 표면 모델은 잔기 D135-N139 (영역 X5, 서열번호: 164), 및 자주색으로 강조된 아스파라긴 잔기 (예를 들어, 잠재적 당화 부위)를 나타낸다.
도 21a는 서열번호: 178의 콜릭스 폴리펩티드의 아미노산 서열을 나타낸다.
도 21b는 영역 X1, X3 및 X4의 위치를 나타낸다.
도 21c는 영역 X1 및 X2, 및 X3 및 X4의 위치를 나타낸다.
도 21d는 영역 X1, X2, X4 및 X5의 위치를 나타낸다.
도 21e는 영역 X1, X2, X3, X4 및 X5의 위치를 나타낸다.
도 22a-22l은 유도된 전달 구조체 (서열번호: 149)에 대한 트래피킹 경로 분석을 나타낸다. 전달 구조체는 글리신-세린 스페이서 (서열번호: 176)를 통해 활성 분비 형태의 IL-10 (서열번호: 145)에 결합된 콜릭스 유래 담체 (서열번호: 135)를 포함하였다. 도 22a-22l에서, 백색 화살표 #1은 정점 표면을 강조하며, 백색 화살표 #2는 기저 표면을 강조하고, 백색 화살표 #3은 고유판을 강조한다.
도 22a는 전달 구조체 (서열번호: 149)가 상피 세포의 정점 구획 및 기저 구획 둘 다에서 트래피킹과 일치하는 세포 위치에서 EEA1 항원과 강하게 공동-국소화되었음을 나타내며, 이는 초기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다. 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다.
도 22b는 전달 구조체 (서열번호: 149)가 주로 상피 세포의 정점 구획에서 Rab7 (왼쪽 상단)과 강하게 공동-국소화되었으나, 고유판 내의 세포에서 제한된 공동-국소화만 있음을 나타내며, 이는 후기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다 (왼쪽 하단은 백색광 영상을 나타내며, 오른쪽 하단은 청색으로 나타낸 DAPI 염색과 병합된 염색을 나타내고, 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다).
도 22c는 LAMP1이 전달 구조체 (서열번호: 149)가 없는 성숙 리소좀과 일치하는 크고 특정한 소포에서 확인되었음을 나타낸다 (백색 화살표, 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다). 그러나, 전달 구조체 (서열번호: 149)는 상피 세포의 정점 구획 및 기저 구획 둘 다에서 소포 트래피킹과 일치하는, 리소좀-유사 구조 이외의 세포 위치에서 LAMP1 항원과 공동-국소화되었으며, 이는 후기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다.
도 22d는 전달 구조체 (서열번호: 149)도 특히 핵에 인접한 영역에서 클라트린-코팅된 소포, 및 고유판 내의 선택된 세포에서 뿐만 아니라 상피 세포의 기저 구획에서 주로 Rab11a와 강하게 공동-국소화되었음을 나타낸다. DAPI 염색은 청색 으로 나타내며, 적색 형광은 IL-10 항원의 국소화를 나타내고, 녹색 형광은 클라트린의 국소화를 나타낸다.
도 22e는 전달 구조체 (서열번호: 149)가 상피 세포에서 핵에 인접한 패턴으로 및 고유판 내의 대부분의 세포에서 칼넥신에 의해 나타낸 바와 같이 소포체와 공동-국소화되었음을 나타낸다 (적색 형광은 칼넥신의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다). 구체적으로, 주사 후 5분 (도 22f), 10분 (도 22g), 및 15분 (도 22h)에 나타낸 바와 같이, 전달 구조체 (서열번호: 149)는 담체 세포내이입 및 통과세포외배출에 대한 반응으로 재-분포되는 것으로 나타난 소포체 골지 중간 구획 (ERGIC) 및 LAMN1 항원과 강하게 공동-국소화되었다.
도 22f는 주사 후 5분에 나타낸 바와 같이, 전달 구조체 (서열번호: 149)가 담체 세포내이입 및 통과세포외배출에 대한 반응으로 재-분포되는 것으로 나타난 소포체 골지 중간 구획 53 (ERGIC-53) 및 LAMN1 항원과 강하게 공동-국소화되었음을 나타낸다 (적색 형광은 ERGIC-53 및 LMAN1의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다).
도 22g는 주사 후 10분에, 전달 구조체 (서열번호: 149)가 LMAN1 항원과 공동-국소화되었음을 나타낸다. 자료는 고유판에서 전달 구조체 (서열번호: 149)의 상당한 국소화를 나타낸다.
도 22h는 주사 후 15분에, 전달 구조체 (서열번호: 149)가 LMAN1 항원과 공동-국소화되었음을 나타낸다. 자료는 고유판에서 전달 구조체 (서열번호: 149)의 상당한 국소화를 나타낸다.
도 22i는 전달 구조체 (서열번호: 149)가 상피 세포에 존재하는 낮은 수준의 기안틴(giantin)과 공동-국소화되지 않았음을 나타낸다 (적색 형광은 IL-10의 국소화를 나타내며, 녹색 형광은 기안틴의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다). 일부 기안틴은 고유판에 존재하는 세포의 하위집합(subset)에서 구조체와 공동-국소화되었으며, 이는 콜릭스 유래 담체가 골지 구획과 국소화되지 않음을 시사한다.
도 22j는 58K 항원이 핵의 정점 부위에서의 상피 세포에서 국소화되었으며, 전달 구조체 (서열번호: 149)가 이 구획을 통한 짧은 이동을 제안하는 방식으로 이 단백질과 일부 공동-국소화 (적색 형광은 IL-10의 국소화를 나타내며, 녹색 형광은 58K 골지 항원의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타냄)를 나타내었음을 나타낸다. 고유판 내의 세포에서는 58K 항원이 관찰되지 않았다.
도 22k는 전달 구조체 (서열번호: 149, 왼쪽 상단, IL-10 국소화)가 TGN38 항원 (오른쪽 상단)과 일정 수준의 공동-국소화를 나타내었으며, 이는 상피 세포에서 핵의 정점 측면으로 제한되고 고유판 내의 몇몇 세포에서 핵에 인접한 세포 분포를 나타내었음을 나타낸다. 왼쪽 하단 영상은 백색광 영상을 나타내며, 오른쪽 하단은 IL-10 (적색), TGN38 (녹색), 및 DAPI 신호 (청색 형광)와의 병합 (중첩)을 나타낸다.
도 22l은 전달 구조체 (서열번호: 149) (녹색 형광으로 나타낸 IL-10 국소화, 오른쪽 상단)가 주로 상피 세포의 기저 구획 및 고유판 내의 선택된 세포에서 Rab11a (왼쪽 상단, 적색 형광으로 나타낸 국소화)와 강하게 공동-국소화되었음을 나타낸다. 왼쪽 하단 영상은 백색광 영상을 나타내며, 오른쪽 하단은 IL-10 (녹색), Rab11a (적색), 및 DAPI 신호 (청색 형광)와의 병합 (중첩)을 나타낸다.
도 23a-23c는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후에, 다양한 시점에서 비스타(Wistar) 랫트의 편광 장 상피 세포를 가로질러 IL-10의 통과세포외배출을 나타내는 현미경 영상을 나타낸다. 전달 구조체 (서열번호: 149)는 서열번호: 176에 제시된 아미노산 서열을 갖는 스페이서를 통해 서열번호: 145에 제시된 아미노산 서열을 갖는 IL-10 페이로드에 결합된 서열번호: 135의 담체를 포함하였다. 녹색 형광은 IL-10의 존재를 나타낸다 (항-IL-10 항체로 염색을 통해). 청색 형광은 DNA를 표지하는 DAPI 염색을 나타내며, 적색 형광은 콜릭스-유래 담체가 통과세포외배출 동안 (예를 들어, 상피 세포의 핵상 영역에서) 공동-국소화할 수 있는 CK-8 (시토케라틴(cytokeratin)-8)의 존재를 나타낸다. 백색 화살표 #1은 상피 세포의 정점 막을 강조하며, 백색 화살표 #2는 상피 세포의 기저막을 강조한다.
도 23a는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 1분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 정점에서 기저 부위로 및 고유판으로의 IL-10 페이로드의 수송이 전달 구조체의 적용 후 빠르면 1분에 발생하였음을 나타낸다. 백색 화살표 #3은 고유판에서 IL-10의 존재를 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23b는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 5분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 전달 구조체의 내강 적용 후 5분에 고유판에 존재하는 수송된 IL-10의 증가된 양을 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23c는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 10분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 전달 구조체의 내강 적용 후 10분에 고유판에 존재하는 수송된 IL-10 페이로드의 훨씬 더 많은 양을 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23d-23f는 랫트 공장에서 IL-10 (서열번호: 145)에 결합된 서열번호: 135의 콜릭스 담체를 포함하는 전달 구조체 (서열번호: 149)의 내강 주사 후 1분에, 상피 세포에서 서열번호: 135의 콜릭스 담체의 정점 세포내이입 및 초기 트래피킹을 나타낸다. 자료는 콜릭스-유래 담체가 리소좀 회피 수용체와 상호작용함으로써 리소좀 파괴 경로를 피한다는 것을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, 정점 진입 수용체 TMEM132 국소화는 적색 형광으로 나타내고, 리소좀 회피 수용체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 정점 진입 수용체 TMEM132의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 리소좀 회피 수용체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, 정점 진입 수용체 TMEM132 및 리소좀 회피 수용체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 23d는 편광 상피 세포의 정점 막 (백색 화살표 #1로 나타냄)에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 기저막은 백색 화살표 #2로 나타내며, 고유판은 백색 화살표 #3으로 나타낸다.
도 23e는 정점 막에서 및 그 주위에서 황색 형광으로 나타낸 바와 같이, 콜릭스 담체 (서열번호: 135)와 정점 진입 수용체 TMEM132의 상호작용을 나타낸다.
도 23f는 콜릭스 담체 (서열번호: 135), 정점 진입 수용체 TMEM132, 및 리소좀 회피 수용체가 백색 화살표로 나타낸 백색 반점 (예를 들어, 녹색, 적색 및 자주색 형광의 중첩)으로 나타낸 바와 같이 정점 막에서 매우 근접해 있음을 나타낸다. 예를 들어, 도 15b에 나타낸 바와 같이, 이들 콜릭스 담체-수용체 상호작용의 pH 환경 및 pH-의존성의 변화로 인해, 리소좀 회피 수용체 (GRP75)는 콜릭스 담체-정점 진입 수용체 복합체에 접근할 수 있으며, 이어서 콜릭스 담체와 정점 진입 수용체 TMEM132의 해리 및 콜릭스 담체와 리소좀 회피 수용체 GRP75의 결합이 뒤따를 수 있다고 가정한다.
도 23g-23h는 랫트 공장에서 IL-10 (서열번호: 145)에 결합된 콜릭스-유래 담체 (서열번호: 135)를 포함하는 전달 구조체 (서열번호: 149)의 내강 주사 후 5분 및 15분에, 상피 세포에서 정점에서 핵상 구획으로의 콜릭스 담체 (서열번호: 135)의 트래피킹을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, ERGIC 수용체 국소화는 적색 형광으로 나타내고, 정점 진입 수용체 (예를 들어, TMEM132) 국소화는 주황색 형광으로 나타내며, 리소좀 회피 수용체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 리소좀 회피 수용체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, 정점 진입 수용체 및 리소좀 회피 수용체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 23g는 전달 구조체 (서열번호: 149)의 내강 주사 후 5분에, 편광 장 상피 세포에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 자료는 정점 수용체-매개 세포내이입 후에, 콜릭스 담체가 리소좀 회피 수용체 및 정점 막에 가까운 정점 진입 수용체와 복합체를 형성하며 (백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타내며, 백색 화살표로 강조됨), 또한 세포 내의 핵상 영역에 약간 더 가까운 황색 형광 (및 황색 화살표)으로 나타낸 바와 같이 ERGIC 수용체와 상호작용을 시작함을 나타낸다.
도 23h는 전달 구조체 (서열번호: 149)의 내강 주사 후 15분에, 편광 장 상피 세포에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 자료는 담체가 ERGIC (황색 화살표 참조)와 결합되는 동안 정점에서 핵상 구획으로 이동하였으며, 여기서 황색 형광 강도는 주사 후 5분에 비해 증가하였음을 나타내고, 이는 시간이 지남에 따라 정점에서 핵상 영역으로 콜릭스 담체 이동이 증가하였음을 나타낸다. 자료는 기저막 및 고유판 (금색 화살표)에서 콜릭스 담체의 국소화를 더 나타낸다.
도 24는 본 명세서에 기재된 담체의 정점에서 기저로의 통과세포외배출에 관여하는 세포내 구획 요소 (예를 들어, 세포 영역, 구획 및 담체의 수송 수용체 상호작용 파트너 (또는 TRIPs)와 같은 수용체)의 도표를 나타낸다. 통과세포외배출 과정은 15분 시간 경과 동안 개략적으로 기재된다. 예를 들어, 통과세포외배출할 수 있는 콜릭스 유래 담체는 (예를 들어, 엔도좀 또는 "RE"를 재순환하여 나타낸 바와 같이) 세포내이입 후에 리소좀 또는 정점 재순환 경로(들)에 들어가지 않을 수도 있거나 또는 상당히 들어가지 않을 수도 있다. 콜릭스 유래 담체의 정점 적용 및 기저 구획 재순환 경로(들)에 대한 접근 후에, COPI 및 LMAN1의 재분포 (SEC22b 제외)는 콜릭스 유래 담체의 경로 특성으로 나타낸다. 따라서, 본 명세서에 기재된 콜릭스 유래 담체는 일련의 세포내 소포성 구획을 이용하여 정점에서 기저로의 통과세포외배출로 최고조에 달할 수 있는 편광 장 상피 세포를 통해 수송할 수 있으며, 이러한 담체가 빠르게 효율적으로 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 고유판으로 페이로드 (예를 들어, 치료용 단백질)를 왕복할 수 있도록 한다.
도 25는 Cholix386 유래 담체 (예를 들어, 서열번호: 135 또는 180) 및 Cholix415 유래 담체 (예를 들어, 서열번호: 1의 잔기 1-415 포함) 둘 다 10분 및 40분에 장 상피 세포를 가로질러 항-TNFα 제제 (예를 들어, 항-TNFα 항체 또는 이의 기능적 단편)를 수송함을 나타낸다. 또한, Cholix386-항-TNFα 구조체는 항-TNF-α 단독의 약 12× 속도로 수송하고, Cholix415-항-TNFα는 항-TNF-α 단독의 ~7× 속도로 수송한다.
도 26은 쿠마씨 블루(Coomassie Blue)-염색된 SDS-PAGE 겔 상에서 수행된 서열번호: 192-엑세나티드(Exenatide) (엑세나티드에 가교결합된 서열번호: 192 (서열번호: 195))의 순도를 나타낸다.
도 27은 스프라그 돌리(Sprague Dawley) 랫트의 공장을 가로질러 담체 서열번호: 191 또는 서열번호: 192에 가교결합된 엑세나티드의 in vivo 통과세포외배출을 나타낸다. 처리 후 10분 및 40분에, 장 조직을 가로질러 수송된 엑세나티드의 양 (pM)을 측정하였다. 자료는 서열번호: 191-엑세나티드 및 서열번호: 192-엑세나티드 둘 다 10분 및 40분에 엑세나티드 단독보다 더 높은 속도로 수송할 수 있음을 나타낸다.
도 28a는 서열번호: 175, 196 및 197의 스페이서의 아미노산 길이가 서열번호: 147, 198 및 199의 전달 구조체에 포함될 때 IL-22 (서열번호: 142)의 능력에 영향을 미치지 않고 IL-22 수용체 이량체화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22, 서열번호: 143)의 수용체 이량체화의 유도는 검은색 곡선으로 나타낸다.
도 28b는 서열번호: 196의 스페이서를 통해 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체의 N- 또는 C-말단에 IL-22 페이로드 (서열번호: 142)의 결합이 서열번호: 198, 200 및 201의 전달 구조체의 능력을 상당히 변화시키지 않고 IL-22 수용체 이량체화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22)의 수용체 이량체화의 유도는 검은색 곡선으로 나타낸다.
도 28c는 서열번호: 175, 196 및 197의 스페이서의 아미노산 길이가 서열번호: 147, 198 및 199의 전달 구조체에 포함될 때 IL-22 (서열번호: 142)의 능력에 영향을 미치지 않고 pSTAT3 활성화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22, 서열번호: 143)의 pSTAT3 활성화는 검은색 곡선으로 나타낸다.
도 28d는 서열번호: 196의 스페이서를 통해 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체의 N- 또는 C-말단에 IL-22 페이로드 (서열번호: 142)의 결합이 서열번호: 198, 200 및 201의 전달 구조체의 능력을 상당히 변화시키지 않고 pSTAT3 활성화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22)의 pSTAT3 활성화는 검은색 곡선으로 나타낸다.
도 1은 상피 세포 단층 위의 정점 챔버(apical chamber) 및 이러한 상피 세포 단층 아래의 기저 챔버(basal chamber)를 포함하는 장치를 개략적으로 나타낸다. 정점에서 기저측(basolateral) 투과도 (예를 들어, 통과세포외배출)의 경우, 시험 물품 (예를 들어, 담체, 전달 구조체, 페이로드 등)을 정점 (A) 측면에 적용하고, 투과된 (예를 들어, 통과세포외배출된) 물질의 양을 기저측 (B) 측면에서 (예를 들어, 웨스턴 블로팅, 크로마토그래피 등을 이용하여) 결정하였다.
도 2는 담체 (서열번호: 134) 및 IL-22 페이로드 (서열번호: 142)를 포함하는 서열번호: 147의 전달 구조체가 시간-의존적 방식으로 온전한 편광 Caco-2 장 상피 세포 단층을 가로질러 IL-22 페이로드를 수송하였음을 나타낸다 (도 1에서 상기 기재된 바와 같이, 기저측 부위의 단백질의 양은 전달 구조체를 단층의 정점 막에 적용한 후 15분, 30분 및 45분에 측정하였다). 자료는 서열번호: 134의 담체 및 서열번호: 142의 IL-22 페이로드를 포함하는 전달 구조체 (서열번호: 147)가 Caco-2 상피 세포에 적용될 때, 담체에 결합되지 않은 IL-22 (서열번호: 143)가 Caco-2 상피 세포에 적용된 경우에 비해 약 2-3 배 더 많은 IL-22가 Caco-2 상피 세포 단층을 통과하였음을 더 나타낸다.
도 3은 담체 (서열번호: 134) 및 IL-22 페이로드 (서열번호: 142)를 포함하는 서열번호: 147의 전달 구조체가 시간-의존적 방식으로 온전한 편광 SMI-100 장 상피 세포 단층을 가로질러 IL-22 페이로드를 수송하였음을 나타낸다 (기저측 챔버 내의 단백질의 양은 전달 구조체를 단층의 정점 막에 적용한 후 15분, 30분 및 45분에 측정하였다). 자료는 서열번호: 142의 IL-22 페이로드에 결합된 서열번호: 134의 담체를 포함하는 전달 구조체가 SMI-100 상피 세포에 적용될 때, 담체에 결합되지 않은 IL-22 (서열번호: 143)가 SMI-100 상피 세포에 적용된 경우에 비해 약 2-3 배 더 많은 IL-22가 SMI-100 상피 세포 단층을 통과하였음을 더 나타낸다.
도 4는 서열번호: 147의 전달 구조체가 in vivo에서 온전한 편광 장 상피를 가로질러 IL-22 (서열번호: 142)를 상당한 양으로 수송하였음을 나타낸다. 장 상피의 정점 부위는 백색 화살표 #1로 강조된다. 고유판(lamina propria)은 "l.p."로 약칭된다. 편광 상피의 외부 기저막은 백색 화살표 #2로 강조된다. IL-22 국소화는 백색 화살표 및 녹색 형광 (예를 들어, 백색 화살표 #3)으로 나타내고, 청색 형광은 DAPI 염색을 나타낸다.
도 5는 제 1 전달 구조체 (서열번호: 147) 및 제 2 전달 구조체 (서열번호: 148)가 Caco-2 단층을 가로질러 IL-22 페이로드를 수송하였음을 나타낸다 ("수송 후"는 Caco-2 단층을 가로질러 수송 후 기저측 구획에 위치한 단백질을 나타낸다). 웨스턴 블롯 자료는, 예를 들어 저분자량 분해 산물의 부재에 의해 나타난 바와 같이, 전달 구조체가 수송 후 온전하였음을 더 나타낸다. 전달 구조체 서열번호: 147 및 서열번호: 148를 사용한 IL-22 페이로드의 수송은 담체의 부재 하에 IL-22 대조군 단백질 (서열번호: 143)의 수송에 대하여 나타낸다. 대조군 단백질 IL-22는 서열번호: 143에 제시된 아미노산 서열로 이루어졌다.
도 6은 통과세포외배출 후에 Caco-2 상피 세포 단층의 기저측 구획에서 검출된 전달 구조체 (서열번호: 147) 및 IL-22 (서열번호: 143)의 양을 나타낸다. 단백질 양은 정규화되었다. 자료는 편광 상피 세포를 가로질러 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 147)의 수송이 글루코오스-조절 단백질 75 (GRP75, 예를 들어, GRP75B)에 의존적이었음을 나타낸다. GRP75의 녹다운을 갖는 Caco-2 세포 (Caco-2GRP75-로 나타냄)는 GRP75를 발현하는 세포 (Caco-2로 나타냄)에 비해 상당히 감소된 전달 구조체 (서열번호: 147)의 수송을 나타내었다. GRP75에 대한 수송의 의존은 GRP75를 발현하는 세포에 비해 GRP75 녹다운 세포의 기저측 구획에서 검출된 전달 구조체의 감소된 양으로 나타낸다. IL-22 (서열번호: 143) 단독의 수송은 GRP75 녹다운에 의해 영향을 받지 않았다.
도 7은 편광 상피 세포를 가로질러 전달 구조체 (서열번호: 147)의 수송이 기저막-특이적 헤파란 설페이트 프로테오글리칸 코어 단백질 (HSPG)에 의존적이었음을 나타낸다. 이 단백질의 녹다운을 갖는 Caco-2 세포 (Caco-2HSPG-로 나타냄)는 HSPG를 발현하는 세포 (Caco-2로 나타냄)에 비해 상당히 감소된 전달 구조체 (서열번호: 147)의 수송을 나타내었다. HSPG에 대한 수송의 의존은 HSPG를 발현하는 세포에 비해 HSPG 녹다운 세포의 기저측 구획에서 검출된 전달 구조체의 감소된 양으로 나타낸다. IL-22 (서열번호: 143) 단독 (즉, 담체에 결합되지 않음)의 수송은 HSPG에 의존적이지 않았다.
도 8은 랫트 내강내 주사 모델을 이용하여 내강내 주사 후 15분에 상피 세포 내의 정점 구획 (백색 화살표 #2로 강조됨)에서 전달 구조체 (서열번호: 154)의 형광 현미경 검출을 나타낸다 (백색 화살표 #1은 정점 표면을 강조하고, 백색 화살표 #3은 기저막을 강조하며, 백색 화살표 #4는 고유판을 강조한다). 자료는 Cholix41-187 (예를 들어, 서열번호: 137)의 예로부터 유래된 담체가 상피 세포의 정점 구획으로 페이로드를 수송할 수 있으나, 상피 세포를 가로질러 수송할 수 없음을 나타낸다. 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다.
도 9는 랫트 내강내 주사 모델을 이용하여 내강내 주사 후 15분에 상피 세포의 정점 구획 (백색 화살표 #2로 강조됨)에서 전달 구조체 (서열번호: 156)의 형광 현미경 검출을 나타낸다 (백색 화살표 #1은 정점 표면을 강조하고, 백색 화살표 #3은 기저막을 강조하며, 백색 화살표 #4는 고유판을 강조한다). 자료는 Cholix40-205 (예를 들어, 서열번호: 138)의 예로부터 유래된 담체가 상피 세포의 정점 구획으로 페이로드 (예를 들어, hGH)를 수송할 수 있으나, 상피 세포를 가로질러 고유판으로 수송할 수 없음을 나타낸다. 이들 자료는 서열번호: 1의 잔기 1-39가 통과세포외배출에서 역할을 할 수 있으나, 콜릭스 담체의 세포내이입에는 필요하지 않을 수 있음을 더 시사한다. 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다.
도 10a는 랫트 공장으로 전달 구조체의 내강내 주사 후 5분에 상피 세포 내부의 정점 구획에서 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 도 10a-10c에서, 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다: 백색 화살표 #1은 정점 구획을 강조하고, 백색 화살표 #2는 핵상 구획을 강조한다.
도 10b는 내강내 주사 후 10분에 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 자료는 담체가 시간이 지남에 따라 정점 구획에서 핵상 및 기저 구획으로 hGH 페이로드를 수송하였음을 나타낸다.
도 10c는 내강내 주사 후 15분에 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 자료는 담체가 시간이 지남에 따라 정점 구획에서 핵상 및 기저 구획으로 페이로드를 수송하였음을 나타낸다.
도 11a-11b는 담체에 결합된 hGH (서열번호: 146)에 비해 인간 성장 호르몬 (hGH, 서열번호: 190) 단독의 정점에서 기저로의 수송을 나타낸다. 담체 길이는 기준 서열번호: 1에 대한 C-말단 절단으로 나타낸다 (예를 들어, "134"는 서열번호: 1의 잔기 1-134를 갖는 담체를 나타낸다). 모든 담체는 N-말단 메티오닌을 더 포함하였다. hGH에 대한 웨스턴 블로팅은 2 h 후 in vitro에서 1차 인간 소장 상피 세포의 편광 단층을 가로질러 정점에서 기저로 수송하는 이들 단백질의 용량 (capacity)을 정성적으로 평가하였다. 정점에서-적용된 물질의 양은 hGH 함량에 대해 몰 기준으로 동등하였으며, 기저 수집물은 분석 전에 ~10배 농축시켰다.
도 11a는 각각 위치 134, 151, 187, 41-187, 및 266에서 절단이 있는 서열번호: 151 - 서열번호: 154 및 서열번호: 159에 제시된 서열을 갖는 전달 구조체에 대해 측정된 것에 대하여 hGH (서열번호: 190) 단독의 정점에서 기저로의 수송의 비교를 나타낸다. 자료는 서열번호: 1의 위치 134, 151, 187에서 C-말단 절단, 또는 서열번호: 1의 위치 41에서 N-말단 절단 및 위치 187에서 C-말단 절단이 있는 콜릭스 담체가 위치 266에서 C-말단 절단이 있는 콜릭스 담체 (서열번호: 159)를 갖는 구조체에 비해 결합된 hGH의 정점에서 기저로의 수송이 상당히 더 낮음을 나타내었음을 나타낸다.
도 11b는 서열번호: 1에 비해 각각 위치 206 (서열번호: 131), 245 (서열번호: 132), 251 (서열번호: 133), 및 266 (서열번호: 134)에서 C-말단 절단이 있는 콜릭스 담체를 포함하는 서열번호: 155 및 서열번호: 157 - 서열번호: 159의 전달 구조체가 결합된 hGH (서열번호: 146)의 효율적인 정점에서 기저로의 수송을 나타내었음을 나타낸다. 위치 245 및 251에서 콜릭스 C-말단 절단이 있는 담체는 위치 266에서 C-말단 절단이 있는 담체의 것과 비슷한 결합된 hGH (서열번호: 146)의 정점에서 기저로의 수송을 나타내었지만, 위치 206에서 콜릭스 C-말단 절단이 있는 담체는 위치 245, 251 및 266에서 C-말단 절단이 있는 담체에 비해 hGH의 정점에서 기저로의 수송의 상당한 향상을 나타내었다.
도 12a-12f는 각각 상이한 콜릭스 담체를 포함하는 6개의 전달 구조체의 랫트 공장에서 편광 장 상피 세포를 가로질러 정점에서 기저로의 수송 정도를 나타낸다. 콜릭스 담체 (적색 형광) 및 hGH (녹색 형광)의 국소화는 각각 다클론 항-콜릭스 및 단일클론 항-hGH 항체를 이용한 면역형광 현미경으로 나타낸다. 백색 화살표는 정점 막을 나타내고, "l-p"는 고유판을 나타내며, "GC"는 배상 세포(goblet cells)를 나타내고, 열린 화살표는 고유판에 존재하는 전달 구조체를 나타낸다.
도 12a는 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 140)를 포함하는 전달 구조체 (서열번호: 151)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12a는 담체가 전달 구조체가 상피 세포로 들어가는 것을 가능하게 하지 않았음을 나타내며, 이는 서열번호: 1의 아미노산 잔기 135-151을 갖는 기능적 서열 단편이 편광 상피 세포로의 세포내이입에서 역할을 할 수 있음을 시사한다 (반대로, 도 12b는 서열번호: 139의 담체가 세포내이입을 통해 각각의 전달 구조체의 세포 진입을 가능하게 함을 나타낸다).
도 12b는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 139)를 포함하는 전달 구조체 (서열번호: 152)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12b는 이 구조체가 상피 세포로 들어갔으나 (도 12a에 기재된 서열번호: 151의 구조체와는 대조적으로), 주로 정점에 남아있고, 어느 정도는 기저 소포성 풀(vesicular pools)에 남아있으나 고유판에는 들어가지 않았음을 나타내며, 이에 의해 상피 세포의 정점 및 기저 구획으로 페이로드의 전달을 가능하게 한다.
도 12c는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 136)를 포함하는 전달 구조체 (서열번호: 153)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12c는 이 구조체가 상피 세포에 들어갔으며, 정점 및 기저 구획에 도달하였고, 세포의 핵상 영역에도 도달하였지만, 여전히 상피 세포 내부에 남아있음을 나타내며, 이는 서열번호: 1의 아미노산 잔기 152-187로 이루어진 서열 단편이 핵상 영역에 대한 접근 및 전달을 허용할 수 있을뿐만 아니라, 기저 구획에서 국소화를 허용할 수 있음을 시사한다.
도 12d는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 137)를 포함하는 전달 구조체 (서열번호: 154)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12d는 이 구조체가 상피 세포에 들어갔으나, 정점 구획에 남아있었고, 기저 또는 핵상 구획에 도달하지 않는 것으로 나타났음을 나타낸다.
도 12e는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 131)를 포함하는 전달 구조체 (서열번호: 155)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12e는 이 구조체가 고유판에 도달하는 전달 구조체에 의해 나타낸 바와 같이 통과세포외배출 과정을 완료하였음을 나타내며 (열린 화살표 참조), 이는 서열번호: 1에 제시된 서열의 아미노산 잔기 188-206으로 이루어진 서열 단편이 담체 (및 이러한 담체를 포함하는 구조체)가 상피 세포에서 기저측 구획 (예를 들어, 고유판)으로 담체 또는 각각의 구조체의 방출을 허용하는 기저 재순환 과정에 관여할 수 있게 함을 시사한다.
도 12f는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강내 주사 후 15분에 in vivo에서 랫트 공장 상피 단층을 가로지르는 수송을 나타낸다. 도 12f는 이 구조체가 고유판에 도달하는 전달 구조체에 의해 나타낸 바와 같이 통과세포외배출 과정을 완료하였음을 나타낸다 (열린 화살표 참조).
도 13a, 도 13b 및 도 13c는 각각 서열번호: 154, 서열번호: 152, 및 서열번호: 153의 전달 구조체가 상피 세포의 정점 측면에서 Rab11a와 공동-국소화됨을 나타낸다. 또한, 자료는 서열번호: 152 및 서열번호: 154의 구조체가 기저 측면에서 상당히 국소화되지 않았으나, 주로 정점 측면에 남아있었음을 나타낸다. 서열번호: 153의 구조체는 정점 및 기저 측면 둘 다에서 국소화되었으나, 기저 측면이 아닌 정점 측면에서만 Rab11a와 공동-국소화되었다 (도 13c의 하위-영상(sub-images) 3a 및 3b). 종합하면, 이러한 결과는 통과세포외배출할 수 없는 담체가 상피 세포의 정점 재순환 시스템에 들어갈 수 있음을 시사한다. 내강내 주사 후 15분에 측정을 수행하였다. 녹색 형광은 hGH의 국소화를 나타내며, 적색 형광은 Rab11a (또는 Rab11)의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다 (실험 설명은 도 13d를 포함한다).
도 13d는 서열번호: 159의 전달 구조체가 편광 상피 세포의 기저 측면에서 Rab11a와 공동-국소화되었으나, 정점 측면에서는 상당히 공동-국소화되지 않았음을 나타낸다. 이는 통과세포외배출할 수 있는 담체가 상피 세포로부터 고유판으로 이의 방출을 위해 기저 재순환 시스템을 이용할 수 있음을 시사한다 (도 13d의 하위-영상 4a 및 4b 참조).
도 14a-14c는 hGH 단독 (서열번호: 190)에 비해, 서열이 서열번호: 177에 제시된 스페이서를 통해 hGH에 결합된 서열번호: 134에 제시된 서열을 갖는 콜릭스 유래 담체를 포함하는 서열번호: 150의 전달 구조체의 통과세포외배출 기능에 대한 K8, HSPG (페를레칸) 및 GRP75 각각의 녹아웃 효과를 나타낸다. 특정 후보 단백질 K8 (Caco-2K8-), HSPG (Caco-2HSPG-), 및 GRP75 (Caco-2GRP75-)의 발현이 결여된 Caco-2 세포의 안정된 세포주를 in vitro에서 단층으로 사용하여, 활성 및 선택적 내인성 수송 메커니즘을 통해 담체 (예를 들어, 콜릭스 담체) 통과세포외배출에 이들의 관여를 확인하였다.
도 14a는 K8 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시키지 않았음을 나타낸다.
도 14b는 HSPG (페를레칸) 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시켰음을 나타낸다.
도 14c는 GRP75 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시켰음을 나타낸다.
도 15a는 콜릭스 담체-GRP75 상호작용의 pH-의존성을 확인하기 위해 사용된 Biacore™ 결합 상호작용을 나타낸다. 이를 위해, 비오틴을 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질의 C-말단에 결합하였으며, 이어서 비오틴-스트렙타비딘 생체접합을 이용하여 표면 (예를 들어, 칩 표면, 플라스틱 96-웰 플레이트 등)에 부착하였고, 각각 pH 5.5, 6.5 및 7.5의 완충 용액에서 정제된 GRP75 단백질과 함께 배양하였다. 이 상호작용에 대한 가장 높은 결합 친화도는 pH 6.5에서 측정되었다.
도 15b는 콜릭스-유래 담체 (서열번호: 189, 위치 581에서 글루탐산 잔기가 결실된 서열번호: 1의 전장 콜릭스 서열)와 정점 수용체 (예를 들어, TMEM132A와 같은 TMEM132), 리소좀 회피(avoidance) 수용체 (예를 들어, GRP75), 트래픽 수용체 (예를 들어, ERGIC-53), 및 기저 수용체 (예를 들어, 페를레칸)의 상호작용의 pH-의존성을 나타낸다. 플라즈몬 공명 분석에서 결정된 수용체 상호작용의 이 pH 의존성은 콜릭스-유래 담체가 그 위치에 따라 순차적으로 특정 수용체와 상호작용할 수 있음을 나타낸다. 예를 들어, 이러한 자료는 콜릭스-유래 담체가 pH 7.5에서 세포내이입, 및 정점 진입 수용체 및 리소좀 회피 수용체와 같은 초기 트래피킹 수용체에 대해 상당히 높은 친화도를 가짐을 나타낸다. 일단 pH가 약 5.5로 떨어지면, 이러한 초기 트래피킹 수용체에 대한 콜릭스 담체의 친화도는 감소하는 반면, 정점-기저 트래피킹 수용체 ERGIC-53 및 기저 방출 단백질 페를레칸에 대한 이의 친화도는 그 pH에서 상당히 증가하여, 콜릭스 담체가 소포성 통과세포외배출 과정 동안 트래피킹 및 기저 방출 수용체로 "전달"될 수 있도록 한다.
도 16은 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질과 페를레칸 및 GRP75의 상당한 Biacore™ 결합 상호작용을 나타낸다.
도 17은 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질과 GRP75, 페를레칸 및 TMEM132A의 상당한 Biacore™ 결합 상호작용을 나타낸다.
도 18a-18d는 in vivo에서 랫트 공장으로 내강내 주사 (ILI, 내강 표면은 도 18a-도 18f에서 백색 화살표로 나타냄)에 의해 투여된 인간 성장 호르몬 (hGH, 서열번호: 190)의 운명이 세포 흡수 후 리소좀으로의 수송을 기대하는 음성 대조군으로 먼저 평가되었음을 나타낸다.
도 18a는 주사 (ILI) 후 15분에 hGH (서열번호: 190)의 국소화가 녹색 면역형광 검출에 의해 나타낸 바와 같이 상피 세포의 정점 영역 내 소포(vesicles)의 소집단으로 제한되었음을 나타낸다.
도 18b, 도 18c, 및 도 18d는 ILI 후 15분에, hGH (서열번호: 190)가 내재하는(resident) LAMP1+, Rab7+ 리소좀과 거의 동일한 빈도 및 특성으로 (도 18d), 리소좀-관련 막 단백질 1 (LAMP1, 적색 형광) (도 18b) 및 Ras-관련 단백질 (Rab7, 자주색 형광) (도 18c)과 공동-국소화되었음을 나타내며, 이는 hGH가 상피 세포로 흡수된 직후 리소좀 파괴 (예를 들어, 재순환) 경로로 유도되었음을 나타낸다.
도 18e 및 도 18f는 스페이서 (서열번호: 175)를 통해 hGH (서열번호: 146)에 결합된 콜릭스 유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)가 리소좀 경로로부터 멀어졌으므로, LAMP1 (도 18e) 또는 Rab7 (도 18f)과 공동-국소화를 나타내지 않았으며, 이에 의해 편광 상피 세포를 가로질러 고유판으로 기능적 페이로드의 통과세포외배출을 가능하게 함을 나타낸다.
도 19a는 스페이서 (서열번호: 175)를 통해 hGH (서열번호: 146)에 결합된 콜릭스 유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 전에, 코팅 단백질 I (COPI, 적색 형광) 분포가 상피 세포의 내강 정점 막 및 정점 소포성 구획으로 제한되었음을 나타낸다. 이에 비해, 전달 구조체 (서열번호: 159)의 정점 내강내 주사 (ILI, 내강 표면은 도 19a-도 19d에서 백색 화살표로 나타냄) 후에, 도 19b는 COPI가 핵상 위치로 재분포되었음을 나타내며, 이는 서열번호: 159의 전달 구조체 및 COPI 둘 다를 함유하는 소포의 공동-국소화를 나타낸다. 청색 형광은 DAPI 염색을 나타낸다. ILI 후 15분에, 도 19a-19d의 측정을 수행하였다.
도 19c는 전달 구조체 (서열번호: 159)의 주사 전에, LMAN1 (녹색 형광)이 편광 상피 세포의 정점 영역 (백색 화살표로 강조됨)에서 COPI (적색 형광)와 공동-국소화되었음을 나타낸다.
도 19d는 전달 구조체 (서열번호: 159)의 정점 ILI (백색 화살표로 강조됨) 후에, LMAN1이 전달 구조체와 상호작용하여 고유판 ("l-p"로 나타냄)에 인접한 상피 세포의 기저 영역으로 분포하였음을 나타낸다. 따라서, LMAN1 재분포 메커니즘은 상피 세포의 정점 측면에서 기저 구획으로 이동하기 위해 콜릭스 담체에 의해 사용되는 것으로 보인다.
도 19e-19h는 랫트 공장에서 hGH (서열번호: 146)에 결합된 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 후 5분 (도 19f), 10분 (도 19g), 및 15분 (도 19h)에 상피 세포의 정점 구획 (백색 화살표 #1으로 나타냄)에서 기저 구획 (백색 화살표 #2로 나타냄)으로의 콜릭스 담체 (서열번호: 134)의 트래피킹을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, ERGIC 수용체 국소화는 적색 형광으로 나타내고, 정점에서 기저 트래피킹 (본 명세서에서 ER-골지 트래피킹 단백질 복합체라고도 함)에서 역할을 할 수 있는 ERGIC의 다른 마커의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 ER-골지 트래피킹 단백질 복합체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, ERGIC 수용체 및 ER-골지 트래피킹 단백질 복합체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩(overlay))으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 19e는 미처리된 편광 장 상피 세포를 나타낸다.
도 19f는 정점 구획에서 분홍색 형광 신호로 나타낸 바와 같이 정점 구획에서 내강 주사 후 5분에 콜릭스 담체 (서열번호: 134)와 ER-골지 트래피킹 단백질 복합체의 국소화 및 상호작용을 나타낸다.
도 19g는 내강 주사 후 10분에 기저막으로 ERGIG-53과 결합된 콜릭스 담체 (서열번호: 134)의 트래피킹에 이어 고유판 (금색 화살표)으로 담체 (및 구조체)의 기저 방출을 나타낸다. 이러한 자료는 콜릭스-유래 담체가 ERGIC 단백질 (예를 들어, ERGIC-53)과의 특이적 상호작용을 이용하여 편광 상피 세포의 정점 구획에서 기저 구획으로 소포성 트래피킹을 "강탈(hijack)"할 수 있음을 나타낸다.
도 19h는 내강 주사 후 15분에 고유판에 존재하는 콜릭스 담체 (서열번호: 134)의 증가된 양을 나타낸다.
도 19i-19k는 콜릭스 담체 (서열번호: 134)가 기저 단백질 분비 메커니즘을 이용하여 편광 상피 세포를 통해 고유판으로 이동하였음을 나타낸다. 랫트 공장에서 hGH (서열번호: 146)에 결합된 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 후 15분에 형광 현미경 영상을 얻었으며, 이는 기저 소포 (상이한 상피 세포에서 백색 원과 숫자 "1-3"으로 강조됨)가 콜릭스 담체 및 ERGIC-53 수용체, 콜릭스 담체 및 기저 분비 단백질, 또는 콜릭스 담체, ERGIC 수용체 및 기저 분비 단백질의 3개 모두를 함유할 수 있음을 나타낸다. 콜릭스 담체 국소화는 (항-콜릭스 담체 항체를 이용하여) 녹색 형광으로 나타내며, ERGIC-53 수용체 국소화는 적색 형광으로 나타내고, 기저 분비 단백질의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC-53 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 기저 분비 단백질 페를레칸의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, ERGIC-53 수용체 및 페를레칸의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 19i는 황색 형광으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134) 및 ERGIC-53 수용체를 함유하였음을 나타낸다.
도 19j는 분홍색 형광으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134) 및 페를레칸을 함유하였음을 나타낸다.
도 19k는 백색 반점 (예를 들어, 녹색, 적색 및 자주색 형광의 중첩)으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134), ERGIC-53 수용체 및 페를레칸을 함유하였음을 나타낸다.
도 20a는 전달 구조체 (서열번호: 159)의 부재 하에, 또 다른 소포체-골지-중간 구획 (endoplasmic reticulum-Golgi-intermediate compartment, ERGIC) 요소인 SEC22b의 분포를 나타낸다. 미처리된 (즉, 전달 구조체의 주입 없음) 조직에서, SEC22b 및 LMAN1은 정점 구획에서 광범위하게 공동-국소화되는 반면, LMAN1 단독은 정점 원형질막 가까이에서 별도로 관찰되었다. 도 20a-20d에서, 적색 형광은 LMAN1의 국소화를 나타내며, 자주색 형광은 SEC22b의 국소화를 나타내고, 녹색 형광은 hGH의 국소화를 나타내며, 백색 화살표는 정점 표면을 나타내고, "G"는 배상 세포를 나타낸다.
도 20b는 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 ILI 후 5분에, LMAN1, SEC22b, 및 hGH는 상피 세포의 정점 구획에서 공동-국소화되었으나, 상피 세포의 기저 구획에서는 상당히 공동-국소화되지 않았음을 나타낸다.
도 20c는 ILI 후 10분에, 전달 구조체 (서열번호: 159) 및 LMAN1이 SEC22b 없이 상피 세포의 기저 구획에서 공동-국소화되는 것으로 관찰되었음을 나타내며, 이는 LMAN1이 상피 세포의 정점에서 기저 소포성 구획으로 소포 내부의 전달 구조체와 상호작용하고 이동하였음을 확인한다.
도 20d는 ILI 후 15분에, 기저 구획에서 공동-국소화하는 전달 구조체 (서열번호: 159) 및 LMAN1의 정도가 증가하였으며, 증가하는 양의 hGH가 시간이 지남에 따라 고유판에 도달함을 나타낸다.
도 20e-도 20h는 도 20a-도 20d에서 상기 기재되고 나타낸 것과 동일한 조직 부문을 나타내나, LMAN1 및 SEC22b 신호만을 나타낸다 (hGH 신호 없음). 이는 전달 구조체 (서열번호: 159)의 정점 적용에 대한 반응으로 SEC22b의 재분포없이 기저 구획으로 LMAN1의 완전한 재분포를 나타낸다. 이러한 자료는 콜릭스 유래 담체를 포함하는 전달 구조체가 페이로드를 담체에 결합함으로써 장 상피를 가로질러 페이로드의 빠르고 효율적인 수송을 허용하는 내인성 콜릭스 트래피킹 경로를 이용할 수 있음을 나타낸다.
도 21a-21e는 단백질 표면에서 이들의 상대적 위치 및 근접성뿐만 아니라, 정점에서 기저로의 통과세포외배출과 관련된 특정 기능에서 역할을 할 수 있는 선택된 관심 영역을 강조하는데 사용된 서열번호: 178 (서열번호: 1의 아미노산 잔기 1-265 및 N-말단 메티오닌을 포함)로 이루어진 콜릭스 유래 담체의 예시적인 표면 모델을 나타낸다. 잔기 V1 및 E39 내에 위치한 아미노산 영역은 표면 노출된 아미노산 D150-K186 및 K186-L205에 인접해 있다. 구체적으로, L17-I25 (영역 X1, 서열번호: 160) 및 T170-I176 (영역 X2, 서열번호: 161)은 여러 개의 음전하로 둘러싸인 주머니를 형성하도록 조정된다. 유사하게, K186-H202 (영역 X3, 서열번호: 162)는 I31-E39 (영역 X4, 서열번호: 163)와 조정하여 연속 능선(ridge) 구조를 형성한다. 또한, 표면 모델은 잔기 D135-N139 (영역 X5, 서열번호: 164), 및 자주색으로 강조된 아스파라긴 잔기 (예를 들어, 잠재적 당화 부위)를 나타낸다.
도 21a는 서열번호: 178의 콜릭스 폴리펩티드의 아미노산 서열을 나타낸다.
도 21b는 영역 X1, X3 및 X4의 위치를 나타낸다.
도 21c는 영역 X1 및 X2, 및 X3 및 X4의 위치를 나타낸다.
도 21d는 영역 X1, X2, X4 및 X5의 위치를 나타낸다.
도 21e는 영역 X1, X2, X3, X4 및 X5의 위치를 나타낸다.
도 22a-22l은 유도된 전달 구조체 (서열번호: 149)에 대한 트래피킹 경로 분석을 나타낸다. 전달 구조체는 글리신-세린 스페이서 (서열번호: 176)를 통해 활성 분비 형태의 IL-10 (서열번호: 145)에 결합된 콜릭스 유래 담체 (서열번호: 135)를 포함하였다. 도 22a-22l에서, 백색 화살표 #1은 정점 표면을 강조하며, 백색 화살표 #2는 기저 표면을 강조하고, 백색 화살표 #3은 고유판을 강조한다.
도 22a는 전달 구조체 (서열번호: 149)가 상피 세포의 정점 구획 및 기저 구획 둘 다에서 트래피킹과 일치하는 세포 위치에서 EEA1 항원과 강하게 공동-국소화되었음을 나타내며, 이는 초기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다. 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다.
도 22b는 전달 구조체 (서열번호: 149)가 주로 상피 세포의 정점 구획에서 Rab7 (왼쪽 상단)과 강하게 공동-국소화되었으나, 고유판 내의 세포에서 제한된 공동-국소화만 있음을 나타내며, 이는 후기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다 (왼쪽 하단은 백색광 영상을 나타내며, 오른쪽 하단은 청색으로 나타낸 DAPI 염색과 병합된 염색을 나타내고, 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다).
도 22c는 LAMP1이 전달 구조체 (서열번호: 149)가 없는 성숙 리소좀과 일치하는 크고 특정한 소포에서 확인되었음을 나타낸다 (백색 화살표, 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다). 그러나, 전달 구조체 (서열번호: 149)는 상피 세포의 정점 구획 및 기저 구획 둘 다에서 소포 트래피킹과 일치하는, 리소좀-유사 구조 이외의 세포 위치에서 LAMP1 항원과 공동-국소화되었으며, 이는 후기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다.
도 22d는 전달 구조체 (서열번호: 149)도 특히 핵에 인접한 영역에서 클라트린-코팅된 소포, 및 고유판 내의 선택된 세포에서 뿐만 아니라 상피 세포의 기저 구획에서 주로 Rab11a와 강하게 공동-국소화되었음을 나타낸다. DAPI 염색은 청색 으로 나타내며, 적색 형광은 IL-10 항원의 국소화를 나타내고, 녹색 형광은 클라트린의 국소화를 나타낸다.
도 22e는 전달 구조체 (서열번호: 149)가 상피 세포에서 핵에 인접한 패턴으로 및 고유판 내의 대부분의 세포에서 칼넥신에 의해 나타낸 바와 같이 소포체와 공동-국소화되었음을 나타낸다 (적색 형광은 칼넥신의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다). 구체적으로, 주사 후 5분 (도 22f), 10분 (도 22g), 및 15분 (도 22h)에 나타낸 바와 같이, 전달 구조체 (서열번호: 149)는 담체 세포내이입 및 통과세포외배출에 대한 반응으로 재-분포되는 것으로 나타난 소포체 골지 중간 구획 (ERGIC) 및 LAMN1 항원과 강하게 공동-국소화되었다.
도 22f는 주사 후 5분에 나타낸 바와 같이, 전달 구조체 (서열번호: 149)가 담체 세포내이입 및 통과세포외배출에 대한 반응으로 재-분포되는 것으로 나타난 소포체 골지 중간 구획 53 (ERGIC-53) 및 LAMN1 항원과 강하게 공동-국소화되었음을 나타낸다 (적색 형광은 ERGIC-53 및 LMAN1의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다).
도 22g는 주사 후 10분에, 전달 구조체 (서열번호: 149)가 LMAN1 항원과 공동-국소화되었음을 나타낸다. 자료는 고유판에서 전달 구조체 (서열번호: 149)의 상당한 국소화를 나타낸다.
도 22h는 주사 후 15분에, 전달 구조체 (서열번호: 149)가 LMAN1 항원과 공동-국소화되었음을 나타낸다. 자료는 고유판에서 전달 구조체 (서열번호: 149)의 상당한 국소화를 나타낸다.
도 22i는 전달 구조체 (서열번호: 149)가 상피 세포에 존재하는 낮은 수준의 기안틴(giantin)과 공동-국소화되지 않았음을 나타낸다 (적색 형광은 IL-10의 국소화를 나타내며, 녹색 형광은 기안틴의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다). 일부 기안틴은 고유판에 존재하는 세포의 하위집합(subset)에서 구조체와 공동-국소화되었으며, 이는 콜릭스 유래 담체가 골지 구획과 국소화되지 않음을 시사한다.
도 22j는 58K 항원이 핵의 정점 부위에서의 상피 세포에서 국소화되었으며, 전달 구조체 (서열번호: 149)가 이 구획을 통한 짧은 이동을 제안하는 방식으로 이 단백질과 일부 공동-국소화 (적색 형광은 IL-10의 국소화를 나타내며, 녹색 형광은 58K 골지 항원의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타냄)를 나타내었음을 나타낸다. 고유판 내의 세포에서는 58K 항원이 관찰되지 않았다.
도 22k는 전달 구조체 (서열번호: 149, 왼쪽 상단, IL-10 국소화)가 TGN38 항원 (오른쪽 상단)과 일정 수준의 공동-국소화를 나타내었으며, 이는 상피 세포에서 핵의 정점 측면으로 제한되고 고유판 내의 몇몇 세포에서 핵에 인접한 세포 분포를 나타내었음을 나타낸다. 왼쪽 하단 영상은 백색광 영상을 나타내며, 오른쪽 하단은 IL-10 (적색), TGN38 (녹색), 및 DAPI 신호 (청색 형광)와의 병합 (중첩)을 나타낸다.
도 22l은 전달 구조체 (서열번호: 149) (녹색 형광으로 나타낸 IL-10 국소화, 오른쪽 상단)가 주로 상피 세포의 기저 구획 및 고유판 내의 선택된 세포에서 Rab11a (왼쪽 상단, 적색 형광으로 나타낸 국소화)와 강하게 공동-국소화되었음을 나타낸다. 왼쪽 하단 영상은 백색광 영상을 나타내며, 오른쪽 하단은 IL-10 (녹색), Rab11a (적색), 및 DAPI 신호 (청색 형광)와의 병합 (중첩)을 나타낸다.
도 23a-23c는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후에, 다양한 시점에서 비스타(Wistar) 랫트의 편광 장 상피 세포를 가로질러 IL-10의 통과세포외배출을 나타내는 현미경 영상을 나타낸다. 전달 구조체 (서열번호: 149)는 서열번호: 176에 제시된 아미노산 서열을 갖는 스페이서를 통해 서열번호: 145에 제시된 아미노산 서열을 갖는 IL-10 페이로드에 결합된 서열번호: 135의 담체를 포함하였다. 녹색 형광은 IL-10의 존재를 나타낸다 (항-IL-10 항체로 염색을 통해). 청색 형광은 DNA를 표지하는 DAPI 염색을 나타내며, 적색 형광은 콜릭스-유래 담체가 통과세포외배출 동안 (예를 들어, 상피 세포의 핵상 영역에서) 공동-국소화할 수 있는 CK-8 (시토케라틴(cytokeratin)-8)의 존재를 나타낸다. 백색 화살표 #1은 상피 세포의 정점 막을 강조하며, 백색 화살표 #2는 상피 세포의 기저막을 강조한다.
도 23a는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 1분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 정점에서 기저 부위로 및 고유판으로의 IL-10 페이로드의 수송이 전달 구조체의 적용 후 빠르면 1분에 발생하였음을 나타낸다. 백색 화살표 #3은 고유판에서 IL-10의 존재를 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23b는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 5분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 전달 구조체의 내강 적용 후 5분에 고유판에 존재하는 수송된 IL-10의 증가된 양을 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23c는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 10분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 전달 구조체의 내강 적용 후 10분에 고유판에 존재하는 수송된 IL-10 페이로드의 훨씬 더 많은 양을 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23d-23f는 랫트 공장에서 IL-10 (서열번호: 145)에 결합된 서열번호: 135의 콜릭스 담체를 포함하는 전달 구조체 (서열번호: 149)의 내강 주사 후 1분에, 상피 세포에서 서열번호: 135의 콜릭스 담체의 정점 세포내이입 및 초기 트래피킹을 나타낸다. 자료는 콜릭스-유래 담체가 리소좀 회피 수용체와 상호작용함으로써 리소좀 파괴 경로를 피한다는 것을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, 정점 진입 수용체 TMEM132 국소화는 적색 형광으로 나타내고, 리소좀 회피 수용체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 정점 진입 수용체 TMEM132의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 리소좀 회피 수용체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, 정점 진입 수용체 TMEM132 및 리소좀 회피 수용체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 23d는 편광 상피 세포의 정점 막 (백색 화살표 #1로 나타냄)에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 기저막은 백색 화살표 #2로 나타내며, 고유판은 백색 화살표 #3으로 나타낸다.
도 23e는 정점 막에서 및 그 주위에서 황색 형광으로 나타낸 바와 같이, 콜릭스 담체 (서열번호: 135)와 정점 진입 수용체 TMEM132의 상호작용을 나타낸다.
도 23f는 콜릭스 담체 (서열번호: 135), 정점 진입 수용체 TMEM132, 및 리소좀 회피 수용체가 백색 화살표로 나타낸 백색 반점 (예를 들어, 녹색, 적색 및 자주색 형광의 중첩)으로 나타낸 바와 같이 정점 막에서 매우 근접해 있음을 나타낸다. 예를 들어, 도 15b에 나타낸 바와 같이, 이들 콜릭스 담체-수용체 상호작용의 pH 환경 및 pH-의존성의 변화로 인해, 리소좀 회피 수용체 (GRP75)는 콜릭스 담체-정점 진입 수용체 복합체에 접근할 수 있으며, 이어서 콜릭스 담체와 정점 진입 수용체 TMEM132의 해리 및 콜릭스 담체와 리소좀 회피 수용체 GRP75의 결합이 뒤따를 수 있다고 가정한다.
도 23g-23h는 랫트 공장에서 IL-10 (서열번호: 145)에 결합된 콜릭스-유래 담체 (서열번호: 135)를 포함하는 전달 구조체 (서열번호: 149)의 내강 주사 후 5분 및 15분에, 상피 세포에서 정점에서 핵상 구획으로의 콜릭스 담체 (서열번호: 135)의 트래피킹을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, ERGIC 수용체 국소화는 적색 형광으로 나타내고, 정점 진입 수용체 (예를 들어, TMEM132) 국소화는 주황색 형광으로 나타내며, 리소좀 회피 수용체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 리소좀 회피 수용체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, 정점 진입 수용체 및 리소좀 회피 수용체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 23g는 전달 구조체 (서열번호: 149)의 내강 주사 후 5분에, 편광 장 상피 세포에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 자료는 정점 수용체-매개 세포내이입 후에, 콜릭스 담체가 리소좀 회피 수용체 및 정점 막에 가까운 정점 진입 수용체와 복합체를 형성하며 (백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타내며, 백색 화살표로 강조됨), 또한 세포 내의 핵상 영역에 약간 더 가까운 황색 형광 (및 황색 화살표)으로 나타낸 바와 같이 ERGIC 수용체와 상호작용을 시작함을 나타낸다.
도 23h는 전달 구조체 (서열번호: 149)의 내강 주사 후 15분에, 편광 장 상피 세포에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 자료는 담체가 ERGIC (황색 화살표 참조)와 결합되는 동안 정점에서 핵상 구획으로 이동하였으며, 여기서 황색 형광 강도는 주사 후 5분에 비해 증가하였음을 나타내고, 이는 시간이 지남에 따라 정점에서 핵상 영역으로 콜릭스 담체 이동이 증가하였음을 나타낸다. 자료는 기저막 및 고유판 (금색 화살표)에서 콜릭스 담체의 국소화를 더 나타낸다.
도 24는 본 명세서에 기재된 담체의 정점에서 기저로의 통과세포외배출에 관여하는 세포내 구획 요소 (예를 들어, 세포 영역, 구획 및 담체의 수송 수용체 상호작용 파트너 (또는 TRIPs)와 같은 수용체)의 도표를 나타낸다. 통과세포외배출 과정은 15분 시간 경과 동안 개략적으로 기재된다. 예를 들어, 통과세포외배출할 수 있는 콜릭스 유래 담체는 (예를 들어, 엔도좀 또는 "RE"를 재순환하여 나타낸 바와 같이) 세포내이입 후에 리소좀 또는 정점 재순환 경로(들)에 들어가지 않을 수도 있거나 또는 상당히 들어가지 않을 수도 있다. 콜릭스 유래 담체의 정점 적용 및 기저 구획 재순환 경로(들)에 대한 접근 후에, COPI 및 LMAN1의 재분포 (SEC22b 제외)는 콜릭스 유래 담체의 경로 특성으로 나타낸다. 따라서, 본 명세서에 기재된 콜릭스 유래 담체는 일련의 세포내 소포성 구획을 이용하여 정점에서 기저로의 통과세포외배출로 최고조에 달할 수 있는 편광 장 상피 세포를 통해 수송할 수 있으며, 이러한 담체가 빠르게 효율적으로 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 고유판으로 페이로드 (예를 들어, 치료용 단백질)를 왕복할 수 있도록 한다.
도 25는 Cholix386 유래 담체 (예를 들어, 서열번호: 135 또는 180) 및 Cholix415 유래 담체 (예를 들어, 서열번호: 1의 잔기 1-415 포함) 둘 다 10분 및 40분에 장 상피 세포를 가로질러 항-TNFα 제제 (예를 들어, 항-TNFα 항체 또는 이의 기능적 단편)를 수송함을 나타낸다. 또한, Cholix386-항-TNFα 구조체는 항-TNF-α 단독의 약 12× 속도로 수송하고, Cholix415-항-TNFα는 항-TNF-α 단독의 ~7× 속도로 수송한다.
도 26은 쿠마씨 블루(Coomassie Blue)-염색된 SDS-PAGE 겔 상에서 수행된 서열번호: 192-엑세나티드(Exenatide) (엑세나티드에 가교결합된 서열번호: 192 (서열번호: 195))의 순도를 나타낸다.
도 27은 스프라그 돌리(Sprague Dawley) 랫트의 공장을 가로질러 담체 서열번호: 191 또는 서열번호: 192에 가교결합된 엑세나티드의 in vivo 통과세포외배출을 나타낸다. 처리 후 10분 및 40분에, 장 조직을 가로질러 수송된 엑세나티드의 양 (pM)을 측정하였다. 자료는 서열번호: 191-엑세나티드 및 서열번호: 192-엑세나티드 둘 다 10분 및 40분에 엑세나티드 단독보다 더 높은 속도로 수송할 수 있음을 나타낸다.
도 28a는 서열번호: 175, 196 및 197의 스페이서의 아미노산 길이가 서열번호: 147, 198 및 199의 전달 구조체에 포함될 때 IL-22 (서열번호: 142)의 능력에 영향을 미치지 않고 IL-22 수용체 이량체화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22, 서열번호: 143)의 수용체 이량체화의 유도는 검은색 곡선으로 나타낸다.
도 28b는 서열번호: 196의 스페이서를 통해 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체의 N- 또는 C-말단에 IL-22 페이로드 (서열번호: 142)의 결합이 서열번호: 198, 200 및 201의 전달 구조체의 능력을 상당히 변화시키지 않고 IL-22 수용체 이량체화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22)의 수용체 이량체화의 유도는 검은색 곡선으로 나타낸다.
도 28c는 서열번호: 175, 196 및 197의 스페이서의 아미노산 길이가 서열번호: 147, 198 및 199의 전달 구조체에 포함될 때 IL-22 (서열번호: 142)의 능력에 영향을 미치지 않고 pSTAT3 활성화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22, 서열번호: 143)의 pSTAT3 활성화는 검은색 곡선으로 나타낸다.
도 28d는 서열번호: 196의 스페이서를 통해 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체의 N- 또는 C-말단에 IL-22 페이로드 (서열번호: 142)의 결합이 서열번호: 198, 200 및 201의 전달 구조체의 능력을 상당히 변화시키지 않고 pSTAT3 활성화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22)의 pSTAT3 활성화는 검은색 곡선으로 나타낸다.
실시예
하기의 실시예는 단지 본 발명을 예시할 뿐, 어떤 방식으로도 본 발명을 제한하려는 것이 아니다.
실시예 1
콜릭스-유래 전달 구조체의 제조
이 실시예에서, 콜릭스 담체 서열, 스페이서 서열, 및 치료용 페이로드를 포함하는 단일 아미노산 서열로서 전달 구조체의 제조가 기재된다.
먼저, 전달 구조체의 유전자를 PCR에 의해 증폭시키고, PCR 산물의 양 끝에서 NdeI 및 EcoRI, PstI 및 PstI, AgeI 및 EcoRI, 또는 PstI 및 EcoRI 부위의 제한 효소 쌍을 통합시켰다. 제한 효소 분해 후, PCR 산물을 세포 발현을 위한 적당한 플라스미드에 클로닝시키고, 이를 상응하는 제한 효소 쌍으로 분해하였다. 결과로 생성된 구조체는 서열번호: 147에 제시된 아미노산 서열을 포함하였으며, 또한 단백질의 N-말단에서 6-His 모티프로 태깅하여 정제를 용이하게 하였다. 제한 효소 분해 및 DNA 시퀀싱으로 최종 플라스미드를 확인하였다.
전달 구조체는 하기와 같이 발현되었다: E. coli BL21(DE3) pLysS 컴피턴트 세포(competent cells) (Novagen, Madison, Wis.)는 적당한 플라스미드의 존재 하에 표준 열-쇼크 방법을 이용하여 형질전환시켜 암피실린-함유 배지에서 선택된 전달 구조체 발현 세포를 생성하였고, 항생제와 함께 루리아-베르타니 배양액(Luria-Bertani broth) (Difco; Becton Dickinson, Franklin Lakes, N.J.)에서 분리 및 성장시킨 다음, OD 0.6에서 1 mM 이소프로필-D-티오갈락토피라노시드 (IPTG)를 첨가하여 단백질 발현을 유도하였다. IPTG 유도 후 2시간에, 세포를 10분 동안 5,000 rpm에서 원심분리하여 수확하였다. 세포 용해 후에 봉입체를 분리하고, 단백질을 100 mM Tris-HCl (pH 8.0), 2 mM EDTA, 6 M 구아니딘 HCl, 및 65 mM 디티오트레이톨을 함유하는 완충액에 가용화시켰다. 가용화된 전달 구조체를 0.1 M Tris, pH=7.4, 500 mM L-아르기닌, 0.9 mM GSSG, 2 mM EDTA의 존재 하에 재접힘시켰다. 재접힌 단백질 (서열번호: 147)을 Q 세파로오스 이온 교환 및 Superdex 200 겔 여과 크로마토그래피 (Amersham Biosciences, Inc., Sweden)로 정제하였다. 단백질의 순도는 SDS-PAGE 및 분석 HPLC (Agilent, Inc. Palo Alto, Calif.)로 평가하였다.
전달 구조체는 이의 예상되는 분자 크기와 관련하여 적당한 접힘을 확인하기 위해 평가되었다. 유도 후에, 발현된 단백질을 봉입체로부터 수집하였다. 전달 구조체의 발현 정도를 웨스턴 블롯으로 확인하고, 겉보기 분자량을 계산된 질량과 비교하였다.
결과는 고 수율 및 순도로 기능적 전달 구조체의 안정적이고 효율적인 제조를 나타내었다.
실시예 2
상피 세포 단층을 가로질러 수송 평가를 위한
In
vitro
모델
이 실시예는 본 명세서에 기재된 전달 구조체의 수송 특성을 평가하도록 설계된 in vitro 모델을 나타낸다.
도 1은 상피 세포 단층 위의 정점 챔버 및 이러한 상피 세포 단층 아래의 기저 챔버를 포함하는 장치를 개략적으로 나타낸다.
정점에서 기저측 투과도의 경우, 시험 물품 (예를 들어, 전달 구조체, 페이로드 등)을 정점 (A) 측면에 첨가하고, 투과량을 기저측 (B) 측면에서 결정하였다. 기저측에서 정점 투과도의 경우, 시험 물품을 기저측 (B) 측면에 첨가하고, 투과량을 정점 (A) 측면에서 결정하였다.
자료는 하기 방정식에 따라 투과도 (P ap p)로 나타낼 수 있다: P ap p = (dQ/dt)/ (C0*A). Q/dt는 투과율이며, C0는 시험 물품의 초기 농도이고, A는 단층의 면적이다. 유출 수송비(efflux transport ratio) (Re)는 하기 방정식에 따라 계산될 수 있다: (Re) = Papp(B-A)/Papp(A-B). Re >2는 P-gp 또는 기타 활성 유출 수송체에 대한 잠재적 기질을 나타낼 수 있다.
SMI-100 또는 Caco-2 세포를 사용하여 in vitro에서 담체 또는 전달 구조체의 통과세포외배출 기능을 평가할 수 있다.
Caco-2 세포의 경우, ELISA 분석을 수행하여 통과세포외배출을 통해 Caco-2 세포 단층을 가로질러 이동하는 담체 또는 전달 구조체의 능력을 평가하였다. Caco-2 (ATCC HTB-37™) 세포는 완전 배지: 10% 소태아혈청, 2.5 mM 글루타민, 100 U의 페니실린/ml 및 100 μg의 스트렙토마이신/ml으로 보충된 둘베코스 변형된 이글스 배지 F12 (Dulbecco's modified Eagle's medium F12, DMEM F12) (Gibco BRL, Grand Island, N.Y.)에서 37℃에서 5% CO2로 유지시켰다. 세포를 2 내지 3일 마다 이 배지 (완전 배지로 명명됨)로 공급하고, 5 내지 7일 마다 계대배양하였다. 분석을 위해, 세포를 24- 또는 96-웰 플레이트에 씨딩하고 합류(confluence)할 때까지 성장시켰다.
Caco-2 세포를 콜라겐-코팅된 0.4-μm 기공 크기의 폴리카보네이트 막 트랜스웰 지지체 (Corning-Costar, Cambridge, MA) 상에서 합류 단층으로 성장시키고, chopstick Millicell-ERS® 전압계 (Millipore)를 이용하여 측정된 >250 Ω·㎠의 경상피 전기 저항(trans-epithelial electrical resistance, TER)을 달성한 후 18-25일 동안 사용하였다. 이러한 단층을 가로질러 담체 또는 전달 구조체의 정점에서 기저측 (A→B) 수송은, 37℃에서 전달구조체의 4.7 nM, 23.6 nM 및 236 nM 정점 적용 후 특정 시점 (예를 들어, 15, 30, 및 45분)에서 수송된 단백질의 양을 측정하여 결정되었다. TER 치수 및 10 kDa 형광 덱스트란의 크기 (HPLC 크기 배제 프로토콜을 이용하여 측정됨)를 사용하여 연구 과정 동안 단층 장벽 특성을 확인하였다. 전달 구조체의 수송 정도는 세포-기반 세포독성 분석에서 수집된 배지의 적정에 의해 결정되었다. 수송된 전달 구조체는 포획 및 검출용 항체 (예를 들어, 항-담체 또는 항-페이로드, 예를 들어 항-IL-22 항체)를 이용하여 ELISA(enzyme linked immunosorbant assay)로 측정되었다.
세포 배양 삽입물에서 확립된 인간 소장 조직 (SMI-100, MatTek Corporation; Ashland, MA, USA)의 합류 단층을 사용하기 전에 37℃에서 24시간 동안 안정화시켰다. >400 Ω·cm2의 경상피 전기 저항 (TEER)을 갖는 삽입물만이 연구에 사용하기에 충분한 단층 무결성(monolayer integrity)을 갖는 것으로 간주되었다. 70 kD 덱스트란 수송의 억제를 평가하여 단층 무결성의 2차 검증을 수행하였다. 챔버를 수송 완충액 (PBS)으로 1회 세척하였다. 20 μg/mL의 농도로 제조된 시험 분자 (예를 들어, 전달 구조체, 페이로드 등)를 100 μL 부피의 삽입물의 정점 표면에 적용하였다. 500 μL PBS의 기저측 부피는 수송 연구를 위해 각 시점에서 교체되었다. 각 실험 조건은 3회 수행되었다.
실시예 3
편광 장 상피 세포를 가로질러 IL-22의 담체-매개 수송
이 실시예는 서열번호: 134의 담체가 in vitro에서 편광 장 상피 세포를 가로질러 IL-22 페이로드 (서열번호: 142)를 수송할 수 있음을 나타낸다. 이 실시예는 서열번호: 134의 담체가 in vivo에서 편광 장 상피 세포를 가로질러 고유판으로 생물학적 활성 IL-22 페이로드를 수송할 수 있음을 나타낸다.
Caco-2 세포 단층 및 소장 상피 조직 (본 명세서에서 SMI-100이라고도 함)을 가로질러 전달 구조체 (서열번호: 147)의 수송은, 정점 (A)에서 기저 (B)로의 수송을 위해 실시예 2에 따라 및 도 1에 나타낸 바와 같이, 전달 구조체를 상피 세포의 정점 막에 적용하여 시험하였다. 실험을 3회 수행하였으며, 정점 적용 후 15, 30 및 45분에 기저측 챔버로부터의 시료를 수집하여 수송된 단백질의 양을 결정하였다. ELISA 분석을 이용하여 통과세포외배출된 단백질의 양을 측정하였다.
도 2 및 도 3의 자료는 IL-22에 결합되었을 때 서열번호: 134의 담체가 시간-의존적 방식으로 Caco-2 (도 2) 및 SMI-100 (도 3) 단층을 가로질러 IL-22 페이로드 (서열번호: 142)의 수송을 야기하였으며, 전달 구조체가 담체에 결합되지 않은 IL-22 (서열번호: 143)에 비해 상피 세포를 가로질러 약 2-3 배 더 많은 IL-22를 야기하였음을 나타낸다.
in vivo 실험을 위해, 수컷 비스타 랫트를 이용하여 통과세포외배출을 시험하였다. 수컷 비스타 랫트를 12/12 h의 명/암 주기로 케이지 당 3-5 마리 수용하였으며, 연구에 배치될 때 약 225-275 g (약 6-8 주령)이었다. 연속 이소플루란 마취를 사용하는 비-회수 프로토콜을 이용하여 광 단계 동안 실험을 수행하였다. 중간-공장 영역을 노출시킨 4-5 cm 중간선 복부 절개를 수행하였다. 3.86×10-5 M의 전달 구조체의 저장 용액을 인산염 완충 식염수 (PBS)에서 제조하였으며, (250 g 랫트 당) 50 μL를 29-게이지 바늘을 이용하여 관내 주사(ILI)로 투여하였다. 그 다음, 주사 부위 장간막을 영구 마커로 표시하였다. 연구 종료시, 현미경 평가를 위해 표시된 장 부분을 포획한 3-5 mm 영역을 분리하고 처리하였다.
서열번호: 147의 전달 구조체의 통과세포외배출 활성의 결과는 도 4에 나타내었으며, 이는 상당한 양의 IL-22 페이로드 (서열번호: 142)가 콜릭스로부터 유래된 담체를 포함하는 전달 구조체의 일부로 제공될 때 in vivo에서 온전한 편광 장 상피를 가로질렀음을 나타낸다. 이 현미경 영상은 비스타 랫트의 공장에 서열번호: 147의 전달 구조체의 내강 적용 후 장 상피의 정점 부위 (백색 화살표 #1로 강조됨)에서 상피 세포의 기저 부위로 및 고유판 (3) ("l.p."로 약칭됨)으로 IL-22 페이로드 (서열번호: 142)의 수송을 나타낸다. 영상은 IL-22가 고유판 내부의 세포 및 편광 상피의 외부 기저막 (백색 화살표 #2로 강조됨)에 위치한 IL-22 수용체와 상당한 정도로 상호작용하고 결합하였음을 더 나타내며, 이는 IL-22 페이로드가 수송 후 생물학적 활성이었음을 나타낸다. IL-22 국소화는 백색 화살표 및 녹색 형광으로 나타내고, 청색 형광은 DAPI 염색을 나타낸다.
또한, 도 5는 서열번호: 147 및 서열번호: 148에 제시된 아미노산 서열로 이루어진 전달 구조체가 통과세포외배출 후 기저측 구획에서 검출되었음을 나타낸다. 웨스턴 블롯 실험의 분석은 두 전달 구조체가 변하지 않았음을 확인한다.
또한, 후속 실험은 콜릭스 유래 담체를 포함하는 전달 구조체의 통과세포외배출이 GRP75 (도 6) 및 기저막-특이적 헤파란 설페이트 프로테오글리칸 코어 단백질 (HSPG) (도 7) (본 명세서에서 "페를레칸"이라고도 함)의 존재에 의존할 수 있음을 나타내었다. 도 6 및 도 7은 각각 GRP75 (도 6, 즉, Caco-2GRP75 - 세포) 및 HSPG (FIG. 7, 즉, Caco-2HSPG- 세포)가 결여된 Caco-2 세포에서 통과세포외배출 기능이 상당히 감소되었음을 나타낸다. 이것은 GRP75 및 HSPG 둘 다 콜릭스 유래 담체가 정점에서 기저로의 통과세포외배출 동안 상호작용할 수 있는 TRIPs임을 나타낸다.
종합하면, 이들 자료는 본 명세서에 기재된 콜릭스 유래 담체가 페이로드 단독에 비해 상당히 증가된 수송 속도 및 전체 수송 효율 (예를 들어, 적어도 약 2-3배 증가)로, 편광 상피층을 가로질러 IL-22와 같은 치료용 페이로드를 효율적으로 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 수송한다는 것을 나타낸다.
실시예 4
콜릭스 유래 담체를 이용한 편광 상피 세포로의
In vivo
수송 연구
이 실시예는 페이로드를 편광 상피 세포로 수송하는 절단된 콜릭스 유래 담체의 능력을 나타낸다.
도 8은 랫트 내강내 주사 모델을 이용하여 구조체의 내강내 주사 후 15분에 상피 세포 내의 정점 구획 (백색 화살표 #2로 강조됨)에서 전달 구조체 (서열번호: 154)의 형광 현미경 검출을 나타낸다 (백색 화살표 #1은 정점 표면을 강조하고, 백색 화살표 #3은 기저막을 강조하며, 백색 화살표 #4는 고유판을 강조한다). 자료는 Cholix41-187 (예를 들어, 서열번호: 137)로부터 유래된 담체가 상피 세포의 정점 구획으로 페이로드를 수송할 수 있으나, 상피 세포를 가로질러 수송할 수 없음을 나타낸다. 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다.
도 9는 랫트 내강내 주사 모델을 이용하여 내강내 주사 후 15분에 상피 세포의 정점 구획 (백색 화살표 #2로 강조됨)에서 전달 구조체 (서열번호: 156)의 형광 현미경 검출을 나타낸다 (백색 화살표 #1은 정점 표면을 강조하고, 백색 화살표 #3은 기저막을 강조하며, 백색 화살표 #4는 고유판을 강조한다). 자료는 Cholix40-205 (예를 들어, 서열번호: 138)로부터 유래된 담체가 상피 세포의 정점 구획으로 페이로드 (예를 들어, hGH)를 수송할 수 있으나, 상피 세포를 가로질러 고유판으로 수송할 수 없음을 나타낸다. 이들 자료는 서열번호: 1의 잔기 1-40이 통과세포외배출에서 역할을 할 수 있으나, 콜릭스 담체의 세포내이입에는 필요하지 않을 수 있음을 더 시사한다. 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다.
도 10a는 랫트 공장으로 전달 구조체의 내강내 주사 후 5분에 상피 세포 내부의 정점 구획에서 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 도 10a-10c에서, 적색 형광은 콜릭스 담체의 국소화를 나타내고, 녹색 형광은 hGH (서열번호: 146)의 국소화를 나타내며, 청색 형광은 DAPI 염색을 나타낸다: 백색 화살표 #1은 정점 구획을 강조하고, 백색 화살표 #2는 핵상 구획을 강조한다.
도 10b는 내강내 주사 후 10분에 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 자료는 담체가 시간이 지남에 따라 정점 구획에서 핵상 및 기저 구획으로 hGH 페이로드를 수송하였음을 나타낸다.
도 10c는 내강내 주사 후 15분에 전달 구조체 (서열번호: 153)의 형광 현미경 검출을 나타낸다. 자료는 담체가 시간이 지남에 따라 정점 구획에서 핵상 및 기저 구획으로 페이로드를 수송하였음을 나타낸다.
이들 자료는 각각 서열번호: 1의 위치 187 또는 205에서 C-말단 절단 및 서열번호: 1의 위치 40 또는 41에서 N-말단 절단을 갖는 콜릭스 유래 담체가 페이로드를 편광 상피 세포로 수송할 수 있음을 나타내었다.
이들 자료는 콜릭스 담체의 N-말단 39 아미노산이 통과세포외배출에서 역할을 할 수 있으나 기저측 세포내 소포로의 수송에는 충분하지 않으며, 1-187은 통과세포외배출에는 충분하지 않으나 페이로드를 상피 세포로 (예를 들어, 핵상 및 기저 구획으로) 수송하기에 충분함을 더 시사하였다.
실시예 5
콜릭스 유래 담체의
In vitro
통과세포외배출 기능
이 실시예는 실시예 1에서 상기 기재된 바와 같이 재조합 발현을 이용하여 스페이서를 통해 인간 성장 호르몬에 결합된 다양한 콜릭스 유래 담체의 in vitro 정점에서 기저로의 통과세포외배출 기능을 나타낸다.
편광 인간 소장 상피 세포 단층을 가로지르는 능력에 대해 하기의 담체를 평가하였다 (표 10):
서열번호 | 콜릭스 표기법 (서열번호: 1에 대해) |
서열번호: 151 | M+Cholix1-134-(G4S)3-hGH |
서열번호: 152 | M+Cholix1-151-(G4S)3-hGH |
서열번호: 153 | M+Cholix1-187-(G4S)3-hGH |
서열번호: 154 | M+Chx41-187-(G4S)3-hGH |
서열번호: 155 | M+Cholix1-206-(G4S)3-hGH |
서열번호: 156 | M+Cholix40-205-(G4S)3-hGH |
서열번호: 157 | M+Cholix1-245-(G4S)3-hGH |
서열번호: 158 | M+Cholix1-251-(G4S)3-hGH |
서열번호: 159 | M+Cholix1-266-(G4S)3-hGH |
도 11a-11b는 담체에 결합된 hGH을 이용하는 것에 비해 인간 성장 호르몬 (hGH, 서열번호: 190) 단독의 정점에서 기저로의 수송을 나타낸다. 담체 길이는 기준 서열번호: 1에 대한 C-말단 절단으로 나타낸다 (예를 들어, "134"는 서열번호: 1의 잔기 1-134를 갖는 담체를 나타낸다). 모든 담체는 N-말단 메티오닌을 더 포함하였다. hGH에 대한 웨스턴 블로팅은 2 h 후 in vitro에서 1차 인간 소장 상피 세포의 편광 단층을 가로질러 정점에서 기저로 수송하는 이들 단백질의 용량을 정성적으로 평가하였다. 정점에서-적용된 물질의 양은 hGH 함량에 대해 몰 기준으로 동등하였으며, 기저 수집물은 분석 전에 ~10배 농축시켰다.
도 11a는 서열번호: 1의 각각 위치 134, 151, 187, 41-187, 및 266에서 절단이 있는 서열번호: 151 - 서열번호: 154 및 서열번호: 159에 제시된 서열을 갖는 전달 구조체에 대해 측정된 것에 대하여 hGH (서열번호: 190) 단독의 정점에서 기저로의 수송의 비교를 나타낸다. 자료는 서열번호: 1의 위치 134, 151, 187에서 C-말단 절단, 또는 서열번호: 1의 위치 41에서 N-말단 절단 및 위치 187에서 C-말단 절단이 있는 콜릭스 담체가 서열번호: 1의 위치 266에서 C-말단 절단이 있는 콜릭스 담체 (서열번호: 159)를 갖는 구조체에 비해 결합된 hGH의 정점에서 기저로의 수송이 상당히 더 낮음을 나타내었음을 나타낸다.
도 11b는 서열번호: 1의 각각 위치 206 (서열번호: 131), 245 (서열번호: 132), 251 (서열번호: 133), 및 266 (서열번호: 134)에서 C-말단 절단이 있는 콜릭스 담체를 포함하는 서열번호: 155 및 서열번호: 157 - 서열번호: 159의 전달 구조체가 결합된 hGH (서열번호: 146)의 효율적인 정점에서 기저로의 수송을 나타내었음을 나타낸다. 위치 245 및 251에서 콜릭스 C-말단 절단이 있는 담체는 위치 266에서 C-말단 절단이 있는 담체의 것과 비슷한 hGH (서열번호: 146)의 정점에서 기저로의 수송을 나타내었지만, 위치 206에서 콜릭스 C-말단 절단이 있는 담체는 위치 245, 251 및 266에서 C-말단 절단이 있는 담체에 비해 hGH의 정점에서 기저로의 수송의 상당한 향상을 나타내었다.
이러한 결과는 콜릭스의 잔기 1-266이 정점에서 기저로의 수송에 충분하였으며, 상피 세포를 가로질러 다양한 이종성 페이로드를 전달하는 통과세포외배출 요소로 기능할 수 있음을 시사하였다. 또한, 서열번호: 1에 제시된 서열로 이루어진 콜릭스 폴리펩티드의 처음 206 아미노산 잔기 내의 요소가 통과세포외배출 기능에 충분하였으므로 상피 세포층 (예를 들어, 장 상피)을 가로질러 치료용 및/또는 진단용 페이로드와 같은 이종성 페이로드 분자를 효율적으로 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 왕복하는데 사용될 수 있음을 나타내었으며, 이에 의해 비경구 투여 경로 (예를 들어, 정맥내 또는 피하)를 통해서만 투여될 수 있는 페이로드의 경구 투여를 가능하게 한다.
실시예 6
콜릭스 유래 담체의
In vivo
통과세포외배출 기능
이 실시예는 실시예 1에서 상기 기재된 바와 같이 재조합 발현을 이용하여 스페이서를 통해 인간 성장 호르몬에 결합된 다양한 콜릭스 유래 담체의 in vivo 정점에서 기저로의 통과세포외배출 기능을 나타낸다.
실시예 5의 표 10에 나타낸 선택된 콜릭스 담체는 랫트 공장으로 ILI 후에 in vivo에서 통과세포외배출에 대한 이들의 능력에 대해 검사하였다.
이 실험에서 얻은 자료는 각각 상이한 콜릭스 담체를 포함하는 6개의 전달 구조체의 랫트 공장에서 편광 장 상피 세포를 가로질러 정점에서 기저로의 수송 정도를 나타내었다. 콜릭스 담체 (적색 형광) 및 hGH (녹색 형광)의 국소화는 각각 다클론 항-콜릭스 및 단일클론 항-hGH 항체를 이용한 면역형광 현미경으로 나타내었다 (도 12a-12f). 백색 화살표는 정점 막을 나타내고, "l-p"는 고유판을 나타내며, "GC"는 배상 세포(goblet cells)를 나타내고, 열린 화살표는 고유판에 존재하는 전달 구조체를 나타낸다.
도 12a는 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 140)를 포함하는 전달 구조체 (서열번호: 151)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12a는 담체가 전달 구조체가 상피 세포로 들어가는 것을 가능하게 하지 않았음을 나타내며, 이는 서열번호: 1의 아미노산 잔기 135-151을 갖는 기능적 서열 단편이 편광 상피 세포로의 세포내이입에서 역할을 할 수 있음을 시사한다 (반대로, 도 12b는 서열번호: 139의 담체가 세포내이입을 통해 각각의 전달 구조체의 세포 진입을 가능하게 함을 나타낸다).
도 12b는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 139)를 포함하는 전달 구조체 (서열번호: 152)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12b는 이 구조체가 상피 세포로 들어갔으나 (도 12a에 기재된 서열번호: 151의 구조체와는 대조적으로), 주로 정점에 남아있고, 어느 정도는 기저 소포성 풀(vesicular pools)에 남아있으나 고유판에는 들어가지 않았음을 나타내며, 이에 의해 상피 세포의 정점 및 기저 구획으로 페이로드의 전달을 가능하게 한다.
도 12c는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 136)를 포함하는 전달 구조체 (서열번호: 153)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12c는 이 구조체가 상피 세포에 들어갔으며, 정점 및 기저 구획에 도달하였고, 세포의 핵상 영역에도 도달하였지만, 여전히 상피 세포 내부에 남아있음을 나타내며, 이는 서열번호: 1의 아미노산 잔기 152-187로 이루어진 서열 단편이 핵상 영역에 대한 접근 및 전달을 허용할 수 있을뿐만 아니라, 기저 구획에서 국소화를 허용할 수 있음을 시사한다.
도 12d는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 137)를 포함하는 전달 구조체 (서열번호: 154)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12d는 이 구조체가 상피 세포에 들어갔으나, 정점 구획에 남아있었고, 기저 또는 핵상 구획에 도달하지 않는 것으로 나타났음을 나타낸다.
도 12e는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 131)를 포함하는 전달 구조체 (서열번호: 155)의 내강내 주사 후 15분에 정점에서 기저로의 수송 정도를 나타낸다. 도 12e는 이 구조체가 고유판에 도달하는 전달 구조체에 의해 나타낸 바와 같이 통과세포외배출 과정을 완료하였음을 나타내며 (열린 화살표 참조), 이는 서열번호: 1에 제시된 서열의 아미노산 잔기 188-206으로 이루어진 서열 단편이 담체 (및 이러한 담체를 포함하는 구조체)가 상피 세포에서 기저측 구획 (예를 들어, 고유판)으로 담체 또는 각각의 구조체의 방출을 허용하는 기저 재순환 과정에 관여할 수 있게 함을 시사한다.
도 12f는 면역형광 현미경에 의해 나타낸 바와 같이 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강내 주사 후 15분에 in vivo에서 랫트 공장 상피 단층을 가로지르는 수송을 나타낸다. 도 12f는 이 구조체가 고유판에 도달하는 전달 구조체에 의해 나타낸 바와 같이 통과세포외배출 과정을 완료하였음을 나타낸다 (열린 화살표 참조).
따라서, 이러한 결과는 실시예 5에 기재된 in vitro 통과세포외배출 실험으로부터 얻은 자료와 일치하며, 서열번호: 1에 제시된 콜릭스 서열의 잔기 206-266 중 어느 하나에서 C-말단 절단이 있는 담체가 상피 세포를 가로질러 (예를 들어, 피험자의 편광 장 상피 세포를 가로질러) 페이로드 분자 (예를 들어, 치료용 단백질)를 빠르게 (예를 들어, 적어도 10-6 cm/sec, 10-5 cm/sec) 효율적으로 (예를 들어, 정점 표면에 적용된 물질의 적어도 5%, 10%, 20%, 25%, 또는 50%) 수송할 수 있음을 나타내었다. 또한, 이러한 결과는 서열번호: 1에 제시된 콜릭스 서열의 잔기 151-187 중 어느 하나에서 C-말단 절단 및/또는 서열번호: 1의 잔기 1-40 중 어느 하나에서 N-말단 절단이 있는 담체를 사용하여 상피 세포로 다양한 이종성 페이로드를 전달할 수 있음을 나타내었다.
이러한 자료에 기초하여, 서열번호: 1의 콜릭스 폴리펩티드로부터 유래된 담체에 대해 하기의 기능적 콜릭스 서열 단편을 확인하였다.
서열번호 NO | 서열 | 기능 |
서열번호: 165 | 135DQQRNIIEVPKLYSIDL151 | 세포내이입 |
서열번호: 166 | 1VEEALNIFDECRSPCSLTPEPGKPIQSKLSIPSDVVLDEG40 | 정점-기저 전위 |
서열번호: 167 | 151LDNQTLEQWKTQGNVSFSVTRPEHNIAISWPSVSYKA187 | 핵상 국소화 |
서열번호: 168 | 188AQKEGSRHKRWAHWHTGLA206 | 기저 방출 |
실시예 7
콜릭스 유래 담체는 Rab11a와 공동-국소화한다.
이 실시예는 콜릭스 유래 담체가 Ras-관련 단백질 Rab11a (Rab11a 또는 Rab11)와 공동-국소화됨을 나타낸다. 담체와 Rab11a의 공동-국소화는 상피 세포의 정점 측면 또는 기저 측면에서 발생할 수 있다. 상피 세포의 정점 측면에서 담체와 Rab11a의 공동-국소화는 담체를 정점 재순환 엔도좀 및/또는 장 내강으로 유도할 수 있음이 밝혀졌다. 상피 세포의 기저 측면에서 담체와 Rab11a의 공동-국소화는 담체가 기저 세포막에서 기저측 구획 (예를 들어, 고유판)으로의 방출을 위해 기저 재순환 메커니즘을 이용할 수 있음을 나타낸다.
4개의 전달 구조체와 Rab11a의 공동-국소화는 4개의 상이한 전달 구조체의 PBS 내 50 μL의 3.86x10-5 M 용액의 내강내 주사 (ILI)로 시험하였다. 이러한 전달 구조체는 서열번호: 152-154 및 서열번호: 159에 제시된 아미노산 서열로 이루어졌다.
도 13a, 도 13b 및 도 13c는 각각 서열번호: 154, 서열번호: 152, 및 서열번호: 153의 전달 구조체가 상피 세포의 정점 측면에서 Rab11a와 공동-국소화됨을 나타낸다. 또한, 자료는 서열번호: 152 및 서열번호: 154의 구조체가 기저 측면에서 상당히 국소화되지 않았으나, 주로 정점 측면에 남아있었음을 나타낸다. 서열번호: 153의 구조체는 정점 및 기저 측면 둘 다에서 국소화되었으나, 기저 측면이 아닌 정점 측면에서만 Rab11a와 공동-국소화되었다 (또한, 기저 부위에 비해 정점 부위에서 증가된 국소화를 나타내는 도 13c의 하위-영상 3a 및 3b 참조). 종합하면, 이러한 결과는 정점 부위에서 Rab11a와 공동-국소화에 의해 나타낸 바와 같이, 정점에서 기저로 통과세포외배출할 수 없는 담체가 상피 세포 내의 정점 재순환 시스템에 들어갈 수 있음을 시사하였다. 내강내 주사 후 15분에 측정을 수행하였다. 녹색 형광은 hGH의 국소화를 나타내며, 적색 형광은 Rab11a (또는 Rab11)의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다 (도 13d에 대해 동일한 실험 설명).
도 13d는 서열번호: 159의 전달 구조체가 편광 상피 세포의 기저 측면에서 Rab11a와 공동-국소화되었으나, 정점 측면에서는 상당히 공동-국소화되지 않았음을 나타낸다. 이는 통과세포외배출할 수 있는 담체가 상피 세포로부터 고유판으로 이의 방출을 위해 기저 재순환 시스템을 이용할 수 있음을 시사하였다 (또한, 기저 부위에 비해 정점 부위에서 증가된 국소화를 나타내는 도 13d의 하위-영상 4a 및 4b 참조).
이러한 자료는 Rab11a와의 기저 공동-국소화를 가능하게 하여 기저 재순환 시스템에 접근할 수 있는 콜릭스의 기능적 단편이 적어도 서열번호: 1의 아미노산 잔기 187-266 내에 존재할 수 있음을 나타내었다.
또한, 이러한 자료는 페이로드를 상피 세포 내부 또는 이러한 상피 세포를 가로질러 다양한 위치로 수송할 수 있는 담체의 합리적인 설계를 가능하게 한다. 예를 들어, 서열번호: 1에 제시된 아미노산 서열의 아미노산 잔기 1-151, 1-187, 41-187, 41-187, 40-205 또는 41-205를 포함하거나 또는 이루어진 콜릭스 유래 담체는 상피내 페이로드 전달에 사용될 수 있는 반면, 서열번호: 1의 아미노산 잔기 1-266을 포함하는 콜릭스 유래 담체는 이러한 상피 세포 장벽을 가로질러 고유판으로 페이로드를 수송하는데 사용될 수 있다.
실시예 8
콜릭스 담체 상호작용 파트너 (TRIPs)의 유형 및 위치를 평가하기 위한 세포 구획 특이적 단백질 마커
이 실시예는 처리된 세포내이입 및/또는 통과세포외배출 동안 콜릭스 유래 담체와 상호작용하는 단백질을 결정하는데 사용된 상피 세포 구획 특이적 단백질 마커를 기재한다.
하기 표 12는 본 명세서에서 사용된 예시적인 세포 구획 특이적 단백질 마커를 나타낸다. 예를 들어, IL-10에 대한 단일클론 항체 (mAb) 및/또는 콜릭스 담체(예를 들어, 서열번호: 1의 아미노산 잔기 1-266 또는 1-386을 포함하는 것)에 대해 생성된 다클론 항체 (pAb)를 이용한 실험 동안 이종성 페이로드로서 IL-10을 포함하는 콜릭스 유래 전달 구조체를 따랐다.
표적 | pAb/mAb |
종
반응성 |
숙주 | IHC (P)에 대한 희석 | 주석 | 저장 | Cat. # |
콜릭스 담체 | pAb | 토끼 | 1/500 | 전 항혈청 (Whole antiserum) |
-20℃ | - | |
IL-10 | mAb; pAb | 인간 | 마우스, 염소 | 1/25 | -20℃ | - | |
EEA1 | pAb | 마우스, 랫트, 인간 |
토끼 | 1/200 | 초기 엔도좀 | -20℃ | Ab2900 |
Rab7 | mAb | 마우스, 랫트, 인간 |
토끼 | 1/100 | 후기 엔도좀 | -20℃ | Ab1267712 |
Rab11a | pAb | 마우스, 랫트, 인간, 토끼, 개 |
토끼 | 1/500 | 재순환 엔도좀 | -20℃ | Fisher71-5300 |
LAMP1 | pAb | 마우스, 랫트, 인간 |
토끼 | 1/500 | 리소좀 마커 | -20℃ | Ab24170 |
GM130 | pAb | 마우스, 랫트, 인간 |
토끼 | 1/500 | 시스-골지 | -20℃ | - |
기안틴 | mAb | 랫트, 인간 |
마우스 | 1/20 | 골지 | -20℃ | Ab37266 |
58K 골지 단백질 | mAb | 마우스, 랫트, 인간 |
마우스 | 1/100 | 골지 | -20℃ | Nb600-4512 |
TGN38 | mAb | 마우스, 랫트, 인간 |
마우스 | 1/1000 | 트랜스-골지 | -20℃ | Nb300-575 |
칼넥신 | pAb | 마우스, 랫트, 인간 |
토끼 | 1/500 | 소포체 | -20℃ | Ab22595 |
클라트린 | mAb | 마우스, 랫트, 인간 |
마우스 | 1/500 | 클라트린-매개 세포내이입 | -20℃ | Ab2731 |
실시예 9
In
vitro
통과세포외배출 연구는 콜릭스 유래 담체에 대한 수송 수용체 상호작용 파트너 (TRIPs)를 나타낸다.
이 실시예는 콜릭스 유래 담체가 편광 상피 세포를 가로질러 통과세포외배출 동안 상호작용하는 TRIPs의 결정을 나타낸다. 이 실시예는 콜릭스 통과세포외배출 에서 역할을 할 수 있는 중요한 상호작용 파트너를 더 나타낸다.
도 14a-14c는 서열이 서열번호: 177에 제시된 스페이서를 통해 hGH (서열번호: 146)에 결합된 서열번호: 134에 제시된 서열을 갖는 콜릭스 유래 담체를 포함하는 서열번호: 150의 전달 구조체의 통과세포외배출 기능에 대한 K8, HSPG (페를레칸) 및 GRP75 각각의 녹아웃 효과를 나타낸다. 특정 후보 단백질 K8 (Caco-2K8-), HSPG (Caco-2HSPG-), 및 GRP75 (Caco-2GRP75-)의 발현이 결여된 Caco-2 세포의 안정된 세포주를 in vitro에서 단층으로 사용하여, 활성 및 선택적 내인성 수송 메커니즘을 통해 담체 (예를 들어, 콜릭스 담체) 통과세포외배출에 이들의 관여를 확인하였다. Caco-2 세포, 부모 또는 K8, HSPG (페를레칸), 또는 GRP74 녹다운 (KO) 안정된 세포를 각 트랜스웰에서 1.5x105 cells/ml로 씨딩하였다. 18일에, 20 μg/ml의 전달 구조체 (서열번호: 150) 또는 동몰(equal molar) 대조군 hGH (서열번호: 190)를 함유하는 100 μl의 PBS를 정점 측면에 첨가하고, 기저 챔버에는 500 μl의 PBS를 첨가하였다. 37℃에서 1시간 후 기저 용액 내 단백질의 양을 웨스턴 블로팅으로 분석하였다. 블롯은 항-hGH mAb로 조사하였다.
도 14a는 K8 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시키지 않음을 나타낸다.
도 14b는 HSPG (페를레칸) 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시킴을 나타낸다.
도 14c는 GRP75 녹아웃이 전달 구조체 (서열번호: 150)의 통과세포외배출 기능을 상당히 감소시킴을 나타낸다.
다음으로, 콜릭스 단백질과 GRP75 간의 상호작용의 pH-의존성을 평가하였다.
도 15a는 콜릭스 담체-GRP75 상호작용의 이러한 pH-의존성을 확인하기 위해 사용된 Biacore™ 결합 상호작용 (예를 들어, 표면 플라즈몬 공명)을 나타낸다. 이를 위해, 비오틴을 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질의 C-말단에 결합하였으며, 이어서 비오틴-스트렙타비딘 생체접합을 이용하여 표면 (예를 들어, 칩 표면, 플라스틱 96-웰 플레이트 등)에 부착하였고, 각각 pH 5.5, 6.5 및 7.5의 완충 용액에서 정제된 GRP75 단백질과 함께 배양하였다. 이 상호작용에 대한 가장 높은 결합 친화도는 pH 6.5에서 측정되었다. 도 15a는 GPR75에 대한 콜릭스 단백질의 친화도가 pH 7.5 또는 pH 5.5에 비해 pH 6.5에서 약 20-25배 더 높다는 것을 나타낸다.
또한, 도 15b는 콜릭스-유래 담체 (서열번호: 189)와 정점 수용체 (예를 들어, TMEM132), 리소좀 회피 수용체 (예를 들어, GRP75), 트래픽 수용체 (예를 들어, ERGIC-53), 및 기저 수용체 (예를 들어, 페를레칸)의 상호작용의 pH-의존성을 나타낸다. 수용체 상호작용의 이 pH 의존성은 콜릭스-유래 담체가 그 위치에 따라 순차적으로 특정 수용체와 상호작용할 수 있음을 나타낸다. 예를 들어, 이러한 자료는 콜릭스-유래 담체가 pH 7.5에서 세포내이입, 및 정점 진입 수용체 및 리소좀 회피 수용체와 같은 초기 트래피킹 수용체에 대해 상당히 높은 친화도를 가짐을 나타낸다. 일단 pH가 약 5.5로 떨어지면, 이러한 초기 트래피킹 수용체에 대한 콜릭스 담체의 친화도는 감소하는 반면, 정점-기저 트래피킹 수용체 ERGIC-53 및 기저 방출 단백질 페를레칸에 대한 이의 친화도는 그 pH에서 상당히 증가하여, 콜릭스 담체가 소포성 통과세포외배출 과정 동안 트래피킹 및 기저 방출 수용체로 "전달"될 수 있도록 한다.
도 16은 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질과 페를레칸 및 GRP75의 상당하고 순차적인 Biacore™ 결합 상호작용을 나타내며, 이는 콜릭스가 두 단백질과 상호작용함을 나타낸다. 결합 실험을 위해, 50nM의 콜릭스-비오틴 단백질 20 ㎕를 Biacore SA 칩 표면에서 포획하였다. 200 nM의 인간 페를레칸 (HSPG) 단백질 60 ㎕를 30 ㎕/min의 속도로 칩 표면을 통해 주입하였다. 그 다음, 100 nM의 인간 GRP75 단백질 60 ㎕를 30 ㎕/min의 속도로 칩 표면을 통해 주입하였다. pH 1.5에서 50 ㎕의 10 mM 글리신을 주입하여 칩 표면을 재생시켜 결합된 단백질 모두를 제거하였다.
도 17은 서열이 서열번호: 1에 제시된 전장 콜릭스 단백질과 GRP75, 페를레칸 및 TMEM132A의 상당하고 순차적인 Biacore™ 결합 상호작용을 나타내며, 이는 콜릭스가 3개의 단백질 모두와 상호작용함을 나타낸다. 결합 실험을 위해, 50nM의 콜릭스-비오틴 단백질 20 ㎕를 Biacore SA 칩 표면에서 포획하였다. 100 nM의 인간 GRP75 단백질 30 ㎕를 30 ㎕/min의 속도로 칩 표면을 통해 주입하였다. 그 다음, 200 nM의 인간 페를레칸 단백질 60 ㎕를 30 ㎕/min의 속도로 칩 표면을 통해 주입한 다음, 200 nM의 인간 TMEM132A 단백질 30 ㎕를 주입하였다. pH 1.5에서 50 ㎕의 10 mM 글리신을 주입하여 칩 표면을 재생시켜 결합된 단백질 모두를 제거하였다. 이러한 자료는 GRP75 및 페를레칸이 콜릭스 유래 담체의 통과세포외배출 기능에서 역할을 할 수 있으며, 콜릭스 단백질이 GRP75, 페를레칸, TMEM132 단백질과 결합한다는 것을 나타낸다.
실시예 10
편광 상피 세포를 가로질러 통과세포외배출하는 콜릭스 유래 담체는 LAMP1
+
또는 Rab7
+
와 공동-국소화하지 않을 수 있으며, 정점에서 기저로의 통과세포외배출 동안 리소좀으로부터 멀어질 수 있다.
이 실시예는 콜릭스 폴리펩티드로부터 유래된 담체가 통과세포외배출 동안 리소좀으로부터 멀어지므로 담체가 편광 상피 세포를 가로질러 변하지 않고 완전히 기능하는 통과세포외배출을 허용하는 리소좀 재순환 경로와 상호작용하지 않음을 나타낸다.
도 18a-18d는 in vivo에서 랫트 공장으로 내강내 주사 (ILI, 내강 표면은 도 18a-도 18f에서 백색 화살표로 나타냄)에 의해 투여된 인간 성장 호르몬 (hGH, 서열번호: 190)의 운명이 세포 흡수 후 리소좀으로 hGH의 수송을 기대하는 잠재적 대조군 실험으로 먼저 평가되었음을 나타낸다.
도 18a는 주사 (ILI) 후 15분에 hGH (서열번호: 190)의 국소화가 녹색 면역형광 검출에 의해 나타낸 바와 같이 상피 세포의 정점 영역 내 소포의 소집단으로 제한되었음을 나타낸다.
도 18b, 도 18c, 및 도 18d는 ILI 후 15분에, hGH (서열번호: 190)가 내재하는 LAMP1+, Rab7+ 리소좀과 거의 동일한 빈도 및 특성으로 (도 18d), 리소좀-관련 막 단백질 1 (LAMP1, 적색 형광) (도 18b) 및 Ras-관련 단백질 (Rab7, 자주색 형광) (도 18c)과 공동-국소화되었음을 나타내며, 이는 hGH가 상피 세포로 흡수된 직후 리소좀 파괴 (예를 들어, 재순환) 경로로 유도되었음을 나타낸다.
도 18e 및 도 18f는 스페이서 (서열번호: 175)를 통해 hGH (서열번호: 146)에 결합된 콜릭스 유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)가 리소좀 경로로부터 멀어졌으므로, LAMP1 (도 18e) 또는 Rab7 (도 18f)과 공동-국소화를 나타내지 않았으며, 이에 의해 편광 상피 세포를 가로질러 고유판으로 기능적 페이로드의 통과세포외배출을 가능하게 함을 나타낸다.
도 19a는 스페이서 (서열번호: 175)를 통해 hGH (서열번호: 146)에 결합된 콜릭스 유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 전에, 코팅 단백질 I (COPI, 적색 형광) 분포가 상피 세포의 내강 정점 막 및 정점 소포성 구획으로 제한되었음을 나타낸다. 이에 비해, 도 19b는 전달 구조체 (서열번호: 159)의 정점 내강내 주사 (ILI, 내강 표면은 도 19a-도 19d에서 백색 화살표로 나타냄)가, 핵상 위치로 COPI 재분포를 유도하였을 나타내며, 이는 서열번호: 159의 전달 구조체 및 COPI 둘 다를 함유하는 소포의 공동-국소화를 나타낸다. 청색 형광은 DAPI 염색을 나타낸다. ILI 후 15분에, 도 19a-19d의 측정을 수행하였다.
도 19c는 전달 구조체 (서열번호: 159)의 주사 전에, LMAN1 (녹색 형광)이 편광 상피 세포의 정점 영역 (백색 화살표로 강조됨)에서 COPI (적색 형광)와 공동-국소화되었음을 나타낸다.
도 19d는 전달 구조체 (서열번호: 159)의 정점 ILI (백색 화살표로 강조됨) 후에, LMAN1이 전달 구조체와 상호작용하여 고유판 ("l-p"로 나타냄)에 인접한 상피 세포의 기저 영역으로 분포하였음을 나타낸다. 따라서, LMAN1 재분포는 상피 세포의 정점 측면에서 기저 구획으로 이동하기 위해 콜릭스 담체에 의해 사용되는 것으로 보인다.
후속 실험은 콜릭스-유래 담체가 ERGIC 단백질 (예를 들어, ERGIC-53)을 이용하여 세포내이입 후에 정점에서 기저 구획으로 이동할 수 있음을 나타내었다.
도 19e-19h는 랫트 공장에서 hGH (서열번호: 146)에 결합된 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 후 5분 (도 19f), 10분 (도 19g), 및 15분 (도 19h)에 상피 세포의 정점 구획 (백색 화살표 #1으로 나타냄)에서 기저 구획 (백색 화살표 #2로 나타냄)으로의 콜릭스 담체 (서열번호: 134)의 트래피킹을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, ERGIC 수용체 국소화는 적색 형광으로 나타내고, ER-골지 트래피킹 단백질 복합체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 ER-골지 트래피킹 단백질 복합체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, ERGIC 수용체 및 ER-골지 트래피킹 단백질 복합체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 19e는 미처리된 편광 장 상피 세포를 나타낸다.
도 19f는 정점 구획에서 분홍색 형광 신호로 나타낸 바와 같이 정점 구획에서 내강 주사 후 5분에 콜릭스 담체 (서열번호: 134)와 ER-골지 트래피킹 단백질 복합체의 국소화 및 상호작용을 나타낸다.
도 19g는 내강 주사 후 10분에 기저막으로 ERGIG-53과 결합된 콜릭스 담체 (서열번호: 134)의 트래피킹에 이어 고유판 (금색 화살표)으로 담체 (및 구조체)의 기저 방출을 나타낸다. 이러한 자료는 콜릭스-유래 담체가 ERGIC 단백질과의 특이적 상호작용을 이용하여 편광 상피 세포의 정점 구획에서 기저 구획으로 소포성 트래피킹을 "강탈"할 수 있음을 나타내었다.
도 19h는 내강 주사 후 15분에 고유판에 존재하는 콜릭스 담체 (서열번호: 134)의 증가된 양을 나타낸다.
도 19i-19k는 콜릭스 담체 (서열번호: 134)가 기저 단백질 분비 메커니즘을 이용하여 편광 상피 세포를 통해 고유판으로 이동하였음을 나타낸다. 랫트 공장에서 hGH (서열번호: 146)에 결합된 콜릭스-유래 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 내강 주사 후 15분에 형광 현미경 영상을 얻었으며, 이는 기저 소포가 콜릭스 담체 및 ERGIC-53 수용체, 콜릭스 담체 및 기저 분비 단백질, 또는 콜릭스 담체, ERGIC-53 수용체 및 기저 분비 단백질의 3개 모두를 함유할 수 있음을 나타내었다. 콜릭스 담체 국소화는 (항-콜릭스 담체 항체를 이용하여) 녹색 형광으로 나타내며, ERGIC-53 수용체 국소화는 적색 형광으로 나타내고, 기저 분비 단백질의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC-53 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 기저 분비 단백질의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, ERGIC-53 수용체 및 기저 분비 단백질의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 19i는 황색 형광으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134) 및 ERGIC-53 수용체를 함유하였음을 나타낸다.
도 19j는 분홍색 형광으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134) 및 기저 분비 단백질을 함유하였음을 나타낸다.
도 19k는 백색 반점 (예를 들어, 녹색, 적색 및 자주색 형광의 중첩)으로 나타낸 바와 같이 기저 구획 소포가 콜릭스 담체 (서열번호: 134), ERGIC-53 수용체 및 기저 분비 단백질을 함유하였음을 나타낸다.
도 20a는 전달 구조체 (서열번호: 159)의 부재 하에, 또 다른 소포체-골지-중간 구획 (ERGIC) 요소인 SEC22b의 분포를 나타낸다. 미처리된 (즉, 전달 구조체의 주입 없음) 조직에서, SEC22b 및 LMAN1은 정점 구획에서 광범위하게 공동-국소화되는 반면, LMAN1 단독은 정점 원형질막 가까이에서 별도로 관찰되었다. 도 20a-20d에서, 적색 형광은 LMAN1의 국소화를 나타내며, 자주색 형광은 SEC22b의 국소화를 나타내고, 녹색 형광은 hGH의 국소화를 나타내며, 백색 화살표는 정점 표면을 나타내고, "G"는 배상 세포를 나타낸다.
도 20b는 hGH (서열번호: 146)에 결합된 콜릭스 담체 (서열번호: 134)를 포함하는 전달 구조체 (서열번호: 159)의 ILI 후 5분에, LMAN1, SEC22b, 및 hGH는 상피 세포의 정점 구획에서 공동-국소화되었으나, 상피 세포의 기저 구획에서는 상당히 공동-국소화되지 않았음을 나타낸다.
도 20c는 ILI 후 10분에, 전달 구조체 (서열번호: 159) 및 LMAN1이 SEC22b 없이 상피 세포의 기저 구획에서 공동-국소화되는 것으로 관찰되었음을 나타내며, 이는 LMAN1이 상피 세포의 정점에서 기저 소포성 구획으로 소포 내부의 전달 구조체와 상호작용하고 이동하였음을 확인한다.
도 20d는 ILI 후 15분에, 기저 구획에서 공동-국소화하는 전달 구조체 (서열번호: 159) 및 LMAN1의 정도가 증가하였으며, 상당한 양의 hGH가 시간이 지남에 따라 고유판에 도달함을 나타낸다.
도 20e-도 20h는 도 20a-도 20d에서 상기 기재되고 나타낸 것과 동일한 조직 부문을 나타내나, LMAN1 및 SEC22b 신호만을 나타낸다 (hGH 신호 없음). 이는 전달 구조체 (서열번호: 159)의 정점 적용에 대한 반응으로 SEC22b의 재분포없이 기저 구획으로 LMAN1의 완전한 재분포를 나타내었다. 이러한 자료는 콜릭스 유래 담체를 포함하는 전달 구조체가 페이로드를 담체에 결합함으로써 장 상피를 가로질러 페이로드의 빠르고 효율적인 수송을 허용하는 내인성 콜릭스 트래피킹 경로를 이용할 수 있음을 더 나타내었다.
종합하면, 이러한 자료는 콜릭스-유래 담체가 내인성 박테리아 트래피킹 메커니즘을 이용하여 정점에서 기저로의 통과세포외배출을 달성함을 나타내었으며, 이는 이러한 담체 및 이러한 담체를 포함하는 전달 구조체가 장 상피의 장벽 기능을 손상시키지 않고 이러한 수송 중에 효소적으로 또는 화학적으로 변형되지 않고 장 내강에서 고유판으로 이동하도록 허용한다. 이러한 경상피 수송 메커니즘은 치료용 페이로드에 결합된 콜릭스-유래 담체를 포함하는 치료용 전달 구조체의 경구 투여 및 온전한 편광 상피 막을 가로질러 치료용 페이로드의 수송을 가능하게 할 수 있다.
실시예 11
콜릭스 유래 담체의 표면 모델
이 실시예는 서열번호: 178의 콜릭스 폴리펩티드의 구조적 서열 요소를 나타낸다.
도 21a-21e는 단백질 표면에서 이들의 상대적 위치 및 근접성뿐만 아니라, 정점에서 기저로의 통과세포외배출과 관련된 특정 기능에서 역할을 할 수 있는 선택된 관심 영역을 강조하는데 사용된 서열번호: 178 (서열번호: 1의 아미노산 잔기 1-265 및 N-말단 메티오닌을 포함)로 이루어진 콜릭스 유래 담체의 예시적인 표면 모델을 나타낸다. 잔기 V1 및 E39 내에 위치한 아미노산 영역은 표면 노출된 아미노산 D150-K186 및 K186-L205에 인접해 있다. 구체적으로, L17-I25 (영역 X1, 서열번호: 160) 및 T170-I176 (영역 X2, 서열번호: 161)은 여러 개의 음전하로 둘러싸인 주머니를 형성하도록 조정된다. 유사하게, K186-H202 (영역 X3, 서열번호: 162)는 I31-E39 (영역 X4, 서열번호: 163)와 조정하여 연속 능선 구조를 형성한다. 또한, 표면 모델은 잔기 D135-N139 (영역 X5, 서열번호: 164), 및 자주색으로 강조된 아스파라긴 잔기 (예를 들어, 잠재적 당화 부위)를 나타낸다.
도 21a는 서열번호: 178의 콜릭스 폴리펩티드의 아미노산 서열을 나타낸다. 도 21b는 영역 X1, X3 및 X4의 위치를 나타낸다. 도 21c는 영역 X1 및 X2, 및 X3 및 X4의 위치를 나타낸다. 도 21d는 영역 X1, X2, X4 및 X5의 위치를 나타낸다.
이 구조 자료는 서열번호: 1의 콜릭스 서열 내의 기능적 서열 단편이 영역 X3 및 X4 및 영역 X1 및 X2와 같이 서로 매우 근접할 수 있음을 나타낸다.
실시예 12
콜릭스 유래 전달 구조체는 별개의 구획을 이용하여 통과세포외배출 동안 다양한 마커 단백질과 상호작용 및/또는 공동-국소화한다.
이 실시예는 콜릭스 유래 담체가 다양한 마커 단백질을 이용하여 상피 세포 내로 및 상피 세포를 가로질러 (예를 들어, 통과세포외배출을 통해) 트래피킹하기 위해 별개의 구획을 이용할 수 있음을 나타낸다 (예를 들어, 실시예 8 참조). 이러한 자료는 콜릭스 유래 담체 구조체가 특이적 및 내인성 콜릭스 트래피킹 경로를 이용하거나 또는 "강탈"할 수 있음을 나타낸다 (도 24). 이 실시예에 기재된 연구는 서열번호: 176에 제시된 서열을 갖는 스페이서를 통해 IL-10 (서열번호: 145)에 결합된 담체 (서열번호: 135)를 포함하는 서열번호: 149에 제시된 서열을 갖는 콜릭스 유래 전달 구조체를 이용하여 수행되었다.
도 22a-22l은 유도된 전달 구조체 (서열번호: 149)에 대한 트래피킹 경로 분석을 나타낸다. 도 22a-22l에서, 백색 화살표 #1은 정점 표면을 강조하며, 백색 화살표 #2는 기저 표면을 강조하고, 백색 화살표 #3은 고유판을 강조한다.
도 22a는 전달 구조체 (서열번호: 149)가 상피 세포의 정점 구획 및 기저 구획 둘 다에서 트래피킹과 일치하는 세포 위치에서 EEA1 항원과 강하게 공동-국소화되었음을 나타내며, 이는 초기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다. 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다.
도 22b는 전달 구조체 (서열번호: 149)가 주로 상피 세포의 정점 구획에서 Rab7 (왼쪽 상단)과 강하게 공동-국소화되었으나, 고유판 내의 세포에서 제한된 공동-국소화만 있음을 나타내며, 이는 후기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다 (왼쪽 하단은 백색광 영상을 나타내며, 오른쪽 하단은 청색으로 나타낸 DAPI 염색과 병합된 염색을 나타내고, 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다).
도 22c는 LAMP1이 전달 구조체 (서열번호: 149)가 없는 성숙 리소좀과 일치하는 크고 특정한 소포에서 확인되었음을 나타낸다 (백색 화살표, 적색 형광은 EEA1 항원의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다). 그러나, 전달 구조체 (서열번호: 149)는 상피 세포의 정점 구획 및 기저 구획 둘 다에서 소포 트래피킹과 일치하는, 리소좀-유사 구조 이외의 세포 위치에서 LAMP1 항원과 공동-국소화되었으며, 이는 후기 엔도좀 구획에서 콜릭스 유래 전달 구조체의 존재를 시사한다.
도 22d는 전달 구조체 (서열번호: 149)도 특히 핵에 인접한 영역에서 클라트린-코팅된 소포, 및 고유판 내의 선택된 세포에서 뿐만 아니라 상피 세포의 기저 구획에서 주로 Rab11a와 강하게 공동-국소화되었음을 나타낸다. DAPI 염색은 청색 으로 나타내며, 적색 형광은 IL-10 항원의 국소화를 나타내고, 녹색 형광은 클라트린의 국소화를 나타낸다.
도 22e는 전달 구조체 (서열번호: 149)가 상피 세포에서 핵에 인접한 패턴으로 및 고유판 내의 대부분의 세포에서 칼넥신에 의해 나타낸 바와 같이 소포체와 공동-국소화되었음을 나타낸다 (적색 형광은 칼넥신의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타낸다). 구체적으로, 주사 후 5분 (도 22f), 10분 (도 22g), 및 15분 (도 22h)에 나타낸 바와 같이, 전달 구조체 (서열번호: 149)는 담체 세포내이입 및 통과세포외배출에 대한 반응으로 재-분포되는 것으로 나타난 소포체 골지 중간 구획 (ERGIC) 및 LAMN1 항원과 강하게 공동-국소화되었다.
도 22f는 주사 후 5분에 나타낸 바와 같이, 전달 구조체 (서열번호: 149)가 담체 세포내이입 및 통과세포외배출에 대한 반응으로 재-분포되는 것으로 나타난 소포체 골지 중간 구획 53 (ERGIC-53) 및 LAMN1 항원과 강하게 공동-국소화되었음을 나타낸다 (적색 형광은 ERGIC-53 및 LMAN1의 국소화를 나타내며, 녹색 형광은 IL-10의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다).
도 22g는 주사 후 10분에, 전달 구조체 (서열번호: 149)가 LMAN1 항원과 공동-국소화되었음을 나타낸다. 자료는 고유판에서 전달 구조체 (서열번호: 149)의 상당한 국소화를 나타낸다.
도 22h는 주사 후 15분에, 전달 구조체 (서열번호: 149)가 LMAN1 항원과 공동-국소화되었음을 나타낸다. 자료는 고유판에서 전달 구조체 (서열번호: 149)의 상당한 국소화를 나타낸다.
도 22i는 전달 구조체 (서열번호: 149)가 상피 세포에 존재하는 낮은 수준의 기안틴(giantin)과 공동-국소화되지 않았음을 나타낸다 (적색 형광은 IL-10의 국소화를 나타내며, 녹색 형광은 기안틴의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타낸다). 일부 기안틴은 고유판에 존재하는 세포의 하위집합에서 구조체와 공동-국소화되었으며, 이는 콜릭스 유래 담체가 골지 구획과 국소화되지 않았음을 시사한다.
도 22j는 58K 항원이 핵의 정점 부위에서의 상피 세포에서 국소화되었으며, 전달 구조체 (서열번호: 149)가 이 구획을 통한 짧은 이동을 제안하는 방식으로 이 단백질과 일부 공동-국소화 (적색 형광은 IL-10의 국소화를 나타내며, 녹색 형광은 58K 골지 항원의 국소화를 나타내고, 청색 형광은 DAPI 염색을 나타냄)를 나타내었음을 나타낸다. 고유판 내의 세포에서는 58K 항원이 관찰되지 않았다.
도 22k는 전달 구조체 (서열번호: 149, 왼쪽 상단, IL-10 국소화)가 TGN38 항원 (오른쪽 상단)과 일정 수준의 공동-국소화를 나타내었으며, 이는 상피 세포에서 핵의 정점 측면으로 제한되고 고유판 내의 몇몇 세포에서 핵에 인접한 세포 분포를 나타내었음을 나타낸다. 왼쪽 하단 영상은 백색광 영상을 나타내며, 오른쪽 하단은 IL-10 (적색), TGN38 (녹색), 및 DAPI 신호 (청색 형광)와의 병합 (중첩)을 나타낸다.
도 22l은 전달 구조체 (서열번호: 149) (녹색 형광으로 나타낸 IL-10 국소화, 오른쪽 상단)가 주로 상피 세포의 기저 구획 및 고유판 내의 선택된 세포에서 Rab11a (왼쪽 상단, 적색 형광으로 나타낸 국소화)와 강하게 공동-국소화되었음을 나타낸다. 왼쪽 하단 영상은 백색광 영상을 나타내며, 오른쪽 하단은 IL-10 (녹색), Rab11a (적색), 및 DAPI 신호 (청색 형광)와의 병합 (중첩)을 나타낸다.
도 23a-23c는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후에, 다양한 시점에서 비스타 랫트의 편광 장 상피 세포를 가로질러 IL-10의 통과세포외배출을 나타내는 현미경 영상을 나타낸다. 전달 구조체 (서열번호: 149)는 서열번호: 176에 제시된 아미노산 서열을 갖는 스페이서를 통해 서열번호: 145에 제시된 아미노산 서열을 갖는 IL-10 페이로드에 결합된 서열번호: 135의 담체를 포함하였다. 녹색 형광은 IL-10의 존재를 나타낸다 (항-IL-10 항체로 염색을 통해). 청색 형광은 DNA를 표지하는 DAPI 염색을 나타내며, 적색 형광은 콜릭스-유래 담체가 통과세포외배출 동안 (예를 들어, 상피 세포의 핵상 영역에서) 공동-국소화할 수 있는 CK-8 (시토케라틴-8)의 존재를 나타낸다. 백색 화살표 #1은 상피 세포의 정점 막을 강조하며, 백색 화살표 #2는 상피 세포의 기저막을 강조한다.
도 23a는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 1분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 정점에서 기저 부위로 및 고유판으로의 IL-10 페이로드의 수송이 전달 구조체의 적용 후 빠르면 1분에 발생하였음을 나타내었다. 백색 화살표 #3은 고유판에서 IL-10의 존재를 나타낸다.
도 23b는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 5분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 전달 구조체의 내강 적용 후 5분에 고유판에 존재하는 수송된 IL-10의 증가된 양을 나타낸다 (예를 들어, 백색 화살표 #3 참조).
도 23c는 랫트 공장으로 서열번호: 149에 제시된 서열을 갖는 전달 구조체의 내강 적용 후 10분에, IL-10의 통과세포외배출의 정도를 나타낸다. 자료는 전달 구조체의 내강 적용 후 10분에 고유판에 존재하는 수송된 IL-10 페이로드의 훨씬 더 많은 양을 나타낸다 (예를 들어, 백색 화살표 #3 참조).
형광 현미경을 이용한 추가 트래피킹 실험을 수행하여 서열번호: 149의 전달 구조체에 포함된 서열번호: 135의 콜릭스 담체의 통과세포외배출 메커니즘을 규명하였다.
도 23d-23f는 랫트 공장에서 IL-10 (서열번호: 145)에 결합된 서열번호: 135의 콜릭스 담체를 포함하는 전달 구조체 (서열번호: 149)의 내강 주사 후 1분에, 상피 세포에서 서열번호: 135의 콜릭스 담체의 정점 세포내이입 및 초기 트래피킹을 나타낸다. 자료는 콜릭스-유래 담체가 리소좀 회피 수용체와 상호작용함으로써 리소좀 파괴 경로를 피한다는 것을 나타내었다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, 정점 진입 수용체 (예를 들어, TMEM132) 국소화는 적색 형광으로 나타내고, 리소좀 회피 수용체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 정점 진입 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 리소좀 회피 수용체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, 정점 진입 수용체 및 리소좀 회피 수용체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 23d는 편광 상피 세포의 정점 막 (백색 화살표 #1로 나타냄)에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 기저막은 백색 화살표 #2로 나타내며, 고유판은 백색 화살표 #3으로 나타낸다.
도 23e는 정점 막에서 및 그 주위에서 황색 형광으로 나타낸 바와 같이, 콜릭스 담체 (서열번호: 135)와 정점 진입 수용체 (예를 들어, TMEM132)의 상호작용을 나타낸다.
도 23f는 콜릭스 담체 (서열번호: 135), 정점 진입 수용체, 및 리소좀 회피 수용체가 백색 화살표로 나타낸 백색 반점 (예를 들어, 녹색, 적색 및 자주색 형광의 중첩)으로 나타낸 바와 같이 정점 막에서 매우 근접해 있음을 나타낸다. 예를 들어, 도 15b에 나타낸 바와 같이, 이들 콜릭스 담체-수용체 상호작용의 pH 환경 및 pH-의존성의 변화로 인해, 리소좀 회피 수용체는 콜릭스 담체-정점 진입 수용체 복합체에 접근할 수 있으며, 이어서 콜릭스 담체와 정점 진입 수용체의 해리 및 콜릭스 담체와 리소좀 회피 수용체의 결합이 뒤따를 수 있다고 가정한다.
도 23g-23h는 랫트 공장에서 IL-10 (서열번호: 145)에 결합된 콜릭스-유래 담체 (서열번호: 135)를 포함하는 전달 구조체 (서열번호: 149)의 내강 주사 후 5분 및 15분에, 상피 세포에서 정점에서 핵상 구획으로의 콜릭스 담체 (서열번호: 135)의 트래피킹을 나타낸다. 콜릭스 담체 국소화는 녹색 형광으로 나타내며, ERGIC 수용체 국소화는 적색 형광으로 나타내고, 정점 진입 수용체 (예를 들어, TMEM132) 국소화는 주황색 형광으로 나타내며, 리소좀 회피 수용체의 국소화는 자주색 형광으로 나타낸다; 따라서 콜릭스 담체와 ERGIC 수용체의 상호작용은 황색 형광으로 나타내며, 콜릭스 담체와 리소좀 회피 수용체의 상호작용은 분홍색 형광으로 나타내고, 콜릭스 담체, 정점 진입 수용체 및 리소좀 회피 수용체의 상호작용 및/또는 공동-국소화는 백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타낸다. DAPI 염색은 청색 형광으로 나타낸다.
도 23g는 전달 구조체 (서열번호: 149)의 내강 주사 후 5분에, 편광 장 상피 세포에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 자료는 정점 수용체-매개 세포내이입 후에, 콜릭스 담체가 리소좀 회피 수용체 및 정점 막에 가까운 정점 진입 수용체와 복합체를 형성하였으며 (백색 반점 (녹색, 적색 및 자주색 형광의 중첩)으로 나타내며, 백색 화살표로 강조됨), 또한 세포 내의 핵상 영역에 약간 더 가까운 황색 형광 (및 황색 화살표)으로 나타낸 바와 같이 ERGIC 수용체와 상호작용을 시작하였음을 나타내었다.
도 23h는 전달 구조체 (서열번호: 149)의 내강 주사 후 15분에, 편광 장 상피 세포에서 콜릭스 담체 (서열번호: 135)의 국소화를 나타낸다. 자료는 담체가 ERGIC (황색 화살표 참조)와 결합되는 동안 정점에서 핵상 구획으로 이동하였으며, 여기서 황색 형광 강도는 주사 후 5분에 비해 증가하였음을 나타내고, 이는 시간이 지남에 따라 정점에서 핵상 영역으로 콜릭스 담체 이동이 증가하였음을 나타낸다. 자료는 기저막 및 고유판 (금색 화살표)에서 콜릭스 담체의 국소화를 더 나타내었다.
종합하면, 이러한 자료는 콜릭스 유래 담체가 내인성 콜릭스 트래피킹 경로를 이용하여 편광 상피 세포를 가로질러 통과세포외배출할 수 있으므로, 이러한 페이로드의 생물학적 활성을 손상시키지 않고 상피 세포 장벽을 가로질러 페이로드 (예를 들어, 인터루킨과 같은 치료용 단백질)를 빠르게 효율적으로 수송하는데 사용될 수 있음을 나타내었다.
실시예 13
상피 세포층을 가로질러 항-TNFα 제제의 수송
이 실시예는 콜릭스 폴리펩티드 유래 담체가 온전한 상피 세포층을 가로질러 항-TNFα 제제를 수송할 수 있음을 나타낸다.
전달 구조체는 하기와 같이 장 상피 수송에 대해 시험한다: 야생형 랫트 (Sprague Dawley®, ~200 - 250 그램, ~ 6 주령, 찰스 리버(Charles River)에서 구입)를 밤새도록 금식시켜 장을 청소한다; 4% 포름알데히드를 함유하는 마이크로퓨즈 튜브(microfuge tubes), 조직 보존용 튜브, 혈액 수집용 마이크로퓨즈 튜브, 혈청 수집용 마이크로퓨즈 튜브, PBS 및 시험 물품을 준비한다; 실험을 위해 동물을 준비한다 (이소플로란으로 동물을 마취시키고, 복부를 면도한다); 각 동물에 대해 주사를 준비한다 (각 동물은 4회 주사 (2 x 공장 및 2 x 결장)를 받는다); 복강을 열고, 주사 부위의 위치를 찾고 구별되는 색으로 표시하였다; 시험 물품을 내강으로 천천히 주사하고 (주사는 결장에서 10분, 공장에서 40분에 발생함), 동물은 1 μg/μL의 농도로 주사 당 35 μg의 단백질을 받는다; 동물을 50분에 안락사시킨다; 말단 혈액을 심장 천자를 통해 수집한다; 공장과 결장을 제거하고 플라스틱으로 된(plastic-lined) 작업 표면에 놓았다; PBS를 이용하여 공장과 결장의 내용물을 씻어 버렸다; 주사 부위에서 1cm 길이의 장을 절개한다; 절개된 조직을 반으로 자르고, 1 절편을 4% 포름알데히드에 넣는다. 나머지 조직은 세로로 얇게 썬 다음, 즉시 마이크로퓨즈 튜브에 넣고 동결시킨다. 이 과정은 모든 주사 부위에 대해 반복될 수 있다. 간 (~1cm3)을 제거하고 2 조각으로 나눈다. 간의 1 절편을 포름알데히드에 넣고 2번째 절편은 즉시 냉동 보관한다. 장, 간 및 혈액 혈청 시료를 40분 종료시 수집한다. 혈액 시료를 원심분리하고 혈청을 저장용 용기로 옮긴다. 시료를 드라이-아이스로 수송하고 -80℃에서 저장한다. 투여 계획은 하기와 같다: Chx386-항-TNFα 100 μL, 490 pmol/98 μg (4.9μM); Chx415-항-TNFα 100 μL, 490 pmol/99.5 μg (4.9μM); 항-TNFα 100 μL, 490 pmol/76 μg (4.9μM).
콜릭스-항-TNF-α 구조체의 장 상피 수송에 대한 생물분석학적 분석 (Bioanalytical analysis)은 하기와 같이 마우스 IgG1 ELISA 키트 (abcam®, Cat# ab133045)를 이용하여 수행된다: 조직 시료를 Brains On-line에서 얻는다; 300 μL 분석 완충액 1X를 조직 시료를 함유하는 각 튜브에 첨가한다; 조직을 분석 완충액에서 제거하고, 멸균되고 깨끗한 세포 배양 뚜껑 플레이트에 놓는다; 장 시료를 조심스럽게 세포 스크래퍼(cell scrapper)로 부드럽게 긁어내어 장간막의 수집을 피한다; 간 시료를 추가 침연(maceration) 및 균질화와 유사한 방식으로 처리한다; 결과로 생성된 세포 균질액(homogenate)을 원래의 튜브로 다시 옮긴다; 나머지 조직 시료와 작업 영역을 100 μL 완충액 (2x)으로 헹군다; 세포 균질 용액을 최대 힘으로 5분 동안 원심분리한다; 제조자의 지시에 따라 ELISA 플레이트에 상청액을 적용한다. 나머지 상청액은 나중에 사용하기 위해 -20℃에서 저장된다.
도 25는 Cholix386 유래 담체 (예를 들어, 서열번호: 135 또는 180) 및 Cholix415 유래 담체 (예를 들어, 서열번호: 1의 잔기 1-415 포함) 둘 다 10분 및 40분에 장 상피 세포를 가로질러 항-TNFα 제제 (예를 들어, 항-TNFα 항체 또는 이의 기능적 단편)를 수송함을 나타낸다. 또한, Cholix386-항-TNFα 구조체는 항-TNF-α 단독의 약 12× 속도로 수송하고, Cholix415-항-TNFα는 항-TNF-α 단독의 ~7× 속도로 수송한다.
이러한 자료는 콜릭스 유래 담체가 온전한 편광 상피 세포층을 가로질러 항-TNFα 제제와 같은 다양한 페이로드 분자를 수송할 수 있음을 나타낸다.
실시예 14
엑세나티드를 포함하는 전달 구조체의 제조
엑세나티드 (서열번호: 195)는 C-말단 아민 및 N-말단 H에 의해 안정화된 GLP-1 유사 생물학적 활성을 갖는 펩티드이다. 이 실시예에서, 1) 서열번호: 192를 갖는 담체로 처리되고 서열번호: 195에 가교결합된 서열번호: 194를 갖는 담체, 및 2) 서열번호: 193을 갖는 담체로 처리되고 서열번호: 195에 가교결합된 서열번호: 191을 갖는 담체를 포함하는, 2개의 비-자연적으로 발생하는 분리된 구조체를 제조하고, in vivo에서 장 상피 수송에 대해 시험하였다. 서열번호: 191 및 서열번호: 192를 갖는 담체를 본 명세서에 기재된 바와 같이 제조하였으며, 엑세나티드 (서열번호: 195) (Cat# HOR-246)는 ProSpec-Tany Technogene Ltd. PO Box 6591, East Brunswick, NJ 08816에서 구입하였다. 설포-SMCC 가교제를 포함하는 PierceTM 조절 단백질-단백질 가교 키트 (Cat# 23456)를 ThermoFisher에서 구입하였다.
페이로드 및 담체 활성화 및 가교결합:
엑세나티드 (10 mg)를 5 mL H20에 용해시켜 2 mg/mL 용액을 형성하였다. 설포-SMCC (2 mg)를 2 mL의 PBS에 용해시켰다. 그 직후, 0.088mL (~5배 몰 과량)의 설포-SMCC 용액을 1.0 mL 엑세나티드 용액에 첨가하고 실온에서 30분 동안 배양하였다. 1.0 mL의 말레이미드-엑세나티드 반응 혼합물을 PBS로 평형화된 탈염 컬럼에 적용시키고, PBS로 용리한 다음, 0.5 mL 분획을 수집하여 미반응 설포-SMCC를 제거하였다. 280nm에서 각 분획의 흡광도를 측정하여 단백질 피크의 위치를 찾았다. 대부분의 단백질을 함유하는 피크 분획을 모았다. 모아진 활성화된 엑세나티드의 농도는 280 nm에서 이의 흡광도와 원래 단백질 용액의 흡광도를 비교하여 결정되었다.
서열번호: 193 및 서열번호: 194를 갖는 담체는 이황화 결합을 형성하는 2개의 시스테인 잔기가 측면에 있는 TEV 절단 부위 및 C-말단 His6 태그를 포함하는 C-말단 연장을 가진다. 서열번호: 193 및 서열번호: 194를 갖는 담체를 표준 방법을 이용하여 HisTrap 컬럼에서 정제하였다. pH 7.4에서 PBS 내 2 mg 단백질 (200 μL의 10 mg/ml)은 2 μl의 0.1M 디티오트레이톨 및 5 μl의 TEV 프로테아제로 30℃에서 2시간 동안 처리하여 활성화시켰다. 절단되고 환원된 단백질을 PBS로 평형화된 1-ml HisTrap 컬럼에 적용하였다. 컬럼에 결합된 C-말단 단편 및 이의 C-말단 근처에 유리 시스테인이 있는 활성화된 N-말단 서열번호: 191 또는 서열번호: 192 생성물을 통과액(flow through)에서 수집하였다.
말레이미드-활성화된 엑세나티드 및 담체 (설프히드릴-서열번호: 191 단백질 또는 설프히드릴-서열번호: 192 단백질)를 동몰량으로 혼합한 다음, 실온에서 60분 동안 배양하였다. SMCC-가교결합된 서열번호: 192 - 엑세나티드 복합체의 순도를 쿠마씨-염색된 SDS 겔 상에서 평가하였다. 복합체는 대략 정확한 분자량이었고, >90% 순도를 가졌다 (도 26). 그 다음, 가교결합된 전달 구조체를 4℃에서 저장하였다.
실시예 15
엑세나티드 전달 구조체의
In vivo
통과세포외배출
전달 구조체는 하기와 같이 장 상피 수송에 대해 시험하였다: 야생형 Sprague Dawley® 랫트 (~200 - 250 그램, ~ 6 주령, 찰스 리버에서 구입)를 밤새도록 금식시켜 이들의 장을 청소하였다; 하기의 물질을 준비하였다: 4% 포름알데히드를 함유하는 마이크로퓨즈 튜브, 조직 보존용 튜브, 혈액 수집용 마이크로퓨즈 튜브, 혈청 수집용 마이크로퓨즈 튜브, PBS 및 시험 물품. 실험을 위해 이소플로란으로 동물을 마취시키고, 이들의 복부를 면도하여 동물을 준비하였다. 각 동물에 대해 4회 주사를 준비하였다 (공장 당 2회 및 결장 당 2회). 복강을 열였다. 주사 부위의 위치를 찾고 구별되는 색으로 표시하였다. 시험 물품을 결장에 대해 10분 및 공장에 대해 40분 동안 내강으로 천천히 주사하였다. 동물은 1 μg/μL의 농도로 주사 당 35 μg의 단백질을 받았다. 동물을 50분에 안락사시켰다. 말단 혈액을 심장 천자를 통해 수집하였다. 공장과 결장을 제거하고 플라스틱으로 된 작업 표면에 놓았다. PBS를 이용하여 공장과 결장의 내용물을 씻어 버렸다. 주사 부위에서 1cm 길이의 장을 절개하였다. 절개된 조직을 반으로 잘랐다. 하나의 절편을 4% 포름알데히드에 넣었다. 나머지 조직은 세로로 얇게 썬 다음, 즉시 마이크로퓨즈 튜브에 넣고 동결시켰다. 이 과정은 모든 주사 부위에 대해 반복되었다. 간 (~1cm3)을 제거하고 2 조각으로 나누었다. 저장을 위해, 간의 하나의 절편을 포름알데히드에 넣고 2번째 절편은 즉시 냉동 보관하였다. 장, 간 및 혈액 혈청 시료를 주사 후 40분에 수집하였다. 혈액 시료를 원심분리하고, 결과로 생성된 혈청을 저장용 용기로 옮겼다. 시료를 드라이-아이스로 수송하고 -80℃에서 저장하였다. 투여 계획은 하기와 같았다: 서열번호: 192-엑세나티드 100 μL, 490 pmol / 29.4 μg (4.9 μM); 서열번호: 191-엑세나티드 100 μL, 490 pmol / 30.9 μg (4.9 μM); 서열번호: 195, 100 μL, 490 pmol/2 μg (4.9 μM).
서열번호: 192-엑세나티드, 서열번호: 191-엑세나티드, 및 서열번호: 195 (엑세나티드)의 장 상피 수송에 대한 생물분석학적 분석은 하기와 같이 엑센딘-4 ELISA 키트 (Phoenix Pharma, Cat# EK-070-94)를 이용하여 수행되었다: 조직 시료를 Brains On-line에서 얻었다; 300 μL 분석 완충액 (1X)을 조직 시료를 함유하는 각 튜브에 첨가하였다; 조직을 분석 완충액에서 제거하고, 멸균되고 깨끗한 세포 배양 뚜껑 플레이트에 놓았다; 장 시료를 조심스럽게 세포 스크래퍼로 부드럽게 긁어내어 장간막의 수집을 피하였다; 간 시료를 추가 침연 및 균질화와 유사한 방식으로 처리하였다; 결과로 생성된 세포 균질액을 원래의 튜브로 다시 옮겼다; 나머지 조직 시료와 작업 영역을 100 μL 완충액 (2x)으로 헹구었다; 세포 균질 용액을 최대 힘으로 5분 동안 원심분리하였다; 제조자의 지시에 따라 처리된 ELISA 플레이트에 상청액을 적용하였다. 나머지 상청액은 나중에 사용하기 위해 -20℃에서 저장된다.
도 27에 나타낸 바와 같이, 장 상피 세포를 가로질러 서열번호: 192-엑세나티드 및 서열번호: 191-엑세나티드의 수송을 10분 및 40분에 관찰하였다. 또한, 서열번호: 192-엑세나티드 및 서열번호: 191-엑세나티드는 둘 다 특히 40분에 서열번호: 195 (엑세나티드) 단독보다 높은 속도로 수송하였다.
실시예 16
스페이서 길이 및 담체의 N- 또는 C-말단에 페이로드의 결합은 페이로드의 생물학적 활성에 상당히 영향을 미치지 않는다.
이 실시예는 다양한 길이의 아미노산 링커 및 담체의 N-말단에 이종성 페이로드의 결합이 전달 구조체에 포함될 때 페이로드의 표적 결합 능력에 상당히 영향을 미치지 않음을 나타낸다.
DiscoverX HEK293 세포를 씨딩하고 표시된 농도의 작용제 (IL-22 페이로드를 함유하는 전달 구조체)를 이용하여 16 h (웰당 5,000 세포) 동안 세포를 배양하여, IL-22 수용체 이량체화 분석을 수행하였다. PathHunter® eXpress IL22RA1/IL10RB 이량체화 분석을 이용하여 플레이트 판독기에서 종료점 발광을 판독하였다.
도 28a는 서열번호: 175, 196 및 197의 스페이서의 아미노산 길이가 서열번호: 147, 198 및 199의 전달 구조체에 포함될 때 IL-22 (서열번호: 142)의 능력에 영향을 미치지 않고 IL-22 수용체 이량체화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22, 서열번호: 143)의 수용체 이량체화의 유도는 검은색 곡선으로 나타낸다.
도 28b는 서열번호: 196의 스페이서를 통해 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체의 N- 또는 C-말단에 IL-22 페이로드 (서열번호: 142)의 결합이 서열번호: 198, 200 및 201의 전달 구조체의 능력을 상당히 변화시키지 않고 IL-22 수용체 이량체화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22)의 수용체 이량체화의 유도는 검은색 곡선으로 나타낸다.
15분 동안 다양한 농도를 갖는 10 μL의 작용제 (각각의 전달 구조체 또는 IL-22 대조군)와 함께 배양된 Colo205 세포를 이용하여 pSTAT3 활성화 분석을 수행하였다. 그 다음, MSD STAT3 플레이트 (Cat. No. N450SMA-1)를 이용하여 pSTAT3 활성화의 연장을 판독하였다.
도 28c는 서열번호: 175, 196 및 197의 스페이서의 아미노산 길이가 서열번호: 147, 198 및 199의 전달 구조체에 포함될 때 IL-22 (서열번호: 142)의 능력에 영향을 미치지 않고 pSTAT3 활성화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22, 서열번호: 143)의 pSTAT3 활성화는 검은색 곡선으로 나타낸다.
도 28d는 서열번호: 196의 스페이서를 통해 서열번호: 1의 아미노산 잔기 1-266을 포함하는 담체의 N- 또는 C-말단에 IL-22 페이로드 (서열번호: 142)의 결합이 서열번호: 198, 200 및 201의 전달 구조체의 능력을 상당히 변화시키지 않고 pSTAT3 활성화를 유도하였음을 나타낸다. 대조군 재조합 인간 IL-22 (rhIL-22)의 pSTAT3 활성화는 검은색 곡선으로 나타낸다.
본 명세서에 개시되고 청구된 모든 물품 및 방법은 본 발명의 관점에서 과도한 실험 없이 제조되고 수행될 수 있다. 본 발명의 물품 및 방법이 실시예에 의하여 기재되었지만, 본 발명의 정신 및 범위로부터 벗어나지 않고 물품 및 방법에 변화를 적용할 수 있음은 통상의 기술자에게 명백할 것이다. 통상의 기술자에게 명백한 이러한 모든 변화 및 균등물은, 현재 존재하든 또는 나중에 개발되든, 첨부된 청구범위에 의해 정의된 바와 같이 본 발명의 정신 및 범위 내에 있는 것으로 간주된다. 본 명세서에 언급된 모든 특허, 특허 출원 및 간행물은 본 발명이 속하는 기술 분야에서 통상의 기술자의 수준을 나타낸다. 모든 특허, 특허 출원 및 간행물은 모든 목적을 위해, 그리고 마치 각 개개의 간행물이 임의의 및 모든 목적을 위해 전체 참조로 포함되도록 구체적이고 개별적으로 나타낸 것과 동일한 정도로, 본 명세서에 전체 참조로 포함된다. 본 명세서에 예시적으로 기재된 발명은 본 명세서에 구체적으로 개시되지 않은 임의의 요소(들)의 부재 하에 적절하게 실시될 수 있다. 사용된 용어 및 표현은 설명의 용어로서 사용되는 것이지 제한을 위한 것이 아니며, 나타내고 기재된 특징 또는 이의 일부의 임의의 등가물을 배제하는 이러한 용어 및 표현의 사용에 있어서 의도는 없지만, 청구된 발명의 범위 내에서 다양한 변형이 가능하다는 것이 인정된다. 따라서, 본 발명이 실시예들 및 임의의 특징들에 의해 구체적으로 개시되었지만, 본 명세서에 개시된 개념들의 변형 및 변화가 통상의 기술자에 의해 의지될 수 있고, 이러한 변형 및 변화는 첨부된 청구범위에 의해 정의된 본 발명의 범위 내에 있는 것으로 간주된다는 것을 이해하여야 한다.
SEQUENCE LISTING
<110> APPLIED MOLECULAR TRANSPORT INC.
<120> CHOLIX-DERIVED CARRIERS FOR ORAL DELIVERY OF HETEROLOGOUS PAYLOAD
<130> 40566-722.601
<140> PCT/US2019/050708
<141> 2019-09-11
<150> 62/888,400
<151> 2019-08-16
<150> 62/888,144
<151> 2019-08-16
<150> 62/888,133
<151> 2019-08-16
<150> PCT/US2019/021474
<151> 2019-03-08
<150> 62/816,022
<151> 2019-03-08
<150> 62/756,889
<151> 2018-11-07
<160> 205
<170> PatentIn version 3.5
<210> 1
<211> 634
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 1
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 2
<211> 634
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Leu Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 3
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 3
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 4
<211> 644
<212> PRT
<213> Vibrio cholerae
<400> 4
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Lys Gln Ser Ile Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser
180 185 190
Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp
195 200 205
Ala His Trp His Thr Gly Leu Ala Leu Cys Trp Leu Val Pro Ile Asp
210 215 220
Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn
225 230 235 240
Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala Gly Thr Pro Lys Ala Ile
245 250 255
Thr Val Lys Gln Gly Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His
260 265 270
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
275 280 285
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
290 295 300
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
305 310 315 320
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
325 330 335
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
340 345 350
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
355 360 365
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
370 375 380
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
385 390 395 400
Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro Cys Val Ala Ser Asn Asn
405 410 415
Asp Gln Ala Asn Ile Asn Val Glu Ser Arg Ser Gly Arg Ser Tyr Leu
420 425 430
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
435 440 445
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
450 455 460
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
465 470 475 480
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
485 490 495
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
500 505 510
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
515 520 525
Arg Ala Glu Arg Glu Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
530 535 540
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
545 550 555 560
Ala Glu Arg His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
565 570 575
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
580 585 590
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
595 600 605
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
610 615 620
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
625 630 635 640
Asp Glu Leu Lys
<210> 5
<211> 639
<212> PRT
<213> Vibrio cholerae
<400> 5
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Met Asp Glu Gly Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala
180 185 190
Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr
195 200 205
Gly Leu Ala Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr
210 215 220
Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser
225 230 235 240
Tyr Glu Thr Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly
245 250 255
Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn
260 265 270
Ala Met Glu Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu
275 280 285
Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser
290 295 300
Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg
305 310 315 320
Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu
325 330 335
Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn
340 345 350
Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln
355 360 365
Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln
370 375 380
Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro
385 390 395 400
Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile
405 410 415
Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala
420 425 430
Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu
435 440 445
Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr
450 455 460
His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala
465 470 475 480
Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly
485 490 495
Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile
500 505 510
Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp
515 520 525
Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu
530 535 540
Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile
545 550 555 560
Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr
565 570 575
Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp
580 585 590
Met Ala Ile His Ala Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala
595 600 605
Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser
610 615 620
Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630 635
<210> 6
<211> 639
<212> PRT
<213> Vibrio cholerae
<400> 6
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Arg Leu Thr
595 600 605
Pro Ala Glu Glu Ala Val Val Lys Glu Ala Ile Ala Lys Glu Gln Ser
610 615 620
Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630 635
<210> 7
<211> 639
<212> PRT
<213> Vibrio cholerae
<400> 7
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Arg Leu Thr
595 600 605
Pro Ala Glu Glu Ala Val Val Lys Glu Ala Ile Ala Lys Glu Gln Ser
610 615 620
Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630 635
<210> 8
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 8
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Gln Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Lys Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 9
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 9
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 10
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 10
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ser Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 11
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 11
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Lys Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 12
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 12
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile His Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 13
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 13
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asp Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 14
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 14
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Ile Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 15
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 15
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Ile Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 16
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 16
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Met Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Ile Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 17
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 17
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Leu Lys Lys Gly Thr Gly
500 505 510
Asn Ala Glu Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr His Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Arg Val
565 570 575
Asp Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Val Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Glu Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 18
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 18
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Phe Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Thr Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile His Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 19
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 19
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 20
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 20
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Leu Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 21
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 21
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Ala Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Val Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Asn Gly Gly Leu Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 22
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 22
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Asn Gly Gly Leu Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Asp Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 23
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 23
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Met Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Tyr Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Arg Val
565 570 575
Asp Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Pro Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 24
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 24
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Asp Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val
325 330 335
Ala Glu Arg Leu Ser Ala Ile Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asp Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 25
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 25
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Asp Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys His
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 26
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 26
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp Arg Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 27
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 27
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Asn Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 28
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 28
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Leu Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 29
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 29
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Lys Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 30
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 30
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile Tyr Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 31
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 31
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 32
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 32
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile Tyr Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 33
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 33
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Lys Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 34
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 34
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Arg Val
565 570 575
Asp Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 35
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 35
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Asn Gly Gly Leu Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Asp Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 36
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 36
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile His Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 37
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 37
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Ile Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 38
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 38
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Phe Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 39
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 39
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala
290 295 300
Gln Gln Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Thr His
305 310 315 320
Ile Asp Ser Ile Phe Thr Leu Asn Leu Asp Gly Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Asp Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Ile Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Gln Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Gln Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Ser Pro Val Pro Arg Gly
465 470 475 480
Ser Asp Thr Glu Ser Glu Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr
485 490 495
Asp Ala Ser Val Ala Tyr Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala
500 505 510
Asp Gly Gly Gly Leu Thr Pro Ala Glu Arg Lys Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Leu Pro Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile
530 535 540
Asn Ala Asp Leu Glu Lys Glu Arg Asn Leu Val Glu Arg Val Ile Gly
545 550 555 560
His Pro Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu
565 570 575
Glu Gly Ser Asp Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 40
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 40
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 41
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 41
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asp Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 42
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 42
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Asn Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 43
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 43
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Ile Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 44
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 44
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 45
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 45
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Thr Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 46
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 46
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 47
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 47
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Thr Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 48
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 48
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Leu
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 49
<211> 634
<212> PRT
<213> Vibrio cholerae
<400> 49
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Ile Pro Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Thr Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Pro
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 50
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 50
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 51
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 51
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Gln Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 52
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 52
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 53
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 53
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 54
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 54
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 55
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 55
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Ile Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 56
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 56
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Ile Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 57
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 57
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Glu Val
195 200 205
Val Leu Cys Phe Phe Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln Gln Ile Val Ser Leu
290 295 300
Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile Asp Ser Ile Phe Thr
305 310 315 320
Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala Glu Arg Leu Asp Asp
325 330 335
Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Ile Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Ser
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Gln Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 58
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 58
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Asp Gly
180 185 190
Ala Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Leu Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Met Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Gly
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Gln Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Thr Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Ile Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr Glu His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Glu Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Lys His Gln Thr
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Thr Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Lys Glu Glu Glu Trp Gly Gly Val Tyr Val Ala Thr
485 490 495
His Ala Glu Leu Ala His Arg Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Asn Gly Leu Pro Thr Thr Glu Glu Lys Lys Ser Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Leu Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Ile Pro Leu Glu Asn Ala Asp Glu His Val Thr Gln Val Ile Gly
545 550 555 560
His Pro Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu His Asp Glu Leu Lys
625 630
<210> 59
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 59
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Asp Gly
180 185 190
Ala Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Leu Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Met Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Gly
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Gln Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Thr Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Ile Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr Glu His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Glu Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Lys His Gln Thr
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Thr Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Lys Glu Glu Glu Trp Gly Gly Val Tyr Val Ala Thr
485 490 495
His Ala Glu Val Asn His Arg Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Asn Gly Leu Pro Thr Thr Glu Glu Lys Lys Ser Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Leu Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Ile Pro Leu Glu Asn Ala Asp Glu His Val Thr Gln Val Ile Gly
545 550 555 560
His Pro Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu His Asp Glu Leu Lys
625 630
<210> 60
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 60
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Asp Gly
180 185 190
Ala Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Leu Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Met Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Gly
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Gln Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Thr Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Ile Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr Glu His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Glu Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Lys His Gln Thr
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Thr Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Lys Glu Glu Glu Trp Gly Gly Val Tyr Val Ala Thr
485 490 495
His Ala Glu Leu Ala His Arg Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Asn Gly Leu Pro Thr Thr Glu Lys Lys Lys Ser Arg Gly Val Met
515 520 525
Leu Lys Val Tyr Leu Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Ile Pro Leu Glu Asn Ala Asp Glu His Val Thr Gln Val Ile Gly
545 550 555 560
His Pro Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asn Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu His Asp Glu Leu Lys
625 630
<210> 61
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 61
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
625 630
<210> 62
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 62
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Ile Pro Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Gly Leu Thr Thr Asp Glu Glu Ala Val
595 600 605
Val Lys Glu Ala Ile Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
610 615 620
Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 63
<211> 633
<212> PRT
<213> Vibrio cholerae
<400> 63
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Ile Pro Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Asp Gly
180 185 190
Ala Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Leu Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Met Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Gly
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Gln Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Thr Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Ile Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr Glu His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Glu Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Lys His Gln Thr
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Thr Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Lys Glu Glu Glu Trp Gly Gly Val Tyr Val Ala Thr
485 490 495
His Ala Glu Leu Ala His Arg Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Asn Gly Leu Pro Thr Thr Glu Glu Lys Lys Ser Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Leu Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Ile Pro Leu Glu Asn Ala Asp Glu His Val Thr Gln Val Ile Gly
545 550 555 560
His Pro Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly
580 585 590
Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro
595 600 605
Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro
610 615 620
Pro Tyr Lys Glu His Asp Glu Leu Lys
625 630
<210> 64
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 64
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 65
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 65
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 66
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 66
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Asn Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Val Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 67
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 67
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Asn Gly Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 68
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 68
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Arg Val Asp Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 69
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 69
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Met Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Arg Val Asp Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 70
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 70
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Lys Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Glu Pro Glu Leu Cys Thr Tyr Gly Glu Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Glu Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Gln Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Ala Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 71
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 71
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Glu Val
195 200 205
Val Leu Cys Phe Phe Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln Gln Ile Val Ser Leu
290 295 300
Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile Asp Ser Ile Phe Thr
305 310 315 320
Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala Glu Arg Leu Asp Asp
325 330 335
Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Ile Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Ser
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Gln Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Ser Ile
450 455 460
Val Asn Arg Ile Ser Pro Val Pro Arg Gly Ser Asp Thr Glu Ser Glu
465 470 475 480
Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr Asp Ala Ser Val Ala Tyr
485 490 495
Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala Asp Gly Gly Gly Leu Thr
500 505 510
Pro Ala Glu Arg Lys Ala Arg Gly Val Met Leu Arg Val Tyr Leu Pro
515 520 525
Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile Asn Ala Asp Leu Glu Lys
530 535 540
Glu Arg Asn Leu Val Glu Arg Val Ile Gly His Pro Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu Glu Gly Ser Asp Glu Thr
565 570 575
Ala Ile Gly Trp Asp Met Ala Ile His Gly Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 72
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 72
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Glu Val
195 200 205
Val Leu Cys Phe Phe Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln Gln Ile Val Ser Leu
290 295 300
Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile Asp Ser Ile Phe Thr
305 310 315 320
Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala Glu Arg Leu Asp Asp
325 330 335
Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Ile Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Leu
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Ser
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Gln Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Ser Ile
450 455 460
Val Asn Arg Ile Ser Pro Val Pro Arg Gly Ser Asp Thr Glu Ser Glu
465 470 475 480
Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr Asp Ala Ser Val Ala Tyr
485 490 495
Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala Asp Gly Gly Gly Leu Thr
500 505 510
Pro Ala Glu Arg Lys Ala Arg Gly Val Met Leu Arg Val Tyr Leu Pro
515 520 525
Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile Asn Ala Asp Leu Glu Lys
530 535 540
Glu Arg Asn Leu Val Glu Arg Val Ile Gly His Pro Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu Glu Gly Ser Asp Glu Thr
565 570 575
Ala Ile Gly Trp Asp Met Ala Ile His Gly Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 73
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 73
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Glu Val
195 200 205
Val Leu Cys Phe Phe Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln Gln Ile Val Ser Leu
290 295 300
Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile Asp Ser Ile Phe Thr
305 310 315 320
Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala Glu Arg Leu Asp Asp
325 330 335
Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Ile Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Ser
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Gln Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Ser Ile
450 455 460
Val Asn Arg Ile Ser Pro Val Pro Arg Gly Ser Asp Thr Glu Ser Glu
465 470 475 480
Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr Asp Ala Ser Val Ala Tyr
485 490 495
Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala Asp Gly Gly Gly Leu Thr
500 505 510
Pro Ala Glu Arg Lys Ala Arg Gly Val Met Leu Arg Val Tyr Leu Pro
515 520 525
Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile Asn Ala Asp Leu Glu Lys
530 535 540
Glu Arg Asn Leu Val Glu Arg Val Ile Gly His Pro Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu Glu Gly Ser Asp Glu Thr
565 570 575
Ala Ile Gly Trp Asp Met Ala Ile His Gly Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 74
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 74
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Phe Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Ile Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Ala Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 75
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 75
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro Lys Val
195 200 205
Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly Asp Asp
210 215 220
Trp Tyr Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Thr Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Asp Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys
610 615 620
Asp Glu Leu Lys
625
<210> 76
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 76
Val Glu Asp Glu Leu Lys Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 77
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 77
Val Glu Asp Glu Leu Lys Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Ala Pro Glu Val Ala Glu Arg Leu Ser Asp
325 330 335
Leu Arg Arg Ile Asn Glu Asp Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Thr Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 78
<211> 628
<212> PRT
<213> Vibrio cholerae
<400> 78
Val Glu Asp Glu Leu Lys Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly Asp Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Ala Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile
450 455 460
Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu
465 470 475 480
Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His
485 490 495
Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Asn Gly Gly Leu Pro Thr
500 505 510
Arg Ala Glu Arg Glu Thr Arg Gly Val Met Leu Arg Val Tyr Ile Pro
515 520 525
Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn
530 535 540
Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg
545 550 555 560
Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr
565 570 575
Val Ile Gly Trp Asp Met Ala Ile Tyr Ala Val Ala Ile Pro Ser Thr
580 585 590
Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val
595 600 605
Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys Glu Gln Lys
610 615 620
Asp Glu Leu Lys
625
<210> 79
<211> 617
<212> PRT
<213> Vibrio cholerae
<400> 79
Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro Gly
1 5 10 15
Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile Asn
20 25 30
Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile Ile
35 40 45
Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val Ser
50 55 60
Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu Asn
65 70 75 80
Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala Ile
85 90 95
Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys Ile
100 105 110
Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro Lys
115 120 125
Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr
130 135 140
Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile Ala
145 150 155 160
Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly Ser
165 170 175
Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys Trp
180 185 190
Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn Cys
195 200 205
Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala Gly
210 215 220
Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro Val
225 230 235 240
Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala
245 250 255
Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg
260 265 270
Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln
275 280 285
Gln Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile
290 295 300
Asp Ser Ile Phe Thr Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala
305 310 315 320
Glu Arg Leu Asp Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met
325 330 335
Val Ile Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val
340 345 350
Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln
355 360 365
Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys
370 375 380
Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser
385 390 395 400
Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly
405 410 415
Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu
420 425 430
Thr Gln Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val
435 440 445
Ala Ala Gln Ser Ile Val Asn Arg Ile Ser Pro Val Pro Arg Gly Ser
450 455 460
Asp Thr Glu Ser Glu Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr Asp
465 470 475 480
Ala Ser Val Ala Tyr Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala Asp
485 490 495
Gly Gly Gly Leu Thr Pro Ala Glu Arg Lys Ala Arg Gly Val Met Leu
500 505 510
Arg Val Tyr Leu Pro Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile Asn
515 520 525
Ala Asp Leu Glu Lys Glu Arg Asn Leu Val Glu Arg Val Ile Gly His
530 535 540
Pro Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu Glu
545 550 555 560
Gly Ser Asp Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly Val
565 570 575
Ala Ile Pro Ser Thr Ile Pro Gly Asn Ser Tyr Ala Gln Leu Pro Ile
580 585 590
Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro
595 600 605
Tyr Lys Glu Gln Lys Asp Glu Leu Lys
610 615
<210> 80
<211> 605
<212> PRT
<213> Vibrio cholerae
<400> 80
Ser Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser
1 5 10 15
Met Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly
20 25 30
Glu Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg
35 40 45
His Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile
50 55 60
Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly
65 70 75 80
Glu Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala
85 90 95
Ser Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile
100 105 110
Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu
115 120 125
Gln Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu
130 135 140
His Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln
145 150 155 160
Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu
165 170 175
Ala Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr
180 185 190
Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu
195 200 205
Thr Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu
210 215 220
Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met
225 230 235 240
Glu Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu
245 250 255
Ala Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala
260 265 270
Tyr Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu
275 280 285
Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu
290 295 300
Pro Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn
305 310 315 320
Asn Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr
325 330 335
Asn Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser
340 345 350
Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala
355 360 365
Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile
370 375 380
Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile
385 390 395 400
Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr
405 410 415
His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly
420 425 430
Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val
435 440 445
Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr
450 455 460
Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu
465 470 475 480
Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg
485 490 495
Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe
500 505 510
Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln
515 520 525
Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro
530 535 540
Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala
545 550 555 560
Ile His Ala Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu
565 570 575
Glu Leu Ala Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser
580 585 590
Thr Lys Pro Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
595 600 605
<210> 81
<211> 594
<212> PRT
<213> Vibrio cholerae
<400> 81
Met Thr Ile Asn Asp Glu Gln Asn Asp Ile Met Asp Glu Gly Lys Gly
1 5 10 15
Glu Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg
20 25 30
His Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile
35 40 45
Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly
50 55 60
Glu Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala
65 70 75 80
Ser Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile
85 90 95
Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu
100 105 110
Gln Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu
115 120 125
Gln Ser Ile Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser
130 135 140
Tyr Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His
145 150 155 160
Trp His Thr Gly Leu Ala Leu Cys Trp Leu Val Pro Ile Asp Ala Ile
165 170 175
Tyr Asn Tyr Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe
180 185 190
Gly Gly Ser Tyr Glu Thr Val Ala Gly Thr Pro Lys Ala Ile Thr Val
195 200 205
Lys Gln Gly Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser
210 215 220
Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys Gly Val
225 230 235 240
Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp
245 250 255
Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu Phe Val
260 265 270
Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn
275 280 285
Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala Leu Arg
290 295 300
Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu Thr Val
305 310 315 320
Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly Leu Thr
325 330 335
Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu
340 345 350
Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln
355 360 365
Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu
370 375 380
Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln
385 390 395 400
Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe
405 410 415
Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn
420 425 430
Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys
435 440 445
Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr
450 455 460
Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala
465 470 475 480
Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala
485 490 495
Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu
500 505 510
Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu
515 520 525
Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile
530 535 540
Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr Ile Pro
545 550 555 560
Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val Ala Lys
565 570 575
Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys Asp Glu
580 585 590
Leu Lys
<210> 82
<211> 588
<212> PRT
<213> Vibrio cholerae
<400> 82
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Met Asp Glu Gly Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Thr Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr
165 170 175
Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp
180 185 190
His Thr Gly Leu Ala Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr
195 200 205
Asn Tyr Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly
210 215 220
Gly Ser Tyr Glu Thr Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys
225 230 235 240
Gln Gly Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys
245 250 255
Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys Gly Val Pro
260 265 270
Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp
275 280 285
Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala
290 295 300
Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu
305 310 315 320
Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Asp Leu Arg Arg
325 330 335
Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu Thr Val Ala
340 345 350
Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly Leu Thr Pro
355 360 365
Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe
370 375 380
Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala
385 390 395 400
Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn
405 410 415
Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu
420 425 430
Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val
435 440 445
Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg
450 455 460
Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp
465 470 475 480
Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala
485 490 495
Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu
500 505 510
Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser
515 520 525
Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu
530 535 540
His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala
545 550 555 560
Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Ile Ile Gly
565 570 575
Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser
580 585
<210> 83
<211> 588
<212> PRT
<213> Vibrio cholerae
<400> 83
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Met Asp Glu Gly Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr
165 170 175
Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp
180 185 190
His Thr Gly Leu Ala Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr
195 200 205
Asn Tyr Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly
210 215 220
Gly Ser Tyr Glu Thr Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys
225 230 235 240
Gln Gly Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys
245 250 255
Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys Gly Val Pro
260 265 270
Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp
275 280 285
Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala
290 295 300
Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu
305 310 315 320
Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln
325 330 335
Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu Thr Val Ala
340 345 350
Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly Leu Thr Pro
355 360 365
Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe
370 375 380
Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala
385 390 395 400
Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn
405 410 415
Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu
420 425 430
Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val
435 440 445
Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg
450 455 460
Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp
465 470 475 480
Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala
485 490 495
Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu
500 505 510
Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser
515 520 525
Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu
530 535 540
His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala
545 550 555 560
Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly
565 570 575
Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser
580 585
<210> 84
<211> 588
<212> PRT
<213> Vibrio cholerae
<400> 84
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Met Asp Glu Gly Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr
165 170 175
Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp
180 185 190
His Thr Gly Leu Ala Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr
195 200 205
Asn Tyr Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly
210 215 220
Gly Ser Tyr Glu Thr Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys
225 230 235 240
Gln Gly Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys
245 250 255
Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys Gly Val Pro
260 265 270
Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp
275 280 285
Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala
290 295 300
Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu
305 310 315 320
Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln
325 330 335
Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu Thr Val Ala
340 345 350
Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly Leu Thr Pro
355 360 365
Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe
370 375 380
Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala
385 390 395 400
Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn
405 410 415
Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu
420 425 430
Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val
435 440 445
Gly Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg
450 455 460
Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp
465 470 475 480
Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala
485 490 495
Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu
500 505 510
Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser
515 520 525
Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu
530 535 540
His Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala
545 550 555 560
Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly
565 570 575
Trp Asp Met Ala Ile His Ala Val Ala Ile Pro Ser
580 585
<210> 85
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 85
Met Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly
1 5 10 15
Glu Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg
20 25 30
His Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile
35 40 45
Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly
50 55 60
Glu Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala
65 70 75 80
Ser Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile
85 90 95
Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu
100 105 110
Gln Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu
115 120 125
Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His
130 135 140
Lys Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu
145 150 155 160
Pro Lys Val Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr
165 170 175
Gly Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro
180 185 190
Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Ala Val Glu Gln
195 200 205
Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His
210 215 220
Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro
225 230 235 240
Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile
245 250 255
Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser
260 265 270
Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg
275 280 285
Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr
290 295 300
Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His
305 310 315 320
His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala
325 330 335
Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala
340 345 350
Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg
355 360 365
Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr
370 375 380
Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg
385 390 395 400
Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala
405 410 415
Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr
420 425 430
Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu
435 440 445
Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Asn Gly Gly
450 455 460
Leu Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met Leu Arg Val
465 470 475 480
Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro
485 490 495
Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu
500 505 510
Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu
515 520 525
Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile Tyr Ala Val Ala Ile
530 535 540
Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu
545 550 555 560
Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr Lys
565 570 575
Glu Gln Lys Asp Glu Leu Lys
580
<210> 86
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 86
Met Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly
1 5 10 15
Glu Ser Ile Ile Thr Ile Gly Asp Phe Ala Thr Val Arg Ala Thr Arg
20 25 30
His Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile
35 40 45
Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly
50 55 60
Glu Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala
65 70 75 80
Ser Ile Lys Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile
85 90 95
Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu
100 105 110
Gln Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu
115 120 125
Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His
130 135 140
Lys Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser
145 150 155 160
Pro Lys Val Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr
165 170 175
Gly Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro
180 185 190
Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln
195 200 205
Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His
210 215 220
Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro
225 230 235 240
Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile
245 250 255
Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser
260 265 270
Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg
275 280 285
Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr
290 295 300
Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His
305 310 315 320
His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala
325 330 335
Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala
340 345 350
Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg
355 360 365
Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr
370 375 380
Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg
385 390 395 400
Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala
405 410 415
Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr
420 425 430
Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu
435 440 445
Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly
450 455 460
Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val
465 470 475 480
Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro
485 490 495
Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu
500 505 510
Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Arg Val Asp Gly Glu
515 520 525
Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile
530 535 540
Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp Glu
545 550 555 560
Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro Tyr Lys
565 570 575
Glu Arg Lys Asp Glu Leu Lys
580
<210> 87
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 87
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Gln Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Thr Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Arg Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 88
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 88
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 89
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 89
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 90
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 90
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Ile Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Pro Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 91
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 91
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Thr Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Asn Gly Gly Leu Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Asp Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 92
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 92
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Ala Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Leu Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 93
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 93
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Met Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Tyr Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Arg Val Asp Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 94
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 94
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Asp Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Ala Val Ala Glu Arg Leu Ser Ala Ile Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asp Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 95
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 95
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Asp Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Ala Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asp Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Leu Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 96
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 96
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 97
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 97
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Thr Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 98
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 98
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Tyr Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 99
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 99
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Asn Gly Gly Leu Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 100
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 100
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Lys Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 101
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 101
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 102
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 102
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Ser Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Pro Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 103
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 103
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 104
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 104
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Glu Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 105
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 105
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Ala Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asp Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 106
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 106
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Pro Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Val Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Glu Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Arg His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 107
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 107
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Ala Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Arg Val Asp Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 108
<211> 583
<212> PRT
<213> Vibrio cholerae
<400> 108
Cys Ser Leu Thr Pro Glu Leu Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Asp Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His
145 150 155 160
Asn Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys
165 170 175
Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
180 185 190
Leu Cys Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln
195 200 205
Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr
210 215 220
Val Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln
225 230 235 240
Lys Pro Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu
245 250 255
Ala Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala
260 265 270
Arg Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr
275 280 285
Gln Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe
290 295 300
Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro
305 310 315 320
Glu Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn
325 330 335
Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn
340 345 350
Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala
355 360 365
Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp
370 375 380
Lys Pro Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu
385 390 395 400
Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr
405 410 415
Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His
420 425 430
Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr
435 440 445
Asn His Val Ala Ala Gln Asn Ile Val Asn Arg Ile Ala Pro Val Pro
450 455 460
Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val
465 470 475 480
Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly
485 490 495
Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly
500 505 510
Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr
515 520 525
Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val
530 535 540
Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu
545 550 555 560
Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile
565 570 575
His Ala Val Ala Ile Pro Ser
580
<210> 109
<211> 582
<212> PRT
<213> Vibrio cholerae
<400> 109
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Met Asp Glu Gly Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Lys Gln Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr
165 170 175
Lys Ala Ala His Lys Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp
180 185 190
Leu Thr Thr Leu Pro Lys Val Val Leu Cys Phe Phe Glu Asp Pro Glu
195 200 205
Leu Cys Thr Tyr Gly Glu Asp Trp His Gly Gly Ala Tyr Lys Thr Val
210 215 220
Ala Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
225 230 235 240
Thr Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala
245 250 255
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
260 265 270
Ser Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln
275 280 285
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
290 295 300
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
305 310 315 320
Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro
325 330 335
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
340 345 350
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
355 360 365
Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys
370 375 380
Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser
385 390 395 400
Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro
405 410 415
Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln
420 425 430
Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn
435 440 445
His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg
450 455 460
Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala
465 470 475 480
Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr
485 490 495
Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val
500 505 510
Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg
515 520 525
Thr Asn Thr Leu Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile
530 535 540
Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser
545 550 555 560
Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His
565 570 575
Ala Val Ala Ile Pro Ser
580
<210> 110
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 110
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro
180 185 190
Lys Val Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Asp Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 111
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 111
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro
180 185 190
Lys Val Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Asp Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Ala Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 112
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 112
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Lys Val Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 113
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 113
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Lys Val Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Ala Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Asp Leu Arg Arg Ile Asn Glu Asp Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Thr Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 114
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 114
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Lys Val Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Asn Gly Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile Tyr Ala Val Ala Ile Pro
565 570 575
Ser
<210> 115
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 115
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Ile Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Phe Thr Thr Ser Pro
180 185 190
Lys Val Thr Leu Cys Phe Tyr Glu Asp Pro Ala Gln Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Ile Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Asp Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Gln Glu Thr Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 116
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 116
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Lys Val Val Leu Cys Phe Tyr Glu Glu Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Glu Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Gly
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 117
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 117
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Lys Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Lys Val Val Leu Cys Phe Tyr Glu Glu Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Glu Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Glu
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Ala Val Ala Glu Arg Leu
305 310 315 320
Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 118
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 118
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Ile Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Lys Val Val Leu Cys Phe Tyr Glu Asp Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val
275 280 285
Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val
290 295 300
Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Val Val Ile Thr Pro Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Asp Ala Thr His Gln Ala Leu Thr Arg Glu
420 425 430
Asp Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn Thr Glu
450 455 460
Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala Glu Val
465 470 475 480
Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu
485 490 495
Pro Thr Arg Ala Glu Arg Glu Thr Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu
515 520 525
Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp
545 550 555 560
Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala Ile Pro
565 570 575
Ser
<210> 119
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 119
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Glu Val Val Leu Cys Phe Phe Glu Asp Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln Gln Ile Val
275 280 285
Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile Asp Ser Ile
290 295 300
Phe Thr Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Asp Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Ile Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Gln Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Ser Ile Val Asn Arg Ile Ser Pro Val Pro Arg Gly Ser Asp Thr Glu
450 455 460
Ser Glu Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr Asp Ala Ser Val
465 470 475 480
Ala Tyr Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala Asp Gly Gly Gly
485 490 495
Leu Thr Pro Ala Glu Arg Lys Ala Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Leu Pro Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile Asn Ala Asp Leu
515 520 525
Glu Lys Glu Arg Asn Leu Val Glu Arg Val Ile Gly His Pro Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu Glu Gly Ser Asp
545 550 555 560
Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly Val Ala Ile Pro
565 570 575
Ser
<210> 120
<211> 577
<212> PRT
<213> Vibrio cholerae
<400> 120
Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser
1 5 10 15
Ile Pro Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met
20 25 30
Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu
35 40 45
Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His
50 55 60
Tyr Val Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr
65 70 75 80
Thr Glu Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu
85 90 95
Phe Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser
100 105 110
Ile Lys Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu
115 120 125
Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln
130 135 140
Trp Glu Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln
145 150 155 160
Ser Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys
165 170 175
Asn Gly Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro
180 185 190
Glu Val Val Leu Cys Phe Phe Glu Asp Pro Glu Leu Cys Thr Tyr Gly
195 200 205
Asp Asp Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Lys
210 215 220
Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg
225 230 235 240
Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg
245 250 255
Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg
260 265 270
Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala Gln Gln Ile Val
275 280 285
Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Thr His Ile Asp Ser Ile
290 295 300
Phe Thr Leu Asn Leu Asp Gly Gln Glu Pro Glu Val Ala Glu Arg Leu
305 310 315 320
Asp Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val Ile Gln
325 330 335
Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His
340 345 350
Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Ser Ala Gln Ala Ala Asp
355 360 365
Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser
370 375 380
Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser
385 390 395 400
Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Gln Gln Gly Val Thr Asn
405 410 415
Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Gln Glu
420 425 430
Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala Ala Gln
435 440 445
Ser Ile Val Asn Arg Ile Ser Pro Val Pro Arg Gly Ser Asp Thr Glu
450 455 460
Ser Glu Arg Ala Trp Gly Gly Leu Tyr Val Ser Thr Asp Ala Ser Val
465 470 475 480
Ala Tyr Gly Tyr Ala Arg Ile Gln Glu Gly Thr Ala Asp Gly Gly Gly
485 490 495
Leu Thr Pro Ala Glu Arg Lys Ala Arg Gly Val Met Leu Arg Val Tyr
500 505 510
Leu Pro Gln Ala Ser Leu Glu Arg Phe Tyr Arg Ile Asn Ala Asp Leu
515 520 525
Glu Lys Glu Arg Asn Leu Val Glu Arg Val Ile Gly His Pro Leu Pro
530 535 540
Leu Arg Asn Glu Ala Phe Thr Gly Thr Asp Ala Glu Glu Gly Ser Asp
545 550 555 560
Glu Thr Ala Ile Gly Trp Asp Met Ala Ile His Gly Val Ala Ile Pro
565 570 575
Ser
<210> 121
<211> 531
<212> PRT
<213> Vibrio cholerae
<400> 121
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Gln Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Val Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Lys Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val
530
<210> 122
<211> 491
<212> PRT
<213> Vibrio cholerae
<400> 122
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Glu Lys Asp Gly
180 185 190
Ala Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Leu Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Met Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Gly
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Gln Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Thr Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Ile Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr Glu His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Leu Cys Pro Asp Ala Asp Gly Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Lys His Gln Thr
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Thr Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Lys Glu Glu Glu Trp Gly Gly
485 490
<210> 123
<211> 491
<212> PRT
<213> Vibrio cholerae
<400> 123
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Glu Lys Asp Gly
180 185 190
Ala Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Leu Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Met Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Gly
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Gln Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Thr Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Ile Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr Glu His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Glu Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Lys His Gln Thr
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Ser Ile Val Asn Arg Ile Thr Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Lys Glu Glu Glu Trp Gly Gly
485 490
<210> 124
<211> 488
<212> PRT
<213> Vibrio cholerae
<400> 124
Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln
1 5 10 15
Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile Ala Ile
20 25 30
Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly Ser Arg
35 40 45
His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys Trp Leu
50 55 60
Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn Cys Thr
65 70 75 80
Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala Gly Thr
85 90 95
Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro Val Glu
100 105 110
Gln Arg Ile His Phe Ser Asn Gly Asn Ala Met Ser Ala Leu Ala Ala
115 120 125
His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys
130 135 140
Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn
145 150 155 160
Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp
165 170 175
Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val Ala Glu
180 185 190
Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly Met Val
195 200 205
Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr
210 215 220
His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala
225 230 235 240
Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val
245 250 255
Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly
260 265 270
Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val
275 280 285
Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr
290 295 300
Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His Val Ala
305 310 315 320
Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly Asn Asn
325 330 335
Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr His Ala
340 345 350
Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly Glu Tyr
355 360 365
Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met Leu Arg
370 375 380
Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr Asn Thr
385 390 395 400
Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly His Ser
405 410 415
Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala Gly Gly
420 425 430
Glu Asp Glu Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val Ala
435 440 445
Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile Asp
450 455 460
Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Ala Lys Pro Pro Tyr
465 470 475 480
Lys Glu Arg Lys Asp Glu Leu Lys
485
<210> 125
<211> 459
<212> PRT
<213> Vibrio cholerae
<400> 125
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Lys Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Glu
145 150 155 160
Asn Gln Gly Asn Val Ser Phe Ala Val Thr Arg Pro Glu Gln Ser Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala His Lys Asn Gly
180 185 190
Ser Arg His Lys Arg Trp Ala Asn Trp Leu Thr Thr Leu Pro Lys Val
195 200 205
Val Leu Cys Phe Tyr Glu Glu Pro Glu Leu Cys Thr Tyr Gly Glu Asp
210 215 220
Trp His Gly Gly Ala Tyr Lys Thr Val Ala Gly Thr Pro Glu Ala Ile
225 230 235 240
Thr Val Lys Gln Gly Ile Glu Gln Lys Thr Val Glu Gln Arg Ile His
245 250 255
Phe Ser Lys Lys Asn Ala Met Glu Ala Leu Ala Ala His Arg Val Cys
260 265 270
Gly Val Pro Leu Glu Thr Leu Ala Arg Ser Arg Lys Pro Arg Asp Leu
275 280 285
Gln Asp Asp Leu Ser Cys Ala Tyr Gln Ala Gln Asn Ile Val Ser Leu
290 295 300
Phe Val Ala Thr Arg Ile Leu Phe Ser His Leu Asp Ser Val Phe Thr
305 310 315 320
Leu Asn Leu Asp Glu Gln Glu Pro Ala Val Ala Glu Arg Leu Ser Ala
325 330 335
Leu Arg Gln Ile Asn Glu Asn Asn Pro Gly Met Val Thr Gln Val Leu
340 345 350
Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr His His Pro Gly
355 360 365
Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu
370 375 380
Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser Cys Val Ala Ser Asn Asn
385 390 395 400
Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu
405 410 415
Pro Glu Asn Arg Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr
420 425 430
Tyr Gln Glu Leu Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr
435 440 445
Val Phe Val Gly Tyr His Gly Thr Asn His Val
450 455
<210> 126
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 126
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Gly Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Ser Gln Asp Ala Pro Phe Gly Val Ile Asn Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Phe Asn Arg Lys Glu Ser Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Ile Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Ile Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Ala Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Lys Asn Ala Met Glu Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Pro Asp Asp Leu Ser Cys Ala Tyr Asn Ala
290 295 300
Gln Gln Ile Val Ser Leu Phe Leu Ala Thr Arg Ile Leu Phe Thr His
305 310 315 320
Ile Asp Ser Ile Phe Thr Leu Asn Leu Asp Gly Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Asp Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Ile Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Ser Asp Gln Ala Asn Ile Asn Ile Glu Ser
405 410 415
<210> 127
<211> 318
<212> PRT
<213> Vibrio cholerae
<400> 127
Leu Phe Ser His Leu Asp Ser Val Phe Thr Leu Asn Leu His Glu Gln
1 5 10 15
Glu Pro Ala Val Ala Glu Arg Leu Ser Ala Leu Arg Gln Ile Asn Glu
20 25 30
Asn Asn Pro Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile
35 40 45
Tyr Asn Asp Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr
50 55 60
Ser Ala Gly Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp
65 70 75 80
Ala Asp Lys Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn
85 90 95
Ile Glu Ser Arg Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val
100 105 110
Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala
115 120 125
Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His
130 135 140
Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro
145 150 155 160
Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu
165 170 175
Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys
180 185 190
Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala
195 200 205
Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg
210 215 220
Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr
225 230 235 240
Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly
245 250 255
Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp Asp Met
260 265 270
Ala Ile His Ala Val Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr
275 280 285
Glu Glu Leu Ala Ile Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile
290 295 300
Ser Ala Lys Pro Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
305 310 315
<210> 128
<211> 208
<212> PRT
<213> Vibrio cholerae
<400> 128
Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu
1 5 10 15
Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly
20 25 30
Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile
35 40 45
Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly
50 55 60
Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg
65 70 75 80
Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg
85 90 95
Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu
100 105 110
Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His
115 120 125
Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe
130 135 140
Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp
145 150 155 160
Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr Ile Pro Gly Asn
165 170 175
Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val Ala Lys Glu Gln
180 185 190
Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys Asp Glu Leu Lys
195 200 205
<210> 129
<211> 207
<212> PRT
<213> Vibrio cholerae
<400> 129
Ala Val Ile Thr Pro Gln Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu
1 5 10 15
Glu Ala Thr His Gln Ala Leu Thr Arg Glu Gly Tyr Val Phe Val Gly
20 25 30
Tyr His Gly Thr Asn His Val Ala Ala Gln Thr Ile Val Asn Arg Ile
35 40 45
Ala Pro Val Pro Arg Gly Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly
50 55 60
Gly Leu Tyr Val Ala Thr His Ala Glu Val Ala His Gly Tyr Ala Arg
65 70 75 80
Ile Lys Glu Gly Thr Gly Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg
85 90 95
Asp Ala Arg Gly Val Met Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu
100 105 110
Glu Arg Phe Tyr Arg Thr Asn Thr Pro Leu Glu Asn Ala Glu Glu His
115 120 125
Ile Thr Gln Val Ile Gly His Ser Leu Pro Leu Arg Asn Glu Ala Phe
130 135 140
Thr Gly Pro Glu Ser Ala Gly Gly Glu Asp Glu Thr Val Ile Gly Trp
145 150 155 160
Asp Met Ala Ile His Ala Val Ala Ile Pro Ser Thr Ile Pro Gly Asn
165 170 175
Ala Tyr Glu Glu Leu Ala Ile Asp Glu Glu Ala Val Ala Lys Glu Gln
180 185 190
Ser Ile Ser Thr Lys Pro Pro Tyr Lys Glu Arg Lys Asp Glu Leu
195 200 205
<210> 130
<211> 649
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (1)..(1)
<223> V or L
<220>
<221> MOD_RES
<222> (3)..(3)
<223> E or D
<220>
<221> MOD_RES
<222> (4)..(4)
<223> A or E
<220>
<221> MOD_RES
<222> (6)..(6)
<223> N or K
<220>
<221> MOD_RES
<222> (16)..(16)
<223> S or L
<220>
<221> MOD_RES
<222> (21)..(21)
<223> P or L
<220>
<221> MOD_RES
<222> (24)..(24)
<223> P or Q
<220>
<221> MOD_RES
<222> (30)..(30)
<223> S or F
<220>
<221> MOD_RES
<222> (33)..(33)
<223> S or G
<220>
<221> MOD_RES
<222> (56)..(56)
<223> K or M
<220>
<221> MOD_RES
<222> (59)..(59)
<223> D or G
<220>
<221> MOD_RES
<222> (67)..(67)
<223> I or F
<220>
<221> MOD_RES
<222> (73)..(73)
<223> V or I
<220>
<221> MOD_RES
<222> (81)..(81)
<223> N or S
<220>
<221> MOD_RES
<222> (90)..(90)
<223> H or N
<220>
<221> MOD_RES
<222> (101)..(101)
<223> T or M
<220>
<221> MOD_RES
<222> (104)..(104)
<223> Y or F
<220>
<221> MOD_RES
<222> (108)..(108)
<223> E or D
<220>
<221> MOD_RES
<222> (109)..(109)
<223> G or S
<220>
<221> MOD_RES
<222> (112)..(112)
<223> A or T
<220>
<221> MOD_RES
<222> (114)..(114)
<223> N or H
<220>
<221> MOD_RES
<222> (118)..(118)
<223> P or I
<220>
<221> MOD_RES
<222> (119)..(119)
<223> I or P
<220>
<221> MOD_RES
<222> (131)..(131)
<223> V or I
<220>
<221> MOD_RES
<222> (134)..(134)
<223> L or I
<220>
<221> MOD_RES
<222> (137)..(137)
<223> Q or K
<220>
<221> MOD_RES
<222> (160)..(160)
<223> K or E
<220>
<221> MOD_RES
<222> (161)..(161)
<223> T or N
<220>
<221> MOD_RES
<222> (166)..(166)
<223> S or F
<220>
<221> MOD_RES
<222> (168)..(168)
<223> S or A
<220>
<221> MOD_RES
<222> (174)..(174)
<223> H or Q
<220>
<221> MOD_RES
<222> (175)..(185)
<223> This region may encompass one of the following sequences:
"N", "S", "SIAKQS", or "SIAKQSIAKQS"
<220>
<221> MOD_RES
<222> (196)..(196)
<223> K or N
<220>
<221> MOD_RES
<222> (199)..(199)
<223> Q, E, or H
<220>
<221> MOD_RES
<222> (201)..(201)
<223> E, N, or D
<220>
<221> MOD_RES
<222> (203)..(203)
<223> S or A
<220>
<221> MOD_RES
<222> (210)..(210)
<223> H or N
<220>
<221> MOD_RES
<222> (212)..(212)
<223> H, L, F, or R
<220>
<221> MOD_RES
<222> (214)..(214)
<223> G or T
<220>
<221> MOD_RES
<222> (215)..(215)
<223> L or S
<220>
<221> MOD_RES
<222> (216)..(216)
<223> A or P
<220>
<221> MOD_RES
<222> (217)..(217)
<223> L, E, or K
<220>
<221> MOD_RES
<222> (218)..(218)
<223> C or V
<220>
<221> MOD_RES
<222> (219)..(219)
<223> W, V, or T
<220>
<221> MOD_RES
<222> (221)..(221)
<223> V or absent
<220>
<221> MOD_RES
<222> (222)..(222)
<223> P or absent
<220>
<221> MOD_RES
<222> (223)..(223)
<223> M, I, L, or absent
<220>
<221> MOD_RES
<222> (224)..(224)
<223> D or absent
<220>
<221> MOD_RES
<222> (225)..(225)
<223> A or absent
<220>
<221> MOD_RES
<222> (226)..(226)
<223> I or absent
<220>
<221> MOD_RES
<222> (227)..(227)
<223> Y or C
<220>
<221> MOD_RES
<222> (228)..(228)
<223> N or F
<220>
<221> MOD_RES
<222> (229)..(229)
<223> Y or F
<220>
<221> MOD_RES
<222> (230)..(230)
<223> I or E
<220>
<221> MOD_RES
<222> (231)..(231)
<223> T or D
<220>
<221> MOD_RES
<222> (232)..(232)
<223> Q or P
<220>
<221> MOD_RES
<222> (233)..(233)
<223> Q, E, or A
<220>
<221> MOD_RES
<222> (234)..(234)
<223> N, L, or Q
<220>
<221> MOD_RES
<222> (237)..(237)
<223> L or Y
<220>
<221> MOD_RES
<222> (239)..(239)
<223> D or E
<220>
<221> MOD_RES
<222> (240)..(240)
<223> N or D
<220>
<221> MOD_RES
<222> (242)..(242)
<223> F, H, or Y
<220>
<221> MOD_RES
<222> (245)..(245)
<223> S or A
<220>
<221> MOD_RES
<222> (247)..(247)
<223> E or K
<220>
<221> MOD_RES
<222> (252)..(252)
<223> T or I
<220>
<221> MOD_RES
<222> (254)..(254)
<223> K, E, or G
<220>
<221> MOD_RES
<222> (255)..(255)
<223> V or A
<220>
<221> MOD_RES
<222> (257)..(257)
<223> T or M
<220>
<221> MOD_RES
<222> (262)..(262)
<223> I or M
<220>
<221> MOD_RES
<222> (266)..(266)
<223> P, T, or A
<220>
<221> MOD_RES
<222> (275)..(275)
<223> K, Q, or N
<220>
<221> MOD_RES
<222> (276)..(276)
<223> G or K
<220>
<221> MOD_RES
<222> (279)..(279)
<223> M or I
<220>
<221> MOD_RES
<222> (280)..(280)
<223> S or E
<220>
<221> MOD_RES
<222> (281)..(281)
<223> A or T
<220>
<221> MOD_RES
<222> (298)..(298)
<223> S or G
<220>
<221> MOD_RES
<222> (303)..(303)
<223> D or Y
<220>
<221> MOD_RES
<222> (305)..(305)
<223> T, P, or Q
<220>
<221> MOD_RES
<222> (309)..(309)
<223> S or Q
<220>
<221> MOD_RES
<222> (311)..(311)
<223> A or V
<220>
<221> MOD_RES
<222> (313)..(313)
<223> Q or N
<220>
<221> MOD_RES
<222> (316)..(316)
<223> N or Q
<220>
<221> MOD_RES
<222> (322)..(322)
<223> V or L
<220>
<221> MOD_RES
<222> (326)..(326)
<223> I or M
<220>
<221> MOD_RES
<222> (329)..(329)
<223> S or T
<220>
<221> MOD_RES
<222> (331)..(331)
<223> L or I
<220>
<221> MOD_RES
<222> (334)..(334)
<223> V or I
<220>
<221> MOD_RES
<222> (340)..(340)
<223> D, E, or H
<220>
<221> MOD_RES
<222> (341)..(341)
<223> E or G
<220>
<221> MOD_RES
<222> (343)..(343)
<223> E or A
<220>
<221> MOD_RES
<222> (345)..(345)
<223> E or A
<220>
<221> MOD_RES
<222> (347)..(347)
<223> A or T
<220>
<221> MOD_RES
<222> (351)..(351)
<223> S, D, or T
<220>
<221> MOD_RES
<222> (352)..(352)
<223> D or A
<220>
<221> MOD_RES
<222> (353)..(353)
<223> L or I
<220>
<221> MOD_RES
<222> (355)..(355)
<223> R or Q
<220>
<221> MOD_RES
<222> (359)..(359)
<223> N or D
<220>
<221> MOD_RES
<222> (363)..(363)
<223> M or V
<220>
<221> MOD_RES
<222> (365)..(365)
<223> T or I
<220>
<221> MOD_RES
<222> (370)..(370)
<223> V or I
<220>
<221> MOD_RES
<222> (381)..(381)
<223> H or E
<220>
<221> MOD_RES
<222> (384)..(384)
<223> G or L
<220>
<221> MOD_RES
<222> (386)..(386)
<223> T or I
<220>
<221> MOD_RES
<222> (393)..(393)
<223> G or S
<220>
<221> MOD_RES
<222> (403)..(403)
<223> F or L
<220>
<221> MOD_RES
<222> (404)..(404)
<223> C or Y
<220>
<221> MOD_RES
<222> (407)..(407)
<223> A or T
<220>
<221> MOD_RES
<222> (409)..(409)
<223> K, E, or G
<220>
<221> MOD_RES
<222> (410)..(410)
<223> S, P, or H
<220>
<221> MOD_RES
<222> (414)..(414)
<223> S or L
<220>
<221> MOD_RES
<222> (415)..(415)
<223> N or D
<220>
<221> MOD_RES
<222> (416)..(416)
<223> N or S
<220>
<221> MOD_RES
<222> (423)..(423)
<223> I or V
<220>
<221> MOD_RES
<222> (433)..(433)
<223> P or L
<220>
<221> MOD_RES
<222> (441)..(441)
<223> P or Q
<220>
<221> MOD_RES
<222> (453)..(453)
<223> E or D
<220>
<221> MOD_RES
<222> (454)..(454)
<223> A or T
<220>
<221> MOD_RES
<222> (455)..(455)
<223> T or K
<220>
<221> MOD_RES
<222> (458)..(458)
<223> A or T
<220>
<221> MOD_RES
<222> (461)..(461)
<223> R or Q
<220>
<221> MOD_RES
<222> (463)..(463)
<223> G or D
<220>
<221> MOD_RES
<222> (475)..(475)
<223> V or A
<220>
<221> MOD_RES
<222> (479)..(479)
<223> T, S, or N
<220>
<221> MOD_RES
<222> (485)..(485)
<223> A, S, or T
<220>
<221> MOD_RES
<222> (491)..(491)
<223> N or S
<220>
<221> MOD_RES
<222> (492)..(492)
<223> N or D
<220>
<221> MOD_RES
<222> (495)..(495)
<223> N, S, or K
<220>
<221> MOD_RES
<222> (497)..(497)
<223> E, R, or K
<220>
<221> MOD_RES
<222> (498)..(498)
<223> K, A, or E
<220>
<221> MOD_RES
<222> (502)..(502)
<223> L or V
<220>
<221> MOD_RES
<222> (505)..(505)
<223> A or S
<220>
<221> MOD_RES
<222> (507)..(507)
<223> H or D
<220>
<221> MOD_RES
<222> (509)..(509)
<223> E or S
<220>
<221> MOD_RES
<222> (510)..(510)
<223> V or L
<220>
<221> MOD_RES
<222> (511)..(511)
<223> A or N
<220>
<221> MOD_RES
<222> (512)..(512)
<223> H or Y
<220>
<221> MOD_RES
<222> (513)..(513)
<223> G or R
<220>
<221> MOD_RES
<222> (515)..(515)
<223> A or T
<220>
<221> MOD_RES
<222> (517)..(517)
<223> I or L
<220>
<221> MOD_RES
<222> (518)..(518)
<223> K or Q
<220>
<221> MOD_RES
<222> (519)..(519)
<223> E or K
<220>
<221> MOD_RES
<222> (522)..(522)
<223> G or A
<220>
<221> MOD_RES
<222> (523)..(523)
<223> E, D, or N
<220>
<221> MOD_RES
<222> (524)..(524)
<223> Y, G, A, or N
<220>
<221> MOD_RES
<222> (525)..(525)
<223> G or E
<220>
<221> MOD_RES
<222> (526)..(526)
<223> L or G
<220>
<221> MOD_RES
<222> (527)..(527)
<223> P or L
<220>
<221> MOD_RES
<222> (529)..(529)
<223> R, P, or T
<220>
<221> MOD_RES
<222> (530)..(530)
<223> A or E
<220>
<221> MOD_RES
<222> (531)..(531)
<223> E or K
<220>
<221> MOD_RES
<222> (532)..(532)
<223> R, Q, or K
<220>
<221> MOD_RES
<222> (533)..(533)
<223> D, K, or E
<220>
<221> MOD_RES
<222> (534)..(534)
<223> A, T, or S
<220>
<221> MOD_RES
<222> (540)..(540)
<223> R or K
<220>
<221> MOD_RES
<222> (543)..(543)
<223> I or L
<220>
<221> MOD_RES
<222> (544)..(544)
<223> P or H
<220>
<221> MOD_RES
<222> (545)..(545)
<223> R or Q
<220>
<221> MOD_RES
<222> (554)..(554)
<223> T or I
<220>
<221> MOD_RES
<222> (556)..(556)
<223> T, A, or I
<220>
<221> MOD_RES
<222> (557)..(557)
<223> P or D
<220>
<221> MOD_RES
<222> (560)..(560)
<223> N or K
<220>
<221> MOD_RES
<222> (561)..(561)
<223> A or E
<220>
<221> MOD_RES
<222> (562)..(562)
<223> E, R, or D
<220>
<221> MOD_RES
<222> (563)..(563)
<223> E, N, or R
<220>
<221> MOD_RES
<222> (564)..(564)
<223> H or L
<220>
<221> MOD_RES
<222> (565)..(565)
<223> I or V
<220>
<221> MOD_RES
<222> (566)..(566)
<223> T or E
<220>
<221> MOD_RES
<222> (567)..(567)
<223> Q, R, H, or D
<220>
<221> MOD_RES
<222> (572)..(572)
<223> S or P
<220>
<221> MOD_RES
<222> (583)..(583)
<223> P or T
<220>
<221> MOD_RES
<222> (584)..(584)
<223> E or D
<220>
<221> MOD_RES
<222> (585)..(585)
<223> S, A, or R
<220>
<221> MOD_RES
<222> (586)..(586)
<223> A, E, or V
<220>
<221> MOD_RES
<222> (587)..(587)
<223> G, E, or D
<220>
<221> MOD_RES
<222> (589)..(589)
<223> E or S
<220>
<221> MOD_RES
<222> (590)..(590)
<223> D or N
<220>
<221> MOD_RES
<222> (593)..(593)
<223> V or A
<220>
<221> MOD_RES
<222> (598)..(598)
<223> M or I
<220>
<221> MOD_RES
<222> (601)..(601)
<223> H or Y
<220>
<221> MOD_RES
<222> (602)..(602)
<223> A or G
<220>
<221> MOD_RES
<222> (613)..(613)
<223> A or S
<220>
<221> MOD_RES
<222> (615)..(615)
<223> E or A
<220>
<221> MOD_RES
<222> (616)..(616)
<223> E, A, Q, G, V, or R
<220>
<221> MOD_RES
<222> (618)..(618)
<223> A, P, or T
<220>
<221> MOD_RES
<222> (619)..(619)
<223> I, T, or P
<220>
<221> MOD_RES
<222> (620)..(620)
<223> D or A
<220>
<221> MOD_RES
<222> (624)..(629)
<223> This region may encompass one of the following sequences:
"V" or "VVKEAI"
<220>
<221> MOD_RES
<222> (631)..(631)
<223> K or E
<220>
<221> MOD_RES
<222> (637)..(637)
<223> T, A, or P
<220>
<221> MOD_RES
<222> (644)..(644)
<223> R, Q, or H
<220>
<221> MOD_RES
<222> (645)..(645)
<223> K or absent
<220>
<223> See specification as filed for detailed description of
substitutions and preferred embodiments
<400> 130
Xaa Glu Xaa Xaa Leu Xaa Ile Phe Asp Glu Cys Arg Ser Pro Cys Xaa
1 5 10 15
Leu Thr Pro Glu Xaa Gly Lys Xaa Ile Gln Ser Lys Leu Xaa Ile Pro
20 25 30
Xaa Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Xaa Asp Glu Xaa Lys Gly Glu Ser Ile
50 55 60
Ile Thr Xaa Gly Glu Phe Ala Thr Xaa Arg Ala Thr Arg His Tyr Val
65 70 75 80
Xaa Gln Asp Ala Pro Phe Gly Val Ile Xaa Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Xaa Tyr Ser Xaa Asn Arg Lys Xaa Xaa Glu Phe Xaa
100 105 110
Ile Xaa Trp Leu Val Xaa Xaa Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Xaa Asp Glu Xaa Asp Gln Xaa Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Xaa
145 150 155 160
Xaa Gln Gly Asn Val Xaa Phe Xaa Val Thr Arg Pro Glu Xaa Xaa Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ile Ala Ile Ser Trp Pro Ser
180 185 190
Val Ser Tyr Xaa Ala Ala Xaa Lys Xaa Gly Xaa Arg His Lys Arg Trp
195 200 205
Ala Xaa Trp Xaa Thr Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys Thr Xaa Gly Xaa Xaa
225 230 235 240
Trp Xaa Gly Gly Xaa Tyr Xaa Thr Val Ala Gly Xaa Pro Xaa Xaa Ile
245 250 255
Xaa Val Lys Gln Gly Xaa Glu Gln Lys Xaa Val Glu Gln Arg Ile His
260 265 270
Phe Ser Xaa Xaa Asn Ala Xaa Xaa Xaa Leu Ala Ala His Arg Val Cys
275 280 285
Gly Val Pro Leu Glu Thr Leu Ala Arg Xaa Arg Lys Pro Arg Xaa Leu
290 295 300
Xaa Asp Asp Leu Xaa Cys Xaa Tyr Xaa Ala Gln Xaa Ile Val Ser Leu
305 310 315 320
Phe Xaa Ala Thr Arg Xaa Leu Phe Xaa His Xaa Asp Ser Xaa Phe Thr
325 330 335
Leu Asn Leu Xaa Xaa Gln Xaa Pro Xaa Val Xaa Glu Arg Leu Xaa Xaa
340 345 350
Xaa Arg Xaa Ile Asn Glu Xaa Asn Pro Gly Xaa Val Xaa Gln Val Leu
355 360 365
Thr Xaa Ala Arg Gln Ile Tyr Asn Asp Tyr Val Thr Xaa His Pro Xaa
370 375 380
Leu Xaa Pro Glu Gln Thr Ser Ala Xaa Ala Gln Ala Ala Asp Ile Leu
385 390 395 400
Ser Leu Xaa Xaa Pro Asp Xaa Asp Xaa Xaa Cys Val Ala Xaa Xaa Xaa
405 410 415
Asp Gln Ala Asn Ile Asn Xaa Glu Ser Arg Ser Gly Arg Ser Tyr Leu
420 425 430
Xaa Glu Asn Arg Ala Val Ile Thr Xaa Gln Gly Val Thr Asn Trp Thr
435 440 445
Tyr Gln Glu Leu Xaa Xaa Xaa His Gln Xaa Leu Thr Xaa Glu Xaa Tyr
450 455 460
Val Phe Val Gly Tyr His Gly Thr Asn His Xaa Ala Ala Gln Xaa Ile
465 470 475 480
Val Asn Arg Ile Xaa Pro Val Pro Arg Gly Xaa Xaa Thr Glu Xaa Glu
485 490 495
Xaa Xaa Trp Gly Gly Xaa Tyr Val Xaa Thr Xaa Ala Xaa Xaa Xaa Xaa
500 505 510
Xaa Tyr Xaa Arg Xaa Xaa Xaa Gly Thr Xaa Xaa Xaa Xaa Xaa Xaa Thr
515 520 525
Xaa Xaa Xaa Xaa Xaa Xaa Arg Gly Val Met Leu Xaa Val Tyr Xaa Xaa
530 535 540
Xaa Ala Ser Leu Glu Arg Phe Tyr Arg Xaa Asn Xaa Xaa Leu Glu Xaa
545 550 555 560
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Val Ile Gly His Xaa Leu Pro Leu Arg
565 570 575
Asn Glu Ala Phe Thr Gly Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Glu Thr
580 585 590
Xaa Ile Gly Trp Asp Xaa Ala Ile Xaa Xaa Val Ala Ile Pro Ser Thr
595 600 605
Ile Pro Gly Asn Xaa Tyr Xaa Xaa Leu Xaa Xaa Xaa Glu Glu Ala Xaa
610 615 620
Xaa Xaa Xaa Xaa Xaa Ala Xaa Glu Gln Ser Ile Ser Xaa Lys Pro Pro
625 630 635 640
Tyr Lys Glu Xaa Xaa Asp Glu Leu Lys
645
<210> 131
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 131
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
195 200 205
<210> 132
<211> 246
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 132
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val
245
<210> 133
<211> 252
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 133
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly
245 250
<210> 134
<211> 267
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 134
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly
260 265
<210> 135
<211> 387
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 135
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala
385
<210> 136
<211> 188
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 136
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala
180 185
<210> 137
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 137
Met Val Leu Tyr Tyr Ser Met Thr Ile Asn Asp Glu Gln Asn Asp Ile
1 5 10 15
Lys Asp Glu Asp Lys Gly Glu Ser Ile Ile Thr Ile Gly Glu Phe Ala
20 25 30
Thr Val Arg Ala Thr Arg His Tyr Val Asn Gln Asp Ala Pro Phe Gly
35 40 45
Val Ile His Leu Asp Ile Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser
50 55 60
Tyr Asn Arg Lys Glu Gly Glu Phe Ala Ile Asn Trp Leu Val Pro Ile
65 70 75 80
Gly Glu Asp Ser Pro Ala Ser Ile Lys Ile Ser Val Asp Glu Leu Asp
85 90 95
Gln Gln Arg Asn Ile Ile Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu
100 105 110
Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln Gly Asn Val Ser Phe
115 120 125
Ser Val Thr Arg Pro Glu His Asn Ile Ala Ile Ser Trp Pro Ser Val
130 135 140
Ser Tyr Lys Ala
145
<210> 138
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 138
Met Gly Val Leu Tyr Tyr Ser Met Thr Ile Asn Asp Glu Gln Asn Asp
1 5 10 15
Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile Ile Thr Ile Gly Glu Phe
20 25 30
Ala Thr Val Arg Ala Thr Arg His Tyr Val Asn Gln Asp Ala Pro Phe
35 40 45
Gly Val Ile His Leu Asp Ile Thr Thr Glu Asn Gly Thr Lys Thr Tyr
50 55 60
Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala Ile Asn Trp Leu Val Pro
65 70 75 80
Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys Ile Ser Val Asp Glu Leu
85 90 95
Asp Gln Gln Arg Asn Ile Ile Glu Val Pro Lys Leu Tyr Ser Ile Asp
100 105 110
Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln Gly Asn Val Ser
115 120 125
Phe Ser Val Thr Arg Pro Glu His Asn Ile Ala Ile Ser Trp Pro Ser
130 135 140
Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp
145 150 155 160
Ala His Trp His Thr Gly Leu
165
<210> 139
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 139
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu
145 150
<210> 140
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 140
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu
130 135
<210> 141
<211> 179
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 141
Met Ala Ala Leu Gln Lys Ser Val Ser Ser Phe Leu Met Gly Thr Leu
1 5 10 15
Ala Thr Ser Cys Leu Leu Leu Leu Ala Leu Leu Val Gln Gly Gly Ala
20 25 30
Ala Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser Asn Phe Gln
35 40 45
Gln Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys Glu Ala Ser
50 55 60
Leu Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu Lys Leu Phe
65 70 75 80
His Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys Gln Val Leu
85 90 95
Asn Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp Arg Phe Gln
100 105 110
Pro Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu Ser Asn Arg
115 120 125
Leu Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile Gln Arg Asn
130 135 140
Val Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu Ser Gly Glu
145 150 155 160
Ile Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser Leu Arg Asn
165 170 175
Ala Cys Ile
<210> 142
<211> 146
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 142
Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser Asn Phe Gln Gln
1 5 10 15
Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys Glu Ala Ser Leu
20 25 30
Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu Lys Leu Phe His
35 40 45
Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys Gln Val Leu Asn
50 55 60
Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp Arg Phe Gln Pro
65 70 75 80
Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu Ser Asn Arg Leu
85 90 95
Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile Gln Arg Asn Val
100 105 110
Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu Ser Gly Glu Ile
115 120 125
Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser Leu Arg Asn Ala
130 135 140
Cys Ile
145
<210> 143
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 143
Met Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser Asn Phe Gln
1 5 10 15
Gln Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys Glu Ala Ser
20 25 30
Leu Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu Lys Leu Phe
35 40 45
His Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys Gln Val Leu
50 55 60
Asn Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp Arg Phe Gln
65 70 75 80
Pro Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu Ser Asn Arg
85 90 95
Leu Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile Gln Arg Asn
100 105 110
Val Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu Ser Gly Glu
115 120 125
Ile Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser Leu Arg Asn
130 135 140
Ala Cys Ile
145
<210> 144
<211> 178
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 144
Met His Ser Ser Ala Leu Leu Cys Cys Leu Val Leu Leu Thr Gly Val
1 5 10 15
Arg Ala Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His
20 25 30
Phe Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe
35 40 45
Ser Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu
50 55 60
Leu Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys
65 70 75 80
Gln Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro
85 90 95
Gln Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu
100 105 110
Gly Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg
115 120 125
Phe Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn
130 135 140
Ala Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu
145 150 155 160
Phe Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile
165 170 175
Arg Asn
<210> 145
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 145
Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His Phe Pro
1 5 10 15
Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe Ser Arg
20 25 30
Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu Leu Leu
35 40 45
Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys Gln Ala
50 55 60
Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro Gln Ala
65 70 75 80
Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu Gly Glu
85 90 95
Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg Phe Leu
100 105 110
Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn Ala Phe
115 120 125
Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu Phe Asp
130 135 140
Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile Arg Asn
145 150 155 160
<210> 146
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 146
Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg
1 5 10 15
Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu
20 25 30
Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro
35 40 45
Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg
50 55 60
Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu
65 70 75 80
Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val
85 90 95
Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp
100 105 110
Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu
115 120 125
Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser
130 135 140
Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr
145 150 155 160
Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe
165 170 175
Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
180 185 190
<210> 147
<211> 428
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 147
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Gly Gly Gly Gly Ser
260 265 270
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Pro Ile Ser Ser His
275 280 285
Cys Arg Leu Asp Lys Ser Asn Phe Gln Gln Pro Tyr Ile Thr Asn Arg
290 295 300
Thr Phe Met Leu Ala Lys Glu Ala Ser Leu Ala Asp Asn Asn Thr Asp
305 310 315 320
Val Arg Leu Ile Gly Glu Lys Leu Phe His Gly Val Ser Met Ser Glu
325 330 335
Arg Cys Tyr Leu Met Lys Gln Val Leu Asn Phe Thr Leu Glu Glu Val
340 345 350
Leu Phe Pro Gln Ser Asp Arg Phe Gln Pro Tyr Met Gln Glu Val Val
355 360 365
Pro Phe Leu Ala Arg Leu Ser Asn Arg Leu Ser Thr Cys His Ile Glu
370 375 380
Gly Asp Asp Leu His Ile Gln Arg Asn Val Gln Lys Leu Lys Asp Thr
385 390 395 400
Val Lys Lys Leu Gly Glu Ser Gly Glu Ile Lys Ala Ile Gly Glu Leu
405 410 415
Asp Leu Leu Phe Met Ser Leu Arg Asn Ala Cys Ile
420 425
<210> 148
<211> 548
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 148
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
385 390 395 400
Gly Ser Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser Asn Phe
405 410 415
Gln Gln Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys Glu Ala
420 425 430
Ser Leu Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu Lys Leu
435 440 445
Phe His Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys Gln Val
450 455 460
Leu Asn Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp Arg Phe
465 470 475 480
Gln Pro Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu Ser Asn
485 490 495
Arg Leu Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile Gln Arg
500 505 510
Asn Val Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu Ser Gly
515 520 525
Glu Ile Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser Leu Arg
530 535 540
Asn Ala Cys Ile
545
<210> 149
<211> 561
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 149
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
385 390 395 400
Gly Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His Phe
405 410 415
Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe Ser
420 425 430
Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu Leu
435 440 445
Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys Gln
450 455 460
Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro Gln
465 470 475 480
Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu Gly
485 490 495
Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg Phe
500 505 510
Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn Ala
515 520 525
Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu Phe
530 535 540
Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile Arg
545 550 555 560
Asn
<210> 150
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 150
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Gly Gly Gly Gly Ser
260 265 270
Asn Leu Gln Gly Gly Leu Arg Gln Pro Arg Phe Pro Thr Ile Pro Leu
275 280 285
Ser Arg Leu Phe Asp Asn Ala Met Leu Arg Ala His Arg Leu His Gln
290 295 300
Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys
305 310 315 320
Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe
325 330 335
Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln Lys
340 345 350
Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp
355 360 365
Leu Glu Pro Val Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val
370 375 380
Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu
385 390 395 400
Glu Gly Ile Gln Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg
405 410 415
Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser
420 425 430
His Asn Asp Asp Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe
435 440 445
Arg Lys Asp Met Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys
450 455 460
Arg Ser Val Glu Gly Ser Cys Gly Phe
465 470
<210> 151
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 151
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe
145 150 155 160
Asp Asn Ala Met Leu Arg Ala His Arg Leu His Gln Leu Ala Phe Asp
165 170 175
Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr
180 185 190
Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile
195 200 205
Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu
210 215 220
Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp Leu Glu Pro Val
225 230 235 240
Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser
245 250 255
Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln
260 265 270
Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile
275 280 285
Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser His Asn Asp Asp
290 295 300
Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met
305 310 315 320
Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys Arg Ser Val Glu
325 330 335
Gly Ser Cys Gly Phe
340
<210> 152
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 152
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Gly Gly Gly Gly Ser Gly Gly Gly
145 150 155 160
Gly Ser Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro Leu Ser Arg Leu
165 170 175
Phe Asp Asn Ala Met Leu Arg Ala His Arg Leu His Gln Leu Ala Phe
180 185 190
Asp Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys Glu Gln Lys
195 200 205
Tyr Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe Ser Glu Ser
210 215 220
Ile Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln Lys Ser Asn Leu
225 230 235 240
Glu Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp Leu Glu Pro
245 250 255
Val Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val Tyr Gly Ala
260 265 270
Ser Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu Glu Gly Ile
275 280 285
Gln Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg Thr Gly Gln
290 295 300
Ile Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser His Asn Asp
305 310 315 320
Asp Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe Arg Lys Asp
325 330 335
Met Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys Arg Ser Val
340 345 350
Glu Gly Ser Cys Gly Phe
355
<210> 153
<211> 394
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 153
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Gly Gly Gly Gly
180 185 190
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro
195 200 205
Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg Ala His Arg Leu His
210 215 220
Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro
225 230 235 240
Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys
245 250 255
Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln
260 265 270
Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser
275 280 285
Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu
290 295 300
Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu
305 310 315 320
Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro
325 330 335
Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn
340 345 350
Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys
355 360 365
Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln
370 375 380
Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
385 390
<210> 154
<211> 354
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 154
Met Val Leu Tyr Tyr Ser Met Thr Ile Asn Asp Glu Gln Asn Asp Ile
1 5 10 15
Lys Asp Glu Asp Lys Gly Glu Ser Ile Ile Thr Ile Gly Glu Phe Ala
20 25 30
Thr Val Arg Ala Thr Arg His Tyr Val Asn Gln Asp Ala Pro Phe Gly
35 40 45
Val Ile His Leu Asp Ile Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser
50 55 60
Tyr Asn Arg Lys Glu Gly Glu Phe Ala Ile Asn Trp Leu Val Pro Ile
65 70 75 80
Gly Glu Asp Ser Pro Ala Ser Ile Lys Ile Ser Val Asp Glu Leu Asp
85 90 95
Gln Gln Arg Asn Ile Ile Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu
100 105 110
Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln Gly Asn Val Ser Phe
115 120 125
Ser Val Thr Arg Pro Glu His Asn Ile Ala Ile Ser Trp Pro Ser Val
130 135 140
Ser Tyr Lys Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
145 150 155 160
Gly Gly Ser Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala
165 170 175
Met Leu Arg Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln
180 185 190
Glu Phe Glu Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu
195 200 205
Gln Asn Pro Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro
210 215 220
Ser Asn Arg Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg
225 230 235 240
Ile Ser Leu Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu
245 250 255
Arg Ser Val Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn
260 265 270
Val Tyr Asp Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met
275 280 285
Gly Arg Leu Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln
290 295 300
Thr Tyr Ser Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu
305 310 315 320
Lys Asn Tyr Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val
325 330 335
Glu Thr Phe Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys
340 345 350
Gly Phe
<210> 155
<211> 413
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 155
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Gly
195 200 205
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Phe Pro
210 215 220
Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg Ala His
225 230 235 240
Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu Glu Ala
245 250 255
Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro Gln Thr
260 265 270
Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg Glu Glu
275 280 285
Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu Leu Leu
290 295 300
Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val Phe Ala
305 310 315 320
Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp Leu Leu
325 330 335
Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu Glu Asp
340 345 350
Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser Lys Phe
355 360 365
Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr Gly Leu
370 375 380
Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe Leu Arg
385 390 395 400
Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
405 410
<210> 156
<211> 379
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 156
Met Gly Val Leu Tyr Tyr Ser Met Thr Ile Asn Asp Glu Gln Asn Asp
1 5 10 15
Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile Ile Thr Ile Gly Glu Phe
20 25 30
Ala Thr Val Arg Ala Thr Arg His Tyr Val Asn Gln Asp Ala Pro Phe
35 40 45
Gly Val Ile His Leu Asp Ile Thr Thr Glu Asn Gly Thr Lys Thr Tyr
50 55 60
Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala Ile Asn Trp Leu Val Pro
65 70 75 80
Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys Ile Ser Val Asp Glu Leu
85 90 95
Asp Gln Gln Arg Asn Ile Ile Glu Val Pro Lys Leu Tyr Ser Ile Asp
100 105 110
Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln Gly Asn Val Ser
115 120 125
Phe Ser Val Thr Arg Pro Glu His Asn Ile Ala Ile Ser Trp Pro Ser
130 135 140
Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp
145 150 155 160
Ala His Trp His Thr Gly Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly
165 170 175
Ser Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe
180 185 190
Asp Asn Ala Met Leu Arg Ala His Arg Leu His Gln Leu Ala Phe Asp
195 200 205
Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr
210 215 220
Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile
225 230 235 240
Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu
245 250 255
Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp Leu Glu Pro Val
260 265 270
Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser
275 280 285
Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln
290 295 300
Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile
305 310 315 320
Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser His Asn Asp Asp
325 330 335
Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met
340 345 350
Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys Arg Ser Val Glu
355 360 365
Gly Ser Cys Gly Phe His His His His His His
370 375
<210> 157
<211> 452
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 157
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
245 250 255
Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp
260 265 270
Asn Ala Met Leu Arg Ala His Arg Leu His Gln Leu Ala Phe Asp Thr
275 280 285
Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser
290 295 300
Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro
305 310 315 320
Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu
325 330 335
Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln
340 345 350
Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp
355 360 365
Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr
370 375 380
Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe
385 390 395 400
Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala
405 410 415
Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp
420 425 430
Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly
435 440 445
Ser Cys Gly Phe
450
<210> 158
<211> 458
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 158
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Gly Gly Gly Gly
245 250 255
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro
260 265 270
Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg Ala His Arg Leu His
275 280 285
Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro
290 295 300
Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys
305 310 315 320
Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln
325 330 335
Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser
340 345 350
Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu
355 360 365
Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu
370 375 380
Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro
385 390 395 400
Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn
405 410 415
Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys
420 425 430
Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln
435 440 445
Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
450 455
<210> 159
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 159
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Gly Gly Gly Gly Ser
260 265 270
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Phe Pro Thr Ile Pro Leu
275 280 285
Ser Arg Leu Phe Asp Asn Ala Met Leu Arg Ala His Arg Leu His Gln
290 295 300
Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys
305 310 315 320
Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe
325 330 335
Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg Glu Glu Thr Gln Gln Lys
340 345 350
Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp
355 360 365
Leu Glu Pro Val Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val
370 375 380
Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu
385 390 395 400
Glu Gly Ile Gln Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg
405 410 415
Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser
420 425 430
His Asn Asp Asp Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe
435 440 445
Arg Lys Asp Met Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys
450 455 460
Arg Ser Val Glu Gly Ser Cys Gly Phe
465 470
<210> 160
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 160
Leu Thr Pro Glu Pro Gly Lys Pro Ile
1 5
<210> 161
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 161
Thr Arg Pro Glu His Asn Ile
1 5
<210> 162
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 162
Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp
1 5 10 15
His
<210> 163
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 163
Ile Pro Ser Asp Val Val Leu Asp Glu
1 5
<210> 164
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 164
Asp Gln Gln Arg Asn
1 5
<210> 165
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 165
Asp Gln Gln Arg Asn Ile Ile Glu Val Pro Lys Leu Tyr Ser Ile Asp
1 5 10 15
Leu
<210> 166
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 166
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly
35 40
<210> 167
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 167
Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln Gly Asn Val Ser
1 5 10 15
Phe Ser Val Thr Arg Pro Glu His Asn Ile Ala Ile Ser Trp Pro Ser
20 25 30
Val Ser Tyr Lys Ala
35
<210> 168
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 168
Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr
1 5 10 15
Gly Leu Ala
<210> 169
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(30)
<223> This sequence may encompass 1-15 "Gly Ser"
repeating units
<400> 169
Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
1 5 10 15
Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
20 25 30
<210> 170
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(45)
<223> This sequence may encompass 1-15 "Gly Gly Ser"
repeating units
<400> 170
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
35 40 45
<210> 171
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(60)
<223> This sequence may encompass 1-15 "Gly Gly Gly Ser"
repeating units
<400> 171
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
20 25 30
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
35 40 45
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
50 55 60
<210> 172
<211> 75
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(75)
<223> This sequence may encompass 1-15 "Gly Gly Gly Gly Ser"
repeating units
<400> 172
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70 75
<210> 173
<211> 90
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MISC_FEATURE
<222> (1)..(90)
<223> This sequence may encompass 1-15 "Gly Gly Gly Gly Gly Ser"
repeating units
<400> 173
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10 15
Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser
35 40 45
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly
65 70 75 80
Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser
85 90
<210> 174
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(25)
<223> This sequence may encompass 1-5 "Gly Gly Gly Gly Ser"
repeating units
<400> 174
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 175
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 175
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 176
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 176
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5 10
<210> 177
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 177
Gly Gly Gly Gly Ser Asn Leu Gln Gly Gly Leu Arg Gln Pro Arg
1 5 10 15
<210> 178
<211> 266
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 178
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys
260 265
<210> 179
<211> 348
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 179
Val Glu Asp Glu Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu
340 345
<210> 180
<211> 386
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 180
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala
385
<210> 181
<211> 266
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 181
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly
260 265
<210> 182
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 182
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly
245 250
<210> 183
<211> 245
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 183
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val
245
<210> 184
<211> 206
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 184
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala
195 200 205
<210> 185
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 185
Val Glu Glu Ala
1
<210> 186
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 186
Val Leu Tyr Tyr
1
<210> 187
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 187
Gly Val Leu Tyr Tyr
1 5
<210> 188
<211> 428
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 188
Met Leu Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Gly Gly Gly Gly Ser
260 265 270
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Pro Ile Ser Ser His
275 280 285
Cys Arg Leu Asp Lys Ser Asn Phe Gln Gln Pro Tyr Ile Thr Asn Arg
290 295 300
Thr Phe Met Leu Ala Lys Glu Ala Ser Leu Ala Asp Asn Asn Thr Asp
305 310 315 320
Val Arg Leu Ile Gly Glu Lys Leu Phe His Gly Val Ser Met Ser Glu
325 330 335
Arg Cys Tyr Leu Met Lys Gln Val Leu Asn Phe Thr Leu Glu Glu Val
340 345 350
Leu Phe Pro Gln Ser Asp Arg Phe Gln Pro Tyr Met Gln Glu Val Val
355 360 365
Pro Phe Leu Ala Arg Leu Ser Asn Arg Leu Ser Thr Cys His Ile Glu
370 375 380
Gly Asp Asp Leu His Ile Gln Arg Asn Val Gln Lys Leu Lys Asp Thr
385 390 395 400
Val Lys Lys Leu Gly Glu Ser Gly Glu Ile Lys Ala Ile Gly Glu Leu
405 410 415
Asp Leu Leu Phe Met Ser Leu Arg Asn Ala Cys Ile
420 425
<210> 189
<211> 633
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 189
Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys Ser
1 5 10 15
Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile Pro
20 25 30
Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr Ile
35 40 45
Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser Ile
50 55 60
Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr Val
65 70 75 80
Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr Glu
85 90 95
Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe Ala
100 105 110
Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile Lys
115 120 125
Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val Pro
130 135 140
Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp Lys
145 150 155 160
Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn Ile
165 170 175
Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu Gly
180 185 190
Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu Cys
195 200 205
Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln Asn
210 215 220
Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val Ala
225 230 235 240
Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys Pro
245 250 255
Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala Leu
260 265 270
Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg Ser
275 280 285
Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln Ala
290 295 300
Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser His
305 310 315 320
Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu Val
325 330 335
Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro Gly
340 345 350
Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp Tyr
355 360 365
Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly Ala
370 375 380
Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys Ser
385 390 395 400
Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser Arg
405 410 415
Ser Gly Arg Ser Tyr Leu Pro Glu Asn Arg Ala Val Ile Thr Pro Gln
420 425 430
Gly Val Thr Asn Trp Thr Tyr Gln Glu Leu Glu Ala Thr His Gln Ala
435 440 445
Leu Thr Arg Glu Gly Tyr Val Phe Val Gly Tyr His Gly Thr Asn His
450 455 460
Val Ala Ala Gln Thr Ile Val Asn Arg Ile Ala Pro Val Pro Arg Gly
465 470 475 480
Asn Asn Thr Glu Asn Glu Glu Lys Trp Gly Gly Leu Tyr Val Ala Thr
485 490 495
His Ala Glu Val Ala His Gly Tyr Ala Arg Ile Lys Glu Gly Thr Gly
500 505 510
Glu Tyr Gly Leu Pro Thr Arg Ala Glu Arg Asp Ala Arg Gly Val Met
515 520 525
Leu Arg Val Tyr Ile Pro Arg Ala Ser Leu Glu Arg Phe Tyr Arg Thr
530 535 540
Asn Thr Pro Leu Glu Asn Ala Glu Glu His Ile Thr Gln Val Ile Gly
545 550 555 560
His Ser Leu Pro Leu Arg Asn Glu Ala Phe Thr Gly Pro Glu Ser Ala
565 570 575
Gly Gly Glu Asp Thr Val Ile Gly Trp Asp Met Ala Ile His Ala Val
580 585 590
Ala Ile Pro Ser Thr Ile Pro Gly Asn Ala Tyr Glu Glu Leu Ala Ile
595 600 605
Asp Glu Glu Ala Val Ala Lys Glu Gln Ser Ile Ser Thr Lys Pro Pro
610 615 620
Tyr Lys Glu Arg Lys Asp Glu Leu Lys
625 630
<210> 190
<211> 192
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 190
Met Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu
1 5 10 15
Arg Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe
20 25 30
Glu Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn
35 40 45
Pro Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn
50 55 60
Arg Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser
65 70 75 80
Leu Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser
85 90 95
Val Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr
100 105 110
Asp Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg
115 120 125
Leu Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr
130 135 140
Ser Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn
145 150 155 160
Tyr Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr
165 170 175
Phe Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
180 185 190
<210> 191
<211> 422
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 191
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys
385 390 395 400
Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser
405 410 415
Cys Glu Asn Leu Phe Gln
420
<210> 192
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 192
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Cys Glu Asn Leu Phe Gln
385 390
<210> 193
<211> 432
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 193
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Ala Asp Ile Leu Ser Leu Phe Cys Pro Asp Ala Asp Lys
385 390 395 400
Ser Cys Val Ala Ser Asn Asn Asp Gln Ala Asn Ile Asn Ile Glu Ser
405 410 415
Cys Glu Asn Leu Phe Gln Ser Gly Thr Cys His His His His His His
420 425 430
<210> 194
<211> 403
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 194
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Cys Glu Asn Leu Phe Gln Ser Gly Thr Cys His His His
385 390 395 400
His His His
<210> 195
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 195
His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu
1 5 10 15
Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser
20 25 30
Ser Gly Ala Pro Pro Pro Ser
35
<210> 196
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 196
Gly Gly Gly Gly Ser
1 5
<210> 197
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 197
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 198
<211> 418
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 198
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Gly Gly Gly Gly Ser
260 265 270
Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser Asn Phe Gln Gln
275 280 285
Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys Glu Ala Ser Leu
290 295 300
Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu Lys Leu Phe His
305 310 315 320
Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys Gln Val Leu Asn
325 330 335
Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp Arg Phe Gln Pro
340 345 350
Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu Ser Asn Arg Leu
355 360 365
Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile Gln Arg Asn Val
370 375 380
Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu Ser Gly Glu Ile
385 390 395 400
Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser Leu Arg Asn Ala
405 410 415
Cys Ile
<210> 199
<211> 438
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 199
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Gly Gly Gly Gly Ser
260 265 270
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
275 280 285
Gly Gly Gly Ser Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser
290 295 300
Asn Phe Gln Gln Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys
305 310 315 320
Glu Ala Ser Leu Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu
325 330 335
Lys Leu Phe His Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys
340 345 350
Gln Val Leu Asn Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp
355 360 365
Arg Phe Gln Pro Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu
370 375 380
Ser Asn Arg Leu Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile
385 390 395 400
Gln Arg Asn Val Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu
405 410 415
Ser Gly Glu Ile Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser
420 425 430
Leu Arg Asn Ala Cys Ile
435
<210> 200
<211> 418
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 200
Met Ala Pro Ile Ser Ser His Cys Arg Leu Asp Lys Ser Asn Phe Gln
1 5 10 15
Gln Pro Tyr Ile Thr Asn Arg Thr Phe Met Leu Ala Lys Glu Ala Ser
20 25 30
Leu Ala Asp Asn Asn Thr Asp Val Arg Leu Ile Gly Glu Lys Leu Phe
35 40 45
His Gly Val Ser Met Ser Glu Arg Cys Tyr Leu Met Lys Gln Val Leu
50 55 60
Asn Phe Thr Leu Glu Glu Val Leu Phe Pro Gln Ser Asp Arg Phe Gln
65 70 75 80
Pro Tyr Met Gln Glu Val Val Pro Phe Leu Ala Arg Leu Ser Asn Arg
85 90 95
Leu Ser Thr Cys His Ile Glu Gly Asp Asp Leu His Ile Gln Arg Asn
100 105 110
Val Gln Lys Leu Lys Asp Thr Val Lys Lys Leu Gly Glu Ser Gly Glu
115 120 125
Ile Lys Ala Ile Gly Glu Leu Asp Leu Leu Phe Met Ser Leu Arg Asn
130 135 140
Ala Cys Ile Gly Gly Gly Gly Ser Val Glu Glu Ala Leu Asn Ile Phe
145 150 155 160
Asp Glu Cys Arg Ser Pro Cys Ser Leu Thr Pro Glu Pro Gly Lys Pro
165 170 175
Ile Gln Ser Lys Leu Ser Ile Pro Ser Asp Val Val Leu Asp Glu Gly
180 185 190
Val Leu Tyr Tyr Ser Met Thr Ile Asn Asp Glu Gln Asn Asp Ile Lys
195 200 205
Asp Glu Asp Lys Gly Glu Ser Ile Ile Thr Ile Gly Glu Phe Ala Thr
210 215 220
Val Arg Ala Thr Arg His Tyr Val Asn Gln Asp Ala Pro Phe Gly Val
225 230 235 240
Ile His Leu Asp Ile Thr Thr Glu Asn Gly Thr Lys Thr Tyr Ser Tyr
245 250 255
Asn Arg Lys Glu Gly Glu Phe Ala Ile Asn Trp Leu Val Pro Ile Gly
260 265 270
Glu Asp Ser Pro Ala Ser Ile Lys Ile Ser Val Asp Glu Leu Asp Gln
275 280 285
Gln Arg Asn Ile Ile Glu Val Pro Lys Leu Tyr Ser Ile Asp Leu Asp
290 295 300
Asn Gln Thr Leu Glu Gln Trp Lys Thr Gln Gly Asn Val Ser Phe Ser
305 310 315 320
Val Thr Arg Pro Glu His Asn Ile Ala Ile Ser Trp Pro Ser Val Ser
325 330 335
Tyr Lys Ala Ala Gln Lys Glu Gly Ser Arg His Lys Arg Trp Ala His
340 345 350
Trp His Thr Gly Leu Ala Leu Cys Trp Leu Val Pro Met Asp Ala Ile
355 360 365
Tyr Asn Tyr Ile Thr Gln Gln Asn Cys Thr Leu Gly Asp Asn Trp Phe
370 375 380
Gly Gly Ser Tyr Glu Thr Val Ala Gly Thr Pro Lys Val Ile Thr Val
385 390 395 400
Lys Gln Gly Ile Glu Gln Lys Pro Val Glu Gln Arg Ile His Phe Ser
405 410 415
Lys Gly
<210> 201
<211> 538
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 201
Met Val Glu Glu Ala Leu Asn Ile Phe Asp Glu Cys Arg Ser Pro Cys
1 5 10 15
Ser Leu Thr Pro Glu Pro Gly Lys Pro Ile Gln Ser Lys Leu Ser Ile
20 25 30
Pro Ser Asp Val Val Leu Asp Glu Gly Val Leu Tyr Tyr Ser Met Thr
35 40 45
Ile Asn Asp Glu Gln Asn Asp Ile Lys Asp Glu Asp Lys Gly Glu Ser
50 55 60
Ile Ile Thr Ile Gly Glu Phe Ala Thr Val Arg Ala Thr Arg His Tyr
65 70 75 80
Val Asn Gln Asp Ala Pro Phe Gly Val Ile His Leu Asp Ile Thr Thr
85 90 95
Glu Asn Gly Thr Lys Thr Tyr Ser Tyr Asn Arg Lys Glu Gly Glu Phe
100 105 110
Ala Ile Asn Trp Leu Val Pro Ile Gly Glu Asp Ser Pro Ala Ser Ile
115 120 125
Lys Ile Ser Val Asp Glu Leu Asp Gln Gln Arg Asn Ile Ile Glu Val
130 135 140
Pro Lys Leu Tyr Ser Ile Asp Leu Asp Asn Gln Thr Leu Glu Gln Trp
145 150 155 160
Lys Thr Gln Gly Asn Val Ser Phe Ser Val Thr Arg Pro Glu His Asn
165 170 175
Ile Ala Ile Ser Trp Pro Ser Val Ser Tyr Lys Ala Ala Gln Lys Glu
180 185 190
Gly Ser Arg His Lys Arg Trp Ala His Trp His Thr Gly Leu Ala Leu
195 200 205
Cys Trp Leu Val Pro Met Asp Ala Ile Tyr Asn Tyr Ile Thr Gln Gln
210 215 220
Asn Cys Thr Leu Gly Asp Asn Trp Phe Gly Gly Ser Tyr Glu Thr Val
225 230 235 240
Ala Gly Thr Pro Lys Val Ile Thr Val Lys Gln Gly Ile Glu Gln Lys
245 250 255
Pro Val Glu Gln Arg Ile His Phe Ser Lys Gly Asn Ala Met Ser Ala
260 265 270
Leu Ala Ala His Arg Val Cys Gly Val Pro Leu Glu Thr Leu Ala Arg
275 280 285
Ser Arg Lys Pro Arg Asp Leu Thr Asp Asp Leu Ser Cys Ala Tyr Gln
290 295 300
Ala Gln Asn Ile Val Ser Leu Phe Val Ala Thr Arg Ile Leu Phe Ser
305 310 315 320
His Leu Asp Ser Val Phe Thr Leu Asn Leu Asp Glu Gln Glu Pro Glu
325 330 335
Val Ala Glu Arg Leu Ser Asp Leu Arg Arg Ile Asn Glu Asn Asn Pro
340 345 350
Gly Met Val Thr Gln Val Leu Thr Val Ala Arg Gln Ile Tyr Asn Asp
355 360 365
Tyr Val Thr His His Pro Gly Leu Thr Pro Glu Gln Thr Ser Ala Gly
370 375 380
Ala Gln Ala Gly Gly Gly Gly Ser Ala Pro Ile Ser Ser His Cys Arg
385 390 395 400
Leu Asp Lys Ser Asn Phe Gln Gln Pro Tyr Ile Thr Asn Arg Thr Phe
405 410 415
Met Leu Ala Lys Glu Ala Ser Leu Ala Asp Asn Asn Thr Asp Val Arg
420 425 430
Leu Ile Gly Glu Lys Leu Phe His Gly Val Ser Met Ser Glu Arg Cys
435 440 445
Tyr Leu Met Lys Gln Val Leu Asn Phe Thr Leu Glu Glu Val Leu Phe
450 455 460
Pro Gln Ser Asp Arg Phe Gln Pro Tyr Met Gln Glu Val Val Pro Phe
465 470 475 480
Leu Ala Arg Leu Ser Asn Arg Leu Ser Thr Cys His Ile Glu Gly Asp
485 490 495
Asp Leu His Ile Gln Arg Asn Val Gln Lys Leu Lys Asp Thr Val Lys
500 505 510
Lys Leu Gly Glu Ser Gly Glu Ile Lys Ala Ile Gly Glu Leu Asp Leu
515 520 525
Leu Phe Met Ser Leu Arg Asn Ala Cys Ile
530 535
<210> 202
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 202
Ser Ile Ala Lys Gln Ser
1 5
<210> 203
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 203
Ser Ile Ala Lys Gln Ser Ile Ala Lys Gln Ser
1 5 10
<210> 204
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 204
Val Val Lys Glu Ala Ile
1 5
<210> 205
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
6xHis tag
<400> 205
His His His His His His
1 5
Claims (129)
- 편광 상피 세포로 세포내이입하고 세포의 영역에 축적할 수 있는 담체를 포함하는 담체-페이로드 복합체로서,
페이로드는 담체에 대해 이종성인 것을 특징으로 하는, 담체-페이로드 복합체. - 제 1항에 있어서, 영역은 정점 구획, 핵상 구획, 또는 기저 구획인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항에 있어서, 담체는 영역에서 적어도 5분, 10분, 또는 15분 동안 영역에서 유지되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항에 있어서, 담체는 콜릭스 폴리펩티드로부터 유래되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 4항에 있어서, 담체는 위치 150-195 중 어느 하나에서 C-말단이 있는 콜릭스 서열을 갖는 폴리펩티드인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 5항에 있어서, 담체는 위치 1-41 중 어느 하나에서 N-말단이 있는 콜릭스 서열을 갖는 폴리펩티드인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 4항에 있어서, 담체는 위치 35-40 중 어느 하나에서 N-말단 절단이 있는 콜릭스 서열을 갖는 폴리펩티드인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 7항에 있어서, 담체는 위치 150-205 중 어느 하나에서 C-말단이 있는 콜릭스 서열을 갖는 폴리펩티드인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 4항에 있어서, 담체는 서열번호: 130에 제시된 서열의 N-말단 위치 40에서 C-말단 위치 150-205 중 어느 하나까지의 아미노산 잔기로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 4항에 있어서, 담체는 서열번호: 130에 제시된 서열의 위치 150 또는 187에서 C-말단을 갖는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 4항에 있어서, 담체는 서열번호: 137에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 4항에 있어서, 담체는 서열번호: 137-139 중 어느 하나에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 5항 내지 제 8항 중 어느 한 항에 있어서, 위치 번호매김은 서열번호: 130에 제시된 서열에 대한 콜릭스 폴리펩티드의 정렬을 기반으로 하며, 위치는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 13항 중 어느 한 항에 있어서, 담체는 편광 상피 세포를 가로질러 통과세포외배출할 수 있는 담체보다 편광 상피 세포로 담체의 세포내이입 후에 더 오래 정점 진입 수용체와 결합된 상태로 남아있을 수 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 14항에 있어서, 정점 진입 수용체는 TMEM132 수용체인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 15항 중 어느 한 항에 있어서, 편광 상피 세포는 위장 (gastrointestinal) 편광 상피 세포를 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- b) 이종성 페이로드에 결합된, a) 위치 195-347 중 어느 하나에서 C-말단을 갖고 편광 상피 세포를 가로질러 통과세포외배출할 수 있는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체.
- 제 17항에 있어서, 위치 번호매김은 서열번호: 130에 제시된 서열에 대한 콜릭스 폴리펩티드의 정렬을 기반으로 하며, 위치는 N-말단에서 위치 1로 시작하여 N-말단에서 C-말단으로 번호매김되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 위치 195-266 중 어느 하나에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 195-266 중 어느 하나에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 서열번호: 130에 제시된 서열의 위치 206, 245, 251, 또는 266 중 어느 하나에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78의 위치 206, 245, 251, 또는 266 중 어느 하나에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 22항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78 중 어느 하나의 위치 206에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, 담체는 서열번호: 131 또는 184에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78 중 어느 하나의 위치 245에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, 담체는 서열번호: 132 또는 183에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78의 위치 251에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, 담체는 서열번호: 133 또는 182에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78의 위치 266에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, 담체는 서열번호: 134 또는 181에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 17항에 있어서, 담체는 위치 195-347 중 어느 하나에서 절단이 있는 서열번호: 1-2, 또는 4-78에 제시된 서열로 이루어지며, 서열번호: 1-2, 또는 4-78의 위치 1-40, 133-151, 152-187, 또는 188-206 중 어느 하나에서 5, 4, 3, 2, 또는 1 이하의 아미노산 변이를 갖는 것을 특징으로 하는, 담체-페이로드 복합체.
- b) 이종성 페이로드에 결합된, a) 편광 상피 세포로 세포내이입 또는 편광 상피 세포의 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 포함하는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체.
- 제 32항에 있어서, 담체는 위치 3에서 글루탐산 및 위치 4에서 알라닌을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 32항 내지 제 33항 중 어느 한 항에 있어서, 담체는 비-독성인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 32항 내지 제 34항 중 어느 한 항에 있어서, 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 32항에 있어서, 담체는 편광 상피 세포의 통과세포외배출할 수 있는 단편을 포함하며, 담체는 서열번호: 1-2, 또는 4-78 중 어느 하나에 제시된 서열의 C-말단 잔기에 대한 위치 195 중 어느 하나에서 C-말단을 갖는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 36항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78 중 어느 하나에 제시된 서열의 위치 195-386 중 어느 하나에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 37항에 있어서, C-말단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 386에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 38항에 있어서, C-말단은 서열번호: 1-2에 제시된 서열 중 어느 하나의 위치 386에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 39항에 있어서, 담체는 서열번호: 135에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- b) 이종성 페이로드와 복합체화된, a) 서열번호: 179를 포함하지 않고, 서열번호: 126으로 이루어지지 않은 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 담체-페이로드 복합체로서,
담체는 i) 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있거나; 또는 ii) 편광 상피 세포로 이종성 페이로드를 수송할 수 있는 것을 특징으로 하는, 담체-페이로드 복합체. - 제 41항에 있어서, 담체는 서열번호: 130에 제시된 서열, 또는 이의 단편과 적어도 75% 서열 동일성을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 42항에 있어서, 담체는 서열번호: 130에 제시된 콜릭스 변이체, 또는 이의 단편과 적어도 90% 서열 동일성을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 41항에 있어서, 콜릭스 폴리펩티드는 서열번호: 130에 제시된 서열, 또는 이의 단편인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 41항 내지 제 44항 중 어느 한 항에 있어서, 담체는 위치 3에서 글루탐산 및 위치 4에서 알라닌을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 41항 내지 제 45항 중 어느 한 항에 있어서, 담체는 비-독성인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 41항 내지 제 46항 중 어느 한 항에 있어서, 담체는 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출할 수 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 47항에 있어서, 담체는 서열번호: 130에 제시된 서열의 위치 195-633 중 어느 하나에서 C-말단 절단을 갖는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 48항에 있어서, C-말단 절단은 서열번호: 130에 제시된 서열의 위치 195-386 중 어느 하나에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 49항에 있어서, 담체는 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 195-386 중 어느 하나에서 C-말단 절단을 갖는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 50항에 있어서, C-말단 절단은 서열번호: 1-2, 또는 4-78에 제시된 서열 중 어느 하나의 위치 386에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 51항에 있어서, C-말단 절단은 서열번호: 1-2에 제시된 서열 중 어느 하나의 위치 386에 있는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 52항 중 어느 한 항에 있어서, 담체-페이로드 복합체는 N-말단 메티오닌을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 53항 중 어느 한 항에 있어서, 담체는 이종성 페이로드에 합성적으로 결합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 53항 중 어느 한 항에 있어서, 담체는 이종성 페이로드에 유전적으로 융합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 55항 중 어느 한 항에 있어서, 이종성 페이로드는 치료용 페이로드인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 56항에 있어서, 치료용 페이로드는 사이토카인, 항체, 호르몬, 또는 핵산인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 57항에 있어서, 치료용 페이로드는 사이토카인인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 58항에 있어서, 사이토카인은 인터루킨인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 59항에 있어서, 인터루킨은 IL-10인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 60항에 있어서, IL-10은 서열번호: 145에 제시된 아미노산 서열과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 59항에 있어서, 인터루킨은 IL-22인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 62항에 있어서, IL-22는 서열번호: 142에 제시된 아미노산 서열과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 57항에 있어서, 치료용 페이로드는 항체인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 64항에 있어서, 항체는 항-TNF 항체인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 57항에 있어서, 치료용 페이로드는 호르몬인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 66항에 있어서, 치료용 페이로드는 인간 성장 호르몬인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 67항 중 어느 한 항에 있어서, 이종성 페이로드는 담체에 공유 결합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 68항 중 어느 한 항에 있어서, 이종성 페이로드는 담체의 C-말단에 결합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 68항 중 어느 한 항에 있어서, 이종성 페이로드는 담체의 N-말단에 결합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 68항 중 어느 한 항에 있어서, 담체는 스페이서를 통해 이종성 페이로드에 결합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 71항에 있어서, 스페이서는 비-절단형 스페이서인 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 71항 내지 제 72항 중 어느 한 항에 있어서, 스페이서는 1 내지 100 아미노산 잔기를 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 73항에 있어서, 스페이서는 GS, GGS, GGGS, GGGGS, GGGGGS, 또는 이들의 조합의 최대 15 반복을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 71항에 있어서, 스페이서는 서열번호: 175에 제시된 아미노산 서열을 포함하는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 71항에 있어서, 스페이서는 서열번호: 176에 제시된 아미노산 서열로 이루어진 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 67항 중 어느 한 항에 있어서, 이종성 페이로드는 담체에 비-공유 결합되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 67항 중 어느 한 항에 있어서, 이종성 페이로드는 나노입자를 통해 담체에 복합체화되는 것을 특징으로 하는, 담체-페이로드 복합체.
- 제 1항 내지 제 77항 중 어느 한 항의 담체-페이로드 복합체를 인코딩하는 폴리뉴클레오티드.
- 제 79항의 폴리뉴클레오티드를 포함하는 벡터.
- (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및
(b) 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계를 포함하는, 편광 상피 세포를 가로질러 이종성 페이로드를 통과세포외배출하는 방법으로서,
담체-페이로드 복합체는 이종성 페이로드에 결합된, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 방법. - 제 81항에 있어서, 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계는 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계를 포함하는 것을 특징으로 하는, 방법.
- 제 81항에 있어서, 담체와 막 단백질 TMEM132의 상호작용하는 단계는 담체-페이로드 복합체의 수용체-매개 세포내이입을 야기하는 것을 특징으로 하는, 방법.
- 제 81항 내지 제 83항 중 어느 한 항에 있어서, TMEM132와 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 135-151, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는, 방법.
- 제 81항 내지 제 84항 중 어느 한 항에 있어서, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계는 담체와 GRP75, ERGIC-53, 및 페를레칸 중 어느 하나 또는 그 이상의 상호작용하는 단계를 포함하는 것을 특징으로 하는, 방법.
- 제 81항 내지 제 85항 중 어느 한 항에 있어서, 편광 상피 세포를 가로질러 담체-페이로드 복합체를 통과세포외배출하는 단계는 담체-페이로드 복합체와 상피 세포의 정점 측면에서 COPI, EEA1 및 Rab7 중 어느 하나 또는 그 이상, 및 상피 세포의 기저 측면에서 Rab11a의 공동-국소화를 더 포함하는 것을 특징으로 하는, 방법.
- 제 81항 내지 제 86항 중 어느 한 항에 있어서, GRP7 또는 ERGIC-53과 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 1-40 및 152-187, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는, 방법.
- 제 81항 내지 제 87항 중 어느 한 항에 있어서, 페를레칸과 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 188-205, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는, 방법.
- 제 81항에 있어서, (b) 이후에, 담체-페이로드 복합체를 고유판(lamina propria)으로 전달하는 단계를 더 포함하는, 방법.
- 제 81항 내지 제 89항 중 어느 한 항에 있어서, 편광 상피 세포는 편광 장 상피 세포인 것을 특징으로 하는, 방법.
- 피험자에게 이종성 페이로드를 경구 전달하는 방법.
- 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는, 피험자에게 이종성 페이로드를 경구 전달하는 방법으로서,
담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에게 이종성 페이로드를 전달할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 방법. - 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에게 이종성 페이로드를 경구 전달하기 위한 담체-페이로드 복합체로서,
담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 담체-페이로드 복합체. - 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에게 이종성 페이로드를 경구 전달하기 위한 담체-페이로드 복합체의 용도로서,
담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 용도. - 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는, 피험자에서 질환의 치료 방법으로서,
담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 방법. - 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에서 질환의 치료에 사용하기 위한 담체-페이로드 복합체로서,
담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 담체-페이로드 복합체. - 피험자에게 담체-페이로드 복합체를 경구 투여하는 단계를 포함하는 방법에 의해, 피험자에서 질환을 치료하기 위한 약제의 제조에서 담체-페이로드 복합체의 용도로서,
담체는 편광 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있고, 이에 의해 피험자에서 질환을 치료할 수 있으며, 담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피를 가로질러 담체-페이로드 복합체를 통과세포외배출할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 용도. - 제 91항 내지 제 97항 중 어느 한 항에 있어서, 고유판의 수용체에 이종성 페이로드를 결합하는 단계를 더 포함하는, 방법.
- 제 91항 내지 제 97항 중 어느 한 항에 있어서, 이종성 페이로드를 전신 순환으로 전달하는 단계를 더 포함하는, 방법.
- 제 91항 내지 제 99항 중 어느 한 항에 있어서, 담체는 콜릭스 유래 폴리펩티드인 것을 특징으로 하는, 방법.
- 제 99항에 있어서, 담체는 서열번호: 130에 제시된 서열의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 또는 1-386을 포함하는 것을 특징으로 하는, 방법.
- 제 101항에 있어서, 담체는 서열번호: 1-2에 제시된 서열의 아미노산 잔기 1-206, 1-245, 1-251, 1-266, 또는 1-386을 포함하는 것을 특징으로 하는, 방법.
- 제 102항에 있어서, 담체는 서열번호: 131-135 또는 180-184에 제시된 아미노산 서열 중 어느 하나를 포함하는 것을 특징으로 하는, 방법.
- 제 91항 내지 제 102항 중 어느 한 항에 있어서, 편광 상피는 편광 장 상피인 것을 특징으로 하는, 방법.
- 제 91항 내지 제 103항 중 어느 한 항에 있어서, 질환은 궤양성 대장염, 주머니염(pouchitis), 직장염(proctitis), 크론병, 다발성 경화증 (MS), 전신 홍반성 루푸스 (SLE), 이식편 대 숙주 질환 (GVHD), 류마티스 관절염 또는 건선인 것을 특징으로 하는, 방법.
- 제 104항에 있어서, 질환은 궤양성 대장염인 것을 특징으로 하는, 방법.
- 제 105항에 있어서, 궤양성 대장염은 경증에서 중등도(mild-to-moderate) 또는 중등도에서 중증(moderate-to-severe)인 것을 특징으로 하는, 방법.
- 제 104항에 있어서, 질환은 크론병인 것을 특징으로 하는, 방법.
- 제 107항에 있어서, 크론병은 누공성 크론병(fistulizing Crohn's disease)인 것을 특징으로 하는, 방법.
- 제 91항 내지 제 108항 중 어느 한 항에 있어서, 페이로드는 인터루킨인 것을 특징으로 하는, 방법.
- 제 109항에 있어서, 인터루킨은 서열번호: 142 또는 145의 아미노산 서열을 포함하는 것을 특징으로 하는, 방법.
- (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및
(b) 편광 상피 세포로 담체-페이로드 복합체를 수송하는 단계를 포함하는, 편광 상피 세포로 이종성 페이로드를 수송하는 방법으로서,
담체-페이로드 복합체는 이종성 페이로드에 결합된, 상피 세포로 담체-페이로드 복합체를 수송할 수 있는 서열번호: 1-2, 4-125, 또는 127-129 중 어느 하나에 제시된 아미노산 서열, 또는 이의 단편을 갖는 콜릭스 폴리펩티드로부터 유래된 담체를 포함하는 것을 특징으로 하는, 방법. - 제 111항에 있어서, 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계는 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계를 포함하는 것을 특징으로 하는, 방법.
- 제 111항에 있어서, 담체와 정점 진입 수용체 TMEM132의 상호작용하는 단계는 담체-페이로드 복합체의 수용체-매개 세포내이입을 야기하는 것을 특징으로 하는, 방법.
- 제 111항 내지 제 113항 중 어느 한 항에 있어서, 정점 구획 또는 기저 구획으로 이종성 페이로드를 수송하는 단계를 더 포함하는, 방법.
- 제 111항 내지 제 114항 중 어느 한 항에 있어서, 담체-페이로드 복합체의 담체는 세포내이입 후 TMEM132와 결합된 상태로 남아있는 것을 특징으로 하는, 방법.
- 제 111항 내지 제 115항 중 어느 한 항에 있어서, TMEM132와 상호작용하는 담체는 서열번호: 130의 아미노산 잔기 135-151, 또는 이와 적어도 90% 서열 동일성을 갖는 서열을 포함하는 것을 특징으로 하는, 방법.
- 제 111항 내지 제 116항 중 어느 한 항에 있어서, 담체는 콜릭스 유래 폴리펩티드인 것을 특징으로 하는, 방법.
- 제 117항에 있어서, 담체는 서열번호: 130에 제시된 서열의 아미노산 잔기 1-151, 1-187, 41-187, 또는 40-205로 이루어진 것을 특징으로 하는, 방법.
- 제 117항에 있어서, 담체는 서열번호: 1-2에 제시된 서열의 아미노산 잔기 1-151, 1-187, 41-187, 또는 40-205로 이루어진 것을 특징으로 하는, 방법.
- 제 117항에 있어서, 담체는 서열번호: 136-139에 제시된 아미노산 서열 중 어느 하나로 이루어진 것을 특징으로 하는, 방법.
- 제 111항 내지 제 120항 중 어느 한 항에 있어서, 담체는 나노입자를 통해 이종성 페이로드에 비-공유 결합되는 것을 특징으로 하는, 방법.
- 제 121항에 있어서, 나노입자 상에서 이종성 페이로드 대 담체의 비는 적어도 15,000:1 인 것을 특징으로 하는, 방법.
- 제 121항 내지 제 122항 중 어느 한 항에 있어서, 이종성 페이로드는 글로코오스-저하제인 것을 특징으로 하는, 방법.
- 제 123항에 있어서, 글로코오스-저하제는 나노입자와 비-공유 결합되는 것을 특징으로 하는, 방법.
- 제 121항 내지 제 122항 중 어느 한 항에 있어서, 이종성 페이로드는 siRNA 인 것을 특징으로 하는, 방법.
- 제 125항에 있어서, siRNA는 나노입자와 비-공유 결합되는 것을 특징으로 하는, 방법.
- 제 121항 내지 제 126항 중 어느 한 항에 있어서, 담체는 나노입자에 공유 결합되거나 또는 나노입자 상에서 분무-건조되는 것을 특징으로 하는, 방법.
- (a) 편광 상피 세포의 정점 막을 담체-페이로드 복합체와 접촉시키는 단계; 및
(b) 편광 상피 세포로 담체-페이로드 복합체를 수송하는 단계를 포함하는, 편광 상피 세포로 이종성 페이로드를 수송하는 방법으로서,
담체-페이로드 복합체는 제 17항 내지 제 31항 중 어느 한 항의 담체-페이로드 복합체인 것을 특징으로 하는, 방법.
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862756889P | 2018-11-07 | 2018-11-07 | |
US62/756,889 | 2018-11-07 | ||
US201962816022P | 2019-03-08 | 2019-03-08 | |
US62/816,022 | 2019-03-08 | ||
PCT/US2019/021474 WO2019173787A1 (en) | 2018-03-08 | 2019-03-08 | Toxin-derived delivery constructs for oral delivery |
USPCT/US2019/021474 | 2019-03-08 | ||
US201962888144P | 2019-08-16 | 2019-08-16 | |
US201962888400P | 2019-08-16 | 2019-08-16 | |
US201962888133P | 2019-08-16 | 2019-08-16 | |
US62/888,400 | 2019-08-16 | ||
US62/888,133 | 2019-08-16 | ||
US62/888,144 | 2019-08-16 | ||
PCT/US2019/050708 WO2020096695A1 (en) | 2018-11-07 | 2019-09-11 | Cholix-derived carriers for oral delivery of heterologous payload |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210110800A true KR20210110800A (ko) | 2021-09-09 |
Family
ID=70611452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217017372A KR20210110800A (ko) | 2018-11-07 | 2019-09-11 | 이종성 페이로드의 경구 전달용 콜릭스-유래 담체 |
Country Status (15)
Country | Link |
---|---|
US (3) | US11324833B2 (ko) |
EP (1) | EP3826682A4 (ko) |
JP (1) | JP2022512976A (ko) |
KR (1) | KR20210110800A (ko) |
CN (1) | CN113347997A (ko) |
AU (1) | AU2019374703A1 (ko) |
BR (1) | BR112021009001A8 (ko) |
CA (1) | CA3119179A1 (ko) |
CL (1) | CL2021001210A1 (ko) |
CO (1) | CO2021007359A2 (ko) |
IL (1) | IL282986B2 (ko) |
MX (1) | MX2021005382A (ko) |
SG (1) | SG11202104734YA (ko) |
TW (1) | TW202031297A (ko) |
WO (1) | WO2020096695A1 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11246915B2 (en) | 2010-09-15 | 2022-02-15 | Applied Molecular Transport Inc. | Cholix toxin-derived fusion molecules for oral delivery of biologically active cargo |
KR102598038B1 (ko) | 2014-05-07 | 2023-11-07 | 어플라이드 몰레큘라 트랜스포트 인크. | 생물학적 활성 화물의 경구 전달용 콜릭스 독소-유래 융합 분자 |
PL3762009T3 (pl) | 2018-03-08 | 2022-09-12 | Applied Molecular Transport Inc. | Pochodzące z toksyny konstrukty dostarczające do dostarczania doustnego |
JP2022512976A (ja) | 2018-11-07 | 2022-02-07 | アプライド モレキュラー トランスポート インコーポレイテッド | 異種ペイロードの経口送達のためのコリックス由来担体 |
PL3650037T3 (pl) | 2018-11-07 | 2022-06-06 | Applied Molecular Transport Inc. | Konstrukty dostarczające do transcytozy i powiązane z nimi sposoby |
WO2021034727A1 (en) | 2019-08-16 | 2021-02-25 | Applied Molecular Transport Inc. | Compositions, formulations, and interleukin production and purification |
WO2022159395A1 (en) | 2021-01-20 | 2022-07-28 | Viking Therapeutics, Inc. | Compositions and methods for the treatment of metabolic and liver disorders |
TW202245842A (zh) * | 2021-02-16 | 2022-12-01 | 美商應用分子運輸公司 | 具鋅之固體口服組合物 |
WO2022240407A1 (en) * | 2021-05-12 | 2022-11-17 | Applied Molecular Transport Inc. | Delivery constructs derived from bacterial toxins and uses thereof |
WO2022241167A1 (en) * | 2021-05-12 | 2022-11-17 | Applied Molecular Transport Inc. | Delivery constructs derived from bacterial toxins and uses thereof |
WO2023141527A1 (en) * | 2022-01-21 | 2023-07-27 | Applied Molecular Transport Inc. | Furin-cleavable delivery constructs |
CN114470170B (zh) * | 2022-02-22 | 2023-09-19 | 广州新济药业科技有限公司 | 一种司美格鲁肽可溶性微针组合物及其制备方法 |
WO2023196532A1 (en) * | 2022-04-08 | 2023-10-12 | Applied Molecular Transport Inc. | Chimeric il-10/carrier constructs for treatment of pouchitis and methods of use |
Family Cites Families (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4671958A (en) | 1982-03-09 | 1987-06-09 | Cytogen Corporation | Antibody conjugates for the delivery of compounds to target sites |
US5668255A (en) | 1984-06-07 | 1997-09-16 | Seragen, Inc. | Hybrid molecules having translocation region and cell-binding region |
US6022950A (en) | 1984-06-07 | 2000-02-08 | Seragen, Inc. | Hybrid molecules having translocation region and cell-binding region |
US4542225A (en) | 1984-08-29 | 1985-09-17 | Dana-Farber Cancer Institute, Inc. | Acid-cleavable compound |
US4680338A (en) | 1985-10-17 | 1987-07-14 | Immunomedics, Inc. | Bifunctional linker |
US4892827A (en) | 1986-09-24 | 1990-01-09 | The United States Of America As Represented By The Department Of Health And Human Services | Recombinant pseudomonas exotoxins: construction of an active immunotoxin with low side effects |
US6051405A (en) | 1986-09-24 | 2000-04-18 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Constructs encoding recombinant antibody-toxin fusion proteins |
DK0531434T3 (da) | 1990-05-11 | 2000-01-31 | Us Health | Forbedrede Pseudomonas-exotoksiner med lav dyretoksicitet og høj cytocidal aktivitet |
US5328984A (en) | 1991-03-04 | 1994-07-12 | The United States As Represented By The Department Of Health & Human Services | Recombinant chimeric proteins deliverable across cellular membranes into cytosol of target cells |
GB9112553D0 (en) | 1991-06-11 | 1991-07-31 | Wellcome Found | Fusion proteins |
US6613332B1 (en) | 1991-06-21 | 2003-09-02 | The University Of Cincinnati | Oral administration of therapeutic proteins |
CA2077277A1 (en) | 1991-09-09 | 1993-03-10 | John J. Donnelly | Cellular immunity vaccines from bacterial toxin-antigen conjugates |
US5487994A (en) | 1992-04-03 | 1996-01-30 | The Johns Hopkins University | Insertion and deletion mutants of FokI restriction endonuclease |
WO1993025690A1 (en) | 1992-06-18 | 1993-12-23 | The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services | Recombinant pseudomonas exotoxin with increased activity |
US20020034727A1 (en) | 1992-11-02 | 2002-03-21 | Genentech, Inc. | Compaction assay for assessment of respiratory disease therapy |
US5811409A (en) | 1995-06-05 | 1998-09-22 | Synsorb Biotech, Inc. | Treatment of cholera |
US5912014A (en) | 1996-03-15 | 1999-06-15 | Unigene Laboratories, Inc. | Oral salmon calcitonin pharmaceutical products |
WO1998042876A1 (en) | 1997-03-26 | 1998-10-01 | Board Of Regents, The University Of Texas System | Methods and compositions for using membrane-penetrating proteins to carry materials across cell membranes |
US20030054012A1 (en) | 2000-05-12 | 2003-03-20 | Fitzgerald David J. | Pseudomonas exotoxin a-like chimeric immunogens for eliciting a secretory iga-mediated immune response |
WO1999002712A1 (en) | 1997-07-11 | 1999-01-21 | The Government Of The United States, Represented By The Secretary Department Of Health Andhuman Ser Vices | Pseudomonas exotoxin a-like chimeric immunogens for eliciting a secretory iga-mediated immune response |
US7314632B1 (en) | 1997-07-11 | 2008-01-01 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Pseudomonas exotoxin A-like chimeric immunogens |
DK1000163T3 (da) | 1997-07-11 | 2006-02-06 | Us Gov Health & Human Serv | Pseudomonas-exotoksin A-lignende kimære immunogener |
US6251392B1 (en) | 1997-10-20 | 2001-06-26 | Epicyte Pharmaceuticals, Inc. | Epithelial cell targeting agent |
US8790897B2 (en) | 1998-08-25 | 2014-07-29 | Syntaxin Ltd. | Treatment of mucus hypersecretion |
US20040071736A1 (en) | 1998-08-25 | 2004-04-15 | Health Protection Agency | Methods and compounds for the treatment of mucus hypersecretion |
US6565856B1 (en) * | 1998-12-08 | 2003-05-20 | Corixa Corporation | Compounds and methods for treatment and diagnosis of chlamydial infection |
US6838553B1 (en) | 1999-10-05 | 2005-01-04 | Academia Sinica | Peptide repeat immunogens |
JP2003512441A (ja) | 1999-10-22 | 2003-04-02 | アメリカ合衆国 | 極性上皮細胞層を横断するタンパク質の送達 |
US20030186386A1 (en) | 2000-02-11 | 2003-10-02 | Hansen Christian Karsten | Interleukin 10 |
US6673574B2 (en) | 2000-11-30 | 2004-01-06 | Unigene Laboratories Inc. | Oral delivery of peptides using enzyme-cleavable membrane translocators |
DE60137969D1 (de) | 2000-12-21 | 2009-04-23 | Us Gov Health & Human Serv | Ein chimäres protein das nichttoxische pseudomonas exotoxin a und typ iv pilin sequenzen enthält |
US8206950B2 (en) | 2003-06-09 | 2012-06-26 | Animal Technology Institute Taiwan | Fusion antigen used as vaccine and method of making them |
US7335361B2 (en) | 2003-06-09 | 2008-02-26 | Animal Technology Institute Taiwan | Fusion antigen used as vaccine |
US7595054B2 (en) | 2003-06-09 | 2009-09-29 | Healthbanks Biotech Co., Ltd. | Fusion antigen used as vaccine |
EP1522585A1 (en) | 2003-10-09 | 2005-04-13 | Plant Research International B.V. | Chimeric carrier molecules for the production of mucosal vaccines |
US20080317761A1 (en) | 2004-04-28 | 2008-12-25 | The Trustees Of The University Of Pennsylvania | Peptide-Mediated Protein Transduction Into Cells of the Hematopoietic Lineage |
WO2006009901A2 (en) * | 2004-06-18 | 2006-01-26 | Ambrx, Inc. | Novel antigen-binding polypeptides and their uses |
US20050281885A1 (en) | 2004-06-21 | 2005-12-22 | Egilmez Nejat K | Method for treating inflammatory bowel disease by oral administration of IL-10 |
TWI293957B (en) | 2004-07-21 | 2008-03-01 | Healthbanks Biotech Co Ltd | A superantigen fusion protein and the use thereof |
JP4474264B2 (ja) | 2004-08-20 | 2010-06-02 | 生寶生物科技股▲ふん▼有限公司 | 子宮頸癌抑制の融合蛋白 |
WO2006135428A2 (en) | 2004-10-04 | 2006-12-21 | Trinity Biosystems, Inc. | Methods and compositions for inducing an immune response against multiple antigens |
AU2005294436A1 (en) | 2004-10-04 | 2006-04-20 | Trinity Biosystems, Inc. | Methods and compositions for immunizing against Pseudomonas infection |
AU2005296064A1 (en) | 2004-10-04 | 2006-04-27 | Trinity Biosystems, Inc. | Methods and compositions for needleless delivery of macromolecules |
EP1871880B8 (en) | 2005-04-11 | 2012-09-12 | Yeda Research And Development Co., Ltd. | Chimeric proteins comprising yersinia yop, their preparation and pharmaceutical compositions containing them |
US7964200B2 (en) | 2005-05-18 | 2011-06-21 | Children's Hospital & Research Center At Oakland | Methods and compositions for immunizing against Chlamydia infection |
EP3006458B1 (en) | 2005-07-29 | 2017-11-22 | The Government of the United States of America, as represented by the Secretary of Health and Human Services | Mutated pseudomonas exotoxins with reduced antigenicity |
EP1749833A1 (en) | 2005-08-05 | 2007-02-07 | Healthbanks Biotech Co., Ltd. | Super-antigens derived from the SARS coronavirus E2 spike protein |
ATE521626T1 (de) | 2005-08-24 | 2011-09-15 | Healthbanks Biotech Co Ltd | Fusionsprotein zur inhibierung von gebärmutterhalskrebs |
ES2462117T3 (es) | 2005-09-06 | 2014-05-22 | Oramed Pharmaceuticals Inc. | Métodos y composiciones para la administración oral de proteínas |
WO2007067596A2 (en) | 2005-12-05 | 2007-06-14 | Trinity Biosystems, Inc. | Methods and compositions for needleless delivery of antibodies |
US20090148401A1 (en) | 2005-12-05 | 2009-06-11 | Trinity Biosystems, Inc. | Methods and compositions for needleless delivery of binding partners |
CA2647168A1 (en) | 2006-03-16 | 2007-09-27 | Trinity Biosystems, Inc. | Methods for increasing the size of animals using needleless delivery constructs |
US7465455B2 (en) | 2006-07-05 | 2008-12-16 | Healthbanks Biotech Co., Ltd. | Fusion protein of porcine reproductive and respiratory syndrome virus as PRRS vaccine |
WO2008011157A2 (en) | 2006-07-20 | 2008-01-24 | The General Hospital Corporation | Methods, compositions, and kits for the selective activation of protoxins through combinatorial targeting |
EP1882478B1 (en) | 2006-07-29 | 2012-03-21 | Healthbanks Biotech Co., Ltd. | Fusion protein of porcine reproductive and respiratory syndrome virus as PRRS vaccine |
US20090092660A1 (en) | 2006-08-09 | 2009-04-09 | Trinity Biosystems, Inc. | Methods and compositions for needleless delivery of particles |
US20100196277A1 (en) | 2006-10-09 | 2010-08-05 | The University Of North Carolina At Chapel Hill | Nanoparticle compositions for controlled delivery of nucleic acids |
EP3351270A1 (en) | 2007-05-23 | 2018-07-25 | The Trustees of the University of Pennsylvania | Targeted carriers for intracellular drug delivery |
EP2178559B1 (en) * | 2007-07-20 | 2015-06-24 | The General Hospital Corporation | Recombinant vibrio cholerae exotoxins |
CN101361968B (zh) | 2007-08-06 | 2011-08-03 | 健能隆医药技术(上海)有限公司 | 白介素-22在治疗脂肪肝中的应用 |
CN101969975B (zh) | 2008-01-31 | 2013-06-05 | 生控基因疫苗股份有限公司 | 作为疫苗的hiv嵌合融合蛋白 |
JP5670875B2 (ja) | 2008-03-17 | 2015-02-18 | ウニベルジテーツクリニクム ミュンスター | カーゴ分子の送達ビヒクルおよび炎症反応を免疫調節するための生物学的治療剤としてのYopM |
US20110250199A1 (en) | 2008-06-04 | 2011-10-13 | The Government of the United States of America as represented by the Secretary of the Department.... | Immunotoxins and uses thereof |
US9023363B2 (en) | 2008-10-21 | 2015-05-05 | International Vaccine Institute | A1 moiety of cholera toxin A subunit as an adjuvant for mucosal and systemic vaccines |
US20120258104A1 (en) | 2009-07-22 | 2012-10-11 | Cenix Bioscience Gmbh | Delivery System and Conjugates For Compound Delivery Via Naturally Occurring Intracellular Transport Routes |
WO2011031441A1 (en) | 2009-08-28 | 2011-03-17 | The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Therapy with a chimeric molecule and a pro-apoptotic agent |
US11246915B2 (en) | 2010-09-15 | 2022-02-15 | Applied Molecular Transport Inc. | Cholix toxin-derived fusion molecules for oral delivery of biologically active cargo |
CN105541978B (zh) | 2010-09-15 | 2019-12-13 | 兰德尔·J·米斯尼 | 使用细菌毒素衍生的转运序列递送生物活性剂的系统和方法 |
US20140065172A1 (en) | 2011-01-26 | 2014-03-06 | Cenix Bioscience Gmbh | Delivery system and conjugates for compound delivery via naturally occurring intracellular transport routes |
WO2012110596A1 (en) | 2011-02-16 | 2012-08-23 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Fusion protein for the treatment of immunologic or allergic reactions |
AU2012275112B2 (en) | 2011-06-29 | 2017-07-06 | Rani Therapeutics, Llc | Therapeutic agent preparations for delivery into a lumen of the intestinal tract using a swallowable drug delivery device |
UA113192C2 (xx) | 2011-12-06 | 2016-12-26 | Імуногенна композиція проти цирковірусу свиней типу 2 (pcv2) | |
WO2013130913A1 (en) | 2012-02-29 | 2013-09-06 | Ambrx, Inc. | Interleukin-10 polypeptide conjugates and their uses |
CN109553688A (zh) | 2012-12-05 | 2019-04-02 | 生控基因疫苗股份有限公司 | 用作诱发抗原特异性t细胞反应的免疫原性增强剂的融合蛋白 |
SG11201507429TA (en) | 2013-03-15 | 2015-10-29 | Genentech Inc | Il-22 polypeptides and il-22 fc fusion proteins and methods of use |
JP2016526014A (ja) | 2013-04-24 | 2016-09-01 | アルモ・バイオサイエンシーズ・インコーポレイテッド | インターロイキン−10組成物及びその使用 |
CN104623637A (zh) | 2013-11-07 | 2015-05-20 | 健能隆医药技术(上海)有限公司 | Il-22二聚体在制备静脉注射药物中的应用 |
CN103864938A (zh) | 2014-03-24 | 2014-06-18 | 北京博翱泰生物技术有限公司 | 靶特异性双突变体融合蛋白质及其制备工艺 |
KR102598038B1 (ko) | 2014-05-07 | 2023-11-07 | 어플라이드 몰레큘라 트랜스포트 인크. | 생물학적 활성 화물의 경구 전달용 콜릭스 독소-유래 융합 분자 |
CN107106655A (zh) | 2014-10-22 | 2017-08-29 | 阿尔莫生物科技股份有限公司 | 使用白细胞介素‑10治疗疾病和病症的方法 |
TWI705827B (zh) | 2014-11-07 | 2020-10-01 | 瑞士商諾華公司 | 治療眼部疾病之方法 |
WO2016146833A1 (en) * | 2015-03-19 | 2016-09-22 | F. Hoffmann-La Roche Ag | Biomarkers for nad(+)-diphthamide adp ribosyltransferase resistance |
WO2016196383A1 (en) | 2015-06-01 | 2016-12-08 | Reber Genetics Co., Ltd. | Vaccine compositions against porcine reproductive and respiratory syndrome and porcine circovirus associated diseases |
WO2017118985A1 (en) | 2016-01-06 | 2017-07-13 | Yeda Research And Development Co. Ltd. | Compositions and methods for treating malignant, autoimmune and inflammatory diseases |
WO2018015380A1 (en) | 2016-07-18 | 2018-01-25 | Philippe Ulsemer | Natural microorganisms which are naturally capable of binding toxins and/or toxin receptors |
TW201829470A (zh) | 2016-10-26 | 2018-08-16 | 廖朝暐 | 用於免疫增強的融合胜肽及使用其增強誘發免疫反應的方法 |
KR102557126B1 (ko) | 2016-12-07 | 2023-07-18 | 몰레큘러 템플레이츠, 인코퍼레이션. | 부위 특이적 접합을 위한 시가 독소 a 서브유닛 작동체 폴리펩타이드, 시가 독소 작동체 스캐폴드, 및 세포-표적화 분자 |
US11523772B2 (en) | 2016-12-14 | 2022-12-13 | Biora Therapeutics, Inc. | Treatment of a disease of the gastrointestinal tract with an immunosuppressant |
WO2018112264A1 (en) | 2016-12-14 | 2018-06-21 | Progenity Inc. | Treatment of a disease of the gastrointestinal tract with a chemokine/chemokine receptor inhibitor |
WO2018175340A1 (en) | 2017-03-20 | 2018-09-27 | Sienna Biopharmaceuticals, Inc. | Reduced exposure conjugates modulating therapeutic targets |
WO2018183931A1 (en) | 2017-03-30 | 2018-10-04 | Progenity Inc. | Treatment of a disease of the gastrointestinal tract with il-10 or an il-10 agonist |
CN111225686A (zh) | 2017-08-15 | 2020-06-02 | 普罗根尼蒂公司 | 使用可摄入装置释放免疫调节剂治疗炎性疾病 |
WO2019089603A1 (en) | 2017-10-31 | 2019-05-09 | Dana-Farber Cancer Institute, Inc. | Methods for determining and treating cellular resistance to adp-ribosylating toxin |
US20200354411A1 (en) | 2017-11-29 | 2020-11-12 | Agency For Science, Technology And Research | Chimeric Molecule for Targeting c-Myc in Cells |
WO2019133647A1 (en) | 2017-12-29 | 2019-07-04 | Thevax Genetics Vaccine Co., Ltd. | Combination of a fusion protein vaccine with anti-ox40 antibody for use in eliciting antigen-specific immune responses |
PL3762009T3 (pl) * | 2018-03-08 | 2022-09-12 | Applied Molecular Transport Inc. | Pochodzące z toksyny konstrukty dostarczające do dostarczania doustnego |
CA3093386A1 (en) * | 2018-03-08 | 2019-09-12 | Applied Molecular Transport Inc. | Toxin-derived delivery constructs for oral delivery |
WO2020023389A1 (en) | 2018-07-23 | 2020-01-30 | Sienna Biopharmaceuticals, Inc. | Reduced exposure compositions modulating therapeutic targets |
JP2022512976A (ja) | 2018-11-07 | 2022-02-07 | アプライド モレキュラー トランスポート インコーポレイテッド | 異種ペイロードの経口送達のためのコリックス由来担体 |
PL3650037T3 (pl) | 2018-11-07 | 2022-06-06 | Applied Molecular Transport Inc. | Konstrukty dostarczające do transcytozy i powiązane z nimi sposoby |
US20200140511A1 (en) | 2018-11-07 | 2020-05-07 | Applied Molecular Transport Inc. | Delivery constructs for transcytosis and related methods |
WO2020229964A1 (en) | 2019-05-10 | 2020-11-19 | Glaxosmithkline Biologicals Sa | Conjugate production |
WO2021034727A1 (en) | 2019-08-16 | 2021-02-25 | Applied Molecular Transport Inc. | Compositions, formulations, and interleukin production and purification |
US20210100887A1 (en) | 2019-10-04 | 2021-04-08 | Reber Genetics Co., Ltd. | Recombinant fusion protein and immunogenic composition |
-
2019
- 2019-09-11 JP JP2021525126A patent/JP2022512976A/ja active Pending
- 2019-09-11 TW TW108132886A patent/TW202031297A/zh unknown
- 2019-09-11 SG SG11202104734YA patent/SG11202104734YA/en unknown
- 2019-09-11 EP EP19881649.8A patent/EP3826682A4/en active Pending
- 2019-09-11 KR KR1020217017372A patent/KR20210110800A/ko active Search and Examination
- 2019-09-11 WO PCT/US2019/050708 patent/WO2020096695A1/en unknown
- 2019-09-11 BR BR112021009001A patent/BR112021009001A8/pt unknown
- 2019-09-11 AU AU2019374703A patent/AU2019374703A1/en active Pending
- 2019-09-11 CA CA3119179A patent/CA3119179A1/en active Pending
- 2019-09-11 CN CN201980088247.4A patent/CN113347997A/zh active Pending
- 2019-09-11 IL IL282986A patent/IL282986B2/en unknown
- 2019-09-11 MX MX2021005382A patent/MX2021005382A/es unknown
-
2020
- 2020-05-27 US US16/884,456 patent/US11324833B2/en active Active
- 2020-12-21 US US17/129,376 patent/US11504433B2/en active Active
-
2021
- 2021-05-07 CL CL2021001210A patent/CL2021001210A1/es unknown
- 2021-06-04 CO CONC2021/0007359A patent/CO2021007359A2/es unknown
-
2022
- 2022-11-03 US US18/052,455 patent/US20240009316A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2022512976A (ja) | 2022-02-07 |
EP3826682A4 (en) | 2021-11-17 |
BR112021009001A8 (pt) | 2021-10-26 |
EP3826682A1 (en) | 2021-06-02 |
WO2020096695A1 (en) | 2020-05-14 |
CN113347997A (zh) | 2021-09-03 |
US11504433B2 (en) | 2022-11-22 |
US20210187113A1 (en) | 2021-06-24 |
IL282986A (en) | 2021-06-30 |
CO2021007359A2 (es) | 2021-06-21 |
IL282986B1 (en) | 2023-09-01 |
AU2019374703A1 (en) | 2021-06-24 |
CA3119179A1 (en) | 2020-05-14 |
US20240009316A1 (en) | 2024-01-11 |
US11324833B2 (en) | 2022-05-10 |
US20210100911A1 (en) | 2021-04-08 |
CL2021001210A1 (es) | 2021-11-05 |
TW202031297A (zh) | 2020-09-01 |
SG11202104734YA (en) | 2021-06-29 |
IL282986B2 (en) | 2024-01-01 |
BR112021009001A2 (pt) | 2021-08-17 |
MX2021005382A (es) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11504433B2 (en) | Cholix-derived carriers for oral delivery of heterologous payload | |
Lau et al. | Discovery of the once-weekly glucagon-like peptide-1 (GLP-1) analogue semaglutide | |
ES2610356T3 (es) | Polipéptidos recombinantes extendidos y composiciones que comprenden los mismos | |
EP2536757B1 (en) | Fibronectin based scaffold domain proteins that bind il-23 | |
KR20220066057A (ko) | 페이로드 전달용 조성물 및 입자 | |
EA029334B1 (ru) | Связывающие сывороточный альбумин молекулы | |
US11179440B2 (en) | Pharmaceutical composition containing FGF21 mutant fusion protein and method for treating hepatitis, hepatic fibrosis, and hepatic cirrhosis | |
US11426466B2 (en) | Toxin-derived delivery constructs for pulmonary delivery | |
Tan et al. | Albumin-binding domain extends half-life of glucagon-like peptide-1 | |
US20170368147A1 (en) | Chemically and thermodynamically stable insulin analogues and improved methods for their production | |
Takeuchi et al. | Discovery of a long-acting glucagon-like peptide-1 analog with enhanced aggregation propensity | |
Guo et al. | Discovery of ecnoglutide–A novel, long-acting, cAMP-biased glucagon-like peptide-1 (GLP-1) analog | |
CN115003702B (zh) | Cd164融合蛋白及其应用 | |
US20240034763A1 (en) | Fusion polypeptides for metabolic disorders | |
Cai et al. | The construction of long-acting exendin-4 analog and its hypoglycemic effect in diabetic mice | |
KR20240029769A (ko) | 융합단백질 및 이의 응용 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |