KR20170085129A - 펩티드 생산용 융합 파트너 - Google Patents
펩티드 생산용 융합 파트너 Download PDFInfo
- Publication number
- KR20170085129A KR20170085129A KR1020177017007A KR20177017007A KR20170085129A KR 20170085129 A KR20170085129 A KR 20170085129A KR 1020177017007 A KR1020177017007 A KR 1020177017007A KR 20177017007 A KR20177017007 A KR 20177017007A KR 20170085129 A KR20170085129 A KR 20170085129A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- seq
- fusion protein
- kda
- polypeptide
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 275
- 230000004927 fusion Effects 0.000 title claims abstract description 199
- 238000004519 manufacturing process Methods 0.000 title abstract description 22
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 251
- 229920001184 polypeptide Polymers 0.000 claims abstract description 248
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 199
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 194
- 108090000623 proteins and genes Proteins 0.000 claims description 319
- 102000004169 proteins and genes Human genes 0.000 claims description 278
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 200
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 200
- 230000014509 gene expression Effects 0.000 claims description 195
- 210000004027 cell Anatomy 0.000 claims description 180
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 145
- 238000000034 method Methods 0.000 claims description 127
- 238000003776 cleavage reaction Methods 0.000 claims description 110
- 230000007017 scission Effects 0.000 claims description 108
- 108010013369 Enteropeptidase Proteins 0.000 claims description 79
- 102100029727 Enteropeptidase Human genes 0.000 claims description 79
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 claims description 77
- 239000002773 nucleotide Substances 0.000 claims description 66
- 125000003729 nucleotide group Chemical group 0.000 claims description 66
- 108090001061 Insulin Proteins 0.000 claims description 64
- 102000004877 Insulin Human genes 0.000 claims description 64
- 229940125396 insulin Drugs 0.000 claims description 63
- 108010076181 Proinsulin Proteins 0.000 claims description 59
- 150000001413 amino acids Chemical class 0.000 claims description 54
- 230000001580 bacterial effect Effects 0.000 claims description 48
- 239000012634 fragment Substances 0.000 claims description 39
- 108010006519 Molecular Chaperones Proteins 0.000 claims description 35
- 239000013604 expression vector Substances 0.000 claims description 32
- 108090000631 Trypsin Proteins 0.000 claims description 29
- 102000004142 Trypsin Human genes 0.000 claims description 29
- 239000012588 trypsin Substances 0.000 claims description 29
- 241000589540 Pseudomonas fluorescens Species 0.000 claims description 23
- 210000004369 blood Anatomy 0.000 claims description 22
- 239000008280 blood Substances 0.000 claims description 22
- 238000011534 incubation Methods 0.000 claims description 21
- -1 Glp2 Proteins 0.000 claims description 19
- 210000004899 c-terminal region Anatomy 0.000 claims description 18
- 230000001939 inductive effect Effects 0.000 claims description 15
- 239000004026 insulin derivative Substances 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 14
- 108090000790 Enzymes Proteins 0.000 claims description 14
- 230000000813 microbial effect Effects 0.000 claims description 12
- VOUAQYXWVJDEQY-QENPJCQMSA-N 33017-11-7 Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)NCC(=O)NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N1[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)CCC1 VOUAQYXWVJDEQY-QENPJCQMSA-N 0.000 claims description 9
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 6
- 108010075254 C-Peptide Proteins 0.000 claims description 6
- 108010073961 Insulin Aspart Proteins 0.000 claims description 6
- 235000007164 Oryza sativa Nutrition 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 108010011459 Exenatide Proteins 0.000 claims description 5
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 claims description 5
- 229960001519 exenatide Drugs 0.000 claims description 5
- 108010074860 Factor Xa Proteins 0.000 claims description 4
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 claims description 4
- 229960004717 insulin aspart Drugs 0.000 claims description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 102000004506 Blood Proteins Human genes 0.000 claims description 3
- 108010017384 Blood Proteins Proteins 0.000 claims description 3
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 claims description 3
- 101100192865 Drosophila melanogaster GlyP gene Proteins 0.000 claims description 2
- 108090001126 Furin Proteins 0.000 claims description 2
- 102000004961 Furin Human genes 0.000 claims description 2
- 102100039619 Granulocyte colony-stimulating factor Human genes 0.000 claims description 2
- 101000746367 Homo sapiens Granulocyte colony-stimulating factor Proteins 0.000 claims description 2
- 102100026720 Interferon beta Human genes 0.000 claims description 2
- 108090000467 Interferon-beta Proteins 0.000 claims description 2
- 241000223960 Plasmodium falciparum Species 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 240000007594 Oryza sativa Species 0.000 claims 1
- VOMXSOIBEJBQNF-UTTRGDHVSA-N novorapid Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 VOMXSOIBEJBQNF-UTTRGDHVSA-N 0.000 claims 1
- 239000008194 pharmaceutical composition Substances 0.000 claims 1
- 210000003046 sporozoite Anatomy 0.000 claims 1
- 239000003814 drug Substances 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 244
- 241000589516 Pseudomonas Species 0.000 description 150
- 102000035195 Peptidases Human genes 0.000 description 70
- 108091005804 Peptidases Proteins 0.000 description 70
- 239000004365 Protease Substances 0.000 description 66
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 description 61
- 125000003275 alpha amino acid group Chemical group 0.000 description 60
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 54
- 235000019419 proteases Nutrition 0.000 description 52
- 229940024606 amino acid Drugs 0.000 description 51
- 235000001014 amino acid Nutrition 0.000 description 51
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 48
- 206010057190 Respiratory tract infections Diseases 0.000 description 44
- 238000000855 fermentation Methods 0.000 description 40
- 230000004151 fermentation Effects 0.000 description 39
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 37
- 108091026890 Coding region Proteins 0.000 description 34
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 34
- 239000000872 buffer Substances 0.000 description 32
- 239000013612 plasmid Substances 0.000 description 32
- 229960001322 trypsin Drugs 0.000 description 28
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical group CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 27
- 239000002609 medium Substances 0.000 description 25
- 230000006698 induction Effects 0.000 description 23
- 238000001818 capillary gel electrophoresis Methods 0.000 description 22
- 102000003982 Parathyroid hormone Human genes 0.000 description 20
- 108090000445 Parathyroid hormone Proteins 0.000 description 20
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 20
- 239000000199 parathyroid hormone Substances 0.000 description 20
- 229960001319 parathyroid hormone Drugs 0.000 description 20
- 238000000746 purification Methods 0.000 description 20
- 210000000805 cytoplasm Anatomy 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 18
- 239000003795 chemical substances by application Substances 0.000 description 18
- 239000000523 sample Substances 0.000 description 17
- 230000002950 deficient Effects 0.000 description 16
- 230000003248 secreting effect Effects 0.000 description 16
- 229960005460 teriparatide Drugs 0.000 description 16
- 102000005431 Molecular Chaperones Human genes 0.000 description 15
- 238000012217 deletion Methods 0.000 description 15
- 230000037430 deletion Effects 0.000 description 15
- 239000013613 expression plasmid Substances 0.000 description 15
- 241000588724 Escherichia coli Species 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 14
- 230000001086 cytosolic effect Effects 0.000 description 14
- 102000004447 HSP40 Heat-Shock Proteins Human genes 0.000 description 13
- 108010042283 HSP40 Heat-Shock Proteins Proteins 0.000 description 13
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 13
- 229940088598 enzyme Drugs 0.000 description 13
- 239000002953 phosphate buffered saline Substances 0.000 description 13
- 239000007787 solid Substances 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- 241000192142 Proteobacteria Species 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 229910017053 inorganic salt Inorganic materials 0.000 description 12
- 239000006166 lysate Substances 0.000 description 12
- 230000028327 secretion Effects 0.000 description 12
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 11
- 239000000463 material Substances 0.000 description 11
- 230000012846 protein folding Effects 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 10
- 108091000080 Phosphotransferase Proteins 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- 238000005119 centrifugation Methods 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 239000008188 pellet Substances 0.000 description 10
- 102000020233 phosphotransferase Human genes 0.000 description 10
- 239000011780 sodium chloride Substances 0.000 description 10
- 239000006228 supernatant Substances 0.000 description 10
- 238000003556 assay Methods 0.000 description 9
- 230000003196 chaotropic effect Effects 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 238000004587 chromatography analysis Methods 0.000 description 8
- 210000003000 inclusion body Anatomy 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 101150116440 pyrF gene Proteins 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 239000011347 resin Substances 0.000 description 8
- 229920005989 resin Polymers 0.000 description 8
- 238000011218 seed culture Methods 0.000 description 8
- 238000000527 sonication Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 230000014616 translation Effects 0.000 description 8
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 7
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- 108090000769 Isomerases Proteins 0.000 description 7
- 102000004195 Isomerases Human genes 0.000 description 7
- 239000004472 Lysine Substances 0.000 description 7
- 229930195725 Mannitol Natural products 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 229940059720 apra Drugs 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000012636 effector Substances 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 102000034356 gene-regulatory proteins Human genes 0.000 description 7
- 108091006104 gene-regulatory proteins Proteins 0.000 description 7
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 7
- 239000000594 mannitol Substances 0.000 description 7
- 235000010355 mannitol Nutrition 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 125000006850 spacer group Chemical group 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 6
- 108010057186 Insulin Glargine Proteins 0.000 description 6
- COCFEDIXXNGUNL-RFKWWTKHSA-N Insulin glargine Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(=O)NCC(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 COCFEDIXXNGUNL-RFKWWTKHSA-N 0.000 description 6
- 239000007983 Tris buffer Substances 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 238000004925 denaturation Methods 0.000 description 6
- 230000036425 denaturation Effects 0.000 description 6
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 6
- 238000013537 high throughput screening Methods 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 101150109249 lacI gene Proteins 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 229910000162 sodium phosphate Inorganic materials 0.000 description 6
- 230000002459 sustained effect Effects 0.000 description 6
- 239000011573 trace mineral Substances 0.000 description 6
- 235000013619 trace mineral Nutrition 0.000 description 6
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 241000590031 Alteromonas Species 0.000 description 5
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 5
- 241000228212 Aspergillus Species 0.000 description 5
- WEDIKSVWBUKTRA-WTKGVUNUSA-N CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC Chemical compound CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC WEDIKSVWBUKTRA-WTKGVUNUSA-N 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 108010050904 Interferons Proteins 0.000 description 5
- 102000014150 Interferons Human genes 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- 241000209094 Oryza Species 0.000 description 5
- 102000002933 Thioredoxin Human genes 0.000 description 5
- 238000002835 absorbance Methods 0.000 description 5
- 238000001042 affinity chromatography Methods 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 235000009582 asparagine Nutrition 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 239000012149 elution buffer Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- 239000000411 inducer Substances 0.000 description 5
- 229960002869 insulin glargine Drugs 0.000 description 5
- 229940079322 interferon Drugs 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000004811 liquid chromatography Methods 0.000 description 5
- 238000004949 mass spectrometry Methods 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 235000019833 protease Nutrition 0.000 description 5
- 230000017854 proteolysis Effects 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 239000001488 sodium phosphate Substances 0.000 description 5
- 108060008226 thioredoxin Proteins 0.000 description 5
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 4
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 4
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 4
- 241000588914 Enterobacter Species 0.000 description 4
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 4
- 108010049264 Teriparatide Proteins 0.000 description 4
- 108090000190 Thrombin Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 239000000556 agonist Substances 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000003114 blood coagulation factor Substances 0.000 description 4
- 238000006664 bond formation reaction Methods 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 229940053641 forteo Drugs 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- XLXSAKCOAKORKW-AQJXLSMYSA-N gonadorelin Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 XLXSAKCOAKORKW-AQJXLSMYSA-N 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 229960004072 thrombin Drugs 0.000 description 4
- 230000005030 transcription termination Effects 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- 229960005486 vaccine Drugs 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- 241000589154 Azotobacter group Species 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 101100337060 Caenorhabditis elegans glp-1 gene Proteins 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 3
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 3
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 3
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 3
- 208000031220 Hemophilia Diseases 0.000 description 3
- 208000009292 Hemophilia A Diseases 0.000 description 3
- 241000701806 Human papillomavirus Species 0.000 description 3
- 108010063738 Interleukins Proteins 0.000 description 3
- 102000015696 Interleukins Human genes 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 3
- 102000002704 Leucyl aminopeptidase Human genes 0.000 description 3
- 102000005741 Metalloproteases Human genes 0.000 description 3
- 108010006035 Metalloproteases Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108010067372 Pancreatic elastase Proteins 0.000 description 3
- 102000016387 Pancreatic elastase Human genes 0.000 description 3
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 3
- 241000218935 Pseudomonas azotoformans Species 0.000 description 3
- 241000589537 Pseudomonas marginalis Species 0.000 description 3
- 241000204735 Pseudomonas nitroreducens Species 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- 102000012479 Serine Proteases Human genes 0.000 description 3
- 108010022999 Serine Proteases Proteins 0.000 description 3
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 101710154918 Trigger factor Proteins 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 239000002775 capsule Substances 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 239000003638 chemical reducing agent Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000004090 dissolution Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 229960004222 factor ix Drugs 0.000 description 3
- 229930195712 glutamate Natural products 0.000 description 3
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000006317 isomerization reaction Methods 0.000 description 3
- 101150066555 lacZ gene Proteins 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 229920002704 polyhistidine Polymers 0.000 description 3
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 238000001742 protein purification Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 210000004708 ribosome subunit Anatomy 0.000 description 3
- 238000012807 shake-flask culturing Methods 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000011550 stock solution Substances 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 229940094937 thioredoxin Drugs 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000003643 water by type Substances 0.000 description 3
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 2
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 2
- 102100024341 10 kDa heat shock protein, mitochondrial Human genes 0.000 description 2
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 2
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 2
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 2
- 108090000915 Aminopeptidases Proteins 0.000 description 2
- 102000004400 Aminopeptidases Human genes 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 2
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 2
- 108010024976 Asparaginase Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 108030001720 Bontoxilysin Proteins 0.000 description 2
- 241001453380 Burkholderia Species 0.000 description 2
- 108010032088 Calpain Proteins 0.000 description 2
- 102000007590 Calpain Human genes 0.000 description 2
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 2
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 2
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 2
- 108090000087 Carboxypeptidase B Proteins 0.000 description 2
- 102000003670 Carboxypeptidase B Human genes 0.000 description 2
- 108010080937 Carboxypeptidases A Proteins 0.000 description 2
- 102000000496 Carboxypeptidases A Human genes 0.000 description 2
- 108010059081 Cathepsin A Proteins 0.000 description 2
- 102000005572 Cathepsin A Human genes 0.000 description 2
- 102000003902 Cathepsin C Human genes 0.000 description 2
- 108090000267 Cathepsin C Proteins 0.000 description 2
- 102000003908 Cathepsin D Human genes 0.000 description 2
- 108090000258 Cathepsin D Proteins 0.000 description 2
- 241000557816 Cedrela Species 0.000 description 2
- 108090000746 Chymosin Proteins 0.000 description 2
- 206010010071 Coma Diseases 0.000 description 2
- 241000589518 Comamonas testosteroni Species 0.000 description 2
- 108010028774 Complement C1 Proteins 0.000 description 2
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 2
- 102000005927 Cysteine Proteases Human genes 0.000 description 2
- 108010005843 Cysteine Proteases Proteins 0.000 description 2
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 2
- 108010074604 Epoetin Alfa Proteins 0.000 description 2
- DNXHEGUUPJUMQT-CBZIJGRNSA-N Estrone Chemical compound OC1=CC=C2[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CCC2=C1 DNXHEGUUPJUMQT-CBZIJGRNSA-N 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108010076282 Factor IX Proteins 0.000 description 2
- 108091006020 Fc-tagged proteins Proteins 0.000 description 2
- 108010049003 Fibrinogen Proteins 0.000 description 2
- 102000008946 Fibrinogen Human genes 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 2
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- 102000001398 Granzyme Human genes 0.000 description 2
- 108060005986 Granzyme Proteins 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 241001670062 Halomonas utahensis Species 0.000 description 2
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 2
- 101000878213 Homo sapiens Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Proteins 0.000 description 2
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 102100036984 Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Human genes 0.000 description 2
- 102100034349 Integrase Human genes 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- 241001478324 Liberibacter Species 0.000 description 2
- 102000009151 Luteinizing Hormone Human genes 0.000 description 2
- 108010073521 Luteinizing Hormone Proteins 0.000 description 2
- 108090000856 Lyases Proteins 0.000 description 2
- 102000004317 Lyases Human genes 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 241001670047 Malikia spinosa Species 0.000 description 2
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 2
- 241000589330 Methylococcaceae Species 0.000 description 2
- 241001670070 Microbulbifer elongatus Species 0.000 description 2
- 101710154541 Modulator protein Proteins 0.000 description 2
- 101100386510 Mus musculus Dazap2 gene Proteins 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108090000526 Papain Proteins 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- 102000057297 Pepsin A Human genes 0.000 description 2
- 108010030544 Peptidyl-Lys metalloendopeptidase Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 2
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 101800004937 Protein C Proteins 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 241000157890 Pseudoalteromonas piscicida Species 0.000 description 2
- 241001660019 Pseudomonas borealis Species 0.000 description 2
- 241000429405 Pseudomonas extremorientalis Species 0.000 description 2
- 241001497665 Pseudomonas frederiksbergensis Species 0.000 description 2
- 241000042121 Pseudomonas graminis Species 0.000 description 2
- 241000913726 Pseudomonas kilonensis Species 0.000 description 2
- 241001670039 Pseudomonas lundensis Species 0.000 description 2
- 241000589755 Pseudomonas mendocina Species 0.000 description 2
- 241000589781 Pseudomonas oleovorans Species 0.000 description 2
- 241001291513 Pseudomonas orientalis Species 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 241000577556 Pseudomonas wisconsinensis Species 0.000 description 2
- 229940123452 Rapid-acting insulin Drugs 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 2
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 2
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 2
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 2
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 2
- 102000002278 Ribosomal Proteins Human genes 0.000 description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 description 2
- 201000001718 Roberts syndrome Diseases 0.000 description 2
- 208000012474 Roberts-SC phocomelia syndrome Diseases 0.000 description 2
- 102400000827 Saposin-D Human genes 0.000 description 2
- 101800001700 Saposin-D Proteins 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- 241000863432 Shewanella putrefaciens Species 0.000 description 2
- 108010026951 Short-Acting Insulin Chemical class 0.000 description 2
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 2
- 241001670068 Thauera butanivorans Species 0.000 description 2
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 2
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241001670042 [Pseudomonas] boreopolis Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108091006088 activator proteins Proteins 0.000 description 2
- MGSKVZWGBWPBTF-UHFFFAOYSA-N aebsf Chemical compound NCCC1=CC=C(S(F)(=O)=O)C=C1 MGSKVZWGBWPBTF-UHFFFAOYSA-N 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 239000000538 analytical sample Substances 0.000 description 2
- 229940019748 antifibrinolytic proteinase inhibitors Drugs 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- DEPVWJDTHPEHNI-UHFFFAOYSA-N benzenesulfonyl fluoride;hydrochloride Chemical compound Cl.FS(=O)(=O)C1=CC=CC=C1 DEPVWJDTHPEHNI-UHFFFAOYSA-N 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 229940053031 botulinum toxin Drugs 0.000 description 2
- 108010054847 carboxypeptidase P Proteins 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 239000003398 denaturant Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 108010003914 endoproteinase Asp-N Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 229960003388 epoetin alfa Drugs 0.000 description 2
- 229940012444 factor xiii Drugs 0.000 description 2
- 229940012952 fibrinogen Drugs 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 239000006481 glucose medium Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 229940035638 gonadotropin-releasing hormone Drugs 0.000 description 2
- QQHJDPROMQRDLA-UHFFFAOYSA-N hexadecanedioic acid Chemical compound OC(=O)CCCCCCCCCCCCCCC(O)=O QQHJDPROMQRDLA-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002868 homogeneous time resolved fluorescence Methods 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- PBGKTOXHQIOBKM-FHFVDXKLSA-N insulin (human) Chemical class C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3NC=NC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 PBGKTOXHQIOBKM-FHFVDXKLSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 229940040129 luteinizing hormone Drugs 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- YMXREWKKROWOSO-VOTSOKGWSA-N methyl (e)-3-(2-hydroxyphenyl)prop-2-enoate Chemical compound COC(=O)\C=C\C1=CC=CC=C1O YMXREWKKROWOSO-VOTSOKGWSA-N 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004898 n-terminal fragment Anatomy 0.000 description 2
- 229910052759 nickel Inorganic materials 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 229940055729 papain Drugs 0.000 description 2
- 235000019834 papain Nutrition 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 125000001151 peptidyl group Chemical group 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 229960000856 protein c Drugs 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000005001 rutherford backscattering spectroscopy Methods 0.000 description 2
- 239000012723 sample buffer Substances 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 239000011537 solubilization buffer Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000002798 spectrophotometry method Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 108010059339 submandibular proteinase A Proteins 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- WJCNZQLZVWNLKY-UHFFFAOYSA-N thiabendazole Chemical compound S1C=NC(C=2NC3=CC=CC=C3N=2)=C1 WJCNZQLZVWNLKY-UHFFFAOYSA-N 0.000 description 2
- 210000001685 thyroid gland Anatomy 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 229960000575 trastuzumab Drugs 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 238000002525 ultrasonication Methods 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229960001134 von willebrand factor Drugs 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- ISJKIHHTPAQLLW-TUFLPTIASA-N (2S)-2-[[(2S)-3-(4-hydroxyphenyl)-2-[[(2S)-1-[(2S)-pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]amino]propanoyl]amino]-4-methylpentanoic acid Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ISJKIHHTPAQLLW-TUFLPTIASA-N 0.000 description 1
- SUQWGICKJIJKNO-IHRRRGAJSA-N (2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]acetyl]amino]pentanedioic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O SUQWGICKJIJKNO-IHRRRGAJSA-N 0.000 description 1
- HRNLPPBUBKMZMT-SSSXJSFTSA-N (2s)-6-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2r)-2-[[(2r)-2-aminopropanoyl]amino]-3-naphthalen-2-ylpropanoyl]amino]propanoyl]amino]-3-(1h-indol-3-yl)propanoyl]amino]-3-phenylpropanoyl]amino]hexanamide Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](C)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(=O)[C@H](N)C)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 HRNLPPBUBKMZMT-SSSXJSFTSA-N 0.000 description 1
- DEQANNDTNATYII-OULOTJBUSA-N (4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-19-[[(2r)-2-amino-3-phenylpropanoyl]amino]-16-benzyl-n-[(2r,3r)-1,3-dihydroxybutan-2-yl]-7-[(1r)-1-hydroxyethyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-1,2-dithia-5,8,11,14,17-pentazacycloicosane-4-carboxa Chemical compound C([C@@H](N)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC=CC=2)NC1=O)C(=O)N[C@H](CO)[C@H](O)C)C1=CC=CC=C1 DEQANNDTNATYII-OULOTJBUSA-N 0.000 description 1
- HMLGSIZOMSVISS-ONJSNURVSA-N (7r)-7-[[(2z)-2-(2-amino-1,3-thiazol-4-yl)-2-(2,2-dimethylpropanoyloxymethoxyimino)acetyl]amino]-3-ethenyl-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid Chemical compound N([C@@H]1C(N2C(=C(C=C)CSC21)C(O)=O)=O)C(=O)\C(=N/OCOC(=O)C(C)(C)C)C1=CSC(N)=N1 HMLGSIZOMSVISS-ONJSNURVSA-N 0.000 description 1
- NWUYHJFMYQTDRP-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;1-ethenyl-2-ethylbenzene;styrene Chemical compound C=CC1=CC=CC=C1.CCC1=CC=CC=C1C=C.C=CC1=CC=CC=C1C=C NWUYHJFMYQTDRP-UHFFFAOYSA-N 0.000 description 1
- UUUHXMGGBIUAPW-UHFFFAOYSA-N 1-[1-[2-[[5-amino-2-[[1-[5-(diaminomethylideneamino)-2-[[1-[3-(1h-indol-3-yl)-2-[(5-oxopyrrolidine-2-carbonyl)amino]propanoyl]pyrrolidine-2-carbonyl]amino]pentanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-3-methylpentanoyl]pyrrolidine-2-carbon Chemical compound C1CCC(C(=O)N2C(CCC2)C(O)=O)N1C(=O)C(C(C)CC)NC(=O)C(CCC(N)=O)NC(=O)C1CCCN1C(=O)C(CCCN=C(N)N)NC(=O)C1CCCN1C(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C1CCC(=O)N1 UUUHXMGGBIUAPW-UHFFFAOYSA-N 0.000 description 1
- PRPINYUDVPFIRX-UHFFFAOYSA-N 1-naphthaleneacetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CC=CC2=C1 PRPINYUDVPFIRX-UHFFFAOYSA-N 0.000 description 1
- 101710122378 10 kDa heat shock protein, mitochondrial Proteins 0.000 description 1
- CNLWNYCFDMAZCB-HUVROIHYSA-N 2-[2-[[2-[[(2r)-1-[[(4r,7s,10s,13r,16s,19r)-10-(4-aminobutyl)-16-benzyl-4-[[(2r,3r)-1,3-dihydroxybutan-2-yl]carbamoyl]-7-[(1r)-1-hydroxyethyl]-13-(1h-indol-3-ylmethyl)-6,9,12,15,18-pentaoxo-1,2-dithia-5,8,11,14,17-pentazacycloicos-19-yl]amino]-1-oxo-3-phe Chemical compound C([C@H](C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC=2C=CC=CC=2)NC1=O)C(=O)N[C@H](CO)[C@H](O)C)NC(=O)CN(CCN(CCN(CC(O)=O)CC(O)=O)CC(O)=O)CC(O)=O)C1=CC=CC=C1 CNLWNYCFDMAZCB-HUVROIHYSA-N 0.000 description 1
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- TWJNQYPJQDRXPH-UHFFFAOYSA-N 2-cyanobenzohydrazide Chemical compound NNC(=O)C1=CC=CC=C1C#N TWJNQYPJQDRXPH-UHFFFAOYSA-N 0.000 description 1
- 101710149439 20 kDa chaperonin, chloroplastic Proteins 0.000 description 1
- SHXWCVYOXRDMCX-UHFFFAOYSA-N 3,4-methylenedioxymethamphetamine Chemical compound CNC(C)CC1=CC=C2OCOC2=C1 SHXWCVYOXRDMCX-UHFFFAOYSA-N 0.000 description 1
- AOJJSUZBOXZQNB-VTZDEGQISA-N 4'-epidoxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-VTZDEGQISA-N 0.000 description 1
- CUVGUPIVTLGRGI-UHFFFAOYSA-N 4-(3-phosphonopropyl)piperazine-2-carboxylic acid Chemical compound OC(=O)C1CN(CCCP(O)(O)=O)CCN1 CUVGUPIVTLGRGI-UHFFFAOYSA-N 0.000 description 1
- LKDMKWNDBAVNQZ-UHFFFAOYSA-N 4-[[1-[[1-[2-[[1-(4-nitroanilino)-1-oxo-3-phenylpropan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)CCC(=O)NC(C)C(=O)NC(C)C(=O)N1CCCC1C(=O)NC(C(=O)NC=1C=CC(=CC=1)[N+]([O-])=O)CC1=CC=CC=C1 LKDMKWNDBAVNQZ-UHFFFAOYSA-N 0.000 description 1
- 101710144734 48 kDa protein Proteins 0.000 description 1
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 1
- 101710154868 60 kDa heat shock protein, mitochondrial Proteins 0.000 description 1
- 241001478307 Acidomonas Species 0.000 description 1
- 241000726119 Acidovorax Species 0.000 description 1
- 101100381541 Acinetobacter baylyi (strain ATCC 33305 / BD413 / ADP1) benB gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- CSAHOYQKNHGDHX-ACZMJKKPSA-N Ala-Gln-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CSAHOYQKNHGDHX-ACZMJKKPSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 241001430273 Aminobacter Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000252084 Anguilla Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- YHQGEARSFILVHL-HJGDQZAQSA-N Arg-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O YHQGEARSFILVHL-HJGDQZAQSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- ABMMIOIRQJNRHG-XKNYDFJKSA-N Asn-Asn-Pro-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ABMMIOIRQJNRHG-XKNYDFJKSA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- LDGUZSIPGSPBJP-XVYDVKMFSA-N Asp-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LDGUZSIPGSPBJP-XVYDVKMFSA-N 0.000 description 1
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- GXIUDSXIUSTSLO-QXEWZRGKSA-N Asp-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N GXIUDSXIUSTSLO-QXEWZRGKSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 101100407629 Aspergillus niger pepA gene Proteins 0.000 description 1
- 241000228251 Aspergillus phoenicis Species 0.000 description 1
- 241000131386 Aspergillus sojae Species 0.000 description 1
- 241000040854 Azorhizophilus Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101100189062 Bacillus subtilis (strain 168) proH gene Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 241000486634 Bena Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241001626906 Blastomonas Species 0.000 description 1
- 101100098884 Botryotinia fuckeliana tubA gene Proteins 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 241000131407 Brevundimonas Species 0.000 description 1
- 108010004032 Bromelains Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102100029968 Calreticulin Human genes 0.000 description 1
- 108090000549 Calreticulin Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108090000397 Caspase 3 Proteins 0.000 description 1
- 102000004018 Caspase 6 Human genes 0.000 description 1
- 108090000425 Caspase 6 Proteins 0.000 description 1
- 108090000567 Caspase 7 Proteins 0.000 description 1
- 102100035904 Caspase-1 Human genes 0.000 description 1
- 108090000426 Caspase-1 Proteins 0.000 description 1
- 102000004068 Caspase-10 Human genes 0.000 description 1
- 108090000572 Caspase-10 Proteins 0.000 description 1
- 102000004066 Caspase-12 Human genes 0.000 description 1
- 108090000570 Caspase-12 Proteins 0.000 description 1
- 102000004046 Caspase-2 Human genes 0.000 description 1
- 108090000552 Caspase-2 Proteins 0.000 description 1
- 102100029855 Caspase-3 Human genes 0.000 description 1
- 102100025597 Caspase-4 Human genes 0.000 description 1
- 101710090338 Caspase-4 Proteins 0.000 description 1
- 102100038916 Caspase-5 Human genes 0.000 description 1
- 101710090333 Caspase-5 Proteins 0.000 description 1
- 102100038902 Caspase-7 Human genes 0.000 description 1
- 102100026548 Caspase-8 Human genes 0.000 description 1
- 108090000538 Caspase-8 Proteins 0.000 description 1
- 102000004039 Caspase-9 Human genes 0.000 description 1
- 108090000566 Caspase-9 Proteins 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 108090000712 Cathepsin B Proteins 0.000 description 1
- 102000004225 Cathepsin B Human genes 0.000 description 1
- 102000004178 Cathepsin E Human genes 0.000 description 1
- 108090000611 Cathepsin E Proteins 0.000 description 1
- 102000004173 Cathepsin G Human genes 0.000 description 1
- 108090000617 Cathepsin G Proteins 0.000 description 1
- 108090000619 Cathepsin H Proteins 0.000 description 1
- 102000004175 Cathepsin H Human genes 0.000 description 1
- 108090000624 Cathepsin L Proteins 0.000 description 1
- 102000004172 Cathepsin L Human genes 0.000 description 1
- 241000863387 Cellvibrio Species 0.000 description 1
- 241000010977 Cellvibrio japonicus Species 0.000 description 1
- 101710163595 Chaperone protein DnaK Proteins 0.000 description 1
- 108010059013 Chaperonin 10 Proteins 0.000 description 1
- 101710104159 Chaperonin GroEL Proteins 0.000 description 1
- 101710108115 Chaperonin GroEL, chloroplastic Proteins 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010049048 Cholera Toxin Proteins 0.000 description 1
- 102000009016 Cholera Toxin Human genes 0.000 description 1
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 1
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 101710177832 Co-chaperonin GroES Proteins 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 208000003495 Coccidiosis Diseases 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 102000016917 Complement C1 Human genes 0.000 description 1
- 102100025406 Complement C1s subcomponent Human genes 0.000 description 1
- 108090000044 Complement Factor I Proteins 0.000 description 1
- 108090000059 Complement factor D Proteins 0.000 description 1
- 102000003706 Complement factor D Human genes 0.000 description 1
- 102100035431 Complement factor I Human genes 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 241001670044 Curvibacter lanceolatus Species 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- NLCZGISONIGRQP-DCAQKATOSA-N Cys-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N NLCZGISONIGRQP-DCAQKATOSA-N 0.000 description 1
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- 241001600125 Delftia acidovorans Species 0.000 description 1
- 241000588700 Dickeya chrysanthemi Species 0.000 description 1
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 1
- 102000016622 Dipeptidyl Peptidase 4 Human genes 0.000 description 1
- 108091066263 DnaJ family Proteins 0.000 description 1
- 102000039201 DnaJ family Human genes 0.000 description 1
- 101100396916 Drosophila funebris PapD gene Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101150099000 EXPA1 gene Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 241001528534 Ensifer Species 0.000 description 1
- 241000194033 Enterococcus Species 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- HTIJFSOGRVMCQR-UHFFFAOYSA-N Epirubicin Natural products COc1cccc2C(=O)c3c(O)c4CC(O)(CC(OC5CC(N)C(=O)C(C)O5)c4c(O)c3C(=O)c12)C(=O)CO HTIJFSOGRVMCQR-UHFFFAOYSA-N 0.000 description 1
- 108010056764 Eptifibatide Proteins 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 108010074124 Escherichia coli Proteins Proteins 0.000 description 1
- 101100242758 Escherichia coli papD gene Proteins 0.000 description 1
- 108010008165 Etanercept Proteins 0.000 description 1
- 102100029095 Exportin-1 Human genes 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010071289 Factor XIII Proteins 0.000 description 1
- 108010088842 Fibrinolysin Proteins 0.000 description 1
- 108010029961 Filgrastim Proteins 0.000 description 1
- 241000192128 Gammaproteobacteria Species 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- 108010061711 Gliadin Proteins 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- GLEGHWQNGPMKHO-DCAQKATOSA-N Gln-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GLEGHWQNGPMKHO-DCAQKATOSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- LHMWTCWZARHLPV-CIUDSAMLSA-N Gln-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LHMWTCWZARHLPV-CIUDSAMLSA-N 0.000 description 1
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 1
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- 101100024440 Globodera rostochiensis MSP-3 gene Proteins 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102400000932 Gonadoliberin-1 Human genes 0.000 description 1
- 108010069236 Goserelin Proteins 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102000018997 Growth Hormone Human genes 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 108010010369 HIV Protease Proteins 0.000 description 1
- 239000012630 HPLC buffer Substances 0.000 description 1
- 101150076784 HSP100 gene Proteins 0.000 description 1
- 101150051208 HSPH1 gene Proteins 0.000 description 1
- 101710178376 Heat shock 70 kDa protein Proteins 0.000 description 1
- 101710152018 Heat shock cognate 70 kDa protein Proteins 0.000 description 1
- 102100031624 Heat shock protein 105 kDa Human genes 0.000 description 1
- 101710113864 Heat shock protein 90 Proteins 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 1
- 241001660422 Herbaspirillum huttiense Species 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 1
- XJQDHFMUUBRCGA-KKUMJFAQSA-N His-Asn-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XJQDHFMUUBRCGA-KKUMJFAQSA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- CSTNMMIHMYJGFR-IHRRRGAJSA-N His-His-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 CSTNMMIHMYJGFR-IHRRRGAJSA-N 0.000 description 1
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 1
- UQTKYYNHMVAOAA-HJPIBITLSA-N His-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N UQTKYYNHMVAOAA-HJPIBITLSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- YVCGJPIKRMGNPA-LSJOCFKGSA-N His-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O YVCGJPIKRMGNPA-LSJOCFKGSA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- RNVUQLOKVIPNEM-BZSNNMDCSA-N His-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O RNVUQLOKVIPNEM-BZSNNMDCSA-N 0.000 description 1
- 101500026183 Homo sapiens Gonadoliberin-1 Proteins 0.000 description 1
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 description 1
- 101000780028 Homo sapiens Natriuretic peptides A Proteins 0.000 description 1
- 101001135770 Homo sapiens Parathyroid hormone Proteins 0.000 description 1
- 101001135995 Homo sapiens Probable peptidyl-tRNA hydrolase Proteins 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108010003272 Hyaluronate lyase Proteins 0.000 description 1
- 102000001974 Hyaluronidases Human genes 0.000 description 1
- 241000216643 Hydrogenophaga Species 0.000 description 1
- 241000282596 Hylobatidae Species 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- WKXVAXOSIPTXEC-HAFWLYHUSA-N Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O WKXVAXOSIPTXEC-HAFWLYHUSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108010089308 Insulin Detemir Proteins 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- FYZPCMFQCNBYCY-WIWKJPBBSA-N Insulin degludec Chemical compound CC[C@H](C)[C@H](NC(=O)CN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H]1CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CSSC[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc3c[nH]cn3)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)Cc3ccccc3)C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](Cc3c[nH]cn3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](Cc3ccc(O)cc3)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](Cc3ccc(O)cc3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC2=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccccc2)C(=O)N[C@@H](Cc2ccc(O)cc2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC(O)=O)C(O)=O)C(O)=O)NC1=O)[C@@H](C)O)[C@@H](C)CC FYZPCMFQCNBYCY-WIWKJPBBSA-N 0.000 description 1
- 102100040018 Interferon alpha-2 Human genes 0.000 description 1
- 108010005716 Interferon beta-1a Proteins 0.000 description 1
- 108010005714 Interferon beta-1b Proteins 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010079944 Interferon-alpha2b Proteins 0.000 description 1
- 102000051628 Interleukin-1 receptor antagonist Human genes 0.000 description 1
- 108700021006 Interleukin-1 receptor antagonist Proteins 0.000 description 1
- 206010023076 Isosporiasis Diseases 0.000 description 1
- 241001148466 Janthinobacterium lividum Species 0.000 description 1
- 241000110847 Kochia Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- VLJNHYLEOZPXFW-BYPYZUCNSA-N L-prolinamide Chemical compound NC(=O)[C@@H]1CCCN1 VLJNHYLEOZPXFW-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- 244000199866 Lactobacillus casei Species 0.000 description 1
- 241000186840 Lactobacillus fermentum Species 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- LKXANTUNFMVCNF-IHPCNDPISA-N Leu-His-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LKXANTUNFMVCNF-IHPCNDPISA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 description 1
- 108010019598 Liraglutide Proteins 0.000 description 1
- 101100434212 Listeria monocytogenes serovar 1/2a (strain ATCC BAA-679 / EGD-e) actA gene Proteins 0.000 description 1
- 102000015930 Lon proteases Human genes 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- VHXMZJGOKIMETG-CQDKDKBSSA-N Lys-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCCN)N VHXMZJGOKIMETG-CQDKDKBSSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 1
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- CKSBRMUOQDNPKZ-SRVKXCTJSA-N Lys-Gln-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CKSBRMUOQDNPKZ-SRVKXCTJSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- IPSDPDAOSAEWCN-RHYQMDGZSA-N Lys-Met-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IPSDPDAOSAEWCN-RHYQMDGZSA-N 0.000 description 1
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- RYOLKFYZBHMYFW-WDSOQIARSA-N Lys-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 RYOLKFYZBHMYFW-WDSOQIARSA-N 0.000 description 1
- ZJSXCIMWLPSTMG-HSCHXYMDSA-N Lys-Trp-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJSXCIMWLPSTMG-HSCHXYMDSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 108010057081 Merozoite Surface Protein 1 Proteins 0.000 description 1
- 101100071630 Mesocentrotus franciscanus HSP110 gene Proteins 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- CEGVMWAVGBRVFS-XGEHTFHBSA-N Met-Cys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CEGVMWAVGBRVFS-XGEHTFHBSA-N 0.000 description 1
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- STLBOMUOQNIALW-BQBZGAKWSA-N Met-Gly-Cys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O STLBOMUOQNIALW-BQBZGAKWSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 1
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- LHXFNWBNRBWMNV-DCAQKATOSA-N Met-Ser-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LHXFNWBNRBWMNV-DCAQKATOSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- KYXDADPHSNFWQX-VEVYYDQMSA-N Met-Thr-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O KYXDADPHSNFWQX-VEVYYDQMSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 101710181812 Methionine aminopeptidase Proteins 0.000 description 1
- 241000589350 Methylobacter Species 0.000 description 1
- 241001264650 Methylocaldum Species 0.000 description 1
- 241001533203 Methylomicrobium Species 0.000 description 1
- 241000321843 Methylosarcina Species 0.000 description 1
- 241000530467 Methylosphaera Species 0.000 description 1
- 108010013295 Microbial collagenase Proteins 0.000 description 1
- 101000933115 Mus musculus Caspase-4 Proteins 0.000 description 1
- 101100451677 Mus musculus Hspa4 gene Proteins 0.000 description 1
- 235000021360 Myristic acid Nutrition 0.000 description 1
- TUNFSRHWOTWDNC-UHFFFAOYSA-N Myristic acid Natural products CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241001195348 Nusa Species 0.000 description 1
- HCUVEUVIUAJXRB-UHFFFAOYSA-N OC1=C(C=C(CNC(CCCC=2SC=CC=2)=O)C=C1)OC Chemical compound OC1=C(C=C(CNC(CCCC=2SC=CC=2)=O)C=C1)OC HCUVEUVIUAJXRB-UHFFFAOYSA-N 0.000 description 1
- 241000337007 Oceania Species 0.000 description 1
- 241000625726 Oceanimonas Species 0.000 description 1
- 108010016076 Octreotide Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 101150056612 PPIA gene Proteins 0.000 description 1
- 241000194105 Paenibacillus polymyxa Species 0.000 description 1
- 102000019280 Pancreatic lipases Human genes 0.000 description 1
- 108050006759 Pancreatic lipases Proteins 0.000 description 1
- 102000006461 Parathyroid Hormone Receptors Human genes 0.000 description 1
- 108010058828 Parathyroid Hormone Receptors Proteins 0.000 description 1
- 102100032256 Parathyroid hormone/parathyroid hormone-related peptide receptor Human genes 0.000 description 1
- 101710180613 Parathyroid hormone/parathyroid hormone-related peptide receptor Proteins 0.000 description 1
- 101710167374 Peptidase 1 Proteins 0.000 description 1
- 101800005149 Peptide B Proteins 0.000 description 1
- 108010013639 Peptidoglycan Proteins 0.000 description 1
- 102000004270 Peptidyl-Dipeptidase A Human genes 0.000 description 1
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 1
- 108010020062 Peptidylprolyl Isomerase Proteins 0.000 description 1
- 102000009658 Peptidylprolyl Isomerase Human genes 0.000 description 1
- 108010081690 Pertussis Toxin Proteins 0.000 description 1
- 241001670033 Phaseolibacter flectens Species 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- BTAIJUBAGLVFKQ-BVSLBCMMSA-N Phe-Trp-Val Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C(C)C)C(O)=O)C1=CC=CC=C1 BTAIJUBAGLVFKQ-BVSLBCMMSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 1
- 241000224016 Plasmodium Species 0.000 description 1
- 101000983333 Plasmodium falciparum (isolate NF54) 25 kDa ookinete surface antigen Proteins 0.000 description 1
- 101900205473 Plasmodium falciparum Circumsporozoite protein Proteins 0.000 description 1
- 241000223810 Plasmodium vivax Species 0.000 description 1
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 1
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 1
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- YSUZKYSRAFNLRB-ULQDDVLXSA-N Pro-Gln-Trp Chemical compound N([C@@H](CCC(=O)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 YSUZKYSRAFNLRB-ULQDDVLXSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- BEPSGCXDIVACBU-IUCAKERBSA-N Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BEPSGCXDIVACBU-IUCAKERBSA-N 0.000 description 1
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- NBDHWLZEMKSVHH-UVBJJODRSA-N Pro-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 NBDHWLZEMKSVHH-UVBJJODRSA-N 0.000 description 1
- FYXCBXDAMPEHIQ-FHWLQOOXSA-N Pro-Trp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O FYXCBXDAMPEHIQ-FHWLQOOXSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 1
- 102100038358 Prostate-specific antigen Human genes 0.000 description 1
- 102000007327 Protamines Human genes 0.000 description 1
- 108010007568 Protamines Proteins 0.000 description 1
- 108010023294 Protease La Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 101710132807 Protein P5 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 1
- 241001135311 Pseudoalteromonas nigrifaciens Species 0.000 description 1
- 241000947836 Pseudomonadaceae Species 0.000 description 1
- 241001248479 Pseudomonadales Species 0.000 description 1
- 241000028636 Pseudomonas abietaniphila Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000168225 Pseudomonas alcaligenes Species 0.000 description 1
- 241001459308 Pseudomonas alcaliphila Species 0.000 description 1
- 241001522136 Pseudomonas alginovora Species 0.000 description 1
- 241001325442 Pseudomonas andersonii Species 0.000 description 1
- 241000520869 Pseudomonas anguilliseptica Species 0.000 description 1
- 241000520871 Pseudomonas asplenii Species 0.000 description 1
- 241000202216 Pseudomonas avellanae Species 0.000 description 1
- 241001279845 Pseudomonas balearica Species 0.000 description 1
- 241000226031 Pseudomonas brassicacearum Species 0.000 description 1
- 241000620655 Pseudomonas brenneri Species 0.000 description 1
- 241000204712 Pseudomonas caricapapayae Species 0.000 description 1
- 241000180027 Pseudomonas cedrina Species 0.000 description 1
- 241001646398 Pseudomonas chlororaphis Species 0.000 description 1
- 241001670013 Pseudomonas chlororaphis subsp. aurantiaca Species 0.000 description 1
- 241001508466 Pseudomonas cichorii Species 0.000 description 1
- 241000520873 Pseudomonas citronellolis Species 0.000 description 1
- 241000647960 Pseudomonas coronafaciens pv. coronafaciens Species 0.000 description 1
- 241000218936 Pseudomonas corrugata Species 0.000 description 1
- 241000168053 Pseudomonas denitrificans (nomen rejiciendum) Species 0.000 description 1
- 241000946440 Pseudomonas diterpeniphila Species 0.000 description 1
- 241000520898 Pseudomonas ficuserectae Species 0.000 description 1
- 241001148192 Pseudomonas flavescens Species 0.000 description 1
- 241000960597 Pseudomonas fluorescens group Species 0.000 description 1
- 241000490004 Pseudomonas fuscovaginae Species 0.000 description 1
- 241001312498 Pseudomonas gessardii Species 0.000 description 1
- 241000620589 Pseudomonas grimontii Species 0.000 description 1
- 241000520899 Pseudomonas halodenitrificans Species 0.000 description 1
- 241001531427 Pseudomonas hydrogenovora Species 0.000 description 1
- 241001300822 Pseudomonas jessenii Species 0.000 description 1
- 241001277052 Pseudomonas libanensis Species 0.000 description 1
- 241000357050 Pseudomonas lini Species 0.000 description 1
- 241000218905 Pseudomonas luteola Species 0.000 description 1
- 241001277679 Pseudomonas mandelii Species 0.000 description 1
- 241000145542 Pseudomonas marginata Species 0.000 description 1
- 241001670064 Pseudomonas meliae Species 0.000 description 1
- 241001312486 Pseudomonas migulae Species 0.000 description 1
- 241001291501 Pseudomonas monteilii Species 0.000 description 1
- 241001312420 Pseudomonas mosselii Species 0.000 description 1
- 241000204709 Pseudomonas mucidolens Species 0.000 description 1
- 241000218904 Pseudomonas oryzihabitans Species 0.000 description 1
- 241001670066 Pseudomonas pertucinogena Species 0.000 description 1
- 241001223182 Pseudomonas plecoglossicida Species 0.000 description 1
- 241000589630 Pseudomonas pseudoalcaligenes Species 0.000 description 1
- 241000530526 Pseudomonas psychrophila Species 0.000 description 1
- 241000520900 Pseudomonas resinovorans Species 0.000 description 1
- 241001291486 Pseudomonas rhodesiae Species 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241000218901 Pseudomonas straminea Species 0.000 description 1
- 241000589614 Pseudomonas stutzeri Species 0.000 description 1
- 241000218902 Pseudomonas synxantha Species 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- 241000218903 Pseudomonas taetrolens Species 0.000 description 1
- 241001478288 Pseudomonas thermocarboxydovorans Species 0.000 description 1
- 241001669634 Pseudomonas thivervalensis Species 0.000 description 1
- 241001148199 Pseudomonas tolaasii Species 0.000 description 1
- 241000369631 Pseudomonas vancouverensis Species 0.000 description 1
- 241001291485 Pseudomonas veronii Species 0.000 description 1
- 241001464820 Pseudomonas viridiflava Species 0.000 description 1
- 241000039948 Pseudomonas xiamenensis Species 0.000 description 1
- 108090000919 Pyroglutamyl-Peptidase I Proteins 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000232299 Ralstonia Species 0.000 description 1
- 101001091368 Rattus norvegicus Glandular kallikrein-7, submandibular/renal Proteins 0.000 description 1
- 101000658294 Rattus norvegicus Thioredoxin-like protein 1 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 108090000783 Renin Proteins 0.000 description 1
- 102100028255 Renin Human genes 0.000 description 1
- 101710202964 Replicative DNA helicase Proteins 0.000 description 1
- 241001633102 Rhizobiaceae Species 0.000 description 1
- 102100022135 S-arrestin Human genes 0.000 description 1
- 101710117586 S-arrestin Proteins 0.000 description 1
- 101100119348 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) EXP1 gene Proteins 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101710084578 Short neurotoxin 1 Proteins 0.000 description 1
- 241001135312 Sinorhizobium Species 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 241000736131 Sphingomonas Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000122971 Stenotrophomonas Species 0.000 description 1
- 241001670040 Stenotrophomonas pictorum Species 0.000 description 1
- 101100269618 Streptococcus pneumoniae serotype 4 (strain ATCC BAA-334 / TIGR4) aliA gene Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108010039185 Tenecteplase Proteins 0.000 description 1
- 241000206217 Teredinibacter Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 102000035100 Threonine proteases Human genes 0.000 description 1
- 108091005501 Threonine proteases Proteins 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- 101710182532 Toxin a Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- OQMQBYOEAHVCGD-GQGQLFGLSA-N Trp-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OQMQBYOEAHVCGD-GQGQLFGLSA-N 0.000 description 1
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 1
- 108060005989 Tryptase Proteins 0.000 description 1
- 102000001400 Tryptase Human genes 0.000 description 1
- 108010057266 Type A Botulinum Toxins Proteins 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- 102400000757 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- NWDOPHYLSORNEX-QXEWZRGKSA-N Val-Asn-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N NWDOPHYLSORNEX-QXEWZRGKSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 1
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- GXBMIBRIOWHPDT-UHFFFAOYSA-N Vasopressin Natural products N1C(=O)C(CC=2C=C(O)C=CC=2)NC(=O)C(N)CSSCC(C(=O)N2C(CCC2)C(=O)NC(CCCN=C(N)N)C(=O)NCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(CCC(N)=O)NC(=O)C1CC1=CC=CC=C1 GXBMIBRIOWHPDT-UHFFFAOYSA-N 0.000 description 1
- 108010004977 Vasopressins Proteins 0.000 description 1
- 102000002852 Vasopressins Human genes 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 101000936049 Vibrio cholerae serotype O1 (strain ATCC 39315 / El Tor Inaba N16961) Outer membrane lipoprotein Blc Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 244000273928 Zingiber officinale Species 0.000 description 1
- 235000006886 Zingiber officinale Nutrition 0.000 description 1
- 241001670036 [Pseudomonas] cissicola Species 0.000 description 1
- 241001670030 [Pseudomonas] geniculata Species 0.000 description 1
- 241001670027 [Pseudomonas] hibiscicola Species 0.000 description 1
- 108010023617 abarelix Proteins 0.000 description 1
- AIWRTTMUVOZGPW-HSPKUQOVSA-N abarelix Chemical compound C([C@@H](C(=O)N[C@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCNC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@H](C)C(N)=O)N(C)C(=O)[C@H](CO)NC(=O)[C@@H](CC=1C=NC=CC=1)NC(=O)[C@@H](CC=1C=CC(Cl)=CC=1)NC(=O)[C@@H](CC=1C=C2C=CC=CC2=CC=1)NC(C)=O)C1=CC=C(O)C=C1 AIWRTTMUVOZGPW-HSPKUQOVSA-N 0.000 description 1
- 229960002184 abarelix Drugs 0.000 description 1
- 229960000446 abciximab Drugs 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 125000004442 acylamino group Chemical group 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 229960004733 albiglutide Drugs 0.000 description 1
- OGWAVGNOAMXIIM-UHFFFAOYSA-N albiglutide Chemical compound O=C(O)C(NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)C(NC(=O)CNC(=O)C(NC(=O)CNC(=O)C(N)CC=1(N=CNC=1))CCC(=O)O)C(O)C)CC2(=CC=CC=C2))C(O)C)CO)CC(=O)O)C(C)C)CO)CO)CC3(=CC=C(O)C=C3))CC(C)C)CCC(=O)O)CCC(=O)N)C)C)CCCCN)CCC(=O)O)CC4(=CC=CC=C4))C(CC)C)C)CC=6(C5(=C(C=CC=C5)NC=6)))CC(C)C)C(C)C)CCCCN)CCCNC(=N)N OGWAVGNOAMXIIM-UHFFFAOYSA-N 0.000 description 1
- 229960000548 alemtuzumab Drugs 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 229960003318 alteplase Drugs 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 229960004238 anakinra Drugs 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- RWZYAGGXGHYGMB-UHFFFAOYSA-N anthranilic acid Chemical compound NC1=CC=CC=C1C(O)=O RWZYAGGXGHYGMB-UHFFFAOYSA-N 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000004019 antithrombin Substances 0.000 description 1
- 229940112930 apidra Drugs 0.000 description 1
- RCHHVVGSTHAVPF-ZPHPLDECSA-N apidra Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H]1CSSC[C@H]2C(=O)N[C@H](C(=O)N[C@@H](CO)C(=O)N[C@H](C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3C=CC(O)=CC=3)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=3N=CNC=3)NC(=O)[C@H](CO)NC(=O)CNC1=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O)=O)CSSC[C@@H](C(N2)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)[C@@H](C)CC)[C@@H](C)O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CNC=N1 RCHHVVGSTHAVPF-ZPHPLDECSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- KBZOIRJILGZLEJ-LGYYRGKSSA-N argipressin Chemical compound C([C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSC[C@@H](C(N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)=O)N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(N)=O)C1=CC=CC=C1 KBZOIRJILGZLEJ-LGYYRGKSSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960003272 asparaginase Drugs 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 101150015181 benA gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 108010055460 bivalirudin Proteins 0.000 description 1
- OIRCOABEOLEUMC-GEJPAHFPSA-N bivalirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 OIRCOABEOLEUMC-GEJPAHFPSA-N 0.000 description 1
- 229960001500 bivalirudin Drugs 0.000 description 1
- 229960000182 blood factors Drugs 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- 229940094657 botulinum toxin type a Drugs 0.000 description 1
- 235000019835 bromelain Nutrition 0.000 description 1
- XQMUOIMHJMRRGK-UHFFFAOYSA-M bromolead Chemical compound [Pb]Br XQMUOIMHJMRRGK-UHFFFAOYSA-M 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229950001178 capromab Drugs 0.000 description 1
- 108010030445 carboxyl-terminal parathyroid hormone Proteins 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 229950008486 carperitide Drugs 0.000 description 1
- 108010018550 caspase 13 Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001876 chaperonelike Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 102000021178 chitin binding proteins Human genes 0.000 description 1
- 108091011157 chitin binding proteins Proteins 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 229940015047 chorionic gonadotropin Drugs 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000007697 cis-trans-isomerization reaction Methods 0.000 description 1
- 101150036359 clpB gene Proteins 0.000 description 1
- 101150096566 clpX gene Proteins 0.000 description 1
- 229940105778 coagulation factor viii Drugs 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 229960005099 collagenase clostridium histolyticum Drugs 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 108090000200 cucumisin Proteins 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-XVFCMESISA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-XVFCMESISA-N 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 229960002806 daclizumab Drugs 0.000 description 1
- 229940018872 dalteparin sodium Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000006240 deamidation Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 239000013578 denaturing buffer Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- AAOVKJBEBIDNHE-UHFFFAOYSA-N diazepam Chemical compound N=1CC(=O)N(C)C2=CC=C(Cl)C=C2C=1C1=CC=CC=C1 AAOVKJBEBIDNHE-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 1
- 229960005156 digoxin Drugs 0.000 description 1
- 108010034479 digoxin antibodies Fab fragments Proteins 0.000 description 1
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- PCHPORCSPXIHLZ-UHFFFAOYSA-N diphenhydramine hydrochloride Chemical compound [Cl-].C=1C=CC=CC=1C(OCC[NH+](C)C)C1=CC=CC=C1 PCHPORCSPXIHLZ-UHFFFAOYSA-N 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 101150115114 dnaJ gene Proteins 0.000 description 1
- 108010067396 dornase alfa Proteins 0.000 description 1
- 229960002224 eculizumab Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 229960005153 enoxaparin sodium Drugs 0.000 description 1
- 230000001454 enterotrophic effect Effects 0.000 description 1
- 229960001904 epirubicin Drugs 0.000 description 1
- 108010067416 epoetin delta Proteins 0.000 description 1
- 229950002109 epoetin delta Drugs 0.000 description 1
- 229960004468 eptifibatide Drugs 0.000 description 1
- GLGOPUHVAZCPRB-LROMGURASA-N eptifibatide Chemical compound N1C(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CCCCNC(=N)N)NC(=O)CCSSC[C@@H](C(N)=O)NC(=O)[C@@H]2CCCN2C(=O)[C@@H]1CC1=CN=C2[C]1C=CC=C2 GLGOPUHVAZCPRB-LROMGURASA-N 0.000 description 1
- 239000002329 esterase inhibitor Substances 0.000 description 1
- 229960000403 etanercept Drugs 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 108700002148 exportin 1 Proteins 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000003527 fibrinolytic agent Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- MYDZUHZYHKZGBW-UHFFFAOYSA-N formamide;sodium Chemical compound [Na].NC=O MYDZUHZYHKZGBW-UHFFFAOYSA-N 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 108010062699 gamma-Glutamyl Hydrolase Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000008397 ginger Nutrition 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 229930182478 glucoside Natural products 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 229960001442 gonadorelin Drugs 0.000 description 1
- 229960003690 goserelin acetate Drugs 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 230000007085 granulocyte colony-stimulating factor production Effects 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 108010085742 growth hormone-releasing peptide-2 Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 101150002138 grxA gene Proteins 0.000 description 1
- 101150073747 grxB gene Proteins 0.000 description 1
- 101150007702 grxC gene Proteins 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 229940025294 hemin Drugs 0.000 description 1
- BTIJJDXEELBZFS-QDUVMHSLSA-K hemin Chemical compound CC1=C(CCC(O)=O)C(C=C2C(CCC(O)=O)=C(C)\C(N2[Fe](Cl)N23)=C\4)=N\C1=C/C2=C(C)C(C=C)=C3\C=C/1C(C)=C(C=C)C/4=N\1 BTIJJDXEELBZFS-QDUVMHSLSA-K 0.000 description 1
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 1
- CBCIHIVRDWLAME-UHFFFAOYSA-N hexanitrodiphenylamine Chemical compound [O-][N+](=O)C1=CC([N+](=O)[O-])=CC([N+]([O-])=O)=C1NC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O CBCIHIVRDWLAME-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000003668 hormone analog Substances 0.000 description 1
- 102000056614 human NPPA Human genes 0.000 description 1
- 102000058004 human PTH Human genes 0.000 description 1
- 229960002661 human antihemophilic factor Drugs 0.000 description 1
- 229960002773 hyaluronidase Drugs 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 108091006086 inhibitor proteins Proteins 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 108700039926 insulin glulisine Proteins 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960004461 interferon beta-1a Drugs 0.000 description 1
- 229960003161 interferon beta-1b Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010076401 isopeptidase Proteins 0.000 description 1
- BJHIKXHVCXFQLS-OTWZMJIISA-N keto-L-sorbose Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)C(=O)CO BJHIKXHVCXFQLS-OTWZMJIISA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940060975 lantus Drugs 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 229940102988 levemir Drugs 0.000 description 1
- UGOZVNFCFYTPAZ-IOXYNQHNSA-N levemir Chemical compound CCCCCCCCCCCCCC(=O)NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H]1NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=2N=CNC=2)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=2C=CC=CC=2)C(C)C)CSSC[C@@H]2NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(C)C)CSSC[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC2=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CSSC1)C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 UGOZVNFCFYTPAZ-IOXYNQHNSA-N 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 108010024409 linaclotide Proteins 0.000 description 1
- KXGCNMMJRFDFNR-WDRJZQOASA-N linaclotide Chemical compound C([C@H](NC(=O)[C@@H]1CSSC[C@H]2C(=O)N[C@H]3CSSC[C@H](N)C(=O)N[C@H](C(N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N2)=O)CSSC[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]2CCCN2C(=O)[C@H](CC(N)=O)NC3=O)C(=O)N[C@H](C(NCC(=O)N1)=O)[C@H](O)C)C(O)=O)C1=CC=C(O)C=C1 KXGCNMMJRFDFNR-WDRJZQOASA-N 0.000 description 1
- 229960000812 linaclotide Drugs 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229960002701 liraglutide Drugs 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 235000011147 magnesium chloride Nutrition 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 229940049920 malate Drugs 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000003228 microsomal effect Effects 0.000 description 1
- 239000006151 minimal media Substances 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- BLCLNMBMMGCOAS-UHFFFAOYSA-N n-[1-[[1-[[1-[[1-[[1-[[1-[[1-[2-[(carbamoylamino)carbamoyl]pyrrolidin-1-yl]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-[(2-methylpropan-2-yl)oxy]-1-oxopropan-2-yl]amino]-3-(4-hydroxyphenyl)-1-oxopropan-2-yl]amin Chemical compound C1CCC(C(=O)NNC(N)=O)N1C(=O)C(CCCN=C(N)N)NC(=O)C(CC(C)C)NC(=O)C(COC(C)(C)C)NC(=O)C(NC(=O)C(CO)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C(CC=1NC=NC=1)NC(=O)C1NC(=O)CC1)CC1=CC=C(O)C=C1 BLCLNMBMMGCOAS-UHFFFAOYSA-N 0.000 description 1
- 229950003543 nadroparin calcium Drugs 0.000 description 1
- CMWTZPSULFXXJA-VIFPVBQESA-N naproxen Chemical compound C1=C([C@H](C)C(O)=O)C=CC2=CC(OC)=CC=C21 CMWTZPSULFXXJA-VIFPVBQESA-N 0.000 description 1
- 229960005027 natalizumab Drugs 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 229940029345 neupogen Drugs 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 229940112879 novolog Drugs 0.000 description 1
- 229960002700 octreotide Drugs 0.000 description 1
- 229960000470 omalizumab Drugs 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 230000011164 ossification Effects 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 229960000402 palivizumab Drugs 0.000 description 1
- 229940116369 pancreatic lipase Drugs 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108700037519 pegvisomant Proteins 0.000 description 1
- 229960002995 pegvisomant Drugs 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 1
- 229960003465 pentetreotide Drugs 0.000 description 1
- 108700023050 pentetreotide Proteins 0.000 description 1
- 108010091748 peptide A Proteins 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229940012957 plasmin Drugs 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- QWOXSTGOGUNUGF-UHFFFAOYSA-N platynecine Natural products C1CC(O)C2C(CO)CCN21 QWOXSTGOGUNUGF-UHFFFAOYSA-N 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 235000015277 pork Nutrition 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 229960000208 pralmorelin Drugs 0.000 description 1
- 229960003611 pramlintide Drugs 0.000 description 1
- 108010029667 pramlintide Proteins 0.000 description 1
- NRKVKVQDUCJPIZ-MKAGXXMWSA-N pramlintide acetate Chemical compound C([C@@H](C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 NRKVKVQDUCJPIZ-MKAGXXMWSA-N 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 101150108812 proC gene Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 229940048914 protamine Drugs 0.000 description 1
- 108010043535 protease S Proteins 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 229940024790 prothrombin complex concentrate Drugs 0.000 description 1
- 101150038570 prtB gene Proteins 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 108700027806 rGLP-1 Proteins 0.000 description 1
- 239000002516 radical scavenger Substances 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108010013773 recombinant FVIIa Proteins 0.000 description 1
- 229940038514 recombinant coagulation factor viia Drugs 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 201000010174 renal carcinoma Diseases 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052703 rhodium Inorganic materials 0.000 description 1
- 239000010948 rhodium Substances 0.000 description 1
- MHOVAHRLVXNVSD-UHFFFAOYSA-N rhodium atom Chemical compound [Rh] MHOVAHRLVXNVSD-UHFFFAOYSA-N 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 108010074523 rimabotulinumtoxinB Proteins 0.000 description 1
- 229960004641 rituximab Drugs 0.000 description 1
- 101150116624 rotA gene Proteins 0.000 description 1
- YGSDEFSMJLZEOE-UHFFFAOYSA-M salicylate Chemical compound OC1=CC=CC=C1C([O-])=O YGSDEFSMJLZEOE-UHFFFAOYSA-M 0.000 description 1
- 229960001860 salicylate Drugs 0.000 description 1
- 235000020046 sherry Nutrition 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 108700031632 somatrem Proteins 0.000 description 1
- 229960003259 somatrem Drugs 0.000 description 1
- 229960004532 somatropin Drugs 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229910052713 technetium Inorganic materials 0.000 description 1
- GKLVYJBZJHMRIY-UHFFFAOYSA-N technetium atom Chemical compound [Tc] GKLVYJBZJHMRIY-UHFFFAOYSA-N 0.000 description 1
- 229960000216 tenecteplase Drugs 0.000 description 1
- CIJQTPFWFXOSEO-NDMITSJXSA-J tetrasodium;(2r,3r,4s)-2-[(2r,3s,4r,5r,6s)-5-acetamido-6-[(1r,2r,3r,4r)-4-[(2r,3s,4r,5r,6r)-5-acetamido-6-[(4r,5r,6r)-2-carboxylato-4,5-dihydroxy-6-[[(1r,3r,4r,5r)-3-hydroxy-4-(sulfonatoamino)-6,8-dioxabicyclo[3.2.1]octan-2-yl]oxy]oxan-3-yl]oxy-2-(hydroxy Chemical compound [Na+].[Na+].[Na+].[Na+].O([C@@H]1[C@@H](COS(O)(=O)=O)O[C@@H]([C@@H]([C@H]1O)NC(C)=O)O[C@@H]1C(C[C@H]([C@@H]([C@H]1O)O)O[C@@H]1[C@@H](CO)O[C@H](OC2C(O[C@@H](OC3[C@@H]([C@@H](NS([O-])(=O)=O)[C@@H]4OC[C@H]3O4)O)[C@H](O)[C@H]2O)C([O-])=O)[C@H](NC(C)=O)[C@H]1C)C([O-])=O)[C@@H]1OC(C([O-])=O)=C[C@H](O)[C@H]1O CIJQTPFWFXOSEO-NDMITSJXSA-J 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229960000103 thrombolytic agent Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- YXFVVABEGXRONW-UHFFFAOYSA-N toluene Substances CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 229960005267 tositumomab Drugs 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229940026454 tresiba Drugs 0.000 description 1
- 101150118060 trxA gene Proteins 0.000 description 1
- 101150057627 trxB gene Proteins 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 229940072690 valium Drugs 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 229960003726 vasopressin Drugs 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/53—Colony-stimulating factor [CSF]
- C07K14/535—Granulocyte CSF; Granulocyte-macrophage CSF
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/62—Insulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/635—Parathyroid hormone, i.e. parathormone; Parathyroid hormone-related peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6421—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
- C12N9/6424—Serine endopeptidases (3.4.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
- C12Y304/21009—Enteropeptidase (3.4.21.9), i.e. enterokinase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/35—Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Toxicology (AREA)
- Endocrinology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Diabetes (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 의약 분야, 특히, 관심 폴리펩티드에 연결된 N-말단 융합 파트너를 포함하는 융합 단백질의 일부로서의 가용성 재조합 폴리펩티드의 대량 생산에 관한 것이다.
Description
이종 재조합 폴리펩티드는 단백질 분해, 낮은 발현 수준, 결과적으로 낮은 가용성을 가져올 수 있는 부적합한 단백질 폴딩(folding), 및 숙주 세포로부터 저조한 분비를 포함한 원인으로 인해 대개 박테리아 발현 시스템에서 고수율로 발현하기 어렵다.
발명의 개요
본 발명은 관심 폴리펩티드를 포함하는 재조합 융합 단백질을 제공한다. 기재되는 재조합 융합 단백질의 일부로서 관심 폴리펩티드의 발현은 고품질의 폴리펩티드의 대량 생산을 가능하게 한다. 관심 폴리펩티드는 작거나 신속하게 분해되는 펩티드, 예를 들어, 부갑상선 호르몬 N-말단의 단편(PTH 1-34), 분해되기 쉬운 N-말단을 가진 단백질, 예를 들어, GCSF 및 피. 팔시파룸(P. falciparum ) 포자소체 단백질, 및 전형적으로 미생물 발현 시스템에서 불용성 형태로 생산되는 단백질, 예를 들어, 인슐린 또는 인슐린 유사체로 프로세싱될 수 있는 프로인슐린, GCSF, 또는 IFN-β를 포함한다. 도 1에 개략적으로 나타낸 재조합 융합 단백질은 N-말단의 박테리아 융합 파트너, 예를 들어, 박테리아 샤프론 또는 폴딩 조절 인자를 포함한다. 관심 폴리펩티드와 N-말단의 박테리아 샤프론 또는 폴딩 조절 인자는 프로테아제 절단 부위를 포함하는 가요성 링커 서열에 의해 연결된다. 관심 폴리펩티드는 절단될 때 N-말단 융합 파트너로부터 유리된다. 또한, 본 발명은 재조합 융합 단백질의 발현 벡터, 및 박테리아 숙주 세포에서 고수율의 재조합 융합 단백질의 생산 방법을 개시한다.
본 발명의 재조합 융합 구조물은 예를 들어, 단백질 분해, 낮은 발현 수준, 불량한 폴딩, 및/또는 저조한 분비로 인해 박테리아 발현 시스템에서 과발현하기 어려운 관심의 재조합 폴리펩티드를 고수율로 생산하는데 유용하다. 본 발명의 실시양태에서, 본 발명의 재조합 융합 단백질은 박테리아 숙주 세포에서 0.5 g/L 이상의 역가로 생산된다. 실시양태에서, 관심의 재조합 폴리펩티드를 과발현하기 어려운 박테리아 숙주 세포는 이. 콜라이(E. coli)이다.
예를 들어, 이전에 가용화시키기 위해 고농도의 요소(예를 들어 7 M)를 요구하는 봉입체 내의 융합 단백질의 일부로서 발현된다고 보고된 PTH 1-34 단백질이 가용성 PTH 1-34 융합 단백질의 일부로서 고역가 발현(0.5 g/L 이상)되어 생산된다는 것을 본원에서 기재한다. 게다가, 정제는 비-변성 조건, 예를 들어 4 M 이하 농도의 요소에서, 또는 요소를 함께 사용하지 않으면서 수행될 수 있다. 또한, 본 발명의 방법을 이용하여, 쉽게 분해되는 N 말단을 가진 단백질, 예를 들어, N-met-GCSF 또는 피. 팔시파룸 포자소체 단백질은 숙주 세포 프로테아제를 융합 단백질 제제로부터 제거한 후에 기재된 융합 단백질의 일부로서 생산되어 절단에 의해 N-말단 융합 파트너로부터 분리될 수 있다. 또한, 본원에서 기재되는 바와 같이, 보통 불용성 형태로 생산되는 프로인슐린은 재폴딩의 필요성을 없애면서 상당한 양의 가용성 형태의 본 발명의 재조합 융합 단백질로 생산될 수 있다.
따라서, 본 발명은 하기를 포함하는 재조합 융합 단백질을 제공한다; 박테리아 샤프론 또는 폴딩 조절 인자인 N-말단 융합 파트너; 관심 폴리펩티드; 및 N-말단 융합 파트너와 관심 폴리펩티드 사이에 절단 부위를 포함하는 링커. 실시양태에서, N-말단 융합 파트너는 DnaJ-유사 단백질; FklB 단백질 또는 이의 절두형; FrnE 단백질 또는 이의 절두형; FkpB2 단백질 또는 이의 절두형; EcpD 단백질 또는 이의 절두형; 또는 Skp 단백질 또는 이의 절두형으로부터 선택된다. 실시양태에서, N-말단 융합 파트너는 피. 플루오레센스(P. fluorescens ) DnaJ-유사 단백질; 피. 플루오레센스 FklB 단백질 또는 이의 C-말단 절두형; 피. 플루오레센스 FrnE 단백질 또는 이의 절두형; 피. 플루오레센스 FkpB2 단백질 또는 이의 C-말단 절두형; 또는 피. 플루오레센스 EcpD 단백질 또는 이의 C-말단 절두형으로부터 선택된다. 특정 실시양태에서, N-말단 융합 파트너는 C-말단으로부터 1 내지 200개 아미노산이 제거되도록 절두된 피. 플루오레센스 FklB 단백질, C-말단으로부터 1 내지 200개 아미노산이 제거되도록 절두된 피. 플루오레센스 EcpD 단백질, 또는 C-말단으로부터 1 내지 180개 아미노산이 제거되도록 절두된 피. 플루오레센스 FrnE 단백질이다. 실시양태에서, 관심 폴리펩티드는 작거나 신속하게 분해되는 펩티드; 쉽게 분해되는 N 말단을 가진 단백질; 및 전형적으로 박테리아 발현 시스템에서 불용성 형태로 발현되는 단백질로부터 선택된 발현하기 어려운 단백질이다. 실시양태에서, 관심 폴리펩티드는 작거나 신속하게 분해되는 펩티드로서, 관심 폴리펩티드는 hPTH1-34, Glp1, Glp2, IGF-1 엑세나타이드(서열 번호 37), 테두글루타이드(서열 번호 38), 프람린타이드(서열 번호 39), 지코노타이드(서열 번호 40), 베카플러민(서열 번호 42), 엔푸버타이드(서열 번호 43), 네시리타이드(서열 번호 44)로부터 선택된다. 실시양태에서, 관심 폴리펩티드는 쉽게 분해되는 N 말단을 가진 단백질로서, 관심 폴리펩티드는 N-met-GCSF 또는 피. 팔시파룸 포자소체 단백질이다. 실시양태에서, 관심 폴리펩티드는 전형적으로 박테리아 발현 시스템에서 불용성 단백질로서 발현되는 단백질로서, 관심 폴리펩티드는 인슐린 또는 인슐린 유사체로 프로세싱되는 프로인슐린, GCSF, 또는 IFN-β이다. 임의의 상기 실시양태에서, 프로인슐린 C-펩티드는 서열 번호 97; 서열 번호 98; 서열 번호 99; 또는 서열 번호 100으로부터 선택된 아미노산 서열을 갖는다. 실시양태에서, 인슐린 유사체는 인슐린 글라진, 인슐린 아스파트, 라이스프로, 글루리신, 디터머, 또는 디글루덱이다. 특정 실시양태에서, N-말단 융합 파트너는 서열 번호 2에 개시된 아미노산 서열을 갖는 피. 플루오레센스 DnaJ-유사 단백질이다. 실시양태에서, N-말단 융합 파트너는 서열 번호 4, 서열 번호 28, 서열 번호 61, 또는 서열 번호 62에 개시된 아미노산 서열을 갖는 피. 플루오레센스 FklB 단백질이다. 실시양태에서, N-말단 융합 파트너는 서열 번호 3, 서열 번호 63, 또는 서열 번호 64에 개시된 아미노산 서열을 갖는 피. 플루오레센스 FrnE 단백질이다. 실시양태에서, N-말단 융합 파트너는 서열 번호 7, 서열 번호 65, 서열 번호 66, 또는 서열 번호 67에 개시된 아미노산 서열을 갖는 피. 플루오레센스 EcpD 단백질이다. 실시양태에서, 재조합 융합 단백질 내 절단 부위는 엔테로키나아제; 트립신, 인자 Xa; 및 및 퓨린(furin)으로 이루어진 군의 절단 효소에 의해 인식된다. 청구항 제1항 내지 제15항 중 어느 한 항의 재조합 융합 단백질에서 링커는 친화성 태그를 포함한다. 특정 실시양태에서, 친화성 태그는 폴리히스티딘; FLAG 태그; myc 태그; GST 태그; MBP 태그; 칼모듈린 태그; HA 태그; E-태그; S-태그; SBP 태그; 소프태그 3; V5 태그; 및 VSV 태그로부터 선택된다. 실시양태에서, 링커는 서열 번호 9; 서열 번호 10; 서열 번호 11; 서열 번호 12; 및 서열 번호 226으로부터 선택된 아미노산 서열을 갖는다. 실시양태에서, 관심 폴리펩티드는 hPTH1-34이고, 재조합 융합 단백질은 서열 번호 45; 서열 번호 46; 및 서열 번호 47로부터 선택된 아미노산 서열을 포함한다. 실시양태에서, 관심 폴리펩티드의 등전점은 N-말단 융합 파트너의 등전점보다 적어도 약 1.5배 더 높다. 실시양태에서, 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 10% 내지 약 50%를 구성한다.
또한, 본 발명은 재조합 융합 단백질의 발현을 위한 발현 벡터를 제공한다. 실시양태에서, 발현 벡터는 상기에 기재된 임의의 실시양태에서 재조합 융합 단백질의 발현용이다. 실시양태에서, 발현 벡터는 상기 임의의 실시양태의 재조합 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함한다.
본 발명은 또한 관심 폴리펩티드의 생산 방법으로서 하기 단계를 포함하는 방법을 제공한다:
(i) 재조합 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조물을 포함하는 발현 벡터로 형질전환된 미생물 숙주 세포를 배양하는 단계; (ii) 단계 (i)의 숙주 세포를 재조합 융합 단백질을 발현하도록 유도하는 단계; (iii) 단계 (ii)의 유도된 숙주 세포에서 발현된 재조합 융합 단백질을 정제하는 단계; 및 (iv) 단계 (iii)의 정제된 재조합 융합 단백질을 링커 내 절단 부위를 인식하는 절단 효소와의 인큐베이션에 의해 절단하여 관심 폴리펩티드를 유리시킴으로써 관심 폴리펩티드를 얻는 단계. 실시양태에서, 단계 (i)의 재조합 융합 단백질은 상기에 기재된 임의의 실시양태에서 기재된 것이다. 실시양태에서, 방법은 단계 (ii)에서 발현된 융합 단백질의 발현 수준을 측정하는 단계, 단계 (iii)에서 정제된 재조합 융합 단백질의 양을 측정하는 단계, 또는 적합하게 유리된 단계 (iv)에서 얻은 관심 폴리펩티드의 양을 측정하는 단계, 또는 상기 단계들의 조합을 더 포함한다. 실시양태에서, 단계 (ii)에서 발현된 융합 단백질의 발현 수준은 0.5 g/L 이상이다. 실시양태에서, 단계 (ii)에서 발현된 융합 단백질의 발현 수준은 약 0.5 g/L 내지 약 25 g/L이다. 실시양태에서, 단계 (ii)에서 발현된 융합 단백질은 세포질로 향하게 된다. 실시양태에서, 단계 (ii)에서 발현된 융합 단백질은 주변세포질로 향하게 된다. 실시양태에서, 단계 (iv)의 인큐베이션은 약 1시간 내지 약 16시간이고, 절단효소는 엔테로키나아제이다.
실시양태에서, 단계 (iv)의 인큐베이션은 약 1 내지 약 16시간이고, 절단 효소는 엔테로키나아제이고, 이때 단계 (iv)에서 적합하게 유리된 단계 (iii)에서 정제된 재조합 융합 단백질의 양은 약 90% 내지 약 100%이다. 실시양태에서, 단계 (iv)에서 적합하게 유리된 단계 (iii)에서 정제된 재조합 융합 단백질의 양은 약 100%이다. 실시양태에서, 단계 (iii) 또는 단계 (iv)에서 얻은 관심 폴리펩티드의 양은 약 0.1 g/L 내지 약 25 g/L이다. 실시양태에서, 수득한 적합하게 분비된 관심 폴리펩티드는 가용성, 완전성, 또는 둘 다를 갖는다. 실시양태에서, 단계 (iii)은 비-변성 조건하에서 수행된다. 실시양태에서, 재조합 융합 단백질은 요소 사용 없이 가용화된다. 실시양태에서, 비-변성 조건은 비-변성 농도의 카오트로프제를 포함하는 완충액으로 단계 (ii)의 유도된 세포를 용해시키는 단계를 포함한다. 실시양태에서, 비-변성 농도의 카오트로제는 4M 미만의 요소이다.
실시양태에서, 미생물 숙주 세포는 슈도모나드( Pseudomonad ) 또는 이. 콜라이 숙주 세포이다. 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스( Pseudomonas ) 숙주 세포이다. 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스(Pseudomons fluorescens )이다.
특정 실시양태에서, 숙주 세포는 Lon(서열 번호 14); La1(서열 번호 15); AprA(서열 번호 16); HtpX(서열 번호 17); DegP1(서열 번호 18); DegP2(서열 번호 19); Npr(서열 번호 20); Prc1(서열 번호 21); Prc2(서열 번호 22); M50(서열 번호 24); PrlC(서열 번호 30); 세라리신(RXF04495)(서열 번호 227) 및 PrtB(서열 번호 23)로 이루어진 군으로부터 선택된 적어도 하나 이상의 프로테아제가 결핍된다. 관련 실시양태에서, 숙주 세포는 프로테아제 Lon(서열 번호 14), La1(서열 번호 15), 및 AprA(서열 번호 16)가 결핍된다. 실시양태에서, 숙주 세포는 프로테아제 AprA(서열 번호 16) 및 HtpX(서열 번호 17)가 결핍된다. 다른 실시양태에서, 숙주 세포는 프로테아제 Lon(서열 번호 14), La1(서열 번호 15) 및 DegP2(서열 번호 19)가 결핍된다. 실시양태에서, 숙주 세포는 프로테아제 Npr(서열 번호 20), DegP1(서열 번호 18) 및 DegP2(서열 번호 19)가 결핍된다. 관련 실시양태에서, 숙주 세포는 프로테아제 세라리신(서열 번호 227), 및 AprA(서열 번호 16)가 결핍된다.
참고의 포함
본 명세서에서 언급된 모든 출판물, 특허 및 특허 출원은 각 개별 출판물, 특허, 또는 특허 출원이 구체적으로 개별적으로 참고로 포함되었다고 명시된 것과 같은 정도로 본원에서 참고로 포함된다.
본 발명의 신규 특징은 첨부된 청구범위에서 구체적으로 개시한다. 본 발명의 원리가 이용되는 예시적인 실시양태를 개시하는 하기 상세한 설명 및 수반되는 하기 도면을 참고로 하여 본 발명의 특징 및 장점이 더 잘 이해될 것이다.
도 1. 재조합 융합 단백질을 도식으로 나타낸다. 도메인 1은 N-말단 융합 파트너에 해당하고, 도메인 2는 링커에 해당하고, 도메인 3은 관심 폴리펩티드에 해당한다. N-말단 융합 파트너 및 관심 폴리펩티드의 비제한적 예는 각각의 개별적인 도메인 아래에 열거한다.
도 2a 내지 2c. 3가지 재조합 융합 단백질 아미노산 서열이다. 관심 폴리펩티드로서 hPTH 1-34를 포함하는 3가지 재조합 융합 단백질의 아미노산 서열을 나타낸다. hPTH 1-34 서열은 각각 기울임체로 나타내고, N-말단 융합 파트너와 PTH 1-34 사이의 링커는 밑줄로 나타낸다. 2a. DnaJ-유사 단백질 N-말단 융합 파트너를 포함하는 재조합 융합 단백질. (DnaJ-유사 단백질, aa 1-77; 링커, aa 78-98; hPTH 1-34, aa 99-132.)(서열 번호 45) 2b. FklB N-말단 융합 파트너를 포함하는 재조합 융합 단백질. (FklB, aa 1- 205; 링커, aa 206-226; hPTH 1-34, aa 227-260.)(서열 번호 46) 2c. FrnE N-말단 융합 파트너를 포함하는 재조합 융합 단백질. (FrnE, aa 1-216; 링커, aa 217-237; hPTH 1-34, aa 238-271.)(서열 번호 47)
도 3. 진탕 플라스크 발현 시료의 SDS-CGE 분석이다. 시료는 3세트로 나타낸다: 도면의 맨 아래에 나타낸 바와 같이 전세포 브로쓰(레인 1-6); 무세포 브로쓰(레인 7-12); 및 가용성 분획(레인 13-18). 분자량 마커는 각 이미지의 측면에 나타낸다(맨 아래에서부터 68, 48, 29, 21, 16 kD). 3세트의 각 레인은 왼쪽에서 오른쪽으로: 레인의 위에 나타낸 바와 같이 DnaJ-유사 단백질-PTH 1-34 융합체(STR35970); DnaJ-유사 단백질-PTH 1-34 융합체(STR35984); FklB-PTH 1-34 융합체(STR36034); FklB-PTH 1-34 융합체(STR36085); FrnE-PTH 1-34 융합체(STR36150); 및 FrnE-PTH 1-34 융합체(STR36169)를 나타낸다. DnaJ-유사-PTH 융합 단백질 밴드는 실선 화살표로 표시되며 FklB-PTH 및 FrnE-PTH 융합 단백질 밴드는 파선 화살표로 표시된다.
도 4. 정제된 재조합 융합 단백질의 엔테로키나아제 절단을 나타낸다. 시료는 3세트로 나타낸다: 엔테로키나아제 미처리(레인 1-6); 엔테로키나아제 처리 40 μg/m(레인 7-12); 및 엔테로키나아제 처리 10 μg/ml(레인 13-18). 3세트의 각 레인은 왼쪽에서 오른쪽으로: DnaJ-유사 단백질-PTH 1-34 융합체(STR35970); DnaJ-유사 단백질-PTH 1-34 융합체(STR35984); FklB-PTH 1-34 융합체(STR36034); FklB-PTH 1-34 융합체(STR36085); FrnE-PTH 1-34 융합체(STR36150); 및 FrnE-PTH 1-34 융합체(STR36169)를 나타낸다. DnaJ-유사 융합 단백질의 이동은 아래 화살표 쌍에서 실선 화살표로 나타낸다. 절단된 DnaJ-유사-단백질 N-말단 융합 파트너의 이동은 아래 화살표 쌍에서 파선 화살표로 나타낸다. FklB 및 FrnE 융합 단백질의 이동은 위 화살표 쌍에서 실선 화살표로 나타낸다. FklB 및 FrnE N-말단 융합 파트너의 이동은 위 화살표 쌍에서 파선 화살표로 나타낸다. 분자량 마커는 이미지의 오른쪽에 나타낸다(위에서 아래로 29, 20, 및 16 kD).
도 5. 엔테로키나아제 절단 산물의 원형(intact) 질량 분석이다. 발현 균주 STR35970으로부터 정제되고, 엔테로키나아제로 1시간 절단된 DnaJ-유사 단백질-PTH 1-34 융합 단백질의 디콘볼루션(deconvolution)된 질량 스펙트럼을 나타낸다. PTH 1-34에 해당하는 피크는 실선 화살표로 나타낸다.
도 6. DnaJ-유사 단백질-PTH 1-34 융합 단백질 정제 분획의 엔테로키나아제 절단이다. DnaJ-유사 단백질-PTH 융합 단백질은 통상의 생물반응기에서 배양 후 발현 균주 STR36005로부터 정제하였다. 정제 분획은 엔테로키나아제와 1시간(레인 2-4), 16시간(레인 6-8), 엔테로키나아제 없이(대조군) 1시간(레인 1), 또는 엔테로키나아제 없이(대조군) 16시간(레인 5) 인큐베이션하였다. 분석된 분획은 다음과 같다: 분획 1(레인 1, 2, 5, 및 6); 분획 2(레인 3 및 7); 및 분획 3(레인 4 및 8). 전장의 DnaJ-유사 단백질-PTH 1-34 재조합 융합 단백질 밴드는 검정 실선 화살표로 나타낸다. 절단된 DnaJ-유사 단백질-PTH 1-34 융합 파트너 밴드는 파선 화살표로 나타낸다. 분자량 마커는 이미지 각 측면에 나타낸다(위에서 아래로 49, 29, 21, 및 16 kD).
도 7a 내지 7c. FklB-PTH 1-34 융합 단백질로부터 유래한 PTH 1-34 엔테로키나아제 절단 산물의 원형 질량 분석이다. 도면은 엔테로키나아제로 절단된 FklB-PTH 1-34 융합 단백질 정제 분획에 대한 디콘볼루션된 질량 스펙트럼을 나타낸다. PTH 1-34에 해당하는 피크는 실선 화살표로 나타낸다. 7a. STR36034로부터 정제된 FklB-PTH 융합 단백질. 7b. STR36085로부터 정제된 FklB-PTH 융합 단백질. 7c. STR36098로부터 정제된 FklB-PTH 융합 단백질.
서열
본 출원은 뉴클레오티드 서열, 서열 번호 1-237을 포함하고, 이들 뉴클레오티드 서열은 청구범위 앞에 서열 표에 열거한다.
도 1. 재조합 융합 단백질을 도식으로 나타낸다. 도메인 1은 N-말단 융합 파트너에 해당하고, 도메인 2는 링커에 해당하고, 도메인 3은 관심 폴리펩티드에 해당한다. N-말단 융합 파트너 및 관심 폴리펩티드의 비제한적 예는 각각의 개별적인 도메인 아래에 열거한다.
도 2a 내지 2c. 3가지 재조합 융합 단백질 아미노산 서열이다. 관심 폴리펩티드로서 hPTH 1-34를 포함하는 3가지 재조합 융합 단백질의 아미노산 서열을 나타낸다. hPTH 1-34 서열은 각각 기울임체로 나타내고, N-말단 융합 파트너와 PTH 1-34 사이의 링커는 밑줄로 나타낸다. 2a. DnaJ-유사 단백질 N-말단 융합 파트너를 포함하는 재조합 융합 단백질. (DnaJ-유사 단백질, aa 1-77; 링커, aa 78-98; hPTH 1-34, aa 99-132.)(서열 번호 45) 2b. FklB N-말단 융합 파트너를 포함하는 재조합 융합 단백질. (FklB, aa 1- 205; 링커, aa 206-226; hPTH 1-34, aa 227-260.)(서열 번호 46) 2c. FrnE N-말단 융합 파트너를 포함하는 재조합 융합 단백질. (FrnE, aa 1-216; 링커, aa 217-237; hPTH 1-34, aa 238-271.)(서열 번호 47)
도 3. 진탕 플라스크 발현 시료의 SDS-CGE 분석이다. 시료는 3세트로 나타낸다: 도면의 맨 아래에 나타낸 바와 같이 전세포 브로쓰(레인 1-6); 무세포 브로쓰(레인 7-12); 및 가용성 분획(레인 13-18). 분자량 마커는 각 이미지의 측면에 나타낸다(맨 아래에서부터 68, 48, 29, 21, 16 kD). 3세트의 각 레인은 왼쪽에서 오른쪽으로: 레인의 위에 나타낸 바와 같이 DnaJ-유사 단백질-PTH 1-34 융합체(STR35970); DnaJ-유사 단백질-PTH 1-34 융합체(STR35984); FklB-PTH 1-34 융합체(STR36034); FklB-PTH 1-34 융합체(STR36085); FrnE-PTH 1-34 융합체(STR36150); 및 FrnE-PTH 1-34 융합체(STR36169)를 나타낸다. DnaJ-유사-PTH 융합 단백질 밴드는 실선 화살표로 표시되며 FklB-PTH 및 FrnE-PTH 융합 단백질 밴드는 파선 화살표로 표시된다.
도 4. 정제된 재조합 융합 단백질의 엔테로키나아제 절단을 나타낸다. 시료는 3세트로 나타낸다: 엔테로키나아제 미처리(레인 1-6); 엔테로키나아제 처리 40 μg/m(레인 7-12); 및 엔테로키나아제 처리 10 μg/ml(레인 13-18). 3세트의 각 레인은 왼쪽에서 오른쪽으로: DnaJ-유사 단백질-PTH 1-34 융합체(STR35970); DnaJ-유사 단백질-PTH 1-34 융합체(STR35984); FklB-PTH 1-34 융합체(STR36034); FklB-PTH 1-34 융합체(STR36085); FrnE-PTH 1-34 융합체(STR36150); 및 FrnE-PTH 1-34 융합체(STR36169)를 나타낸다. DnaJ-유사 융합 단백질의 이동은 아래 화살표 쌍에서 실선 화살표로 나타낸다. 절단된 DnaJ-유사-단백질 N-말단 융합 파트너의 이동은 아래 화살표 쌍에서 파선 화살표로 나타낸다. FklB 및 FrnE 융합 단백질의 이동은 위 화살표 쌍에서 실선 화살표로 나타낸다. FklB 및 FrnE N-말단 융합 파트너의 이동은 위 화살표 쌍에서 파선 화살표로 나타낸다. 분자량 마커는 이미지의 오른쪽에 나타낸다(위에서 아래로 29, 20, 및 16 kD).
도 5. 엔테로키나아제 절단 산물의 원형(intact) 질량 분석이다. 발현 균주 STR35970으로부터 정제되고, 엔테로키나아제로 1시간 절단된 DnaJ-유사 단백질-PTH 1-34 융합 단백질의 디콘볼루션(deconvolution)된 질량 스펙트럼을 나타낸다. PTH 1-34에 해당하는 피크는 실선 화살표로 나타낸다.
도 6. DnaJ-유사 단백질-PTH 1-34 융합 단백질 정제 분획의 엔테로키나아제 절단이다. DnaJ-유사 단백질-PTH 융합 단백질은 통상의 생물반응기에서 배양 후 발현 균주 STR36005로부터 정제하였다. 정제 분획은 엔테로키나아제와 1시간(레인 2-4), 16시간(레인 6-8), 엔테로키나아제 없이(대조군) 1시간(레인 1), 또는 엔테로키나아제 없이(대조군) 16시간(레인 5) 인큐베이션하였다. 분석된 분획은 다음과 같다: 분획 1(레인 1, 2, 5, 및 6); 분획 2(레인 3 및 7); 및 분획 3(레인 4 및 8). 전장의 DnaJ-유사 단백질-PTH 1-34 재조합 융합 단백질 밴드는 검정 실선 화살표로 나타낸다. 절단된 DnaJ-유사 단백질-PTH 1-34 융합 파트너 밴드는 파선 화살표로 나타낸다. 분자량 마커는 이미지 각 측면에 나타낸다(위에서 아래로 49, 29, 21, 및 16 kD).
도 7a 내지 7c. FklB-PTH 1-34 융합 단백질로부터 유래한 PTH 1-34 엔테로키나아제 절단 산물의 원형 질량 분석이다. 도면은 엔테로키나아제로 절단된 FklB-PTH 1-34 융합 단백질 정제 분획에 대한 디콘볼루션된 질량 스펙트럼을 나타낸다. PTH 1-34에 해당하는 피크는 실선 화살표로 나타낸다. 7a. STR36034로부터 정제된 FklB-PTH 융합 단백질. 7b. STR36085로부터 정제된 FklB-PTH 융합 단백질. 7c. STR36098로부터 정제된 FklB-PTH 융합 단백질.
서열
본 출원은 뉴클레오티드 서열, 서열 번호 1-237을 포함하고, 이들 뉴클레오티드 서열은 청구범위 앞에 서열 표에 열거한다.
개요
본 발명은 박테리아 발현 시스템에서 관심의 재조합 폴리펩티드를 과발현하기 위한 재조합 융합 단백질, 재조합 융합 단백질을 발현하는 구조물, 및 가용성 형태의 재조합 융합 단백질 및 관심의 재조합 폴리펩티드를 고수율로 생산하기 위한 방법에 관한 것이다. 실시양태에서, 본 발명의 방법은 정제 후 0.5 g/L 이상의 재조합 융합 단백질의 생산을 가능하게 한다. 실시양태에서, 본 발명의 방법은 변성 농도의 카오트로프제를 사용하지 않으면서 고수율의 재조합 융합 단백질을 생산한다. 실시양태에서, 본 발명의 방법은 카오트로프제를 전혀 사용하지 않으면서 고수율의 재조합 융합 단백질을 생산한다.
본원에서 사용되는 용어 "포함하다"("comprise") 또는 이의 변형, 예를 들어 "포함하고"("comprises") 또는 "포함하는"("comprising")는 임의의 나열된 특징을 포함하나 임의의 기타 특징을 배제하지 않는다는 것을 나타내는 것으로 이해되어야 한다. 따라서, 용어 "포함하는"은 포괄적이며 추가의 나열되지 않은 특징을 배제하지 않는다. 본원에서 제공된 임의의 조성물 및 방법의 실시양태에서, "포함하는"은 "~로 필수적으로 이루어진(consisting essentially of)" 또는 "~로 이루어진(consisting of)"으로 대체될 수 있다. 본원에서 용어 "~로 필수적으로 이루어진"은 명시된 특징(들)뿐 아니라 청구 발명의 특징 또는 기능에 실질적으로 영향을 주지 않는 것을 요구하는데 사용된다. 본원에서 사용되는 용어 "이루어진"은 열거된 특징(예를 들어 핵염기(nulceobase) 서열)만의 존재를 나타낸다(명시된 핵염기 서열로 이루어진 안티센스 올리고머일 경우, 추가의 나열되지 않은 핵염기의 존재를 배제하기 위함).
재조합 융합 단백질
본 발명의 재조합 융합 단백질은 일반적으로 도 1에 나타낸 바와 같이 3개의 도메인을 포함한다. 왼쪽으로부터, 융합 단백질은 N-말단 융합 파트너, 링커, 및 관심 폴리펩티드를 포함하며, 링커는 N-말단 융합 파트너와 관심 폴리펩티드 사이에 있고, 관심 폴리펩티드는 링커의 C-말단에 있다. 실시양태에서, 링커 서열은 프로테아제 절단 부위를 포함한다. 실시양태에서, 관심 폴리펩티드는 링커 내에 프로테아제 절단 부위에서 절단에 의해 재조합 융합 단백질로부터 유리될 수 있다.
실시양태에서, 재조합 융합 단백질의 분자량은 약 2 kDa 내지 약 1000 kDa이다. 실시양태에서, 재조합 융합 단백질의 분자량은 약 2 kDa, 약 3 kDa, 약 4 kDa, 약 5 kDa, 약 6 kDa, 약 7 kDa, 약 8 kDa, 약 9 kDa, 약 10 kDa, 약 11 kDa, 약 12 kDa, 약 13 kDa, 약 14 kDa, 약 15 kDa, 약 20 kDa, 약 25 kDa, 약 26 kDa, 약 27 kDa, 약 28 kDa, 약 30 kDa, 약 35 kDa, 약 40 kDa, 약 45 kDa, 약 50 kDa, 약 55 kDa, 약 60 kDa, 약 65 kDa, 약 70 kDa, 약 75 kDa, 약 80 kDa, 약 85 kDa, 약 90 kDa, 약 95 kDa, 약 100 kDa, 약 200 kDa, 약 300 kDa, 약 400 kDa, 약 500 kDa, 약 550 kDa, 약 600 kDa, 약 700 kDa, 약 800 kDa, 약 900 kDa, 약 1000 kDa 이상이다. 실시양태에서, 재조합 융합 단백질의 분자량은 약 2 kDa 내지 약 1000 kDa, 약 2 kDa 내지 약 500 kDa, 약 2 kDa 내지 약 250 kDa, 약 2 kDa 내지 약 100 kDa, 약 2 kDa 내지 약 50 kDa, 약 2 kDa 내지 약 25 kDa, 약 2 kDa 내지 약 30 kDa, 약 2 kDa 내지 약 1000 kDa, 약 2 kDa 내지 약 500 kDa, 약 2 kDa 내지 약 250 kDa, 약 2 kDa 내지 약 100 kDa, 약 2 kDa 내지 약 50 kDa, 약 2 kDa 내지 약 25 kDa, 약 3 kDa 내지 약 1000 kDa, 약 3 kDa 내지 약 500 kDa, 약 3 kDa 내지 약 250 kDa, 약 3 kDa 내지 약 100 kDa, 약 3 kDa 내지 약 50 kDa, 약 3 kDa 내지 약 25 kDa, 약 3 kDa 내지 약 30 kDa, 약 4 kDa 내지 약 1000 kDa, 약 4 kDa 내지 약 500 kDa, 약 4 kDa 내지 약 250 kDa, 약 4 kDa 내지 약 100 kDa, 약 4 kDa 내지 약 50 kDa, 약 4 kDa 내지 약 25 kDa, 약 4 kDa 내지 약 30 kDa, 약 5 kDa 내지 약 1000 kDa, 약 5 kDa 내지 약 500 kDa, 약 5 kDa 내지 약 250 kDa, 약 5 kDa 내지 약 100 kDa, 약 5 kDa 내지 약 50 kDa, 약 5 kDa 내지 약 25 kDa, 약 5 kDa 내지 약 30 kDa, 약 10 kDa 내지 약 1000 kDa, 약 10 kDa 내지 약 500 kDa, 약 10 kDa 내지 약 250 kDa, 약 10 kDa 내지 약 100 kDa, 약 10 kDa 내지 약 50 kDa, 약 10 kDa 내지 약 25 kDa, 약 10 kDa 내지 약 30 kDa, 약 20 kDa 내지 약 1000 kDa, 약 20 kDa 내지 약 500 kDa, 약 20 kDa 내지 약 250 kDa, 약 20 kDa 내지 약 100 kDa, 약 20 kDa 내지 약 50 kDa, 약 20 kDa 내지 약 25 kDa, 약 20 kDa 내지 약 30 kDa, 약 25 kDa 내지 약 1000 kDa, 약 25 kDa 내지 약 500 kDa, 약 25 kDa 내지 약 250 kDa, 약 25 kDa 내지 약 100 kDa, 약 25 kDa 내지 약 50 kDa, 약 25 kDa 내지 약 25 kDa, 또는 약 25 kDa 내지 약 30 kDa이다.
실시양태에서, 재조합 융합 단백질은 약 50, 100, 150, 200, 250, 300, 350, 400, 450, 470, 500, 530, 560, 590, 610, 640, 670, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800, 2000, 2500개 이상의 아미노산 길이이다. 실시양태에서, 재조합 융합 단백질은 약 50 내지 2500, 100 내지 2000, 150 내지 1800, 200 내지 1600, 250 내지 1400, 300 내지 1200, 350 내지 1000, 400 내지 950, 450 내지 900, 470 내지 850, 500 내지 800, 530 내지 750, 560 내지 700, 590 내지 670, 또는 610 내지 640개의 아미노산 길이이다.
실시양태에서, 재조합 융합 단백질은 하기로부터 선택된 N-말단 융합 파트너를 포함한다:
피. 플루오레센스 DnaJ-유사 단백질(예를 들어, 서열 번호 2), FrnE(서열 번호 3), FrnE2(서열 번호 63), FrnE3(서열 번호 64), FklB(서열 번호 4), FklB3*(서열 번호 28), FklB2(서열 번호 61), FklB3(서열 번호 62), FkpB2(서열 번호 5), SecB(서열 번호 6), SecB의 절두형, EcpD(서열 번호 7), EcpD(서열 번호 65), EcpD2(서열 번호 66), 및 EcpD3(서열 번호 67);
서열 번호 9, 10, 11, 12, 및 226으로부터 선택된 링커; 및
hPTH 1-34(서열 번호 1), Met-GCSF(서열 번호 69), rCSP, 프로인슐린(예를 들어, 인간 프로인슐린 서열 번호 32, 인슐린 글라진 프로인슐린 서열 번호 88, 89, 90, 또는 91중 어느 하나), 인슐린 라이스프로 서열 번호 33, 인슐린 글루리신 서열 번호 34), 인슐린 C-펩티드(서열 번호 97); 메카세르민(서열 번호 35), Glp-1(서열 번호 36), 엑세나타이드(서열 번호 37), 테두글루타이드(서열 번호 38), 프람린타이드(서열 번호 39), 지코노타이드(서열 번호 40), 베카플러민(서열 번호 42), 엔푸버타이드(서열 번호 43), 네시리타이드(서열 번호 44) 또는 엔테로키나아제(예를 들어, 서열 번호 31)로부터 선택된 관심 폴리펩티드.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 DnaJ-유사 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 101의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 101을 코딩하는 뉴클레오티드 서열은 서열 번호 202이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 EcpD1 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 102 또는 103의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 102 또는 103을 코딩하는 뉴클레오티드 서열은 각각 서열 번호 202 또는 228이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 EcpD2 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 104의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 104를 코딩하는 뉴클레오티드 서열은 서열 번호 204이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 EcpD3 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 105의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 105를 코딩하는 뉴클레오티드 서열은 서열 번호 205이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FklB1 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 106의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 106을 코딩하는 뉴클레오티드 서열은 서열 번호 206이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FklB2 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 107의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 107을 코딩하는 뉴클레오티드 서열은 서열 번호 207이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FklB3 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 108의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 108을 코딩하는 뉴클레오티드 서열은 서열 번호 208이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FrnE1 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 109의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 109를 코딩하는 뉴클레오티드 서열은 서열 번호 209이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FrnE2 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 110의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 110을 코딩하는 뉴클레오티드 서열은 서열 번호 210이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FrnE3 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 111의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 111을 코딩하는 뉴클레오티드 서열은 서열 번호 211이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 DnaJ-유사 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 112의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 112를 코딩하는 뉴클레오티드 서열은 서열 번호 212이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 EcpD1 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 113의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 113을 코딩하는 뉴클레오티드 서열은 각각 서열 번호 213이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 EcpD2 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 114의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 114를 코딩하는 뉴클레오티드 서열은 서열 번호 214이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 EcpD3 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 115의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 115를 코딩하는 뉴클레오티드 서열은 서열 번호 215이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FklB1 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 216의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 116을 코딩하는 뉴클레오티드 서열은 서열 번호 216이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FklB2 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 217의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 117을 코딩하는 뉴클레오티드 서열은 서열 번호 217이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FklB3 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 118의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 118을 코딩하는 뉴클레오티드 서열은 서열 번호 218이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FrnE1 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 119의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 119를 코딩하는 뉴클레오티드 서열은 서열 번호 219이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FrnE2 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 120의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 120을 코딩하는 뉴클레오티드 서열은 서열 번호 220이다.
실시양태에서, 재조합 융합 단백질은 피. 플루오레센스 FrnE3 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 121의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 121을 코딩하는 뉴클레오티드 서열은 서열 번호 221이다.
실시양태에서, 재조합 융합 단백질의 N-말단 융합 파트너, 링커, 및 관심 폴리펩티드는 각각 피. 플루오레센스 폴딩 조절 인자 DnaJ-유사 단백질(서열 번호 2), 서열 번호 9에 개시된 링커, 및 인간 부갑상선 호르몬 아미노산 1-34(hPTH 1-34)(서열 번호 1)이다. 실시양태에서, 재조합 융합 단백질의 N-말단 융합 파트너, 링커, 및 관심 폴리펩티드는 각각 피. 플루오레센스 폴딩 조절 인자 FrnE(서열 번호 3), 서열 번호 9에 개시된 링커, 및 hPTH 1-34(서열 번호 1)이다. 실시양태에서, 재조합 융합 단백질의 N-말단 융합 파트너, 링커, 및 관심 폴리펩티드는 각각 피. 플루오레센스 폴딩 조절 인자 FklB(서열 번호 4), 서열 번호 9에 개시된 링커, 및 hPTH 1-34(서열 번호 1)이다. 실시양태에서, 재조합 hPTH 융합 단백질은 서열 번호 45, 46, 및 47중 하나에 개시된 아미노산 서열을 갖는다.
실시양태에서, 재조합 융합 단백질은 하기 요소를 갖는 인슐린 융합 단백질이다:
피. 플루오레센스 DnaJ-유사 단백질(예를 들어, 서열 번호 2), FrnE(서열 번호 3), FrnE2(서열 번호 63), FrnE3(서열 번호 64), FklB(서열 번호 4), FklB3*(서열 번호 28), FklB2(서열 번호 61), FklB3(서열 번호 62), FkpB2(서열 번호 5), EcpD EcpD(서열 번호 65), EcpD2(서열 번호 66), 또는 EcpD3(서열 번호 67)로부터 선택된 N-말단 융합 파트너;
서열 번호 226에 개시된 서열을 갖는 링커; 및
글라진 프로인슐린 서열 번호 88, 89, 90, 또는 91로부터 선택된 관심 폴리펩티드.
실시양태에서, 관심 폴리펩티드는 서열 번호 80 또는 84에 개시된 뉴클레오티드 서열에 의해 코딩된 서열 번호 88에 개시된 글라진 프로인슐린이다. 실시양태에서, 관심 폴리펩티드는 서열 번호 81 또는 85에 개시된 뉴클레오티드 서열에 의해 코딩된 서열 번호 89에 개시된 글라진 프로인슐린이다. 실시양태에서, 관심 폴리펩티드는 서열 번호 82 또는 86에 개시된 뉴클레오티드 서열에 의해 코딩된 서열 번호 90에 개시된 글라진 프로인슐린이다. 실시양태에서, 관심 폴리펩티드는 서열 번호 83 또는 87에 개시된 뉴클레오티드 서열에 의해 코딩된 서열 번호 91에 개시된 인슐린 글라진 프로인슐린이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 DnaJ-유사 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 101의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 101을 코딩하는 뉴클레오티드 서열은 서열 번호 202이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 EcpD1 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 102 또는 103의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 102 또는 103을 코딩하는 뉴클레오티드 서열은 각각 서열 번호 202 또는 228이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 EcpD2 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 104의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 104를 코딩하는 뉴클레오티 서열은 서열 번호 204이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 EcpD3 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 105의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 105를 코딩하는 뉴클레오티드 서열은 서열 번호 205이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FklB1 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 106의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 106을 코딩하는 뉴클레오티드 서열은 서열 번호 206이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FklB2 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 107의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 107을 코딩하는 뉴클레오티드 서열은 서열 번호 207이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FklB3 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 108의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 108을 코딩하는 뉴클레오티드 서열은 서열 번호 208이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FrnE1 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 109의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 109를 코딩하는 뉴클레오티드 서열은 서열 번호 209이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FrnE2 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 110의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 110을 코딩하는 뉴클레오티드 서열은 서열 번호 210이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FrnE3 단백질 N-말단 융합 파트너 및 트립신 절단 부위 링커를 포함하며, 동시에 서열 번호 111의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 111을 코딩하는 뉴클레오티드 서열은 서열 번호 211이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 DnaJ-유사 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 112의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 112를 코딩하는 뉴클레오티드 서열은 서열 번호 212이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 EcpD1 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 113의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 113을 코딩하는 뉴클레오티드 서열은 각각 서열 번호 213이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 EcpD2 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 114의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 114를 코딩하는 뉴클레오티드 서열은 서열 번호 214이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 EcpD3 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 115의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 115를 코딩하는 뉴클레오티드 서열은 서열 번호 215이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FklB1 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 216의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 116을 코딩하는 뉴클레오티드 서열은 서열 번호 216이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FklB2 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 217의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 117을 코딩하는 뉴클레오티드 서열은 서열 번호 217이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FklB3 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 118의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 118을 코딩하는 뉴클레오티드 서열은 서열 번호 218이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FrnE1 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 119의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 119를 코딩하는 뉴클레오티드 서열은 서열 번호 219이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FrnE2 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 120의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 120을 코딩하는 뉴클레오티드 서열은 서열 번호 220이다.
실시양태에서, 인슐린 융합 단백질은 피. 플루오레센스 FrnE3 단백질 N-말단 융합 파트너 및 엔테로키나아제 절단 부위 링커를 포함하며, 동시에 서열 번호 121의 아미노산 서열을 갖는다. 실시양태에서, 서열 번호 121을 코딩하는 뉴클레오티드 서열은 서열 번호 221이다.
실시양태에서, 재조합 인슐린 융합 단백질은 서열 번호 122 내지 201 중 하나에 개시된 아미노산 서열을 갖는다.
실시양태에서, 재조합 융합 단백질은 하기 요소를 갖는 GCSF 융합 단백질이다:
피. 플루오레센스 DnaJ-유사 단백질(예를 들어, 서열 번호 2), FrnE(서열 번호 3), FrnE2(서열 번호 63), FrnE3(서열 번호 64), FklB(서열 번호 4), FklB3*(서열 번호 28), FklB2(서열 번호 61), FklB3(서열 번호 62), FkpB2(서열 번호 5), EcpD EcpD(서열 번호 65), EcpD2(서열 번호 66), 또는 EcpD3(서열 번호 67)로부터 선택된 N-말단 융합 파트너;
서열 번호 9에 개시된 서열을 갖는 링커; 및
서열 번호 68에 개시된 서열을 갖는 관심 폴리펩티드.
관심 폴리펩티드
관심의 C-말단 폴리펩티드, 관심의 재조합 폴리펩티드, 및 C-말단 융합 파트너로도 언급되는 재조합 융합 단백질의 관심의 단백질 또는 폴리펩티드는 가용성 형태로 고수율로 발현되기를 요망하는 폴리펩티드이다. 실시양태에서, 관심 폴리펩티드는, 예를 들어, 단백질 분해, 낮은 발현 수준, 부적합한 단백질 폴딩, 및/또는 숙주 세포로부터 저조한 분비로 인해 박테리아 발현 시스템에서 고수율로 발현되지 않는 것으로 확인된 이종 폴리펩티드이다. 관심 폴리펩티드는 작거나 신속하게 분해되는 펩티드, 분해되기 쉬운 N-말단을 가진 단백질, 및 전형적으로 미생물 또는 박테리아 발현 시스템에서 불용성 형태로 생산되는 단백질을 포함한다. 실시양태에서, 관심 폴리펩티드의 N-말단은 N-말단 융합 파트너에 융합되어 있는 동안 분해로부터 보호되어, 결과적으로 더 높은 수율의 N-말단이 완전한 단백질을 가져온다. 실시양태에서, 이종 폴리펩티드는 미생물 또는 박테리아 발현 시스템에서 가용성 형태로 고수율로 발현되지 않는 것으로 개시되었다. 예를 들어, 실시양태에서, 이종 폴리펩티드는 이. 콜라이, 비. 섭틸리스(B. subtilis ), 또는 엘. 플란타럼(L. plantarum ), 엘. 카제이(L. casei ), 엘. 퍼멘툼(L. fermentum ) 또는 코리네박테리움 글루타미쿰( Corynebacterium glutamicum ) 숙주 세포에서 가용성 형태로 고수율로 발현되지 않는 것으로 개시되었다. 실시양태에서, 관심 폴리펩티드는 진핵생물의 폴리펩티드이거나 진핵 폴리펩티드로부터 유래한다(예를 들어, 진핵생물의 폴리펩티드의 유사체이다). 실시양태에서, 관심 폴리펩티드는 포유동물 폴리펩티드 또는 포유동물 폴리펩티드로부터 유래한다. 실시양태에서, 관심 폴리펩티드는 인간 폴리펩티드 또는 인간 폴리펩티드로부터 유래한다. 실시양태에서, 관심 폴리펩티드는 원핵생물 폴리펩티드 또는 원핵생물의 폴리펩티드로부터 유래한다. 실시양태에서, 관심 폴리펩티드는 미생물 폴리펩티드 또는 미생물 폴리펩티드로부터 유래한다. 실시양태에서, 관심 폴리펩티드는 박테리아 폴리펩티드 또는 박테리아 폴리펩티드로부터 유래한다. "이종"은 관심 폴리펩티드가 발현 숙주 세포 이외의 생물체로부터 유래한다는 것을 의미한다. 실시양태에서, 융합 단백질 및/또는 관심 폴리펩티드는 또 다른 미생물 발현 시스템에서보다 본 발명의 방법에 따라서 슈도모나드 숙주 세포(즉, 슈도모다스목(Pseudomonadales)의 숙주 세포)에서 고수율로 생산된다. 실시양태에서, 융합 단백질 또는 관심 폴리펩티드는 실질적으로 비슷한 조건하에서 이. 콜라이 또는 기타 미생물 또는 박테리아 발현 시스템, 예를 들어, 상기에 열거된 것들에서보다 본 발명의 방법에 따라서 슈도모나드, 슈도모나스, 또는 슈도모나스 플루오레센스 발현 시스템에서 고수율로, 예를 들어, 약 1.5배 내지 약 10배, 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 5배, 또는 약 10배 이상 생산된다. 실시양태에서, 융합 단백질 또는 C-말단 폴리펩티드는 이. 콜라이 발현 시스템에서 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만, 또는 0.1 g/ℓ 미만의 수율로 생산된다.
실시양태에서, 관심 폴리펩티드는 작고/거나 신속하게 분해되는 펩티드이다. 실시양태에서, 작고/거나 신속하게 분해되는 펩티드는 부갑상선 호르몬(PTH: Parathyroid Hormone)이다. 실시양태에서, 관심 폴리펩티드는 인간 hPTH 1-34(서열 번호 1)이다. PTH는 갑상선에 의해 분비되는 115 아미노산(aa) 프리-프로-펩티드로부터 유래한 84개 aa 펩티드로, 혈액 내 칼슘 농도를 증가시키는 작용을 하며 뼈 형성을 자극하는 것으로 알려져 있다. N-말단의 34 aa 펩티드는 골다공증 치료를 위해 승인받은 상태이다(포르테오(Forteo)®(Eli Lilly and Company); 포장 삽입물 참조). 포르테오® 활성 성분, PTH 1-34는 C-말단 융합 단백질의 일부로서 이. 콜라이에서 생산된다(포르테오®의 경우 NDA 21-319; 문헌(Chemistry Review, Center for Drug Evaluation and Research, 2000-2001) 참조; 또한, 문헌(Clinical Pharmacology and Biopharmaceutics review, Center for Drug Evaluation and Research, 2000-2001) 참조). 포르테오®(Eli Lilly의 LY333334)의 정제는 예를 들어 본원에서 참고로 포함되는 문헌(Jin, et al. "Crystal Structure of Human Parathyroid Hormon 1-34 at 0.9Å Resolution", J. Biol. Chem. 275(35):27238-55, 2000)에 기재되어 있다. 상기 보고는 봉입체로서 단백질의 발현과 7M 요소에서 후속적인 가용화를 기재한다.
실시양태에서, 관심 폴리펩티드는 전형적으로 박테리아 발현 시스템에서 과발현될 때 불용성 형태로 생산된다. 실시양태에서, 전형적으로 박테리아 발현 시스템에서 과발현될 때 불용성 형태로 생산되는 관심 폴리펩티드는 진핵생물의 폴리펩티드 또는 이의 유도체 또는 유사체이다. 실시양태에서, 전형적으로 박테리아 발현 시스템에서 과발현될 때 불용성 형태로 생산되는 관심 폴리펩티드는 프로인슐린(인슐린의 전구체)이다. 프로인슐린은 3개의 지정된 분절(N에서 C 말단으로: B-C-A)로 구성된다. 프로인슐린은 내부 C- 펩티드가 프로테아제 절단에 의해 제거될 때 인슐린(또는 프로인슐린에 따라 인슐린 유사체)로 프로세싱된다. A와 B-펩티드 사이에 디설피드 결합은 C-펩티드 인슐린의 절제 후 이들의 결합을 유지한다. 여기 인슐린 및 인슐린 유사체와 관련하여, "A-펩티드"와 "A-쇄"가 호환적으로 사용되며, "B-펩티드"와 "B-쇄"가 호환적으로 사용된다. 이 쇄들 사이의 위치는 쇄와 쇄의 아미노 말단으로부터 아미노산 번호로 언급된다. 예를 들어, "B30"은 B-펩티드, 즉, B-쇄에서 30번째 아미노산을 나타낸다. 실시양태에서, 관심 폴리펩티드는 지속작용 인슐린 유사체 또는 신속작용(rapid-acting) 인슐린 유사체를 형성하도록 프로세싱되는 프로인슐린이다.
실시양태에서, 관심 폴리펩티드는 프로세싱되어 지속작용 인슐린 유사체를 형성하는 프로인슐린이다. 지속작용 인슐린 유사체는, 예를 들어, 란투스(Lantus)®로 판매되는 지속작용 인슐린 유사체인 43-아미노산(6050.41 Da), 인슐린 글라진, 트레시바®(Tresiba)로 판매되는 인슐린 디글루덱, 및 레버미어®(Levemir)로 판매되는 인슐린 디터머를 포함한다. 인슐린 글라진에서, N21의 아스파라긴(Asn21)은 글리신으로 치환되고, 2개의 아르기닌은 B-펩티드의 C-말단에 존재한다. 인슐린에서, 이들 2개의 아르기닌은 프로인슐린에는 존재하지만 프로세싱된 성숙 분자에서는 존재하지 않는다. 실시양태에서, 관심 폴리펩티드는 글라진으로 프로세싱되며, 관심 폴리펩티드는 서열 번호 88, 89, 90, 또는 91에 개시된 87-아미노산 프로인슐린이다. 비제한적인 실시양태에서, 서열 번호 88의 코딩 서열은 서열 번호 80 또는 84에 개시된 뉴클레오티드 서열이다. 비제한적인 실시양태에서, 서열 번호 89의 코딩 서열은 서열 번호 81 또는 85에 개시된 뉴클레오티드 서열이다. 비제한적인 실시양태에서, 서열 번호 90의 코딩 서열은 서열 번호 82 또는 86에 개시된 뉴클레오티드 서열이다. 비제한적인 실시양태에서, 서열 번호 91의 코딩 서열은 서열 번호 83 또는 87에 개시된 뉴클레오티드 서열이다. 서열 번호 80-87 각각은 5' 말단에 처음 15bp 클로닝 부위를 포함하므로. 이들 실시양태에서, 언급된 프로인슐린 코딩 서열은 처음 Phe 코돈, TTT(서열 번호 80에서), 또는 TTC(서열 번호 81-87에서)에서 시작하는 서열이다. 인슐린 디글루덱은 위치 B30에서 트레오닌이 결실되고, 위치 B29의 아미노산 리신에서 감마-L-글루타밀 스페이서를 통해 헥사데칸디온산에 접합된다. 인슐린 디터머는 위치 B29의 리신 아미노산에 결합된 지방산(미리스트산)을 갖는다.
실시양태에서, 관심 폴리펩티드는 신속작용 인슐린 유사체를 형성하도록 프로세싱되는 프로인슐린이다. 신속작용(또는 fast-acting) 인슐린 유사체는, 예를 들어, 위치 B28의 프롤린이 아스파트산으로 치환된 인슐린 아스파트(NovoLog/NovoRapid®)(서열 번호 94), B-쇄의 C-말단 끝에 존재하는 마지막 리신과 프롤린이 역전된 인슐린 라이스프로(Humalog®)(라이스프로 프로인슐린, 서열 번호 33), 위치 B3의 아스파라긴이 리신으로 치환되고 위치 B29의 리신이 글루탐산으로 치환된 인슐린 글루리신(Apidra®)(글루리신 프로인슐린, 서열 번호 34)을 포함한다. 다른 모든 위치에서, 이들 분자는 보통 인슐린(프로인슐린, 서열 번호 32; 인슐린 A-펩티드, 서열 번호92; 인슐린 B-펩티드, 서열 번호 93)과 동일한 아미노산 서열을 갖는다.
실시양태에서, 전형적으로 박테리아 발현 시스템에서 과발현될 때 불용성 형태로 생산되는 관심 폴리펩티드는 GCSF, 예를 들어, Met-GCSF이다. 실시양태에서, 전형적으로 박테리아 발현 시스템에서 과발현될 때 불용성 형태로 생산되는 관심 폴리펩티드는 IFN-β, 예를 들어, IFN-β-1b이다. 실시양태에서, 관심의 재조합 폴리펩티드를 과발현하기 어려운 박테리아 발현 시스템은 이. 콜라이 발현 시스템이다.
실시양태에서, 관심 폴리펩티드는 쉽게 분해된 N 말단을 가진 단백질이다. 본 발명의 방법에 따라 생산된 융합 단백질은 숙주 프로테아제와 분리된 후 절단되어 관심 폴리펩티드를 유리시키기 때문에, 관심 폴리펩티드의 N-말단은 정제 과정에 걸쳐 보호된다. 이는 N-말단이 100%까지 완전한 관심 폴리펩티드의 제제의 생산을 가능하게 한다.
실시양태에서, 쉽게 분해되는 N-말단을 가진 관심 폴리펩티드는 GCSF(granulocyte colony stimnulating factor)(과립구 집락 자극 인자, 또는 집락 자극 인자 3 (CSF 3))의 유사체인 필그라스팀이다. GCSF는 골수를 자극하여 과립구 및 줄기세포를 생산하고 이들을 혈류로 분비하는 174개 아미노산의 당단백질이다. 글리코실화되지 않고 N-말단의 메티오닌을 가진 필그라스팀은 뉴포젠(Neupogen)®으로 판매된다. GCSF(필그라스팀)의 아미노산 서열은 서열 번호 69에 개시된다. 실시양태에서, 본 발명의 방법은 N-말단의 메티오닌을 포함하는 완전한 N-말단을 가진 GCSF(필그라스팀)를 고수준으로 생산하는데 사용된다. 프로테아제가 결핍된 숙주 세포에서 GCSF 생산은 본원에서 그 전문이 참고로 포함되는 미국 특허 제8,455,218호("Methods for G-CSF production in a Psudomonas host cell")에 기재되어 있다. 본 발명의 실시양태에서, N-말단의 메티오닌을 포함하는 완전한 GCSF는 프로테아제가 결핍되지 않는 박테리아 숙주 세포, 예를 들어 슈도모나스 숙주 세포에서 융합 단백질 내에서 고수준으로 생산된다.
실시양태에서, 쉽게 분해되는 N 말단을 가진 관심 폴리펩티드는 예를 들어, 본원에서 그 전문이 참고로 포함되는 미국 특허 제9,169,304호("Process for Purifying Recombinant Plasmodium Falciparum Circumsporozoite Protein")에 기재된 재조합 피. 팔시파룸 포자소체 단백질(rCSP)이다.
실시양태에서, 관심 폴리펩티드는 시약 단백질; 치료 단백질; 세포 외 수용체 또는 리간드; 프로테아제; 키나아제; 혈액 단백질; 케모카인; 사이토카인; 항체; 항체 기반 약물; 항체 단편, 예를 들어, 단쇄 항체, 항원 결합(ab) 단편, 예를 들어, IgG 또는 IgM의 가변 영역으로부터 생성된 F(ab), F (ab)', F(ab)'2, Fv, 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편, 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설피드 결합을 환원시켜 생산됨), Fc 융합 단백질, 예를 들어, 관심 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함하는 Fc 융합 단백질, 또는 예를 들어, 본원에서 그 전문이 참고로 포함되는 미국 특허 제5,648,237호("Expression of Functional Antibody Fragments")에 기재된, 당 업계에 기재된 임의의 기타 항체 단편; 항응고제; 혈액 인자; 뼈 형성 단백질; 조작된 단백질 스캐폴드; 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 또는 호르몬이다. 실시양태에서, 관심 폴리펩티드는 다음으로부터 선택된다: 인간 항혈우병 인자; 인간 항혈우병 인자-폰빌레브란트 인자 복합체; 재조합 항혈우병 인자(투록토코그 알파); 아도-트라스투주맙 엠탄신; 알비글루타이드; 알글루코시다아제 알파; 인간 알파-1 프로테이나제 억제제; 보툴리눔 독소 B형(리마보툴리눔독소 B); 응고 인자 IX Fc 융합체; 재조합 응고 인자 IX; 재조합 응고 인자 VIIa; 재조합 응고 인자 XIII A-서브유닛; 인간 응고 인자 VIII-폰빌레브란트 인자 복합체; 콜라게나아제 클로스트리듐 히스톨리티쿰; 인간 혈소판 유래 성장 인자(세카플러민); 아바타셉트; 아브식시맙; 아달리무맙; 애플리버셉트; 알갈시다제 베타; 알데스류킨; 알레파셉트; 알렘투주맙; 알글루코시다제 알파; 알테플라제; 아나킨라; 옥토코그 알파; 재조합 인간 항트롬빈; 아즈피셀-T; 바실릭시맙; 벨라타셉트; 벨리무맙; 베바시주맙; 보툴리눔 독소 A형; 브렌툭시맙 베도틴; 재조합 C1 에스테라아제 억제제; 카나키누맙; 세르톨리주맙 페골; 세툭시맙; 노나코그 알파; 다클리주맙; 다베포에틴 알파; 데노수맙; 디곡신 면역 Fab; 도르나제 알파; 에칼란티드; 에쿨리주맙; 에타너셉트; 피브리노겐; 필그라스팀; 갈설파제; 골리무맙; 이브리투모맙 튜세탄; 이두설파제; 인플릭시맙; 인터페론 알파; 인터페론 알파-2b; 인터페론 알파콘-1; 인터페론 알파-2a; 인터페론 알파-n3; 인터페론 베타-1a; 인터페론 베타-1b; 인터페론 감마-1b; 이필리무맙; 라로니다아제; 에포에틴 알파; 모록토코그 알파; 무로모납-CD3; 나탈리주맙; 오크리플라스민; 오파투무맙; 오말리주맙; 오프렐베킨; 팔리퍼민; 팔리비주맙; 파니투무맙; 페그필그라스팀; 퍼투주맙; 인간 유두종 바이러스(HPV) 6;11;16;18-L1형 바이러스 단백질 바이러스 유사 입자(VLP: Virus like Particle); HPV 16형 및 18형 L1 단백질 VLP; 라니비주맙; 라스부리카아제; 락시바쿠맙; 재조합 인자 IX; 레테플라아제; 릴로나셉트; 리툭시맙; 로미플로스팀; 사그라모스팀; 테넥테플라제; 토실리주맙; 트라스투주맙; 우스테키누맙; 아바렐릭스; 세트로렐릭스; 데시루딘; 엔푸버타이드; 엑세나타이드; 난포호르몬 베타; 가니렐릭스; 데가렐릭스; 히알루로니다아제; 인슐린 아스파트; 인슐린 디글루덱; 인슐린 디터머; 인슐린 글라진 rDNA 주사(지속작용 인간 인슐린 유사체); 재조합 인슐린 글루리신; 인간 인슐린; 인슐린 라이스프로(신속작용 인슐린 유사체); 재조합 인슐린 라이스프로 프로타민; 재조합 인슐린 라이스프로; 란레오타이드; 리라글루티드; 설팍신(루시낙탄; 시나풀티드); 메카세르민; 인슐린 유사 성장 인자; 네시리타이드; 프람린타이드; 재조합 테두글루타이드; 테사모렐린 아세테이트; 지코노타이드 아세테이트; 10.8 mg 고세렐린 아세테이트 이식제; 아보보툴리눔독소A; 아갈시다아제 알파; 알리포진 티파보벡; 안세스팀; 아니스트레플라제; 아데파린 나트륨; 조류 TB 백신; 바트록소빈; 비발리루딘; 부세렐린(성선 자극 호르몬 분비 호르몬 작용제); 카보잔티닙 S-말레이트; 카르페리티드; 카투막소맙; 세룰레티드; 응고 인자 VIII; 콕시디아증 백신; 달테파린 나트륨; 디페리프론; 디피브로타이드; 디보테르민 알파; 드로트레코진 알파; 에도트레오타이드; 에팔리주맙; 에녹사파린 나트륨; 에포에틴 델타; 엡티피바티드; 엡토테르민 알파; 주사용 난포호르몬 알파; 포미비르센; 젬투주맙 오조가미신; 고나도렐린; 재조합 융모막 인간 성선 자극 호르몬; 히스트렐린 아세테이트(성선 자극 호르몬 분비 호르몬 작용제); HVT IBD 백신; 이미글루세라제; 인슐린 이소판; 레노그라스팀(과립구 집락 자극 인자); 레피루딘; 개의 렙토스피라 백신; 류프로프렐린; 리나클로티드; 리페그필그라스팀; 릭시세나타이드; 황체형성 호르몬 알파(인간 황체형성 호르몬); 메폴리주맙; 마이파머티드; 미포머센 나트륨; 미리모스팀(대식구 집락 자극 인자); 모가물리주맙; 몰그라모스팀(과립구 대식구 집락 자극 인자); 몬테플라제; 나드로파린 칼슘; 나파렐린; 네바쿠맙; 옥트레오티드; 파미테플라제; 판크레리파아제; 파르나파린 나트륨; 파시레오티드 다스파테이트; 페기네사타이드 아세테이트; 페그비소만트; 펜테트레오티드; 포락탄트 알파; 프랄모렐린(성장 호르몬 분비 펩티드); 프로티렐린; PTH 1-84; rhBMP-2; rhBMP-7; 엡토테르민 알파; 로머티드; 서모렐린; 소마토스타틴; 소마트렘; 바소프레신; 데스모프레신; 탈리글루세라제 알파; 탈티렐린(갑상선 자극 호르몬-분비 호르몬 유사체); 타소너민; 타스포글루티드; 트롬보모듈린 알파; 갑상선 자극 호르몬 알파; 트라퍼민; 트림토렐린 파모에이트; 주사용 요난포호르몬; 유로키나아제; 벨라글루세라제 알파; 콜레라 독소 B; 재조합 항혈우병 인자(에프랄옥토코그 알파); 인간 알파-1 프로테이나제 억제제; 아스파라기나제 에르비니아 크리산테미(Erwinia Chrysanthemi); 카프로맙; 데닐류킨 디프티톡스; 양의 디곡신 면역 Fab; 엘로설파아제 알파; 에포에틴 알파; 인자 IX 복합체; 인자 XIII 농축물; 테크네튬(파놀레소맙); 피브리노겐; 트롬빈; 인플루엔자 헤마글루티닌 및 뉴라미니다아제; 글루카피다아제; 주사용 헤민; Hep B 표면 항원; 인간 알부민; 인코보툴리눔독소; 노페투모맙; 오비누투주맙; L-아스파라기나아제(에쉐리키아 콜라이(Escherichia . coli ); 에르비니아( Erwinia ) 종; 슈도모나스 종 등의); 펨브롤리주맙; 단백질 C 농축물; 라무시루맙; 실툭시맙; Tbo-필그라스팀; 백일해 독소 서브유닛 A-E; 소 국소 트롬빈; 인간 국소 트롬빈; 토시투모맙; 베돌리주맙; Ziv-애플리버셉트; 글루카곤; 소마트로핀; 플라스모듐 팔시파룸(Plasmodium faciparum ) 또는 플라스모듐 비박스(Plasmodium vivax ) 항원(예를 들어, CSP, CelTOS, TRAP, Rh5, AMA-1, LSA-1, LSA-3, Pfs25, MSP-1, MSP-3, STARP, EXP1, pb9, GLURP). 변이를 포함한 상기 폴리펩티드의 서열은 문헌에서 이용 가능하거나 당 업자에게 공지되어 있다. 열거된 임의의 폴리펩티드의 임의의 공지된 서열은 본 발명의 방법에 사용하기 위해 고려된다.
실시양태에서, 관심 폴리펩티드는 엔테로키나아제(예를 들어, 서열 번호 31 [소]), 인슐린, 프로인슐린(예를 들어, 서열 번호 32), 지속작용 인슐린 유사체 또는 프로세싱되어 지속작용 인슐린 유사체(예를 들어, 인슐린 글라진, 서열 번호 88, 인슐린 디터머, 또는 인슐린 디글루덱)를 형성하는 프로인슐린, 신속작용 인슐린 유사체 또는 프로세싱되어 신속작용 인슐린 유사체(예를 들어, 인슐린 라이스프로, 인슐린 아스파트, 또는 인슐린 글루리신)를 형성하는 프로인슐린, 인슐린 C-펩티드(예를 들어, 서열 번호 97), IGF-1(예를 들어, 메카세르민, 서열 번호 35), Glp-1(예를 들어, 서열 번호 36), Glp-1 유사체(예를 들어, 엑세나타이드, 서열 번호 37), Glp-2(예를 들어, 서열 번호 38), Glp-2 유사체(예를 들어, 테두글루타이드, 서열 번호 39), 프람린타이드(예를 들어, 서열 번호 40), 지코노타이드(예를 들어, 서열 번호 41), 베카플러민(예를 들어, 서열 번호 42), 엔푸버타이드(예를 들어, 서열 번호 43), 또는 네시리타이드(예를 들어, 서열 번호 44)이다.
실시양태에서, 관심 폴리펩티드의 분자량은 약 1 kDa, 약 2 kDa, 약 3 kDa, 약 4 kDa, 약 5 kDa, 약 6 kDa, 약 7 kDa, 약 8 kDa, 약 9 kDa, 약 10 kDa, 약 11 kDa, 약 12 kDa, 약 13 kDa, 약 14 kDa, 약 15 kDa, 약 16 kDa, 약 17 kDa, 약 18 kDa, 약 19 kDa, 약 20 kDa, 약 30 kDa, 약 40 kDa, 약 50 kDa, 약 60 kDa, 약 70 kDa, 약 80 kDa, 약 90 kDa, 약 100 kDa, 약 150 kDa, 약 200 kDa, 약 250 kDa, 약 300 kDa, 약 350 kDa, 약 400 kDa, 약 450 kDa, 약 500 kDa 이상이다. 실시양태에서, 재조합 폴리펩티드의 분자량은 약 1 내지 약 10 kDA, 약 1 내지 약 20 kDA, 약 1 내지 약 30 kDA, 약 1 내지 약 40 kDA, 약 1 내지 약 50 kDA, 약 1 내지 약 60 kDA, 약 1 내지 약 70 kDA, 약 1 내지 약 80 kDA, 약 1 내지 약 90 kDA, 약 1 내지 약 100 kDA, 약 1 kDa 내지 약 200 kDa, 약 1 kDa 내지 약 300 kDa, 약 1 kDa 내지 약 400 kDa, 약 1 kDa 내지 약 500 kDa, 약 2 내지 약 10 kDA, 약 2 내지 약 20 kDA, 약 2 내지 약 30 kDA, 약 2 내지 약 40 kDA, 약 2 내지 약 50 kDA, 약 2 내지 약 60 kDA, 약 2 내지 약 70 kDA, 약 2 내지 약 80 kDA, 약 2 내지 약 90 kDA, 약 2 내지 약 100 kDA, 약 2 kDa 내지 약 200 kDa, 약 2 kDa 내지 약 300 kDa, 약 2 kDa 내지 약 400 kDa, 약 2 kDa 내지 약 500 kDa, 약 3 내지 약 10 kDA, 약 3 내지 약 20 kDA, 약 3 내지 약 30 kDA, 약 3 내지 약 40 kDA, 약 3 내지 약 50 kDA, 약 3 내지 약 60 kDA, 약 3 내지 약 70 kDA, 약 3 내지 약 80 kDA, 약 3 내지 약 90 kDA, 약 3 내지 약 100 kDA, 약 3 kDa 내지 약 200 kDa, 약 3 kDa 내지 약 300 kDa, 약 3 kDa 내지 약 400 kDa, 또는 약 3 kDa 내지 약 500 kDa이다. 실시양태에서 관심 폴리펩티드의 분자량은 약 4.1 kDa이다.
실시양태에서, 관심 폴리펩티드는 25개 이상의 아미노산 길이이다. 실시양태에서, 관심 폴리펩티드는 약 25 내지 약 2000개 이상의 아미노산 길이이다. 실시양태에서, 관심 폴리펩티드는 약 또는 적어도 약 25, 30, 35, 40, 45, 50, 100, 150, 200, 250, 300, 350, 400, 450, 475, 500, 525, 550, 575, 600, 625, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800, 또는 2000개 아미노산 길이이다. 실시양태에서, 관심 폴리펩티드는 약 25 내지 약 2000, 25 내지 약 1000, 25 내지 약 500, 25 내지 약 250, 25 내지 약 100, 또는 25 내지 약 50개 아미노산 길이이다. 실시양태에서, 관심 폴리펩티드는 32, 36, 39, 71, 109, 또는 110개 아미노산 길이이다. 실시양태에서, 관심 폴리펩티드는 34개 아미노산 길이이다.
N-말단 융합 파트너
재조합 융합 단백질의 N-말단 융합 파트너는 박테리아 발현 시스템을 이용하여 얻은 재조합 융합 단백질의 수율을 향상시키는 박테리아 단백질이다. 실시양태에서, N-말단 융합 파트너는 박테리아 숙주 세포에서 재조합 구조물로부터 안정적으로 과발현될 수 있다. 실시양태에서, 관심 폴리펩티드의 수율 및/또는 가용성은 N-말단 융합 파트너의 존재에 의해 증가되거나 향상된다. 실시양태에서, N-말단 융합 파트너는 재조합 융합 단백질의 적합한 폴딩을 촉진시킨다. 실시양태에서, N-말단 융합 파트너는 박테리아 폴딩 조절 인자 또는 샤프론 단백질이다.
실시양태에서, N-말단 융합 파트너는 크기가 큰 친화성 태그 단백질, 폴딩 조절 인자, 분자 샤프론, 리보솜 단백질, 번역 관련 인자, OB-폴딩 단백질(oligonucleotide binding fold protein), 또는 문헌, 예를 들어 본원에서 참고로 포함되는 문헌(Ahn, et al., 2011, "Expression screening of fusion partners from an E. coli genome for soluble expression of recombinant proteins in a cell-free protein synthesis system," PLoS One, 6(11): e26875)에 기재된 또 다른 단백질이다. 실시양태에서, N-말단 융합 파트너는 MBP, GST, NusA, 유비퀴틴, IF-2의 도메인 1, 및 L9의 N-말단의 도메인으로부터 선택된 크기가 큰 친화성 태그 단백질이다. 실시양태에서, N-말단 융합 파트너는 30S 리보솜 서브유닛의 리보솜 단백질 또는 50S 리보솜 서브유닛의 리보솜 단백질이다. 실시양태에서, N-말단 융합 파트너는 이. 콜라이 또는 슈도모나드 샤프론 또는 폴딩 조절 인자 단백질이다. 실시양태에서, N-말단 융합 파트너는 피. 플루오레센스 샤프론 또는 폴딩 조절 인자 단백질이다. 실시양태에서, N-말단 융합 파트너는 표 1로부터 선택된 샤프론 또는 폴딩 조절 인자 단백질이다.
실시양태에서, N-말단 융합 파트너는 피. 플루오레센스 DnaJ-유사 단백질(서열 번호 2), FrnE(서열 번호 3), FrnE2(서열 번호 63), FrnE3(서열 번호 64), FklB(서열 번호 4), FklB3*(서열 번호 28), FklB2(서열 번호 61), FklB3(서열 번호 62), FkpB2(서열 번호 5), SecB(서열 번호 6), EcpD(RXF04553.1, 서열 번호 7), EcpD(RXF04296.1, 서열 번호 65, 본원에서 EcpD1로도 언급됨), EcpD2(서열 번호 66), 또는 EcpD3(서열 번호 67)이다. 실시양태에서, N-말단 융합 파트너는 에쉐리키아 콜라이 단백질 Skp(서열 번호 8)이다.
실시양태에서, N-말단 융합 파트너는 전장의 융합 파트너 폴리펩티드에 비해 절두된다. 실시양태에서, N-말단 융합 파트너는 적어도 한 개의 C-말단 아미노산이 제거되도록 C-말단이 절두된다. 실시양태에서, N-말단 융합 파트너는 전장 폴리펩티드의 C-말단으로부터 1 내지 300개 아미노산이 제거되도록 절두된다. 실시양태에서, N-말단 융합 파트너는 폴리펩티드의 C-말단으로부터 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, 1 내지 300, 1 내지 295, 1 내지 290, 1 내지 280, 1 내지 270, 1 내지 260, 1 내지 250, 1 내지 240, 1 내지 230, 1 내지 220, 1 내지 210, 1 내지 200, 1 내지 190, 1 내지 180, 1 내지 170, 1 내지 160, 1 내지 150, 1 내지 140, 1 내지 130, 1 내지 120, 1 내지 110, 1 내지 100, 1 내지 90, 1 내지 80, 1 내지 70, 1 내지 60, 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20, 1 내지 15, 1 내지 10, 또는 1 내지 5개 아미노산이 제거되도록 절두된다. 실시양태에서, N-말단 융합 파트너 폴리펩티드는 전장 폴리펩티드의 처음 N-말단의 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 150 내지 40, 처음 150 내지 50, 처음 150 내지 75, 처음 150 내지 100, 처음 100 내지 40, 처음 100 내지 50, 처음 100 내지 75, 처음 75 내지 40, 처음 75 내지 50, 처음 300, 처음 250, 처음 200, 처음 150, 처음 140, 처음 130, 처음 120, 처음 110, 처음 100, 처음 90, 처음 80, 처음 75, 처음 70, 처음 65, 처음 60, 처음 55, 처음 50, 또는 처음 40개 아미노산을 보유하도록 C-말단으로부터 절두된다.
실시양태에서, 절두된 N-말단 융합 파트너는 FklB, FrnE, 또는 EcpD1이다. 실시양태에서, 절두형 N-말단 융합 파트너는 FklB로, FklB가 148, 198, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, 1, 1 내지 210, 1 내지 200, 1 내지 190, 1 내지 180, 1 내지 170, 1 내지 160, 1 내지 150, 1 내지 140, 1 내지 130, 1 내지 120, 1 내지 110, 1 내지 100, 1 내지 90, 1 내지 80, 1 내지 70, 1 내지 60, 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20, 1 내지 15, 1 내지 10, 또는 1 내지 5개 아미노산이 제거되도록 C-말단으로부터 절두된다. 실시양태에서, 절두된 N-말단 융합 파트너는 EcpD로, EcpD가 148, 198, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, 1, 1 내지 210, 1 내지 200, 1 내지 190, 1 내지 180, 1 내지 170, 1 내지 160, 1 내지 150, 1 내지 140, 1 내지 130, 1 내지 120, 1 내지 110, 1 내지 100, 1 내지 90, 1 내지 80, 1 내지 70, 1 내지 60, 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20, 1 내지 15, 1 내지 10, 또는 1 내지 5개 아미노산이 제거되도록 C-말단으로부터 절두된다. 실시양태에서, 절두된 N-말단 융합 파트너는 FrnE로, FrnE가 118, 168, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, 1, 1 내지 190, 1 내지 180, 1 내지 170, 1 내지 160, 1 내지 150, 1 내지 140, 1 내지 130, 1 내지 120, 1 내지 110, 1 내지 100, 1 내지 90, 1 내지 80, 1 내지 70, 1 내지 60, 1 내지 50, 1 내지 40, 1 내지 30, 1 내지 20, 1 내지 15, 1 내지 10, 또는 1 내지 5개 아미노산이 제거되도록 C-말단으로부터 절두된다.
실시양태에서, N-말단 융합 파트너는 β-갈락토시다아제가 아니다. 실시양태에서, N-말단 융합 파트너는 티오레독신이 아니다. 실시양태에서, N-말단 융합 파트너는 β-갈락토시다아제도 티오레독신도 아니다.
실시양태에서, N-말단 융합 파트너의 분자량은 약 1 kDa, 약 2 kDa, 약 3 kDa, 약 4 kDa, 약 5 kDa, 약 6 kDa, 약 7 kDa, 약 8 kDa, 약 9 kDa, 약 10 kDa, 약 11 kDa, 약 12 kDa, 약 13 kDa, 약 14 kDa, 약 15 kDa, 약 16 kDa, 약 17 kDa, 약 18 kDa, 약 19 kDa, 약 20 kDa, 약 30 kDa, 약 40 kDa, 약 50 kDa, 약 60 kDa, 약 70 kDa, 약 80 kDa, 약 90 kDa, 약 100 kDa, 약 150 kDa, 약 200 kDa, 약 250 kDa, 약 300 kDa, 약 350 kDa, 약 400 kDa, 약 450 kDa, 약 500 kDa 이상이다. 실시양태에서, N-말단 융합 파트너의 분자량은 약 1 내지 약 10 kDA, 약 1 내지 약 20 kDA, 약 1 내지 약 30 kDA, 약 1 내지 약 40 kDA, 약 1 내지 약 50 kDA, 약 1 내지 약 60 kDA, 약 1 내지 약 70 kDA, 약 1 내지 약 80 kDA, 약 1 내지 약 90 kDA, 약 1 내지 약 100 kDA, 약 1 kDa 내지 약 200 kDa, 약 1 kDa 내지 약 300 kDa, 약 1 kDa 내지 약 400 kDa, 약 1 kDa 내지 약 500 kDa, 약 2 내지 약 10 kDA, 약 2 내지 약 20 kDA, 약 2 내지 약 30 kDA, 약 2 내지 약 40 kDA, 약 2 내지 약 50 kDA, 약 2 내지 약 60 kDA, 약 2 내지 약 70 kDA, 약 2 내지 약 80 kDA, 약 2 내지 약 90 kDA, 약 2 내지 약 100 kDA, 약 2 kDa 내지 약 200 kDa, 약 2 kDa 내지 약 300 kDa, 약 2 kDa 내지 약 400 kDa, 약 2 kDa 내지 약 500 kDa, 약 3 내지 약 10 kDA, 약 3 내지 약 20 kDA, 약 3 내지 약 30 kDA, 약 3 내지 약 40 kDA, 약 3 내지 약 50 kDA, 약 3 내지 약 60 kDA, 약 3 내지 약 70 kDA, 약 3 내지 약 80 kDA, 약 3 내지 약 90 kDA, 약 3 내지 약 100 kDA, 약 3 kDa 내지 약 200 kDa, 약 3 kDa 내지 약 300 kDa, 약 3 kDa 내지 약 400 kDa, 또는 약 3 kDa 내지 약 500 kDa 이다.
실시양태에서, N-말단 융합 파트너 또는 절두된 N-말단 융합 파트너는 25개 이상의 아미노산 길이다. 실시양태에서, N-말단 융합 파트너는 약 25 내지 약 2000개 이상의 아미노산 길이이다. 실시양태에서, N-말단 융합 파트너는 약 또는 적어도 약 25, 35, 40, 45, 50, 100, 150, 200, 250, 300, 350, 400, 450, 470, 500, 530, 560, 590, 610, 640, 670, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800, 2000개 아미노산 길이이다. 실시양태에서, 관심 폴리펩티드는 약: 25 내지 약 2000, 25 내지 약 1000, 25 내지 약 500, 25 내지 약 250, 25 내지 약 100, 또는 25 내지 약 50개 아미노산 길이이다.
관심 폴리펩티드와 재조합 융합 단백질의 상대적인 크기
관심 폴리펩티드의 수율은 전체 재조합 융합 단백질의 수율에 비례한다. 이 비율은 관심 폴리펩티드와 재조합 융합 단백질의 상대적인 크기(예를 들어, 아미노산 분자량 및/또는 길이)에 따라 달라진다. 예를 들어, 융합 단백질 내 N-말단 융합 파트너의 크기의 감소는 결과적으로 관심 폴리펩티드인 생산되는 융합 단백질의 비율을 더 크게 만든다. 실시양태에서, 관심 폴리펩티드의 수율을 최대화하기 위해서, N-말단 융합 파트너는 관심 폴리펩티드에 대한 그 크기를 기준으로 선택된다. 실시양태에서, N-말단 융합 파트너는 관심 폴리펩티드에 비해 어떠한 최소 크기(예를 들어, 아미노산의 MW 또는 길이)가 되도록 선택된다. 실시양태에서, 재조합 융합 단백질은 관심 폴리펩티드의 분자량이 재조합 융합 단백질의 분자량의 약 10% 내지 약 50%를 차지하도록 설계된다. 실시양태에서, 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 또는 적어도 약: 10%, 11 %, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 35%, 40%, 45%, 50%를 차지한다. 실시양태에서, 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 또는 적어도 약: 10% 내지 약 50 %, 11% 내지 약 50%, 12% 내지 약 50%, 13% 내지 약 50%, 14% 내지 약 50%, 15% 내지 약 50%, 20% 내지 약 50%, 25% 내지 약 50%, 30% 내지 약 50%, 35% 내지 약 50%, 40% 내지 약 50%, 13% 내지 약 40%, 14% 내지 약 40%, 15% 내지 약 40%, 20% 내지 약 40%, 25% 내지 약 40%, 30% 내지 약 40%, 35% 내지 약 40%, 13% 내지 약 30%, 14% 내지 약 30%, 15% 내지 약 30%, 20% 내지 약 30%, 25% 내지 약 30%, 13% 내지 약 25%, 14% 내지 약 25%, 15% 내지 약 25%, 또는 20% 내지 약 25%를 차지한다. 실시양태에서, 관심 폴리펩티드는 hPTH이고 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 14.6%를 차지한다. 실시양태에서, 관심 폴리펩티드는 hPTH이고 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 13.6%를 차지한다. 실시양태에서, 관심 폴리펩티드는 hPTH이고 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 27.3%를 차지한다. 실시양태에서, 관심 폴리펩티드는 met-GCSF이고 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 39% 내지 약 72%를 차지한다. 실시양태에서, 관심 폴리펩티드는 프로인슐린이고 관심 폴리펩티드의 분자량은 재조합 융합 단백질의 분자량의 약 20% 내지 약 57%를 차지한다.
실시양태에서, 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 10% 내지 약 50%를 차지한다. 실시양태에서, 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 또는 적어도 약: 10%, 11 %, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 35%, 40%, 45%, 50%를 차지한다. 실시양태에서, 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 또는 적어도 약: 10% 내지 약 50 %, 11% 내지 약 50%, 12% 내지 약 50%, 13% 내지 약 50%, 14% 내지 약 50%, 15% 내지 약 50%, 20% 내지 약 50%, 25% 내지 약 50%, 30% 내지 약 50%, 35% 내지 약 50%, 40% 내지 약 50%, 13% 내지 약 40%, 14% 내지 약 40%, 15% 내지 약 40%, 20% 내지 약 40%, 25% 내지 약 40%, 30% 내지 약 40%, 35% 내지 약 40%, 13% 내지 약 30%, 14% 내지 약 30%, 15% 내지 약 30%, 20% 내지 약 30%, 25% 내지 약 30%, 13% 내지 약 25%, 14% 내지 약 25%, 15% 내지 약 25%, 또는 20% 내지 약 25%를 차지한다. 실시양태에서, 관심 폴리펩티드는 hPTH이고 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 13.1%를 차지한다. 실시양태에서, 관심 폴리펩티드는 hPTH이고 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 12.5%를 차지한다. 실시양태에서, 관심 폴리펩티드는 hPTH이고 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 25.7%를 차지한다. 실시양태에서, 관심 폴리펩티드는 met-GCSF이고 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 40% 내지 약 72%를 차지한다. 실시양태에서, 관심 폴리펩티드는 프로인슐린이고 관심 폴리펩티드의 길이는 재조합 융합 단백질의 전체 길이의 약 19% 내지 약 56%를 차지한다.
관심 폴리펩티드와 N-말단 융합 파트너
등전점의
차이
단백질의 등전점(pI)은 단백질이 순 전하를 띠지 않는 pH로 정의된다. pI 값은 주어진 pH에서 단백질의 가용성에 영향을 준다고 알려져 있다. 자신의 pI 미만의 pH에서, 단백질은 순 양전하를 띠고 자신의 pI 초과의 pH에서 단백질은 순 음전하를 띤다. 단백질은 이의 등전점(전체 전하)에 따라 분리될 수 있다. 실시양태에서, 관심 폴리펩티드의 pI와 N-말단의 융합 단백질의 pI는 실질적으로 상이하다. 이는 N-말단의 융합 단백질로부터 관심 폴리펩티드의 정제를 용이하게 할 수 있다. 실시양태에서, 관심 폴리펩티드의 pI는 N-말단 융합 파트너의 pI보다 적어도 2배 높다. 실시양태에서, 관심 폴리펩티드의 pI는 N-말단 융합 파트너보다 1.5 내지 3배 높다. 실시양태에서, 관심 폴리펩티드의 pI는 N-말단 융합 파트너의 pI보다 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 또는 3배 더 높다. 실시양태에서, N-말단 융합 파트너의 pI는 약 4, 약 4.1, 약 4.2, 약 4.3, 약 4.4, 약 4.5, 약 4.6, 약 4.7, 약 4.8, 약 4.9 또는 약 5이다. 실시양태에서, N-말단 융합 파트너의 pI는 약 4 내지 약 5, 약 4.1 내지 약 4.9, 약 4.2 내지 약 4.8, 약 4.3 내지 약 4.7, 약 4.4 내지 약 4.6이다.
실시양태에서, N-말단 융합 파트너는 표 8 또는 18에 열거된, 그 안에 열거된 pI를 갖는 것이다. 실시양태에서, 관심의 C-말단 폴리펩티드는 8.52의 pI 및 4117.65 달톤의 분자량을 갖는 hPTH 1-34이다. 실시양태에서, 관심의 C-말단 폴리펩티드는 5.66의 pI 및 18801.9 달톤의 분자량을 갖는 Met-GCSF이다. 실시양태에서, 관심의 C-말단 폴리펩티드는 약 5.2의 pI 및 약 9.34KDa의 분자량을 갖는, 서열 번호 88에 개시된 프로인슐린이다. 실시양태에서, 관심의 C-말단 폴리펩티드는 약 6.07의 pI 및 약 8.81KDa의 분자량을 갖는, 서열 번호 89에 개시된 프로인슐린이다. 실시양태에서, 관심의 C-말단 폴리펩티드는 약 5.52의 pI 및 약 8.75 KDa의 분자량을 갖는, 서열 번호 90에 개시된 프로인슐린이다. 실시양태에서, 관심의 C-말단 폴리펩티드는 6.07의 pI 및 약 7.3 KDa의 분자량을 갖는, 서열 번호 91에 개시된 프로인슐린이다. 단백질의 pI는 문헌에 기재되거나 당 업자에게 공지된 임의의 방법에 따라 결정될 수 있다.
샤프론 및 단백질 폴딩 조절 인자
비천연 숙주 세포(이종 단백질이 고유하지 않은 세포)에서 이종 단백질의 고수율 생산의 장애는 세포가 대개는 이종 단백질을 가용성 및/또는 활성 형태로 생산하도록 적합하게 구비되어 있지 않다는 것이다. 단백질의 1차 구조는 이의 아미노산 서열로 정의되지만, 2차 구조는 알파 나선 또는 베타 시트의 존재로 정의되고, 3차 구조는 단백질 사이, 예를 들어 단백질 도메인 사이의 아미노산 측쇄 상호작용에 의해 정의된다. 이종 단백질을, 특히 대규모 생산으로, 발현할 때, 단백질 자체의 2차 및 3차 구조는 매우 중요하다. 단백질 구조의 임의의 유의한 변화는 기능적으로 불활성인 분자, 또는 생물학적 활성이 상당히 감소된 단백질을 생산할 수 있다. 많은 경우에, 숙주 세포는 활성의 이종 단백질의 적합한 생산에 필수적인 샤프론 또는 단백질 폴딩 조절 인자(PFM)를 발현한다. 그러나 일반적으로 사용 가능하고, 경제적으로 만족스러운 생명 공학 산물을 생산하는데 요구되는 높은 수준의 발현에서, 세포는 이종적으로 발현된 단백질을 프로세싱하는데 충분한 천연 단백질 폴딩 조절 인자 또는 조절 인자들을 생산할 수 없다.
특정 발현 시스템에서, 이종 단백질의 과다생산은 이들의 미스폴딩 및 불용성 응집체로의 분리가 수반될 수 있다. 박테리아 세포에서, 이들 응집체는 봉입체로 알려져 있다. 봉입체로 프로세싱된 단백질은, 어떤 경우에는, 불용성 분획의 추가적인 프로세싱을 통해 회수될 수 있다. 봉입체에서 발견되는 단백질은 전형적으로 변성(denaturation) 및 복원(renaturation)을 포함한 여러 단계를 통하여 정제되어야 한다. 봉입체 단백질의 전형적인 복원 과정은 응집체를 농축된 변성제에 용해시키려는 시도와 함께 희석에 의한 변성제의 후속적인 제거를 수반한다. 응집체는 흔히 이 단계에서 다시 형성된다. 추가적인 공정은 비용을 추가시키며, 시험관 내 재폴딩이 생물학적으로 활성인 산물을 생산할 것이라는 것을 보장하지 못하며, 회수된 단백질은 다량의 단편 불순물을 포함할 수 있다.
생체 내 단백질 폴딩은 일시적으로 폴딩 중간체와 상호작용함으로써 다른 폴리펩티드의 적합한 이성질체화 및 세포 표적화를 촉진하는 분자 샤프론 및 폴딩 경로를 따라 속도 제한적인 단계를 가속화하는 폴다아제에 의해 도움을 받는다. 어떤 경우에는, 샤프론의 과발현은 응집하기 쉬운 단백질의 가용성 수율을 증가시키는 것으로 확인되었다(문헌(Baneyx, F., 1999, Curr . Opin . Biotech. 10:411-421) 참고). 이들 샤프론의 세포 내 농도의 증가와 관련된 유익한 효과는 과다 생산된 단백질의 특성에 매우 의존적이고, 모든 이종 단백질에 대해 동일한 단백질 폴딩 조절 인자(들)의 과발현을 요구하지 않을 수 있다. 샤프론, 디설피드 결합 이소머라아제, 및 펩티딜-프롤릴 시스-트랜스 이소머라아제(PPI아제)를 포함한 단백질 폴딩 조절 인자는 신생 폴리펩티드의 폴딩, 풀림(unfolding), 및 분해를 돕는 모든 세포에 존재하는 단백질 부류이다.
샤프론은 신생 폴리펩티드에 결합하고, 이들을 안정화시키고, 이들을 적합하게 폴딩되도록 하여 작용한다. 단백질은 소수성 및 친수성 잔기 둘 다 가지며, 전자는 대개 표면에 노출되지만 후자는 이들이 분자를 둘러싸는 물보다는 다른 친수성 잔기와 상호작용하는 구조 내에 매몰된다. 그러나 폴딩 폴리펩티드 사슬 내에서, 친수성 잔기는 대개 단백질이 부분적으로 폴딩되거나 미스폴딩(misfolding)된 상태로 존재하는 약간의 기간 동안 노출된다. 이 기간에 형성 폴리펩티드는 영구적으로 미스폴딩되거나 다른 미스폴딩된 단백질과 상호작용하고 세포 내에 큰 응집체 또는 봉입체를 형성할 수 있다. 일반적으로 샤프론은 부분적으로 폴딩된 사슬의 소수성 영역에 결합하고 이들이 완전히 미스폴딩되거나 다른 단백질과 응집하는 것을 방지하여 작용한다. 샤프론은 심지어 봉입체 내 단백질에 결합하고 이들이 해체되도록 할 수도 있다. 폴딩 조절 인자의 GroES/EL, DnaKJ, Clp, Hsp90 및 SecB 패밀리는 샤프론 유사 활성을 가진 단백질의 모든 예이다.
디설피드 결합 이소머라아제는 중요한 또 다른 유형의 폴딩 조절 인자이다. 이들 단백질은 폴딩 폴리펩티드가 적합한 단백질 내 디설피드 결합을 형성하는 것을 돕는 매우 특이적인 일련의 반응을 촉매한다. 두 개 이상의 시스테인을 갖는 임의의 단백질은 잘못된 잔기 사이에 디설피드 결합을 형성할 위험이 있다. 디설피드 결합 형성 패밀리는 Dsb 단백질로 이루어지며, 이들은 주변세포질의 비환원 환경에서 디설피드 결합 형성을 촉매한다. 주변세포질 폴리펩티드가 디설피드 결합 이소머라아제를 미스폴딩되도록 할 때, DsbC는 디설피드 결합을 재배열하고 단백질이 정확한 결합을 가지도록 재형성하도록 할 수 있다.
FklB 및 FrnE 단백질은 폴딩 조절 인자의 펩티딜-프롤릴 시스-트랜스 이소머라아제 패밀리에 속한다. 이는 올리고펩티드 내 프롤린 이미드 펩티드 결합의 시스-트랜스 이성질체화를 촉진하는 효소 부류이다. 프롤린 잔기는 이에 바로 선행하는 펩티딜 결합이 시스 또는 트랜스 입체구조를 채택할 수 있다는 점에서 아미노산 가운데 고유하다. 다른 모든 아미노산 경우, 이는 입체적 방해로 인해 알맞지 않다. 펩티딜-프롤릴 시스-트랜스 이소머라아제(PPI아제)는 한 형태에서 다른 형태로 이 결합의 전환을 촉매한다. 이러한 이성질체화는 단백질 폴딩, 재폴딩, 서브유닛의 조립 및 세포 내에서 수송을 촉진하고/거나 돕는다.
단백질과 비특이적인 방식으로 상호작용하는 것으로 보이는 일반적인 샤프론외에도, 특정 표적의 폴딩을 돕는 샤프론도 존재한다. 이들 단백질 특이적 샤프론은 이들의 표적과 복합체를 형성하고, 이는 응집 및 분해를 방지하고 이들이 다중 서브유닛 구조로 조립할 시간을 허용한다. PapD 샤프론이 한 예이다(본원에 참고로 포함되는 문헌(Lombardo et al., 1997, Escherichia coli PapD, in Guidebook to Molecular chaperones and Protien-Folding Catalysts, Gething M-J Ed. Oxford University Press Inc., New York:463-465)에 기재됨).
폴딩 조절 인자는, 예를 들어, HSP70 단백질, HSP110/SSE 단백질, HSP40 (DnaJ-관련) 단백질, GRPE-유사 단백질, HSP90 단백질, CPN60 및 CPN10 단백질, 세포질 샤프로닝, HSP100 단백질, 작은 HSP, 칼넥신 및 칼레티쿨린, PDI 및 티오레독신-관련 단백질, 펩티딜-프롤릴 이소머라아제, 시클로필린 PPI아제, FK-506 결합 단백질, 파불린 PPI아제, 개별 샤프로닝, 단백질 특이적 샤프론, 또는 분자 내 샤프론을 포함한다. 폴딩 조절 인자는 일반적으로 본원에서 참고로 포함되는 문헌("Guidebook to Molecular Chaperones and Protein-Folding Catalysts," 1997, ed. M. Gething, Melbourne University, Australia)에 기재되어 있다.
이. 콜라이의 세포질에서 가장 잘 특성화된 분자 샤프론은 ATP-의존적 DnaK-DnaJ-GrpE 및 GroEL-GroES 시스템이다. 이. 콜라이에서, 폴딩 조절 인자/샤프론의 네트워크는 Hsp70 패밀리를 포함한다. 주요 Hsp70 샤프론, DnaK는 단백질 응집을 효율적으로 방지하고 손상된 단백질의 재폴딩을 지원한다. 열 충격 단백질의 단백질 응집체로의 편입은 분해를 촉진할 수 있다. 시험관 내 연구를 기초로 하고 상동성을 고려하여, 많은 추가의 세포질 단백질이 이. 콜라이에서 분자 샤프론으로 기능을 한다고 제안되었다. 이들은 ClpB, HtpG 및 IbpA/B를 포함하며, 이들은 DnaK-DnaJ-GrpE 및 GroEL-GroES와 같이, 스트레스 레귤론에 속하는 열-충격 단백질(Hsp)이다.
피. 플루오레센스 DnaJ-유사 단백질은 DnaJ/Hsp40 패밀리 단백질에 속하는 분자 샤프론으로, 이들의 높이 보존된 J-도메인을 특징으로 한다. 70개 아미노산의 영역인 J-도메인은 DnaJ 단백질의 C 말단에 위치한다. N 말단은 막으로의 삽입을 촉진하는 막 관통(TM) 도메인을 갖는다. A-도메인은 J-도메인과 TM 도메인을 분리시킨다. DnaJ 패밀리의 단백질은 또 다른 샤프론 단백질, DnaK(공동-샤프론으로서)와 상호작용함으로써 단백질 폴딩에 중요한 역할을 한다. 높이 보존된 J-도메인은 DnaJ 단백질과 DnaK 단백질 사이에 상호작용 부위이다. I형 DnaJ 단백질은 진정한 DnaJ 단백질로 간주되지만, II 및 III형은 대개 DnaJ-유사 단백질로 언급된다. 또한, DnaJ-유사 단백질은, DnaK 의존적 및 DnaK-비의존적 두 가지 방식 모두로. 스트레스-변성된 단백질의 응집을 방지함으로써, 그리고 단백질을 해체함으로써, 고삼투압 및 열 충격에 반응하여 활동적으로 참여한다고 알려져 있다.
X-Pro 결합의 트랜스 입체구조는 신생 단백질 사슬에서 에너지 면에서 유리하다; 그러나 전체 프롤릴 펩티드 결합의 대략 5%는 천연 단백질에서 시스 입체구조로 발견된다. X-Pro 결합의 트랜스에서 시스로 이성질체화는 많은 폴리펩티드의 폴딩에서 속도 제한적이며 펩티딜 프롤릴 시스/트랜스 이소머라아제(PPI아제)에 의해 생체 내에서 촉매된다. 3가지 세포질 PPI아제, SlyD, SlpA 및 유발 인자(TF: trigger factor)가 현재까지 이. 콜라이에서 확인되었다. TF, 48 kDa 단백질은 이.콜라이에서 샤프론과 협력하는 것으로 추정된 50S 리보솜 서브유닛과 결합되어 새로 합성된 단백질의 적합한 폴딩을 보장하였다. 적어도 5가지 단백질(티오레독신 1 및 2, 및 글루타레독신 1, 2 및 3, 각각 trxA, trxB. grxA, grxB, 및 grxC 유전자의 산물)이 세포질 효소에 일시적으로 발생하는 디설피드 결합의 환원과 관련된다. 따라서, N-말단 융합 파트너는 디설피드 결합 형성 단백질 또는 적합한 디설피드 결합 형성을 가능하게 하는 샤프론일 수 있다.
본 발명의 방법에 유용한 폴딩 조절 인자의 예는 표 1에 나타낸다.
표 1. RXF 번호는 오픈 리딩 프레임을 나타낸다. 본원에서 그 전문이 참고로 포함되는 미국 특허 출원 공개공보 제2008/0269070호 및 제2010/0137162호(두 특허 모두의 명칭 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins")는 표 1에 열거된 단백질의 오픈 리딩 프레임을 개시한다. 또한, 프로테아제 및 폴딩 조절 인자는 본원에서 그 전문이 참고로 포함되는 미국 특허 제8,603,824호("Process for improved protein expression by strain engineering")의 표 A 내지 F에 제공된다.
링커
본 발명의 재조합 융합 단백질은 N-말단 융합 파트너와 관심의 C-말단 폴리펩티드 사이에 링커를 포함한다. 실시양태에서, 링커는 절단 효소, 즉, 단백질 내부를 절단하는 단백질 분해 효소에 의해 인식되는 절단 부위를 포함한다. 실시양태에서, 절단 부위에서 링커의 절단은 N-말단 융합 파트너와 관심 폴리펩티드를 분리시킨다. 단백질 분해 효소는 당 업계에 공지되거나 문헌, 예를 들어, 각각 본원에서 그 전문이 참고에 포함되는 PCT 공개공보 WO 2003/010204호("Process for Preparing Polypeptide of Interest from Fusion Polypeptide"), 미국 특허 제5,750,374호("Process for Producing Hydrophobic Polypeptide and Proteins, and Fusion Proteins for Use in Producing Same") 및 미국 특허 제5,935,824호에 기재된 임의의 프로테아제일 수 있다.
실시양태에서, 링커는 예를 들어, 세린 프로테아제, 트레오닌 프로테아제, 시스테인 프로테아제, 아스파테이트 프로테아제, 글루탐산 프로테아제, 메탈로프로테아제, 아스파라긴 프로테아제, 혼합된 프로테아제, 또는 미지의 촉매 유형의 프로테아제에 의해 절단되는 절단 부위를 포함한다. 실시양태에서, 세린 프로테아제는, 예를 들어, 트립신, 키모트립신, 엔도프로테이나제 Arg-C, 엔도프로테이나제 Glu-C, 엔도프로테이나제 Lys-C, 엘라스타아제, 프로테이나제 K, 섭틸리신, 카복시펩티다아제 P, 카복시펩티다아제 Y, 아실아미노산 분비 효소이다. 실시양태에서, 메탈로프로테아제는 예를 들어, 엔도프로테이나제 Asp-N, 써몰리신, 카복시펩티다아제 A, 카복시펩티다아제 B이다. 실시양태에서, 시스테인 프로테아제는 예를 들어, 파파인, 클로스트리파인, 카텝신 C, 또는 피로글루타메이트 아미노펩티다아제이다. 실시양태에서, 아스파테이트 프로테아제는 예를 들어, 펩신, 키모신, 카텝신 D이다. 실시양태에서, 글루탐산 프로테아제는 예를 들어, 사이탈리도글루탐산 펩티다아제이다. 실시양태에서, 아스파라긴 프로테아제는 예를 들어, 노다바이러스 펩티드 리아제, 인테인 함유 엽록체 ATP-의존성 펩티드 리아제, 인테인 함유 복제 DNA 헬리카아제 전구체, 또는 레오바이러스 1형 외피 단백질이다. 실시양태에서, 미지의 촉매 유형의 프로테아제는 예를 들어, 콜라게나아제, 단백질 P5 무레인 엔도펩티다아제, 동종 다량체 펩티다아제, 미크로신 프로세싱 펩티다아제 1, 또는 Dop 이소펩티다아제이다.
실시양태에서, 링커는 아크로모펩티다아제, 아미노펩티다아제, 안크로드, 안지오텐신 전환 효소, 브로멜라인, 칼페인, 칼페인 I, 칼페인 II, 카복시펩티다아제 A, 카복시펩티다아제 B, 카복시펩티다아제 G, 카복시펩티다아제 P, 카복시펩티다아제 W, 카복시펩티다아제 Y, 카스파제(일반), 카스파제 1, 카스파제 2, 카스파제 3, 카스파제 4, 카스파제 5, 카스파제 6, 카스파제 7, 카스파제 8, 카스파제 9, 카스파제 10, 카스파제 11, 카스파제 12, 카스파제 13, 카텝신 B, 카텝신 C, 카텝신 D, 카텝신 E, 카텝신 G, 카텝신 H, 카텝신 L, 키모파파인, 키마아제, 키모트립신, a-클로스트리파인, 콜라게나아제, 보체 C1r, 보체 C1s, 보체 인자 D, 보체 인자 I, 쿠쿠미신, 디펩티딜 펩티다아제 IV, 백혈구 엘라스타아제, 엘라스타아제, 엔도프로테이나제 Arg-C, 엔도프로테이나제 Asp-N, 엔도프로테이나제 Glu-C, 엔도프로테이나제 Lys-C, 엔테로키나아제, 인자 Xa, 피신, 퓨린, 그란자임 A, 그란자임 B, HIV 프로테아제, IG아제, 칼리크레인 조직, 류신 아미노펩티다아제(일반), 세포질 류신 아미노펩티다아제, 마이크로솜 류신 아미노펩티다아제, 기질 메탈로프로테아제, 메티오닌 아미노펩티다아제, 뉴트라제, 파파인, 펩신, 플라스민, 프롤리다아제, 프로나아제 E, 전립선 특이 항원, 스트렙토마이세스 그리세우스 ( Streptomyces griseus)의 호염기성 프로테아제, 아스페르길루스(Aspergillus )의 프로테아제, 아스페르길루스 사이토이(Aspergillus saitoi)의 프로테아제, 아스페르길루스 소제(Aspergillus sojae)의 프로테아제, 프로테아제(비. 리체니포르미스(B. licheniformis))(알칼리), 프로테아제(비. 리체니포르미스)(알칼라아제), 바실러스 폴리믹사(Bacillus polymyxa )의 프로테아제, 바실러스 종의 프로테아제(에스페라아제), 리조푸스(Rhizopus ) 종의 프로테아제, 프로테아제 S, 프로테아솜, 아스페르길루스 오리제( Aspergillus oryzae )의 프로테이나제, 프로테이나제 3, 프로테이나제 A, 프로테이나제 K, 단백질 C, 피로글루타메이트 아미노펩티다아제, 레닌, 렌닌, 스트렙토키나아제, 섭틸리신, 써몰리신, 트롬빈, 조직 플라스미노겐 활성화 인자, 트립신, 트립타아제, 또는 유로키나아제의 절단 부위를 포함한다. 실시양태에서, 링커는 엔테로키나아제, 인자 Xa, 또는 퓨린에 의해 인식되는 절단 부위를 포함한다. 실시양태에서, 링커는 엔테로키나아제 또는 트립신에 의해 인식되는 절단 부위를 포함한다. 실시양태에서, 링커는 소 엔테로키나아제에 의해 인식되는 절단 부위를 포함한다. 본 발명의 방법에 유용한 상기 및 기타 프로테아제, 및 이들의 절단 인식 부위는 당 업계에 공지되거나 문헌, 예를 들어, 본원에서 참고로 포함되는 문헌(Harlow and Lane, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1988); Walsh, PROTEINS: BIOCHEMISTRY AND BIOTECHNOLOGY, John Wiley & Sons, Ltd., West Sussex, England (2002))에 기재되어 있다.
실시양태에서, 링커는 친화성 태그를 포함한다. 친화성 태그는 단백질 정제를 도울 수 있는 펩티드 서열이다. 친화성 태그는 단백질에 융합되어 친화성 기술을 이용하여 천연 그대로의 생물원으로부터 단백질의 정제를 용이하게 한다. 당 업계에 공지된 임의의 적합한 친화성 태그는 원하는 바에 따라 사용할 수 있다. 실시양태에서, 본 발명에 사용되는 친화성 태그는, 예를 들어, 키틴 결합 단백질, 말토오스 결합 단백질, 또는 글루타티온-S-전달효소 단백질, 폴리히스티딘, FLAG 태그(서열 번호 229), 칼모듈린 태그(서열 번호 230), Myc 태그, BP 태그, HA-태그(서열 번호 231), E-태그(서열 번호 232), S-태그(서열 번호 233), SBP 태그(서열 번호 234), 소프태그 1, 소프태그 3(서열 번호 235), V5 태그(서열 번호 236), 엑스프레스(Xpress) 태그, 녹색 형광 단백질, Nus 태그, 스트렙(Strep) 태그, 티오레독신 태그, MBP 태그, VSV 태그(서열 번호 237), 또는 Avi 태그이다.
친화성 태그는 화학 제제 또는 효소 수단, 예를 들어 단백질 분해에 의해 제거될 수 있다. 단백질 정제에 친화성 태그의 이용 방법은 예를 들어, 문헌(Lichty, et al., 2005, "Comparison of affinity tags for protein purification," Protein Expression and Purification 41: 98-105)에 기재되어 있다. 본 발명의 링커에 유용한 기타 친화성 태그는 당 업계에 공지되어 있으며 문헌, 예를 들어 상기에 참고문헌으로 언급된 미국 특허 제5,750,374호, 및 문헌(Terpe K., 2003, "Overview of Tag pPotein Fusions: from molecular and biochemical fundamentals to commercial systems," Applied Microbiology and Biotechnology (60):523-533)에 기재되어 있으며, 이들은 둘 다 본원에서 그 전문이 참고에 포함된다.
실시양태에서, 링커는 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50개 이상의 아미노산 길이이다. 실시양태에서, 링커는 4 내지 50, 4 내지 45, 4 내지 40, 4 내지 35, 4 내지 30, 4 내지 25, 4 내지 20, 4 내지 15, 4 내지 10, 5 내지 50, 5 내지 45, 5 내지 40, 5 내지 35, 5 내지 30, 5 내지 25, 5 내지 20, 5 내지 15, 5 내지 10, 10 내지 50, 10 내지 45, 10 내지 40, 10 내지 35, 10 내지 30, 10 내지 25, 10 내지 20, 10 내지 15, 15 내지 50, 15 내지 45, 15 내지 40, 15 내지 35, 15 내지 30, 15 내지 25, 15 내지 20, 20 내지 50, 20 내지 45, 20 내지 40, 20 내지 35, 20 내지 30, 또는 20 내지 25개 아미노산 길이이다. 실시양태에서, 링커는 18개 아미노산 길이이다. 실시양태에서, 링커는 19개 아미노산 길이이다.
실시양태에서, 링커는 여러 개의 글리신 잔기를 포함한다. 실시양태에서, 링커는 1, 2, 3, 4, 5, 6, 7, 8개 이상의 글리신 잔기를 포함한다. 실시양태에서, 링커는 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 또는 1 내지 4개 글리신 잔기를 포함한다. 실시양태에서, 글리신 잔기는 연속적이다. 실시양태에서, 링커는 적어도 한 개의 세린 잔기를 포함한다. 실시양태에서, 글리신 및/또는 세린 잔기는 스페이서를 포함한다. 실시양태에서, 스페이서는 서열 번호 59에 개시된 10개의 아미노산을 갖는 (G4S)2 스페이서이다. 실시양태에서, 스페이서는 (G4S)1, (G4S)2, (G4S)3, (G4S)4, 또는 (G4S)5 스페이서이다. 실시양태에서, 링커는 6개의 히스티딘 잔기, 또는 His-태그를 포함한다. 실시양태에서 링커는 엔테로키나아제 절단 부위, 예를 들어, 서열 번호 13(DDDDK)에 개시된 바와 같은 부위를 포함한다. 실시양태에서, 재조합 융합 단백질은 표 2에 열거된, 서열 번호 9 내지 12, 또는 226중 어느 하나에 개시된 링커를 포함한다. 서열 번호 9에서 엔테로키나아제 절단 부위는 밑줄로 나타낸다. 폴리히스티딘 친화성 태그는 서열 번호 9 내지 12 및 226 각각에 기울임체로 나타낸다. 실시양태에서, 재조합 융합 단백질은 서열 번호 9에 해당하는 링커를 포함한다.
발현 벡터
실시양태에서, 재조합 융합 단백질을 코딩하는 유전자 단편을 적합한 발현 플라스미드에 도입하여 재조합 융합 단백질을 발현하는 발현 벡터를 생성한다. 발현 벡터는, 예를 들어, 플라스미드일 수 있다. 일부 실시양태에서, 재조합 융합 단백질 서열을 코딩하는 플라스미드는 선별 마커를 포함할 수 있고, 플라스미드를 유지하는 숙주 세포는 선택적인 조건하에서 배양될 수 있다. 일부 실시양태에서, 플라스미드는 선별 마커를 포함하지 않는다. 일부 실시양태에서, 발현 벡터는 숙주 세포 게놈에 통합될 수 있다. 일부 실시양태에서, 발현 벡터는 링커 및 발현된 융합 단백질을 세포질로 향하게 할 수 있는 단백질에 융합된 hPTH 1-34를 코딩한다. 실시양태에서, 발현 벡터는 링커 및 발현된 융합 단백질을 주변세포질로 향하게 할 수 있는 단백질에 융합된 hPTH 1-34를 코딩한다. 일부 실시양태에서, 발현 벡터는 링커 및 피. 플루오레센스 DnaJ-유사 단백질에 융합된 hPTH 1-34를 코딩한다. 일부 실시양태에서, 발현 벡터는 링커 및 피. 플루오레센스 FklB 단백질에 융합된 hPTH 1-34를 코딩한다.
PTH 1-34 융합 단백질을 코딩하는 뉴클레오티드 서열의 예는 본원에서 서열의 표에 제공한다. DnaJ-유사 단백질 N-말단 융합 파트너를 포함하는 융합 단백질을 코딩하는 뉴클레오티드 서열의 예는 유전자 ID 126203(서열 번호 52)으로 지정되며, 이는 피. 플루오레센스에 최적화된 코딩 서열에 해당한다. 유전자 ID 126206(서열 번호 53)으로 지정된 서열은 최적화된 링커 및 PTH 1-34 코딩 서열에 융합된 천연 피. 플루오레센스 DnaJ 코딩 서열에 해당한다. 유전자 서열 126203 및 126206은 각각 발현 플라스미드 p708-001 및 p708-004에 존재하는 것이다. FklB N-말단 융합 파트너를 포함하는 융합 단백질을 코딩하는 뉴클레오티드 서열의 예는 유전자 ID 126204(서열 번호 54)로 지정되며, 이는 피. 플루오레센스에 최적화된 코딩 서열에 해당한다. 유전자 ID 126207(서열호 55)은 최적화된 링커 및 PTH1-34 코딩 서열에 융합된 천연 피. 플루오레센스 FklB 코딩 서열에 해당한다. 유전자 서열 126204 및 126207은 각각 발현 플라스미드 p708-002 및 p708-005에 존재하는 것이다. FrnE N-말단 융합 파트너를 포함하는 융합 단백질을 코딩하는 뉴클레오티드 서열의 예는 유전자 ID 126205(서열 번호 56)로 지정되며, 이는 피. 플루오레센스에 최적화된 코딩 서열에 해당한다. 유전자 ID 126208(서열 번호 57)에 지정된 서열은 최적화된 링커 및 PTH1-34 코딩 서열에 융합된 천연 피. 플루오레센스 FrnE 코딩 서열에 해당한다. 유전자 서열 126205 및 126208은 각각 발현 플라스미드 p708-003 및 p708-006에 존재한다.
코돈 최적화
본 발명은 사용되는 숙주 세포에서 발현에 최적화된 임의의 서열을 포함하는, 융합 단백질의 임의의 적합한 코딩 서열 및/또는 이의 각각의 개별 구성요소의 사용을 고려한다. 박테리아 숙주에서 발현을 향상시키기 위한 코돈의 최적화 방법은 당 업계에 공지되어 있으며, 문헌에 기재되어 있다. 예를 들어, 슈도모나스 숙주 균주에서 발현하기 위한 코돈의 최적화는 예를 들어, 본원에서 그 전문이 참고로 포함되는 미국 특허 출원 공개공보 제2007/0292918호("Codon Optimization Method")에 기재되어 있다. 이. 콜라이에서 발현을 위한 코돈의 최적화는 예를 들어, 본원에서 참고로 포함되는 문헌(Welch, et al., 2009, PLoS One, "Design Parameters to Control Synthetic Gene Expression in Escherichia coli , 4(9): e7002)에 기재되어 있다. 융합 단백질 구성요소를 위한 코딩 서열의 비제한적인 예가 본원에 제공되지만, 임의의 적합한 서열은 당 업자에게 잘 알려진 방법에 따라 원하는 대로 생성될 수 있다고 이해된다.
발현 시스템
본 방법에 따라 관심 폴리펩티드를 생산하는데 유용한 적합한 박테리아 발현 시스템은 본원의 교시내용을 기초로 하여 당업자에 의해 확인될 수 있다. 실시양태에서, 관심 폴리펩티드를 포함하는 재조합 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조물은 유도성 발현 벡터의 일부로서 제공된다. 실시양태에서, 발현 벡터로 형질전환된 숙주 세포를 배양하고, 발현 벡터로부터 융합 단백질의 발현을 유도한다. 발현 벡터는 예를 들어, 플라스미드일 수 있다. 실시양태에서, 발현 벡터는 선별 마커를 추가로 포함하는 재조합 융합 단백질 코딩 서열을 코딩하는 플라스미드이고, 숙주 세포는 플라스미드를 유지하도록 하는 선별 조건하에서 배양된다. 실시양태에서, 발현 구조물은 숙주 세포 게놈으로 통합된다. 실시양태에서, 발현 구조물은 재조합 융합 단백질을 주변세포질로 향하게 할 수 있는 분비 신호에 융합된 재조합 융합 단백질을 코딩한다.
슈도모나스 숙주 세포를 포함하여 본 발명의 방법에 유용한 숙주 세포에서, 유용한 조절 서열(예를 들어, 프로모터, 분비 리더, 및 리보솜 결합 부위)를 포함하는 이종 단백질의 발현 방법은 예를 들어, 각각 본원에서 그 전문이 참고로 포함되는 미국 특허 출원 공개공보 제2008/0269070호 및 제2010/0137162호, 미국 특허 출원 공개공보 제2006/0040352호("Expression of Mammalian Proteins in Pseudomonas fluorescens") 및 미국 특허 제8,603,824호에 기재되어 있다. 또한, 이들 공보는 이종 단백질 발현을 증가시키기 위해서 폴딩 조절 인자를 과발현하도록 조작되거나, 예를 들어, 프로테아제의 활성을 제거, 불활성화, 또는 감소시키도록, 프로테아제 돌연변이가 도입된, 본 발명의 방법을 실시하는데 유용한 박테리아 숙주 균주를 기재한다. 서열 리더는 둘 다 본원에서 그 전문이 참고로 포함되는 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression") 및 미국 특허 제7,985,564호("Expression Systems with Sec-system Secretion)뿐 아니라 앞서 참고문헌으로 언급된 미국 특허 출원 공개공보 제2010/0137162호에 상세하게 기재되어 있다.
본 발명에 따라 사용되는 프로모터는 구성적 프로모터 또는 조절되는 프로모터일 수 있다. 유도성 프로모터의 예는 lac 프로모터(즉, lacZ 프로모터), 예를 들어, 본원에서 참고로 포함되는 미국 특허 제4,551,433호("Microbial Hybrid Promoters")에 기재된 tac 및 trc 프로모터뿐 아니라 Ptac16, Ptac17, PtacII, PlacUV5, 및 T7lac 프로모터로부터 유래한 패밀리의 프로모터를 포함한다. 실시양태에서, 프로모터는 숙주 세포 생물체로부터 유래하지 않는다. 실시양태에서, 프로모터는 이. 콜라이 균으로부터 유래한다. 실시양태에서, lac 프로모터는 플라스미드로부터 재조합 융합 단백질의 발현을 조절하는데 사용된다. lac 프로모터 유도체 또는 패밀리 일원, 예를 들어, tac 프로모터일 경우, 유도인자는 IPTG(이소프로필-β-D-1-티오갈락토피라노시드, "이소프로필티오갈락토시드")이다. 실시양태에서, IPTG는 당 업계에 공지되고 문헌, 예를 들어, 미국 특허 공개공보 제2006/0040352호에 기재된 방법에 따라 슈도모나스 숙주 세포에서 lac 프로모터로부터 재조합 융합 단백질의 발현을 유도하도록 숙주 세포 배양물에 첨가된다.
본 발명에 따른 발현 시스템에 유용한 비-lac 프로모터의 예는 예를 들어 문헌(J. Sanchez-Romero & V. De Lorenzo (1999) Manual of Industrial Microbiology and Biotechnology (A. Demain & J. Davies, eds.) pp. 460-74 (ASM Press, Washington, D.C.); H. Schweizer (2001) Current Opinion in Biotechnology, 12:439-445; and R. Slater & R. Williams (2000 Molecular Biology and Biotechnology (J. Walker & R. Rapley, eds.) pp. 125-54 (The Royal Society of Chemistry, Cambridge, UK))에 기재된 PR(고온에 의해 유도됨), PL(고온에 의해 유도됨), Pm(알킬- 또는 할로-벤조에이트에 의해 유도됨), Pu(알킬- 또는 할로-톨루엔에 의해 유도됨), 또는 Psal(살리실레이트에 의해 유도됨)을 포함한다. 또한, 선택된 박테리아 숙주 세포에 천연인 프로모터의 뉴클레오티드 서열을 가진 프로모터, 예를 들어, 슈도모나스 안트라닐레이트 또는 벤조에이트 오페론 프로모터(Pant, Pben)는 관심 폴리펩티드를 코딩하는 발현 구조물의 발현을 조절하는데 사용될 수 있다. 또한, 하나 이상의 프로모터가, 동일하거나 상이한 생물체로부터 유래한 서열이 동일하거나 상이한, 또 다른 프로모터에 공유적으로 부착된 직렬(tandem) 프로모터, 예를 들어, Pant-Pben 직렬 프로모터(프로모터간 혼성체) 또는 Plac-Plac 직렬 프로모터가 사용될 수 있다. 실시양태에서, 프로모터는 예를 들어, 본원에서 그 전문이 참고에 포함되는 미국 특허 제7,476,532호 및 제8,017,355호(두 특허의 명칭 모두 "Mannitol induced promoter systems in bacterial host cells")에 기재된 Pmtl이다.
조절되는(유도성) 프로모터는 프로모터가 일부가 되는 유전자의 전사를 조절하기 위해서 프로모터 조절 단백질을 이용한다. 조절되는 프로모터가 본원에서 사용되는 경우, 해당하는 프로모터 조절 단백질은 또한 본 발명에 따른 발현 시스템의 일부가 될 것이다. 프로모터 조절 단백질의 예는 활성화 인자 단백질, 예를 들어, 이. 콜라이 분해대사 산물 활성화 인자 단백질, MalT 단백질; AraC 패밀리 전사 활성화 인자; 억제인자 단백질, 예를 들어, 이. 콜라이 Lad 단백질; 및 이중 기능 조절 단백질, 예를 들어, 이. 콜라이 NagC 단백질을 포함한다. 많은 조절되는-프로모터/프로모터-조절-단백질 쌍이 당 업계에 공지되어 있다.
프로모터 조절 단백질은 이펙터 화합물, 즉 조절 단백질과 가역적으로 또는 비가역적으로 결합하는 화합물과 상호작용하여, 단백질이 프로모터 조절하에 있는 유전자의 적어도 하나의 DNA 전사 조절 영역에서 유리되거나 이에 결합하도록 하여 유전자의 전사를 개시하는데 전사효소의 작용을 허용하거나 차단한다. 이펙터 화합물은 유도인자 또는 공-억제인자로서 분류되고, 이들 화합물은 천연 이펙터 화합물 및 무상(gratuitous) 유도인자 화합물을 포함한다. 많은 조절되는-프로모터/프로모터-조절-단백질/이펙터-화합물 트리오는 당 업계에 공지되어 있다. 이펙터 화합물은 세포 배양 또는 발효 과정에 걸쳐 사용될 수 있지만, 요망하는 양 또는 밀도의 숙주 세포 생물량의 배양 후 조절되는 프로모터가 사용되는 바람직한 실시양태에서, 적합한 이펙터 화합물은 배양물에 첨가되어 결과적으로 관심의 단백질 또는 폴리펩티드를 코딩하는 요망하는 유전자(들)의 발현을 직접 또는 간접적으로 일으킨다.
lac 패밀리 프로모터가 이용되는 실시양태에서, lacI 유전자가 또한 시스템에 존재할 수 있다. 보통 구성적으로 발현되는 유전자인 lacI 유전자는 lac 패밀리 프로모터의 lac 작동 인자(operator)에 결합하는 Lac 억제인자 단백질 LacI 단백질을 코딩한다. 따라서, lac 패밀리 프로모터가 이용되는 경우, lac 유전자는 또한 발현 시스템에 포함되고 발현될 수 있다.
기타 조절 요소
실시양태에서, 기타 조절 요소는 재조합 융합 단백질을 코딩하는 발현 구조물에 존재한다. 실시양태에서, 가용성 재조합 융합 단백질은 생산 과정에서 세포의 세포질 또는 주변세포질에 존재한다. 융합 단백질을 표적화하는데 유용한 분비 리더는 본원에서 그 밖의 다른 곳에 기재되어 있다. 실시양태에서, 본 발명의 발현 구조물은 재조합 융합 단백질을 슈도모나드 세포의 세포질로 운반할 수 있는 분비 리더에 융합된 재조합 융합 단백질을 코딩한다. 실시양태에서, 발현 구조물은 재조합 융합 단백질을 슈도모나드 세포의 주변세포질로 운반할 수 있는 분비 리더에 융합된 재조합 융합 단백질을 코딩한다. 실시양태에서, 분비 리더는 재조합 융합 단백질로부터 절단된다.
기타 요소는 앞서 기재된, 발현 폴리펩티드의 확인, 분리, 정제, 및/또는 단리를 용이하게 하는 전사 인핸서 서열, 번역 인핸서 서열, 기타 프로모터, 활성화 인자, 번역 개시 및 정지 신호, 전사 종료 인자, 시스트론 조절 인자, 폴리시스트론 조절 인자, 태그 서열, 예를 들어 뉴클레오티드 서열 "태그" 및 "태그" 폴리펩티드 코딩 서열을 포함하나 이에 제한되지 않는다. 실시양태에서, 발현 구조물은 단백질 코딩 서열 이외에 이에 작동 가능하게 연결된 임의의 하기 조절 요소를 포함한다: 프로모터, 리보솜 결합 부위(RBS), 전사 종결 인자, 및 번역 개시 및 정지 신호. 유용한 RBS는 예를 들어, 앞서 참고문헌으로 언급된 미국 특허 출원 공개공보 제2008/0269070호 및 제2010/0137162호에 따른 발현 시스템에서 숙주 세포로서 유용한 임의의 종으로부터 얻을 수 있다. 많은 특이적이고 다양한 공통 RBS, 예를 들어, 본원에서 참고로 포함되는 문헌(D. Frishman et al., Gene 234(2):257-65 (8 Jul. 1999); 및 B. E. Suzek et al., Bioinformatics 17(12):1123-30 (December 2001))에 기재되고 참고된 것들이 공지되어 있다. 또한, 천연 또는 합성 RBS, 예를 들어, EP 0207459호(합성 RBS); 문헌(O. Ikehata et al., Eur. J. Biochem. 181(3):563-70 (1989))에 기재된 것들이 사용될 수 있다. 실시양태에서, "Hi" 리보솜 결합 부위, aggagg(서열 번호 60)가 구조물에 사용된다. RBS와 번역 개시 코돈 사이의 간격의 최적화를 포함한 리보솜 결합 부위는, 문헌, 예를 들어, 본원에서 참고로 포함되는 문헌(Chen, et al., 1994, "Determination of the optimal aligned spacing between the Shine-Dalgarno sequence and the translation initiation codon of Escherichia coli mRNAs," Nucleic Acids Research 22(23):4953-4957, 및 Ma, et al., 2002, "Correlations between Shine-Dalgarno Sequences and Gene Features Such as Predicted Expression Levels and Operon Structures," J. Bact. 184(20): 5733-45)에 기재되어 있다.
본 발명에 유용한 방법, 벡터 및 번역 및 전사 요소, 및 기타 요소의 추가적인 예는 당 업계에 잘 알려져 있고, 예를 들어 모두 본원에서 참고로 포함되는 미국 특허 제5,055,294호(Gilroy) 및 미국 특허 제5,128,130호(Gilroy et al.); 미국 특허 제5,281,532호(Rammler et al.); 미국 특허 제4,695,455호 및 4,861,595호(Barnes et al.); 미국 특허 제4,755,465호(Gray et al.); 및 미국 특허 제5,169,760호(Wilcox)뿐 아니라 본원에서 참고로 포함되는 많은 기타 출판물에 기재되어 있다.
분비 리더 서열
실시양태에서, 분비 신호 또는 리더 코딩 서열은 재조합 융합 단백질을 코딩하는 서열의 N-말단에 융합된다. 분비 신호 서열의 사용은 세균에서 재조합 단백질의 생산을 증가시킬 수 있다. 추가적으로, 많은 유형의 단백질은 공지된 방법을 이용하여 효율적으로 달성된 2차 변형을 요구한다. 분비 리더 이용은 세포 내 환경으로부터 단백질을 분비하여 적합하게 폴딩된 단백질의 수거량을 증가시킬 수 있다. 그람 음성균에서, 세포질로부터 분비된 단백질은 결국 외부 막에 부착된 주변세포질 공간에, 또는 세포 외 브로쓰에 존재한다. 또한, 이들 방법은 봉입체의 형성을 방지한다. 주변세포질 공간으로 단백질의 분비는 또한 적합한 디설피드 결합 형성을 촉진하는 효과를 갖는다(Bardwell et al., 1994, Phosphate Microorg, Chapter 45, 270-5, 및 Manoil, 2000, Methods in Enzymol. 326:35-47). 재조합 단백질의 분비의 다른 장점은 더 효율적인 단백질의 단리, 적합한 폴딩 및 단백질의 디설피드 결합 형성을 포함하며, 이는 예를 들어, 활성 형태의 단백질의 비율로 나타낸 수율의 증가, 봉입체 형성의 감소 및 숙주 세포에 대한 독성 감소, 및 가용성 형태의 재조합 단백질의 비율의 증가를 일으킨다. 또한, 관심 단백질의 배양 배지로의 분비 가능성은 아마도 단백질 생산을 위한 회분식 배양이라기보다는 연속 배양을 촉진할 수 있다.
실시양태에서, 재조합 융합 단백질 또는 관심 폴리펩티드는 숙주 세포의 주변세포질로 또는 세포 외 공간으로 표적화된다. 실시양태에서, 발현 벡터는 재조합 융합 단백질 또는 관심 폴리펩티드를 코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 분비 신호 폴리펩티드를 코딩하는 뉴클레오티드 서열을 더 포함한다.
따라서, 한 실시양태에서, 재조합 융합 단백질은 분비 신호, N-말단 융합 파트너, 링커, 및 관심 폴리펩티드를 포함하며, 여기서 분비 신호는 융합 파트너의 N-말단이다. 분비 신호는 단백질이 주변세포질로 표적화될 때 재조합 융합 단백질로부터 절단될 수 있다. 실시양태에서, 분비 신호와 단백질 또는 폴리펩티드 사이의 결합은 융합 단백질로부터 분비 신호의 절단을 증가시키도록 변형된다.
숙주 세포 및 균주
슈도모나드(즉, 슈도모나스 목의 숙주 세포)를 포함한 박테리아 숙주 세포 및 밀접하게 관련된 박테리아 유기체가 본 발명의 발명을 실시하는데 사용하기 위해 고려된다. 특정 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 플루오레센스이다. 또한, 숙주 세포는 이. 콜라이일 수 있다
본 발명의 방법을 실시하는데 유용한 숙주 세포 및 구조물은 당 업계에 공지
되고 문헌, 예를 들어, 본원에서 그 전문이 참고로 포함되는 미국 특허 제8,288,127호("Protein Expression Systems")에 기재된 시약 및 방법을 이용하여 확인되거나 제조될 수 있다. 본 특허는 염색체 lacI 유전자 삽입물을 포함하는 영양 요구성 슈도모나스 플루오레센스 숙주 세포로 핵산 구조물의 도입에 의한 재조합 폴리펩티드의 생산을 기재한다. 핵산 구조물은 숙주 세포에서 핵산의 발현을 지시할 수 있는 프로모터에 작동 가능하게 연결된 재조합 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고, 또한, 영양 요구성 선별 마커를 코딩하는 뉴클레오티드 서열을 포함한다. 영양 요구성 선별 마커는 영양 요구성 숙주 세포에 대한 원영양성(prototophy)을 회복시키는 폴리펩티드이다. 실시양태에서, 세포는 프롤린, 우라실, 또는 이들의 조합에 대해 영양 요구성을 갖는다. 실시양태에서, 숙주 세포는 MB101(ATCC 기탁 PTA-7841)로부터 유래한다. 둘 다 본원에서 그 전문이 참고에 포함된 미국 특허 제8,288,127호("Protein Expression Systems") 및 문헌(Schneider, et al., 2005, "Auxotrophic markers pyrF and proC can replace antibiotic markers on protein production plasmids in high-cell-density Psedomonas fluorescens fermentation," Biotechnol. Progress 21(2): 343-8)은 균주 MB101에서 pyrF 유전자를 결실시켜 제작된 우라실에 대한 생산 숙주 균주 영양 요구성을 기재한다. pyrF 유전자를 균주 MB214(ATCC 기탁 PTA-7840)로부터 클로닝하여 pyrF 결실을 보완하여 원영양성을 회복할 수 있는 플라스미드를 생성하였다. 특정 실시양태에서, 피. 플루오레센스 숙주 세포에서 이중 pyrF - proC 이중 영양 요구성 선별 마커 시스템이 사용된다. 공개 문헌에 제공되기 때문에, 기재된 바와 같은 PyrF 생산 숙주 균주는 표준 재조합 방법에 따라 당 업자에 의해 생산될 수 있고 본 발명의 방법을 실행하는데 유용한 것으로 본원에 기재된 것들을 포함하여 기타 요망하는 게놈 변화를 도입하기 위한 배경으로서 사용될 수 있다.
실시양태에서, 숙주 세포는 슈도모나스 목("슈도모나드"로도 불림)이다. 숙주 세포가 슈도모나스 목일 경우, 슈도모나스 속을 포함하는 슈도모나다세에 (Pseudomonadaceae) 과의 일원일 수 있다. 감마 프로테오박테리아 숙주는 이. 콜라이 종의 일원 및 슈도모나스 플루오레센스 종의 일원을 포함한다. 기타 슈도모나스 균이 또한 유용할 수 있다. 슈도모나드 및 밀접하게 관련된 종은 그람 음성 프로테오박테리아 서브그룹 1을 포함하며, 이는 모두 본원에서 그 전문이 참고로 포함되는 문헌("Gram-Negative Aerobic Rods and Cocci" by R. E. Buchanan and N. E. Gibbons (eds.), Bergey's Manual of Determinative Bacteriology, pp. 217-289 (8th ed., 1974) (The Williams & Wilkins Co., Baltimore, Md., USA))에 기재된 과 및/또는 속에 속하는 프로테오박테리아 군을 포함한다(즉, 슈도모나스 목의 숙주 세포). 표 3은 이들 균의 과 및 속을 나타낸다.
슈도모나스 및 밀접하게 관련된 세균은 일반적으로 "그람(-) 프로테오박테리아 서브그룹 1" 또는 "그람 음성 호기성 간균 및 구균" (Buchanan and Gibbons (eds.) (1974) Bergey's Manual of Determinative Bacteriology, pp. 217-289)으로 정의되는 군의 일부이다. 슈도모나스 숙주 균주는 문헌, 예를 들어 본원에서 그 전문이 참고에 포함된 미국 특허 출원 공개공보 2006/0040352호에 개시되어 있다.
또한, "그람 음성 프로테오박테리아 서브그룹 1"은 분류에 사용되는 기준에 따라 표제에 분류되는 프로테오박테리아를 포함한다. 또한, 표제는 이전에는 이 부문에 분류되었지만 더 이상은 아닌 군, 예를 들어 속 애시도보랙스(Acidovorax ), 브레분디모나스(Brevundimonas), 부르크홀데리아(Burkholderia ), 히드로제네파가(Hydrogenophaga), 오세아니모나스( Oceanimonas ), 랄스토니아( Ralstonia ), 및 스테노트로포모나스(Stenotrophomonas), 속 산토모나스에 속하는(그리고 이 종으로 이전에 불리던) 균을 재그룹화하여 생긴 속 스피고모나스(Sphingomonas )(및 이로부터 유래한 속 블라스토모나스(Blastomonas), 문헌(Bergey (1974))에 정의된 속 아세토박터에 속하는 균을 재그룹화하여 생긴 속 애시도모나스(Acidomonas)를 포함한다. 또한, 숙주는 속 슈도모나스, 슈도모나스 에날리아( Pseudomonas enalia )(ATCC 14393), 슈도모나스 니그리파시엔시( Pseudomonas nigrifaciensi)(ATCC 19375), 및 슈도모나스 푸트레파시엔스( Pseudomonas putrefaciens)(ATCC 8071)의 세포를 포함할 수 있으며, 이들은 알테로모나스 할로플란크티스(Alteromonas haloplanktis ), 알테로모나스 니그리파시엔스( Alteromonas nigrifaciens ), 및 알테로모나스 푸트레파시엔스(Alteromonas putrefaciens )로 각각 재분류되었다. 유사하게, 예를 들어, 슈도모나스 애시도보란스(ATCC 15668) 및 슈도모나스 테스토스테로니( Pseudomonas testosteroni )(ATCC 11996)는 각각 코마모나스 애시도보란스( Comamonas acidovorans ) 및 코마모나스 테스토스테로니(Comamonas testosteroni )로 재분류되었고; 슈도모나스 니그리파시엔스(ATCC 19375) 및 슈도모나스 피시시다( Pseudomonas piscicida )(ATCC 15057)는 각각 슈도알테로모나스 니그리파시엔스)(Pseudoalteromonas nigrifaciens ) 및 슈도알테로모나스 피시시다(Pseudoalteromonas piscicida )로 재분류되었다. "그람 음성 프로테오박테리아 서브그룹 1"은 또한 하기 임의의 과에 속한다고 분류되는 프로테오박테리아를 포함한다: 슈도모나다세에, 아조토박테라세에(Azotobacteraceae)(현재 동의어 슈도모나다세에의 "아조토박터 군"으로 대개 불림), 리조비아세에(Rhizobiaceae), 및 메틸로모나다세에(Methylomonadaceae)(현재 동의어 "메틸로코카세에(Methylococcaceae)"로 불림). 결과적으로, 본원에 그 외 기재된 속 이외에, "그람 음성 프로테오박테리아 서브그룹 1" 내에 해당하는 추가의 프로테오박테리아 속은 1) 아조토박터 군 박테리아의 아조리조필러스(Azorhizophilus ) 속; 2) 슈도모나다세에 과 박테리아의 셀비브리오( Cellvibrio ), 올리겔라( Ollygella ), 및 테레디니박터(Teredinibacter) 속; 3) 리조비아세에 과 박테리아의 켈라토박터(Chelatobacter), 엔시퍼( Ensifer ), 리베리박터( Liberibacter )("칸디다터스 리베리박터(Candidatus Liberibacter )"로도 불림), 및 시노리조비움(Sinorhizobium ) 속; 및 4) 메틸로코카세에(Methylococcaceae) 과 박테리아의 메틸로박터(Methylobacter), 메틸로칼둠(Methylocaldum ), 메틸로미크로비움(Methylomicrobium), 메틸로사르시나( Methylosarcina ), 및 메틸로스페라(Methylosphaera) 속을 포함한다.
숙주 세포는 "그람 음성 프로테오박테리아 서브그룹 16"으로부터 선택할 수 있다. "그람 음성 프로테오박테리아 서브그룹 16"은 하기 프로테오박테리아 군의 슈도모나스 종(괄호 안에 나타낸 대표적인 균주(들)의 ATCC 또는 다른 기탁 번호가 함께)으로 정의된다: 슈도모나스 아비에타니필라( Pseudomonas abietaniphila )(ATCC 700689); 슈도모나스 애루지노사( Pseudomonas aeruginosa )(ATCC 10145); 슈도모나스 알칼리제네스( Pseudomonas alcaligenes)(ATCC 14909); 슈도모나스 앤귈리셉티카( Pseudomonas anguilliseptica)(ATCC 33660); 슈도모나스 시트로넬로리스( Pseudomonas citronellolis)(ATCC 13674); 슈도모나스 플라베센스( Pseudomonas flavescens)(ATCC 51555); 슈도모나스 멘도시나( Pseudomonas mendocina )(ATCC 25411); 슈도모나스 니트로리듀센스( Pseudomonas nitroreducens )(ATCC 33634); 슈도모나스 올레오보란스( Pseudomonas oleovorans )(ATCC 8062); 슈도모나스 슈도알칼리제네스(Pseudomonas pseudoalcaligenes )(ATCC 17440); 슈도모나스 레지노보란스(Pseudomonas resinovorans )(ATCC 14235); 슈도모나스 스트라미네아( Pseudomonas straminea)(ATCC 33636); 슈도모나스 아가리시( Pseudomonas agarici )( ATCC 25941); 슈도모나스 알칼리필라( Pseudomonas alcaliphila ); 슈도모나스 알기노보라(Pseudomonas alginovora ); 슈도모나스 앤더소니( Pseudomonas andersonii ); 슈도모나스 아스플레니( Pseudomonas asplenii )( ATCC 23835); 슈도모나스 아젤라이카(Pseudomonas azelaica )(ATCC 27162); 슈도모나스 바이에린키( Pseudomonas beyerinckii)(ATCC 19372); 슈도모나스 보레알리스( Pseudomonas borealis); 슈도모나스 보레오폴리스( Pseudomonas boreopolis )(ATCC 33662); 슈도모나스 브라시카세아룸(Pseudomonas brassicacearum ); 슈도모나스 부타노보라( Pseudomonas butanovora)(ATCC 43655); 슈도모나스 셀룰루로사( Pseudomonas cellulosa)(ATCC 55703); 슈도모나스 아우란티아카( Pseudomonas aurantiaca )(ATCC 33663); 슈도모나스 클로로라피스( Pseudomonas chlororaphis )(ATCC 9446, ATCC 13985, ATCC 17418, ATCC 17461); 슈도모나스 프라지( Pseudomonas fragi )(ATCC 4973); 슈도모나스 룬덴시스(Pseudomonas lundensis )(ATCC 49968); 슈도모나스 태트로렌스( Pseudomonas taetrolens)(ATCC 4683); 슈도모나스 시시콜라( Pseudomonas cissicola)(ATCC 33616); 슈도모나스 코로나페이시엔스( Pseudomonas coronafaciens); 슈도모나스 디터페니필라(Pseudomonas diterpeniphila ); 슈도모나스 엘롱가타( Pseudomonas elongata)(ATCC 10144); 슈도모나스 플렉텐스( Pseudomonas flectens )(ATCC 12775); 슈도모나스 아조토포르만스( Pseudomonas azotoformans); 슈도모나스 브레네리(Pseudomonas brenneri ); 슈도모나스 세드렐라( Pseudomonas cedrella ); 슈도모나스 코루가타( Pseudomonas corrugata )(ATCC 29736); 슈도모나스 엑스트레모리엔탈리스(Pseudomonas extremorientalis ); 슈도모나스 플루오레센스( Pseudomonas fluorescens)(ATCC 35858); 슈도모나스 게사르디( Pseudomonas gessardii ); 슈도모나스 리바넨시스( Pseudomonas libanensis ); 슈도모나스 만델리( Pseudomonas mandelii)(ATCC 700871); 슈도모나스 마르기날리스( Pseudomonas marginalis)(ATCC 10844); 슈도모나스 미굴레( Pseudomonas migulae ); 슈도모나스 뮤시돌렌스(Pseudomonas mucidolens )(ATCC 4685); 슈도모나스 오리엔탈리스( Pseudomonas orientalis); 슈도모나스 로데시에( Pseudomonas rhodesiae ); 슈도모나스 신크산타(Pseudomonas synxantha )(ATCC 9890); 슈도모나스 톨라아시( Pseudomonas tolaasii)(ATCC 33618); 슈도모나스 베로니( Pseudomonas veronii )(ATCC 700474); 슈도모나스 프레데릭스베르젠시스( Pseudomonas frederiksbergensis ); 슈도모나스 제니쿨라타(Pseudomonas geniculata )( ATCC 19374); 슈도모나스 진저리( Pseudomonas gingeri); 슈도모나스 그라미니스( Pseudomonas graminis ); 슈도모나스 그리몬티(Pseudomonas grimontii ); 슈도모나스 할로데니트리피칸스( Pseudomonas halodenitrificans); 슈도모나스 할로필라( Pseudomonas halophila ); 슈도모나스 히비시콜라(Pseudomonas hibiscicola )(ATCC 19867); 슈도모나스 후티엔시스(Pseudomonas huttiensis )(ATCC 14670); 슈도모나스 히드로제노보라( Pseudomonas hydrogenovora); 슈도모나스 예세니( Pseudomonas jessenii )(ATCC 700870); 슈도모나스 킬로넨시스( Pseudomonas kilonensis ); 슈도모나스 란세올라타( Pseudomonas lanceolata)(ATCC 14669); 슈도모나스 리니( Pseudomonas lini ); 슈도모나스 마르기나테(Pseudomonas marginate )(ATCC 25417); 슈도모나스 메피티카( Pseudomonas mephitica)(ATCC 33665); 슈도모나스 데니트리피칸스( Pseudomonas denitrificans)(ATCC 19244); 슈도모나스 퍼투시노제나( Pseudomonas pertucinogena)(ATCC 190); 슈도모나스 픽토룸( Pseudomonas pictorum )(ATCC 23328); 슈도모나스 사이크로필라( Pseudomonas psychrophila ); 슈도모나스 필바(Pseudomonas filva )(ATCC 31418); 슈도모나스 몬테일리( Pseudomonas monteilii)(ATCC 700476); 슈도모나스 모셀리( Pseudomonas mosselii ); 슈도모나스 오리지하비탄스(Pseudomonas oryzihabitans )(ATCC 43272); 슈도모나스 플레코글로시시다(Pseudomonas plecoglossicida )(ATCC 700383); 슈도모나스 푸티다(Pseudomonas putida )(ATCC 12633); 슈도모나스 리액탄스( Pseudomonas reactans); 슈도모나스 스피노사 ( Pseudomonas spinosa )(ATCC 14606); 슈도모나스 발레아리카(Pseudomonas balearica ); 슈도모나스 루테올라( Pseudomonas luteola)(ATCC 43273);. 슈도모나스 스투체리 ( Pseudomonas stutzeri )(ATCC 17588); 슈도모나스 아미그달리 ( Pseudomonas amygdali )(ATCC 33614); 슈도모나스 아벨라네(Pseudomonas avellanae )(ATCC 700331); 슈도모나스 카리카파파예( Pseudomonas caricapapayae)(ATCC 33615); 슈도모나스 시코리( Pseudomonas cichorii )(ATCC 10857); 슈도모나스 피쿠세렉테(Pseudomonas ficuserectae )(ATCC 35104); 슈도모나스 푸스코바기네( Pseudomonas fuscovaginae ); 슈도모나스 멜리에( Pseudomonas meliae)(ATCC 33050); 슈도모나스 시린제( Pseudomonas syringae )(ATCC 19310); 슈도모나스 비리디플라바( Pseudomonas viridiflava )(ATCC 13223); 슈도모나스 써모카르복시도보란스( Pseudomonas thermocarboxydovorans)(ATCC 35961); 슈도모나스 써모톨러란스( Pseudomonas thermotolerans); 슈도모나스 티버발렌시스( Pseudomonas thivervalensis ); 슈도모나스 밴쿠버렌시스( Pseudomonas vancouverensis )(ATCC 700688); 슈도모나스 위스콘시넨시스(Pseudomonas wisconsinensis ); 및 슈도모나스 크시아메네시스(Pseudomonas xiamenensis ). 한 실시양태에서, 숙주 세포는 슈도모나스 플루오레센스이다.
또한, 숙주 세포는 "그람 음성 프로테오박테리아 서브그룹 17"로부터 선택할 수 있다. "그람 음성 프로테오박테리아 서브그룹 17"은, 예를 들어 하기 슈도모나스 종에 속하는 것들을 포함하여 "형광성 슈도모나드"로 당 업계에 알려져 있는 프로테오박테리아 군으로 정의된다: 슈도모나스 아조토포르만스; 슈도모나스 브레네리; 슈도모나스 세드렐라; 슈도모나스 코루가타; 슈도모나스 엑스트레모리엔탈리스; 슈도모나스 플루오레센스; 슈도모나스 게사르디; 슈도모나스 리바넨시스; 슈도모나스 만델리; 슈도모나스 마르기날리스; 슈도모나스 미굴레; 슈도모나스 뮤시돌렌스; 슈도모나스 오리엔탈리스; 슈도모나스 로데시에; 슈도모나스 신크산타; 슈도모나스 톨라아시; 및 슈도모나스 베로니.
실시양태에서, 본 발명의 방법에 사용되는 박테리아 숙주 세포는 프로테아제의 발현이 결핍된다. 실시양태에서, 프로테아제의 발현이 결핍된 박테리아 숙주 세포는 슈도모나드이다. 실시양태에서, 프로테아제의 발현이 결핍된 박테리아 숙주 세포는 슈도모나스이다. 실시양태에서, 프로테아제의 발현이 결핍된 박테리아 숙주 세포는 슈도모나스 플루오레센스이다.
실시양태에서, 본 발명의 방법에 사용되는 박테리아 숙주 세포는 프로테아제의 발현이 결핍되지 않는다. 실시양태에서, 프로테아제의 발현이 결핍되지 않은 박테리아 숙주 세포는 슈도모나드이다. 실시양태에서, 프로테아제의 발현이 결핍되지 않은 박테리아 숙주 세포는 슈도모나스이다. 실시양태에서, 프로테아제의 발현이 결핍되지 않은 박테리아 숙주 세포는 슈도모나스 플루오레센스이다.
실시양태에서, 본 발명의 방법에 사용되는 슈도모나스 숙주 세포는 Lon 프로테아제(예를 들어, 서열 번호 14), La1 프로테아제(예를 들어, 서열 번호 15), AprA 프로테아제(예를 들어, 서열 번호 16), 또는 이들의 조합의 발현이 결핍된다. 실시양태에서, 슈도모나스 숙주 세포는 AprA(예를 들어, 서열 번호 16), HtpX(예를 들어, 서열 번호 17), 또는 이들의 조합의 발현이 결핍된다. 실시양태에서, 슈도모나스 숙주 세포는 Lon(예를 들어, 서열 번호 14), La1(예를 들어, 서열 번호 15), AprA(예를 들어, 서열 번호 16), HtpX(예를 들어, 서열 번호 17), 또는 이들의 조합이 결핍된다. 실시양태에서, 슈도모나스 숙주 세포는 Npr(예를 들어, 서열 번호 20), DegP1(예를 들어, 서열 번호 18), DegP2(예를 들어, 서열 번호 19), 또는 이들의 조합의 발현이 결핍된다. 실시양태에서, 슈도모나스 숙주 세포는 La1(예를 들어, 서열 번호 15), Prc1(예를 들어, 서열 번호 21), Prc2(예를 들어, 서열 번호 22), PrtB(예를 들어, 서열 번호 23), 또는 이들의 조합의 발현이 결핍된다. 이들 프로테아제는 당 업계에 알려져 있으며, 예를 들어, 미국 특허 제8,603,824호("Process for Improved Protein Expression by Strain Engineering"), 미국 특허 공개공보 제2008/0269070호 및 미국 특허 공개공보 제2010/0137162호에 기재되어 있으며, 이들은 상기에 열거된 프로테아제의 오픈 리딩 프레임 서열을 개시한다.
기본 균주 MB101(ATCC 기탁 PTA-7841)로부터 유래한 피. 플루오레센스 숙주 균주의 예는 본 발명의 방법에 유용하다. 실시양태에서, hPTH 융합 단백질을 발현하는데 사용되는 피. 플루오레센스는, 예를 들어, DC454, DC552, DC572, DC1084, DC1106, DC508, DC992.1, PF1201.9, PF1219.9, PF1326.1, PF1331, PF1345.6, 또는 DC1040.1-1이다. 실시양태에서, 피. 플루오레센스 숙주 균주는 F1326.1이다. 실시양태에서, 피. 플루오레센스 숙주 균주는 PF1345.6이다. 본 발명의 방법에 유용한 상기 및 기타 균주는 본원에 제공된 정보, 당 업계에 알려지고 문헌에 기재된 재조합 DNA 방법, 및 이용 가능한 재료, 예를 들어, 기재된 바와 같이 ATCC에 기탁된 피. 플루오레센스 균주 MB101을 이용하여 당 업자에 의해 쉽게 제작될 수 있다.
발현 균주
본 발명의 방법을 실시하는데 유용한 발현 균주는 본원 및 공개된 문헌에 기재된 방법을 이용하여 제작할 수 있다. 실시양태에서, 본 발명의 방법에 유용한 발현 균주는 하나 이상의 피. 플루오레센스 샤프론 또는 폴딩 조절 인자 단백질을 과발현하는 플라스미드를 포함한다. 예를 들어, DnaJ-유사 단백질, FrnE, FklB, 또는 EcpD는 발현 균주에서 과발현될 수 있다. 실시양태에서, 피. 플루오레센스 폴딩 조절 인자 과발현(FMO) 플라스미드는 ClpX, FklB3, FrnE, ClpA, Fkbp, 또는 ppiA를 코딩한다. Fkbp를 코딩하는 발현 플라스미드의 예는 pDOW1384-1이다. 실시양태에서, 폴딩 조절 인자를 코딩하지 않는 발현 플라스미드를 발현 균주에 도입한다. 이들 실시양태에서, 플라스미드는, 예를 들어, pDOW2247이다. 실시양태에서, 본 발명의 방법에서 hPTH 융합 단백질을 발현하는데 유용한 피. 플루오레센스 발현 균주는 본원에서 다른 부분에 기재된 STR35970, STR35984, STR36034, STR36085, STR36150, STR36169, STR35949, STR36098, 또는 STR35783이다.
실시양태에서, 본 발명의 방법에 사용되는 피. 플루오레센스 숙주 균주는 DC1106(mtlDYZ 녹-아웃(knock-out) 돌연변이 ΔpyrF ΔproC ΔbenAB lsc::lacIQ1), 즉, 만니톨(mtl) 오페론으로부터 유전자 pyrF, proC, benA, benB, 및 mtlDYZ 가 결실되고, 이. 콜라이 lacI 전사 억제인자가 삽입되고 레반슈크라아제 유전자(lsc)와 융합된 기탁된 균주 M101의 유도체이다. 상기 유전자 및 이들의 사용 방법은 당 업계에 공지되어 있으며, 문헌, 예를 들어, 각각 본원에서 참고로 포함되는 미국 특허 제8,288,127호, 제8,017,355호("Mannitol induced promoter systems in bacterial host cells") 및 제7,794,972호("Benzoate-and anthranilate-inducible promoters")에 기재되어 있다.
DC1106과 등가의 숙주 세포 또는 본원에 기재된 임의의 숙주 세포 또는 발현 균주는 본원 및 공개된 문헌에 기재된 방법을 이용하여 MB101로부터 제작할 수 있다. 실시양태에서, DC1106과 등가인 숙주 세포가 사용된다. 숙주 세포 DC454는 이것이 DC206으로 언급된 문헌(Schneider, et al., 2005) 및 그 전문이 참고로 포함되는 미국 특허 제 8,569,015호("rPA Optimization")에 기재되어 있다. DC206은 DC454와 동일한 균주이다; 이것은 동물 무첨가 배지에서 3차례 계대 후 DC454로 재명명되었다.
당 업자는 실시양태에서, 게놈 결실 또는 돌연변이(예를 들어, 불활성화시키거나 쇠약하게 하는 돌연변이)가 결실되는 유전자 측면에 위치하는 영역을 포함하고, 피. 플루오레센스에서 복제하지 않는 결실 플라스미드를 이용하여, 예를 들어 대립유전자 교환에 의해 만들어질 수 있다는 것을 이해할 것이다. 플라스미드의 결실은 결실되는 유전자의 상류 및 하류 영역을 포함하여 결실되는 유전자를 PCR 증폭하여 제작할 수 있다. 결실은 분석 프라이머를 이용하여 게놈 DNA로부터 증폭되고 아가로스 슬랩 겔에서 전기영동에 의해 분리 후 관찰되고 그 단편의 DNA 서열 분석이 이어지는 PCR 산물을 서열분석하여 확인할 수 있다. 실시양태에서, 유전자는 완전 결실, 부분 결실, 또는 돌연변이, 예를 들어 프레임 시프트, 점, 또는 삽입 돌연변이에 의해 불활성화된다.
실시양태에서, 사용된 균주는 당 업계에 공지된 방법에 따라 FMO 플라스미드로 형질전환된다. 예를 들어, DC1106 숙주 세포는 FkbP(RXF06591.1), 펩티딜-프롤릴 시스-트랜스 이소머라아제 패밀리에 속하는 폴딩 조절 인자를 과발현하는 FMO 플라스미드 pDOW1384로 형질전환되어 발현 균주 STR36034를 생성할 수 있다. hPTH 융합 단백질 발현 균주의 특정 예와 본 발명의 방법에 따라 hPTH를 발현하는데 유용한 해당 숙주 세포의 유전자형은 표 4에 개시한다. 실시양태에서, 표 4에 기재된 임의의 숙주 세포와 등가인 숙주 세포는 본원에 기재된 등가의 FMO 플라스미드로 형질전환되어 본 발명의 방법을 이용하여 hPTH1-34을 발현하기 위해 본원에 기재된 것과 등가인 발현 균주를 얻는다. 논의된 바와 같이 적합한 발현 균주는 본원 및 문헌에 기재된 방법에 따라 유사하게 유도될 수 있다.
실시양태에서, 표 4에 열거되거나 표 4에 기재된 임의의 숙주 세포 또는 균주와 등가인 숙주 세포 또는 균주는 본 발명의 방법을 이용하여 본원에 기재된 관심 폴리펩티드를 포함하는 융합 단백질을 발현하는데 사용된다. 실시양태에서, 표 4에 열거되거나 표 4에 기재된 임의의 숙주 세포 또는 균주와 등가인 숙주 세포 또는 균주는 본 발명의 방법을 이용하여 본원에 기재된 hPTH, GCSF, 또는 인슐린 폴리펩티드, 예를 들어, 프로인슐린을 포함하는 융합 단백질을 발현하는데 사용된다. 실시양태에서, 야생형 숙주 세포, 예를 들어, DC454 또는 등가물은 본 발명의 방법을 이용하여 본원에 기재된 관심 폴리펩티드를 포함하는 융합 단백질을 발현하는데 사용된다.
본 발명의 숙주 균주를 생성하는데 유용한 상기 및 기타 프로테아제 및 폴딩 조절 인자의 서열은 당 업계에 공지되어 있고, 문헌, 예를 들어, 상기에 기재되고 본원에서 그 전문이 참고로 포함되는 미국 특허 제 8,603,824호의 표 A 내지 F에 제공된 바와 같이, 공개되어 있다. 예를 들어, M50 S2P 프로테아제 패밀리 막 메탈로프로테아제 오픈 리딩 프레임 서열은 그 안에서 RXF04692로 제공된다.
고처리량(high throughput) 스크리닝
일부 실시양태에서, 고처리량 스크리닝은 가용성 재조합 융합 단백질을 발현하기 위한 최적의 조건을 결정하기 위해 수행할 수 있다. 스크리닝에서 변화될 수 있는 조건은, 예를 들어, 숙주 세포, 숙주 세포의 유전적 배경(예를 들어, 다양한 프로테아제의 결실), 발현 구조물 내 프로모터의 유형, 재조합 단백질을 코딩하는 서열에 융합된 분비 리더의 유형, 배양 온도, 유도성 프로모터가 사용될 때 유도 시 OD, lacZ 프로모터가 사용될 때 유도에 사용되는 IPTG의 농도, 단백질 유도기간, 배양물에 유도제 첨가 후 배양 온도, 배양물의 교반 속도, 플라스미드 유지에 대한 선별 방법, 용기 내 배양물의 부피, 및 세포 용해 방법을 포함한다.
일부 실시양태에서, 숙주 균주의 라이브러리(또는 "배열")가 제공되며, 이 때 라이브러리 내 각 균주(또는 "숙주 세포의 집단")가 숙주 세포에서 하나 이상의 목표 유전자의 발현을 조절하도록 유전적으로 변형된다. "최적의 숙주 균주" 또는 "최적의 발현 시스템"은 배열에서 다른 집단의 표현형이 상이한 숙주 세포와 비교하여 발현된 재조합 융합 단백질의 수량, 품질 및/또는 위치를 기준으로 하여 확인하거나 선택할 수 있다. 따라서, 최적의 숙주 균주는 요망하는 규격에 따른 재조합 융합 단백질을 생산하는 균주이다. 요망하는 규격은 생산되는 단백질에 따라 달라질 것이지만, 규격은 단백질의 품질 및/또는 수량, 예를 들어 단백질이 격리되거나 분리되는지, 어느 정도의 수량인지, 단백질이 적합하게 또는 바람직하게 프로세싱되고/거나 폴딩되는지 등을 포함한다. 실시양태에서, 향상되거나 바람직한 품질은 높은 역가로 발현되고 낮은 수준으로 분해되는 재조합 융합 단백질의 생산일 수 있다. 실시양태에서, 최적의 숙주 균주 또는 최적의 발현 시스템은 가용성 재조합 융합 단백질의 양 또는 수량, 회수 가능한 재조합 융합 단백질의 양 또는 수량, 적합하게 프로세싱된 재조합 융합 단백질의 양 또는 수량, 적합하게 폴딩된 재조합 융합 단백질의 양 또는 수량, 활성인 재조합 융합 단백질의 양 또는 수량, 및/또는 어느 정도의 절대 수준의, 또는 지표 균주, 즉 비교에 사용되는 균주에 어느 정도의 상대적인 수준의 재조합 융합 단백질의 총량 또는 총 수량으로 특성화되는 수율을 생산한다.
재조합 융합 단백질의 발현에서 수율 및/또는 품질이 향상된 균주를 확인하기 위한 미생물 숙주의 스크리닝 방법은, 예를 들어, 미국 특허 출원 공개번호 제2008/0269070호에 기재되어 있다.
발효 방식
본 발명의 발현 균주는 임의의 발효 방식으로 배양할 수 있다, 예를 들어, 회분식, 유가식, 반연속식 및 연속식 발효 방식이 이용될 수 있다.
실시양태에서, 발효 배지는 영양이 풍부한 배지, 최소 배지 및 무기염 배지로부터 선택될 수 있다. 다른 실시양태에서, 최소 배지 또는 무기염 배지가 선택된다. 특정 실시양태에서, 무기염 배지가 선택된다.
무기염 배지는 무기염과 탄소원, 예를 들어, 글루코오스, 수크로오스 또는 글리세롤로 이루어진다. 무기염 배지의 예는, 예를 들어, M9 배지, 슈도모나스 배지(ATCC 179)와, 데이비스 및 민지올리(Davis and Mingioli) 배지를 포함한다(문헌 (Davis, B. D. and Mingioli, E. S., 1950) J. Bact. 60: 17-28) 참조). 무기염 배지를 제조하는데 사용되는 무기염은 예를 들어, 인산칼륨, 황산암모늄 또는 염화암모늄, 황산마그네슘 또는 염화마그네슘, 및 미량 무기질, 예를 들어, 염화칼슘, 붕산염, 및 철, 구리, 망간 및 아연의 황산염으로부터 선택된 것들을 포함한다. 전형적으로, 펩톤, 트립톤, 아미노산 또는 효모 추출물과 같은 유기 질소원은 무기염 배지 중에 포함되지 않는다. 대신, 무기 질소원이 사용되며, 이는 예를 들어, 암모늄염, 수성 암모니아 및 기상 암모니아로부터 선택될 수 있다. 무기염 배지는 전형적으로 탄소원으로서 글루코오스 또는 글리세롤을 함유한다. 무기염 배지와 비교하여, 최소 배지는 또한 무기염과 탄소원을 포함할 수 있지만, 비록 아주 최소의 수준으로 첨가되더라도, 예를 들어, 낮은 수준의 아미노산, 비타민, 펩톤 또는 다른 성분들로 보충될 수 있다. 본 발명의 방법에 사용하기에 적합한 배지는 문헌, 예를 들어, 상기에 참고 문헌으로 언급되고 참고로 포함되는 미국 특허 출원 공개공보 제2006/0040352호에 개시된 방법을 이용하여 제조될 수 있다. 본 발명의 방법에 유용한 배양 절차 및 무기염 배지의 상세한 설명은 문헌(Riesenberg, D et al., 1991, "High cell density cultivation of Escherichia coli at controlled specific growth rate," J. Biotechnol. 20 (l): 17-27)에 기재되어 있다.
실시양태에서, 생산은 생물반응기 배양에서 달성될 수 있다. 배양물은 예를 들어, 무기염 배지를 함유하는 최대 2 ℓ 생물반응기에서 배양하고, 32℃와 암모니아 첨가를 통해 pH 6.5로 유지할 수 있다. 용존 산소는 교반 및 발효기 내로 살포 공기와 산소의 흐름의 증가를 통해 과량으로 유지할 수 있다. 과량의 수준을 유지하기 위해 발효과정 동안 글리세롤을 배양물에 전달할 수 있다. 실시양태에서, 상기 조건을 유지하다가, 유도를 위한 목표 배양물의 세포 밀도, 예를 들어, 575 nm에서 광학 밀도(A575)에 도달하면, IPTG를 첨가하여 목표 단백질 생산을 개시한다. 유도 시 세포 밀도, IPTG 농도, pH, 온도, CaCl2 농도, 용존 산소 유속, 이들 각각을 변화시켜 최적의 발현 조건을 결정할 수 있을 것으로 이해된다. 실시양태에서, 유도 시 세포 밀도는 A575 40∼200 흡광도 단위(AU)로 변화시킬 수 있다. IPTG 농도는 0.02∼1.0 mM 범위로, pH는 6∼7.5 범위로, 온도는 20∼35℃ 범위로, CaCl2 농도는 0 내지 0.5 g/L 범위로, 그리고 용존 산소 유속은 1 LPM(분당 리터) 내지 10 LPM 범위)로 변화시킬 수 있다. 6-48시간 후에, 각 생물반응기로부터의 배양물은 원심분리에 의해 수거하고, 세포 펠렛은 -80℃에서 냉동할 수 있다. 그 후, 시료는 산물 형성에 대해, 예를 들어, SDS-CGE에 의해, 분석할 수 있다.
발효는 어느 규모로든 수행될 수 있다. 본 발명에 따른 발현 시스템은 어느 규모로든 재조합 단백질 발현에 유용하다. 따라서, 예를 들어, 마이크로리터 규모, 밀리리터 규모, 센티리터 규모, 및 데시리터 규모의 발효 부피가 사용될 수 있고, 1 리터 이상의 발효 부피도 사용될 수 있다.
실시양태에서, 발효 부피는 약 1 리터 이상이다. 실시양태에서, 발효 부피는 약 1 리터 내지 약 100 리터이다. 실시양태에서, 발효 부피는 약 1 리터, 약 2 리터, 약 3 리터 약 4 리터, 약 5 리터, 약 6 리터, 약 7 리터, 약 8 리터, 약 9 리터, 또는 약 10 리터이다. 실시양태에서, 발효 부피는 약 1 리터 내지 약 5 리터, 약 1 리터 내지 약 10 리터, 약 1 리터 내지 약 25 리터, 약 1 리터 내지 약 50 리터, 약 1 리터 내지 약 75 리터, 약 10 리터 내지 약 25 리터, 약 25 리터 내지 약 50 리터, 또는 약 50 리터 내지 약 100 리터이다. 다른 실시양태에서, 발효 부피는 5 리터, 10 리터, 15 리터, 20 리터, 25 리터, 50 리터, 75 리터, 100 리터, 200 리터, 250 리터, 300 리터, 500 리터, 1,000 리터, 2,000 리터, 5,000 리터, 10,000 리터, 또는 50,000 리터 이상이다.
일반적으로, 더 큰 배양 부피, 예를 들어 50 mL 진탕 플라스크 배양, 1 리터 이상 배양에 의해 수득한 재조합 단백질의 양은 더 작은 배양 부피, 예를 들어 0.5 mL 고처리량 스크리닝 배양에서 관찰되는 것에 비해 증가된다. 이는 배양 크기의 증가뿐 아니라, 예를 들어, 대규모 발효에서 더 높은 밀도(예를 들어, 배양물의 흡광도로 반영되는 바)까지 세포가 자라는 능력에 기인할 수 있다. 예를 들어, 동일한 균주로부터 용적 측정 수율은 HTP 규모로부터 대규모 발효로 10배까지 증가할 수 있다. 실시양태에서, 동일한 발현 균주에 대해 관찰된 용적 측정 수율은 HTP 규모 배양보다 대규모 발효 후 2배 내지 10배 더 크다. 실시양태에서, 동일한 발현 균주에 대해 관찰된 수율은 HTP 규모 배양 후보다 대규모 발효 후 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 2배 내지 10배, 2배 내지 9배, 2배 내지 8배, 2배 내지 7배, 2배 내지 6배, 2배 내지 5배, 2배 내지 4배, 2배 내지 3배, 3배 내지 10배, 3배 내지 9배, 3배 내지 8배, 3배 내지 7배, 3배 내지 6배, 3배 내지 5배, 3배 내지 4배, 4배 내지 10배, 4배 내지 9배, 4배 내지 8배, 4배 내지 7배, 4배 내지 6배, 4배 내지 5배, 5배 내지 10배, 5배 내지 9배, 5배 내지 8배, 5배 내지 7배, 5배 내지 6배, 6배 내지 10배, 6배 내지 9배, 6배 내지 8배, 6배 내지 7배, 7배 내지 10배, 7배 내지 9배, 7배 내지 8배, 8배 내지 10배, 8배 내지 9배, 9배 내지 10배 이상이다. 예를 들어, 본원에서 그 전문이 참고로 포함되는 문헌(Retallack, et al., 2012, "Reliable protein production in a Pseudomonas fluorescens expression system," Prot. Exp. and Purif. 81:157-165)을 참조한다.
박테리아 배양 조건
제공되는 본 발명의 방법에서 유용한 배양 조건은 약 4℃ 내지 약 42℃의 온도 및 약 5.7 내지 약 8.8의 pH를 포함할 수 있다. lacZ 프로모터를 가진 발현 구조물이 사용될 때, 발현은 IPTG를 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 배양물에 첨가하여 유도할 수 있다.
배양물의 pH는 pH 완충액 및 당업자에게 공지된 방법을 이용하여 유지할 수 있다. 또한, 배양 과정에서 pH는 수성 암모니아를 사용하여 조절할 수 있다. 실시양태에서, 배양물의 pH는 약 5.7 내지 약 8.8이다. 실시양태에서, pH는 약 5.7, 5.8, 5.9, 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.0, 8.1, 8.2, 8.3, 8.4, 8.5, 8.6, 8.7, 또는 8.8이다. 실시양태에서, pH는 약 5.7 내지 약 8.8, 약 5.7 내지 약 8.5, 약 5.7 내지 약 8.3, 약 5.7 내지 약 8, 약 5.7 내지 약 7.8, 약 5.7 내지 약 7.6, 약 5.7 내지 약 7.4, 약 5.7 내지 약 7.2, 약 5.7 내지 약 7, 약 5.7 내지 약 6.8, 약 5.7 내지 약 6.6, 약 5.7 내지 약 6.4, 약 5.7 내지 약 6.2, 약 5.7 내지 약 6, 약 5.9 내지 약 8.8, 약 5.9 내지 약 8.5, 약 5.9 내지 약 8.3, 약 5.9 내지 약 8, 약 5.9 내지 약 7.8, 약 5.9 내지 약 7.6, 약 5.9 내지 약 7.4, 약 5.9 내지 약 7.2, 약 5.9 내지 약 7, 약 5.9 내지 약 6.8, 약 5.9 내지 약 6.6, 약 5.9 내지 약 6.4, 약 5.9 내지 약 6.2, 약 6 내지 약 8.8, 약 6 내지 약 8.5, 약 6 내지 약 8.3, 약 6 내지 약 8, 약 6 내지 약 7.8, 약 6 내지 약 7.6, 약 6 내지 약 7.4, 약 6 내지 약 7.2, 약 6 내지 약 7, 약 6 내지 약 6.8, 약 6 내지 약 6.6, 약 6 내지 약 6.4, 약 6 내지 약 6.2, 약 6.1 내지 약 8.8, 약 6.1 내지 약 8.5, 약 6.1 내지 약 8.3, 약 6.1 내지 약 8, 약 6.1 내지 약 7.8, 약 6.1 내지 약 7.6, 약 6.1 내지 약 7.4, 약 6.1 내지 약 7.2, 약 6.1 내지 약 7, 약 6.1 내지 약 6.8, 약 6.1 내지 약 6.6, 약 6.1 내지 약 6.4, 약 6.2 내지 약 8.8, 약 6.2 내지 약 8.5, 약 6.2 내지 약 8.3, 약 6.2 내지 약 8, 약 6.2 내지 약 7.8, 약 6.2 내지 약 7.6, 약 6.2 내지 약 7.4, 약 6.2 내지 약 7.2, 약 6.2 내지 약 7, 약 6.2 내지 약 6.8, 약 6.2 내지 약 6.6, 약 6.2 내지 약 6.4, 약 6.4 내지 약 8.8, 약 6.4 내지 약 8.5, 약 6.4 내지 약 8.3, 약 6.4 내지 약 8, 약 6.4 내지 약 7.8, 약 6.4 내지 약 7.6, 약 6.4 내지 약 7.4, 약 6.4 내지 약 7.2, 약 6.4 내지 약 7, 약 6.4 내지 약 6.8, 약 6.4 내지 약 6.6, 약 6.6 내지 약 8.8, 약 6.6 내지 약 8.5, 약 6.6 내지 약 8.3, 약 6.6 내지 약 8, 약 6.6 내지 약 7.8, 약 6.6 내지 약 7.6, 약 6.6 내지 약 7.4, 약 6.6 내지 약 7.2, 약 6.6 내지 약 7, 약 6.6 내지 약 6.8, 약 6.8 내지 약 8.8, 약 6.8 내지 약 8.5, 약 6.8 내지 약 8.3, 약 6.8 내지 약 8, 약 6.8 내지 약 7.8, 약 6.8 내지 약 7.6, 약 6.8 내지 약 7.4, 약 6.8 내지 약 7.2, 약 6.8 내지 약 7, 약 7 내지 약 8.8, 약 7 내지 약 8.5, 약 7 내지 약 8.3, 약 7 내지 약 8, 약 7 내지 약 7.8, 약 7 내지 약 7.6, 약 7 내지 약 7.4, 약 7 내지 약 7.2, 약 7.2 내지 약 8.8, 약 7.2 내지 약 8.5, 약 7.2 내지 약 8.3, 약 7.2 내지 약 8, 약 7.2 내지 약 7.8, 약 7.2 내지 약 7.6, 약 7.2 내지 약 7.4, 약 7.4 내지 약 8.8, 약 7.4 내지 약 8.5, 약 7.4 내지 약 8.3, 약 7.4 내지 약 8, 약 7.4 내지 약 7.8, 약 7.4 내지 약 7.6, 약 7.6 내지 약 8.8, 약 7.6 내지 약 8.5, 약 7.6 내지 약 8.3, 약 7.6 내지 약 8, 약 7.6 내지 약 7.8, 약 7.8 내지 약 8.8, 약 7.8 내지 약 8.5, 약 7.8 내지 약 8.3, 약 7.8 내지 약 8, 약 8 내지 약 8.8, 약 8 내지 약 8.5, 또는 약 8 내지 약 8.3이다. 실시양태에서, pH는 약 6.5 내지 약 7.2이다.
실시양태에서, 배양 온도는 약 4℃ 내지 약 42℃로 유지한다. 실시양태에서, 배양 온도는 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 또는 약 42℃이다. 실시양태에서, 배양 온도는 약 25℃ 내지 약 32℃이다. 실시양태에서, 배양 온도는 약 22℃ 내지 약 27℃, 약 22℃ 내지 약 28℃, 약 22℃ 내지 약 29℃, 약 22℃ 내지 약 30℃, 23℃ 내지 약 27℃, 약 23℃ 내지 약 28℃, 약 23℃ 내지 약 29℃, 약 23℃ 내지 약 30℃, 약 24℃ 내지 약 27℃, 약 24℃ 내지 약 28℃, 약 24℃ 내지 약 29℃, 약 24℃ 내지 약 30℃, 약 25℃ 내지 약 27℃, 약 25℃ 내지 약 28℃, 약 25℃ 내지 약 29℃, 약 25℃ 내지 약 30℃, 약 25℃ 내지 약 31℃, 약 25℃ 내지 약 32℃, 약 25℃ 내지 약 33℃, 약 26℃ 내지 약 28℃, 약 26℃ 내지 약 29℃, 약 26℃ 내지 약 30℃, 약 26℃ 내지 약 31℃, 약 26℃ 내지 약 32℃, 약 26℃ 내지 약 33℃, 약 27℃ 내지 약 29℃, 약 27℃ 내지 약 30℃, 약 27℃ 내지 약 31℃ , 약 27℃ 내지 약 32℃, 약 27℃ 내지 약 33℃, 약 28℃ 내지 약 30℃, 약 28℃ 내지 약 31℃, 약 28℃ 내지 약 32℃, 약 29℃ 내지 약 31℃, 약 29℃ 내지 약 32℃, 약 29℃ 내지 약 33℃, 약 30℃ 내지 약 32℃, 약 30℃ 내지 약 33℃, 약 31℃ 내지 약 33℃, 약 31℃ 내지 약 32℃, 약 21℃ 내지 약 42℃, 약 22℃ 내지 약 42℃, 약 23℃ 내지 약 42℃, 약 24℃ 내지 약 42℃, 약 25℃ 내지 약 42℃로 유지한다. 실시양태에서, 배양 온도는 약 25℃ 내지 약 28.5℃이다. 실시양태에서, 성장 온도는 약 20℃ 이상, 약 21℃ 이상, 약 22℃ 이상, 약 23℃ 이상, 약 24℃ 이상, 약 25℃ 이상, 약 26℃ 이상, 약 27℃ 이상, 약 28℃ 이상, 약 29℃, 또는 약 30℃ 이상이다.
실시양태에서, 온도는 배양 과정에서 변화된다. 실시양태에서, 온도는 제제, 예를 들어, IPTG를 배양물에 첨가하여 구조물로부터 발현을 유도하기 전에 약 30℃ 내지 약 32℃로 유지하고, 유도제 첨가 후에 온도는 약 25℃ 내지 약 28℃로 감소시킨다. 실시양태에서, 온도는 제제, 예를 들어, IPTG를 배양물에 첨가하여 구조물로부터 발현을 유도하기 전에 약 30℃로 유지하고, 유도제 첨가 후에 온도는 약 25℃로 감소시킨다.
본원의 그 밖에 다른 곳에서 기재된 바와 같이, 유도성 프로모터, 예를 들어, lac 프로모터를 발현 구조물에 사용하여 재조합 융합 단백질의 발현을 조절할 수 있다. lac 프로모터 유도체 또는 패밀리 일원, 예를 들어, tac 프로모터 경우, 이펙터 화합물은 유도 인자, 예를 들어 IPTG와 같은 무상 유도 인자이다. 실시양태에서, lac 프로모터 유도체를 사용하며, 세포 밀도가 약 40 내지 약 180의 OD575로 확인되는 수준에 도달할 때, IPTG를 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 첨가하여 재조합 단백질 발현을 유도한다. 실시양태에서, 재조합 단백질을 위한 배양 유도 시점에서 OD575는 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 110, 약 120, 약 130, 약 140, 약 150, 약 160, 약 170, 약 180일 수 있다. 다른 실시양태에서, OD575는 약 40 내지 약 50, 약 50 내지 약 60, 약 60 내지 약 70, 약 70 내지 약 80, 약 80 내지 약 90, 또는 약 90 내지 약 100이다. 다른 실시양태에서, OD575는 약 40 내지 약 100, 약 100 내지 약 120, 약 120 내지 약 130, 약 130 내지 약 140, 약 140 내지 약 150, 약 150 내지 약 160, 약 160 내지 약 170, 또는 약 170 내지 약 180이다. 다른 실시양태에서, OD575는 약 40 내지 약 140, 또는 약 80 내지 180이다. 세포 밀도는 다른 방법으로 측정하여 다른 단위, 예를 들어 단위 부피당 세포로 표현할 수 있다. 예를 들어, 피. 플루오레센스 배양물의 약 40 내지 약 160의 OD575는 mL당 대략 4 × 1010 내지 약 1.6 × 1011 콜로니 형성 단위 또는 17.5 내지 70 g/L 건조 세포 중량과 등가이다. 실시양태에서, 배양 유도 시점에서 세포 밀도는 세포 밀도를 측정하는데 사용되는 방법 또는 측정 단위와 무관하게 OD575에서 흡광도에 의해 본원에서 명시되는 세포 밀도와 등가이다. 당 업자는 임의의 세포 배양물에 대해 적합하게 전환하는 방법을 알 것이다.
실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM, 약 0.02 mM, 약 0.03 mM, 약 0.04 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM, 약 0.3 mM, 약 0.4 mM, 약 0.5 mM, 약 0.6 mM, 약 0.7 mM, 약 0.8 mM, 약 0.9 mM, 또는 약 1 mM이다. 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM 내지 약 0.1 mM, 약 0.1 mM 내지 약 0.2 mM, 약 0.2 mM 내지 약 0.3 mM, 약 0.3 mM 내지 약 0.4 mM, 약 0.2 mM 내지 약 0.4 mM, 약 0.08 내지 약 0.2 mM, 또는 약 0.1 내지 1 mM이다.
실시양태에서, 비-lac 유형의 프로모터가 사용되는 경우에는, 본원 및 문헌에 기술된 바와 같이, 다른 유도인자 또는 이펙터가 사용될 수 있다. 한 실시양태에서, 프로모터는 구성적 프로모터이다.
유도제를 첨가한 후, 배양물은 일정 기간, 예를 들어, 약 24시간 동안 배양할 수 있는데, 이 기간에 재조합 단백질이 발현된다. 유도제를 첨가한 후, 배양물은 약 1 hr, 약 2 hr, 약 3 hr, 약 4 hr, 약 5 hr, 약 6 hr, 약 7 hr, 약 8 hr, 약 9 hr, 약 10 hr, 약 11 hr, 약 12 hr, 약 13 hr, 약 14 hr, 약 15 hr, 약 16 hr, 약 17 hr, 약 18 hr, 약 19 hr, 약 20 hr, 약 21 hr, 약 22 hr, 약 23 hr, 약 24 hr, 약 36 hr, 또는 약 48 hr 동안 배양할 수 있다. 유도제를 배양물에 첨가한 후, 배양물은 약 1 내지 48 hr, 약 1 내지 24 hr, 약 1 내지 8 hr, 약 10 내지 24 hr, 약 15 내지 24 hr, 또는 약 20 내지 24 hr 동안 배양할 수 있다. 세포 배양물은 원심분리하여 농축하고, 배양물 펠렛은 완충액 또는 후속적인 용해 절차에 적합한 완충액 또는 용액에 재현탁할 수 있다.
실시양태에서, 세포는 고압 기계적 세포 파괴용 장치(구입 가능함, 예를 들어, 마이크로플루이딕스 마이크로플루다이저(Microfluidics Microfluidizer), 콘스턴트 셀 디스럽터(Constant Cell Disruptor), 니로-소아비(Niro-Soavi) 균질화기 또는 APV-가울린(APV-Gaulin) 균질화기)를 사용하여 파괴한다. 재조합 단백질 발현 세포는 예를 들어, 초음파 처리를 사용하여 파괴할 수 있다. 당 업계에 공지된, 세포를 용해시키는데 적합한 임의의 방법을 이용하여 가용성 분획을 유리시킬 수 있다. 예를 들어, 실시양태에서, 화학적 및/또는 효소적 세포 용해 시약, 예를 들어, 세포벽 용해 효소 및 EDTA가 사용될 수 있다. 본 발명의 방법에서는 또한 냉동 배양물 또는 미리 보관된 배양물의 사용이 또한 고려된다. 용해시키기 전에 배양물은 OD에 정규화될 수 있다. 예를 들어, 세포는 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 또는 약 20의 OD600에 정규화될 수 있다.
원심분리는 임의의 적합한 장치 및 방법을 이용하여 실시할 수 있다. 불용성 분획으로부터 가용성 분획을 분리하기 위한 세포 배양물 또는 용해물의 원심분리는 당 업계에 잘 알려져 있다. 예를 들어, 용해된 세포를 20,800 x g에서 20분간(4℃) 원심분리하고, 수동으로 또는 자동 액상 취급기를 사용하여 상등액을 제거할 수 있다. 세포 배양물의 원심분리에 의해 얻은 세포 펠릿, 또는 불용성 분획을 완충액에 재현탁할 수 있다. 예를 들어, 오버헤드 혼합기, 자기 교반 막대, 진동식 진탕기 등에 연결된 임펠러과 같은 장치를 사용하여 세포 펠렛 또는 불용성 분획의 재현탁을 수행할 수 있다.
비-변성 조건
유도된 숙주 세포의 용해는 비-변성 조건하에서 수행한다. 실시양태에서, 비-변성 조건은, 예를 들어, 세포 펠렛 또는 페이스트를 재현탁하기 위해서, 비-변성 처리 완충액의 사용을 포함한다. 실시양태에서, 비-변성 처리 완충액은 인산나트륨 또는 트리스 완충액, 글리세롤, 및 염화나트륨을 포함한다. 실시양태에서, 친화성 크로마토그래피를 고정된 금속 친화성 크로마토그래피(IMAC)에 의해 수행하는 경우, 비-변성 처리 완충액은 이미다졸을 포함한다. 실시양태에서, 비-변성 처리 완충액은 0 내지 50 mM 이미다졸을 포함한다. 실시양태에서, 비-변성 처리 완충액은 이미다졸을 포함하지 않는다. 실시양태에서, 비-변성 처리 완충액은 25mM 이미다졸을 포함한다. 실시양태에서, 비-변성 처리 완충액은 10-30 mM 인산나트륨 또는 트리스, pH 7 내지 9를 포함한다. 실시양태에서, 비-변성 처리 완충액은 7.3, 7.4, 또는 7.5의 pH를 갖는다. 실시양태에서, 비-변성 처리 완충액은 2-10% 글리세롤을 포함한다. 실시양태에서, 비-변성 처리 완충액은 50 mM 내지 750 mM NaCl을 포함한다. 실시양태에서, 세포 페이스트는 10-50% 고체로 재현탁한다. 실시양태에서, 비-변성 처리 완충액은 20 mM 인산나트륨, 5% 글리세롤, 500 mM 염화나트륨, 20 mM 이미다졸, pH 7.4를 포함하고, 20% 고체로 현탁한다. 실시양태에서, 비-변성 처리 완충액은 20 mM 트리스, 50 mM NaCl, pH 7.5를 포함하고, 20% 고체로 재현탁한다.
실시양태에서, 비-변성 처리 완충액은 카오트로프제를 포함하지 않는다. 카오트로프제는 단백질 또는 핵산의 3차원 구조를 파괴하여 변성을 일으킨다. 실시양태에서, 비-변성 처리 완충액은 비-변성 농도의 카오트로프제를 포함한다. 실시양태에서, 카오트로프제는, 예를 들어, 요소 또는 구아니디늄 히드로클로라이드이다. 실시양태에서, 비-변성 처리 완충액은 0 내지 4M 요소 또는 구아니디늄 히드로클로라이드를 포함한다. 실시양태에서, 비-변성 처리 완충액은 요소 또는 구아니디늄 히드로클로라이드를 4M 미만, 3.5M 미만, 3M 미만, 2.5M 미만, 2M 미만, 1.5M 미만, 1M 미만, 0.5M 미만, 약 0.1M, 약 0.2M, 약 0.3M, 약 0.4M, 약 0.5M, 약 0.6M, 약 0.7M, 약 0.8M, 약 0.9M, 약 1.0M, 약 1.1M, 약 1.2M, 약 1.3M, 약 1.4M, 약 1.5M, 약 1.6M, 약 1.7M, 약 1.8M, 약 1.9M, 또는 약 2.0M, 약 2.1M, 약 2.2M, 약 2.3M, 약 2.4M, 약 2.5M, 약 2.6M, 약 2.7M, 약 2.8M, 약 2.9M, 약 3M, 약 3.1M, 약 3.2M, 약 3.3M, 약 3.4M, 약 3.5M, 약 3.6M, 약 3.7M, 약 3.8M, 약 3.9M, 약 4M, 약 0.5 내지 약 3.5M, 약 0.5 내지 약 3M, 약 0.5 내지 약 2.5M, 약 0.5 내지 약 2M, 약 0.5 내지 약 1.5M, 약 0.5 내지 약 1M, 약 1 내지 약 4M, 약 1 내지 약 3.5M, 약 1 내지 약 3M, 약 1 내지 약 2.5M, 약 1 내지 약 2M, 약 1 내지 약 1.5M, 약 1.5 내지 약 4M, 약 1.5 내지 약 3.5M, 약 1.5 내지 약 3M, 약 1.5 내지 약 2.5M, 약 1.5 내지 약 2M, 약 2 내지 약 4M, 약 2 내지 약 3.5M, 약 2 내지 약 3M, 약 2 내지 약 2.5M, 약 2.5 내지 약 4M, 약 2.5 내지 약 3.5M, 약 2.5 내지 약 3M, 약 3 내지 약 4M, 약 3 내지 약 3.5M, 또는 0.5 내지 약 1M의 농도로 포함한다.
실시양태에서, 비-변성 처리 완충액을 사용하는 경우, 세포 페이스트는 20 mM 트리스, 50 mM NaCl, 4 M 요소, pH 7.5, 중에 20% 고체로 2-8℃에서 약 1-2.5시간 동안 슬러리로 만든다. 실시양태에서, 세포 페이스트는 니로 균질화기로, 예를 들어, 15,000 psi에서 용해를 거치고, 14,000 x g에서 35분간 회분식 원심분리 또는 15,000 x g에서 340 mL/min의 공급으로 연속 원심분리를 거치고, 상등 농축액은 적층형 필터(depth filter) 및 막 필터로 여과하고, 재현탁 완충액 예를 들어, 1X PBS pH 7.4로 2X 희석하고, 캡쳐 컬럼에 로딩한다. 실시양태에서, 비-변성 처리 완충액은 본원에서 그 밖의 다른 부분에 기재된 IMAC를 위해 추가의 구성요소, 예를 들어 이미다졸을 포함한다.
카오트로프제의 변성 농도는 pH에 의해 영향받을 수 있고, 변성 수준은 단백질의 특성에 따라 결정된다는 것을 당 업자는 이해한다. 예를 들어, pH를 증가시켜 카오트로프제의 더낮은 농도에서도 단백질 변성을 일으킬 수 있다.
산물 평가
생산된 재조합 융합 단백질 또는 관심 폴리펩티드의 품질은 당 업계에 공지되거나 문헌에 기재된 임의의 방법에 의해 평가할 수 있다. 실시양태에서, 단백질의 변성은 이의 가용성을 기준으로, 또는 생물학적 활성의 결여 또는 손실로 평가한다. 많은 단백질의 경우, 생물학적 활성 분석은 상업적으로 이용 가능하다. 생물학적 활성 분석은 예를 들어 항체 결합 분석을 포함할 수 있다. 실시양태에서, 재조합 융합 단백질 또는 관심 폴리펩티드의 물리적 특성화는 당 업계에서 이용 가능한 방법, 예를 들어 크로마토그래피 및 분광 광도법을 이용하여 수행한다. 관심 폴리펩티드의 평가는 이것이 적합하게 유리되었는지, 예를 들어 이의 N-말단이 완전한지를 결정하는 것을 포함할 수 있다.
hPTH, 예를 들어, hPTH 1-34 또는 1-84의 활성은 당 업계에 공지되거나 본원 또는 문헌에 기재된 임의의 방법을 이용하여, 예를 들어 단백질의 N-말단을 인식하는 항체를 이용하여 평가할 수 있다. 방법은, 예를 들어 원형 질량 분석을 포함한다. PTH 생물활성은 예를 들어, cAMP ELISA, 균일 시분해 형광(HTRF: homogenous time-resolved fluorescence) 분석(Charles River Laboratories)에 의해, 또는 각각 본원에서 참고로 포함되는 문헌(Nissenson, et al., 1985, "Activation of the Parathyroid Hormone Receptor-Adenylate Cyclase System in Osteosarcoma Cells by a Human Renal Carcinoma Factor," Cancer Res. 45:5358-5363), 및 미국 특허 제7,150,974호("Parathyroid Hormone Receptor Binding Method")에 기재된 바와 같이 측정할 수 있다. 또한, PTH 평가 방법은 본원에서 참고로 포함되는 문헌(Shimizu, et al., 2001, "Parathyroid hormone (1-14) and (1-11) analogs conformationally constrained by α-aminoisobutyric acid mediate full agonist responses via the Juxtamembrane region of the PTH-1 receptor," J. Biol. Chem. 276: 49003-49012)에 기재되어 있다.
재조합 융합 단백질 및 관심 폴리펩티드의 정제
가용화된 재조합 융합 단백질 또는 관심 폴리펩티드는 당 업자에 의해 공지되거나 문헌에 기재된 임의의 방법, 예를 들어 원심분리 방법 및/또는 크로마토그래피 방법, 예를 들어 크기 배제, 음이온 또는 양이온 교환, 소수성 상호작용, 또는 친화성 크로마토그래피에 의해 다른 단백질 및 세포 파편으로부터 단리하거나 정제할 수 있다. 실시양태에서, 가용화된 단백질은 고속 성능 액체 크로마토그래피(FPLC: Fast Performance Liquid Chromatography)를 이용하여 정제힐 수 있다. FPLC는 다양한 수지에 대한 친화성을 기반으로 하여 단백질을 분리하는데 사용되는 액체 크로마토그리피의 한 형태이다. 실시양태에서, 융합 단백질과 함께 발현되는 친화성 태그는 가용화 완충액 중에 용해된 융합 단백질이 수지에 결합하게 하지만 불순물은 가용화 완충액 중에 운반되어 나간다. 결과적으로, 용출 완충액을 점진적으로 증가하는 구배로 사용하거나 단계적인 방식으로 첨가하여 융합 단백질을 이온 교환 수지로부터 해리시키고 용출 완충액 중에 순수한 융합 단백질을 단리한다.
실시양태에서, 유도를 완료한 후에, 발효 브로쓰를 원심분리, 예를 들어 15,900 × g에서 60 내지 90분간 원심분리하여 수거한다. 세포 페이스트와 상등액을 분리하고 페이스트를 -80℃에서 냉동한다. 냉동된 세포 페이스트를 본원에 그 밖의 부분에 기재된 완충액, 예를 들어 비-변성 완충액 또는 요소 무함유 완충액 중에서 해동한다. 실시양태에서, 냉동된 세포 페이스트를 20 mM 인산나트륨, 5% 글리세롤, 500 mM 염화나트륨, pH 7.4에서 해동하고 재현탁한다. 실시양태에서, 완충액은 이미다졸을 포함한다. 실시양태에서, 현탁액의 최종 부피는 요망하는 비율의 고체, 예를 들어 20% 고체로 조정한다. 세포는 화학적으로 또는 기계적으로 용해시킬 수 있는데, 예를 들어 재료는 이때 마이크로플루다이저를 15,000 psi에서 통과시켜 균질화할 수 있다. 용해액을, 예를 들어, 12,000 × g에서 30분간 원심분리하고, 예를 들어 사르토리우스 사르토브란(Sartorius Sartobran) 150 (0.45/0.2 μm) 필터 캡슐을 통하여 여과한다.
실시양태에서, 고속 단백질 액체 크로마토그래피(FPLC)는, 예를 들어, Frac-950 분획 수집기가 장착된 AKTA 익스플로러 100 크로마토그래피 시스템(GE Healthcare)을 이용하여 정제에 사용할 수 있다. His-태그가 사용되는 실시양태에서, 시료는 히스트랩(HisTrap) FF, 10 mL 컬럼(일렬로 연결된 2개의 5 mL 히스트랩 FF 카트리지[GE Healthcare, 품번 17-5255-01])에 로딩하고, 세척하고, 예를 들어, 이미다졸 농도를 0 mM 내지 200 mM로 변화시켜 10배 컬럼 부피의 선형 구배의 용출 완충액을 이용하여 용출시키고 분획을 수집할 수 있다.
실시양태에서, 크로마토그래피는 관심 폴리펩티드에 적합하게 수행할 수 있다. 예를 들어, 고정된 금속이온 친화성 크로마토그래피 정제는 본원에서 실시예에 기재된 바와 같이(예를 들어, 니켈 IMAC를 이용하여) 수행할 수 있다.
재조합 융합 단백질의 절단
실시양태에서, 정제된 재조합 융합 단백질 분획은 절단 효소와 인큐베이션하여 링커와 N-말단 융합 파트너로부터 관심 폴리펩티드를 절단한다. 실시양태에서, 절단 효소는 프로테아제, 예를 들어, 세린 프로테아제, 예를 들어, 소 엔테로키나아제, 돼지 엔테로키나아제, 트립신 또는 본원에서 그 밖의 부분에 기재된 임의의 기타 적합한 프로테아제이다. 당 업계에 공지되고 제조사의 지서서를 포함한 문헌에 기재된 임의의 적합한 프로테아제 절단 방법이 이용될 수 있다. 프로테아제는 예를 들어, 시그마-알드리치(Sigma-Aldrich)(St. Louis, MO), 써모피셔 사이언티픽(ThermoFisher Scientific)(Waltham, MA), 및 프로메가(Promega)(Madison, WI)로부터 구입 가능하다. 예를 들어, 실시양태에서, 소 엔테로키나아제(예를 들어, Novagen cat #69066-3, batch D00155747) 절단 융합 단백질 정제 분획은 농축하여 20 mM 트리스 pH 7.4, 50 mM NaCl, 및 2 mM CaCl2를 함유하는 완충액에 재현탁할 수 있다. 2 units의 소 엔테로키나아제는 100㎕ 반응물 중 100 μg 단백질에 첨가한다. 융합 단백질 정제 분획과 엔테로키나아제의 혼합물은 적합한 시간 동안 인큐베이션한다. 실시양태에서, 비교를 위해 엔테로키나아제가 없는 대조 반응물을 인큐베이션한다. 효소 반응은 4-벤젠설포닐 플루오라이드 히드로클로라이드(AEBSF, Sigma cat# P8465)를 함유하는 완전 프로테아제 억제제 칵테일을 첨가하여 정지시킬 수 있다.
실시양태에서, 절단 효소 인큐베이션은 약 1시간 내지 약 24시간 동안 수행한다. 실시양태에서, 인큐베이션은 약 1 hr, 약 2 hr, 약 3hr, 약 4 hr, 약 5 hr, 약 6 hr, 약 7 hr, 약 8 hr, 약 9 hr, 약 10 hr, 약 11 hr, 약 12 hr, 약 13 hr, 약 14 hr, 약 15 hr, 약 16 hr, 약 17 hr, 약 18 hr, 약 19 hr, 약 20 hr, 약 21 hr, 약 22 hr, 약 23 hr, 약 24 hr, 약 1 hr 내지 약 24 hr, 약 1 hr 내지 약 23 hr, 약 1 hr 내지 약 22 hr, 약 1 hr 내지 약 21 hr, 약 1 hr 내지 약 20 hr, 약 1 hr 내지 약 19 hr, 약 1 hr 내지 약 18 hr, 약 1 hr 내지 약 17 hr, 약 1 hr 내지 약 16 hr, 약 1 hr 내지 약 15 hr, 약 1 hr 내지 약 14 hr, 약 1 hr 내지 약 13 hr, 약 1 hr 내지 약 12 hr, 약 1 hr 내지 약 11 hr, 약 1 hr 내지 약 10 hr, 약 1 hr 내지 약 9 hr, 약 1 hr 내지 약 8 hr, 약 1 hr 내지 약 7 hr, 약 1 hr 내지 약 6 hr, 약 1 hr 내지 약 5 hr, 약 1 hr 내지 약 4 hr, 약 1 hr 내지 약 3 hr, 약 1 hr 내지 약 2 hr, 약 2 hr 내지 약 24 hr, 약 2 hr 내지 약 23 hr, 약 2 hr 내지 약 22 hr, 약 2 hr 내지 약 21 hr, 약 2 hr 내지 약 20 hr, 약 2 hr 내지 약 19 hr, 약 2 hr 내지 약 18 hr, 약 2 hr 내지 약 17 hr, 약 2 hr 내지 약 16 hr, 약 2 hr 내지 약 15 hr, 약 2 hr 내지 약 14 hr, 약 2 hr 내지 약 13 hr, 약 2 hr 내지 약 12 hr, 약 2 hr 내지 약 11 hr, 약 2 hr 내지 약 10 hr, 약 2 hr 내지 약 9 hr, 약 2 hr 내지 약 8 hr, 약 2 hr 내지 약 7 hr, 약 2 hr 내지 약 6 hr, 약 2 hr 내지 약 5 hr, 약 2 hr 내지 약 4 hr, 약 2 hr 내지 약 3 hr, 약 3 hr 내지 약 24 hr, 약 3 hr 내지 약 23 hr, 약 3 hr 내지 약 22 hr, 약 3 hr 내지 약 21 hr, 약 3 hr 내지 약 20 hr, 약 3 hr 내지 약 19 hr, 약 3 hr 내지 약 18 hr, 약 3 hr 내지 약 17 hr, 약 3 hr 내지 약 16 hr, 약 3 hr 내지 약 15 hr, 약 3 hr 내지 약 14 hr, 약 3 hr 내지 약 13 hr, 약 3 hr 내지 약 12 hr, 약 3 hr 내지 약 11 hr, 약 3 hr 내지 약 10 hr, 약 3 hr 내지 약 9 hr, 약 3 hr 내지 약 8 hr, 약 3 hr 내지 약 7 hr, 약 3 hr 내지 약 6 hr, 약 3 hr 내지 약 5 hr, 약 3 hr 내지 약 4 hr, 약 4 hr 내지 약 24 hr, 약 4 hr 내지 약 23 hr, 약 4 hr 내지 약 22 hr, 약 4 hr 내지 약 21 hr, 약 4 hr 내지 약 20 hr, 약 4 hr 내지 약 19 hr, 약 4 hr 내지 약 18 hr, 약 4 hr 내지 약 17 hr, 약 4 hr 내지 약 16 hr, 약 4 hr 내지 약 15 hr, 약 4 hr 내지 약 14 hr, 약 4 hr 내지 약 13 hr, 약 4 hr 내지 약 12 hr, 약 4 hr 내지 약 11 hr, 약 4 hr 내지 약 10 hr, 약 4 hr 내지 약 9 hr, 약 4 hr 내지 약 8 hr, 약 4 hr 내지 약 7 hr, 약 4 hr 내지 약 6 hr, 약 4 hr 내지 약 5 hr, 약 5 hr 내지 약 24 hr, 약 5 hr 내지 약 23 hr, 약 5 hr 내지 약 22 hr, 약 5 hr 내지 약 20 hr, 약 5 hr 내지 약 21 hr, 약 5 hr 내지 약 19 hr, 약 5 hr 내지 약 18 hr, 약 5 hr 내지 약 17 hr, 약 5 hr 내지 약 16 hr, 약 5 hr 내지 약 15 hr, 약 5 hr 내지 약 14 hr, 약 5 hr 내지 약 13 hr, 약 5 hr 내지 약 12 hr, 약 5 hr 내지 약 11 hr, 약 5 hr 내지 약 10 hr, 약 5 hr 내지 약 9 hr, 약 5 hr 내지 약 8 hr, 약 5 hr 내지 약 7 hr, 약 5 hr 내지 약 6 hr, 약 6 hr 내지 약 24 hr, 약 6 hr 내지 약 23 hr, 약 6 hr 내지 약 22 hr, 약 6 hr 내지 약 21 hr, 약 6 hr 내지 약 20 hr, 약 6 hr 내지 약 19 hr, 약 6 hr 내지 약 18 hr, 약 6 hr 내지 약 17 hr, 약 6 hr 내지 약 16 hr, 약 6 hr 내지 약 15 hr, 약 6 hr 내지 약 14 hr, 약 6 hr 내지 약 13 hr, 약 6 hr 내지 약 12 hr, 약 6 hr 내지 약 11 hr, 약 6 hr 내지 약 10 hr, 약 6 hr 내지 약 9 hr, 약 6 hr 내지 약 8 hr, 약 6 hr 내지 약 7 hr, 약 7 hr 내지 약 24 hr, 약 7 hr 내지 약 23 hr, 약 7 hr 내지 약 22 hr, 약 7 hr 내지 약 21 hr, 약 7 hr 내지 약 20 hr, 약 7 hr 내지 약 19 hr, 약 7 hr 내지 약 18 hr, 약 7 hr 내지 약 17 hr, 약 7 hr 내지 약 16 hr, 약 7 hr 내지 약 15 hr, 약 7 hr 내지 약 14 hr, 약 7 hr 내지 약 13 hr, 약 7 hr 내지 약 12 hr, 약 7 hr 내지 약 11 hr, 약 7 hr 내지 약 10 hr, 약 7 hr 내지 약 9 hr, 약 7 hr 내지 약 8 hr, 약 8 hr 내지 약 24 hr, 약 8 hr 내지 약 23 hr, 약 8 hr 내지 약 22 hr, 약 8 hr 내지 약 21 hr, 약 8 hr 내지 약 20 hr, 약 8 hr 내지 약 19 hr, 약 8 hr 내지 약 18 hr, 약 8 hr 내지 약 17 hr, 약 8 hr 내지 약 16 hr, 약 8 hr 내지 약 15 hr, 약 8 hr 내지 약 14 hr, 약 8 hr 내지 약 13 hr, 약 8 hr 내지 약 12 hr, 약 8 hr 내지 약 11 hr, 약 8 hr 내지 약 10 hr, 약 8 hr 내지 약 9 hr, 약 9 hr 내지 약 24 hr, 약 9 hr 내지 약 23 hr, 약 9 hr 내지 약 22 hr, 약 9 hr 내지 약 21 hr, 약 9 hr 내지 약 20 hr, 약 9 hr 내지 약 19 hr, 약 9 hr 내지 약 18 hr, 약 9 hr 내지 약 17 hr, 약 9 hr 내지 약 16 hr, 약 9 hr 내지 약 15 hr, 약 9 hr 내지 약 14 hr, 약 9 hr 내지 약 13 hr, 약 9 hr 내지 약 12 hr, 약 9 hr 내지 약 11 hr, 약 9 hr 내지 약 10 hr, 약 10 hr 내지 약 24 hr, 약 10 hr 내지 약 23 hr, 약 10 hr 내지 약 22 hr, 약 10 hr 내지 약 21 hr, 약 10 hr 내지 약 20 hr, 약 10 hr 내지 약 19 hr, 약 10 hr 내지 약 18 hr, 약 10 hr 내지 약 17 hr, 약 10 hr 내지 약 16 hr, 약 10 hr 내지 약 15 hr, 약 10 hr 내지 약 14 hr, 약 10 hr 내지 약 13 hr, 약 10 hr 내지 약 12 hr, 약 10 hr 내지 약 11 hr, 약 11 hr 내지 약 24 hr, 약 11 hr 내지 약 23 hr, 약 11 hr 내지 약 22 hr, 약 11 hr 내지 약 21 hr, 약 11 hr 내지 약 20 hr, 약 11 hr 내지 약 19 hr, 약 11 hr 내지 약 18 hr, 약 11 hr 내지 약 17 hr, 약 11 hr 내지 약 16 hr, 약 11 hr 내지 약 15 hr, 약 11 hr 내지 약 14 hr, 약 11 hr 내지 약 13 hr, 약 11 hr 내지 약 12 hr, 약 12 hr 내지 약 24 hr, 약 12 hr 내지 약 23 hr, 약 12 hr 내지 약 22 hr, 약 12 hr 내지 약 21 hr, 약 12 hr 내지 약 20 hr, 약 12 hr 내지 약 19 hr, 약 12 hr 내지 약 18 hr, 약 12 hr 내지 약 17 hr, 약 12 hr 내지 약 16 hr, 약 12 hr 내지 약 15 hr, 약 12 hr 내지 약 14 hr, 약 12 hr 내지 약 13 hr, 약 13 hr 내지 약 24 hr, 약 13 hr 내지 약 23 hr, 약 13 hr 내지 약 22 hr, 약 13 hr 내지 약 21 hr, 약 13 hr 내지 약 20 hr, 약 13 hr 내지 약 19 hr, 약 13 hr 내지 약 18 hr, 약 13 hr 내지 약 17 hr, 약 13 hr 내지 약 16 hr, 약 13 hr 내지 약 15 hr, 약 13 hr 내지 약 14 hr, 약 14 hr 내지 약 24 hr, 약 14 hr 내지 약 23 hr, 약 14 hr 내지 약 22 hr, 약 14 hr 내지 약 21 hr, 약 14 hr 내지 약 20 hr, 약 14 hr 내지 약 19 hr, 약 14 hr 내지 약 18 hr, 약 14 hr 내지 약 17 hr, 약 14 hr 내지 약 16 hr, 약 14 hr 내지 약 15 hr, 약 15 hr 내지 약 24 hr, 약 15 hr 내지 약 23 hr, 약 15 hr 내지 약 22 hr, 약 15 hr 내지 약 21 hr, 약 15 hr 내지 약 20 hr, 약 15 hr 내지 약 19 hr, 약 15 hr 내지 약 18 hr, 약 15 hr 내지 약 17 hr, 약 16 hr 내지 약 24 hr, 약 16 hr 내지 약 23 hr, 약 16 hr 내지 약 22 hr, 약 16 hr 내지 약 21 hr, 약 16 hr 내지 약 20 hr, 약 16 hr 내지 약 19 hr, 약 16 hr 내지 약 18 hr, 또는 약 16 hr 내지 약 17 hr, 약 17 hr 내지 약 24 hr, 약 17 hr 내지 약 23 hr, 약 17 hr 내지 약 22 hr, 약 17 hr 내지 약 21 hr, 약 17 hr 내지 약 20 hr, 약 17 hr 내지 약 19 hr, 약 17 hr 내지 약 18 hr, 약 18 hr 내지 약 24 hr, 약 18 hr 내지 약 23 hr, 약 18 hr 내지 약 22 hr, 약 18 hr 내지 약 21 hr, 약 18 hr 내지 약 20 hr, 약 18 hr 내지 약 19 hr, 약 19 hr 내지 약 24 hr, 약 19 hr 내지 약 23 hr, 약 19 hr 내지 약 22 hr, 약 19 hr 내지 약 21 hr, 약 19 hr 내지 약 20 hr, 약 20 hr 내지 약 24 hr, 약 20 hr 내지 약 23 hr, 약 20 hr 내지 약 22 hr, 약 20 hr 내지 약 21 hr, 약 21 hr 내지 약 24 hr, 약 21 hr 내지 약 23 hr, 약 21 hr 내지 약 22 hr, 약 22 hr 내지 약 24 hr, 또는 약 22 hr 내지 약 23 hr 동안 수행한다.
실시양태에서, 프로테아제와 인큐베이션 후 재조합 융합 단백질의 절단 정도는 약 90% 내지 약 100%이다. 실시양태에서, 프로테아제와 인큐베이션 후 단백질의 절단 정도는 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 약 100%, 약 91% 내지 약 100%, 약 92% 내지 약 100%, 약 93% 내지 약 100%, 약 94% 내지 약 100%, 약 95% 내지 약 100%, 약 96% 내지 약 100%, 약 97% 내지 약 100%, 약 98% 내지 약 100%, 약 99% 내지 약 100%, 약 90% 내지 약 99%, 약 91% 내지 약 99%, 약 92% 내지 약 99%, 약 93% 내지 약 99%, 약 94% 내지 약 99%, 약 95% 내지 약 99%, 약 96% 내지 약 99%, 약 97% 내지 약 99%, 약 98% 내지 약 99%, 약 90% 내지 약 98%, 약 91% 내지 약 98%, 약 92% 내지 약 98%, 약 93% 내지 약 98%, 약 94% 내지 약 98%, 약 95% 내지 약 98%, 약 96% 내지 약 98%, 약 97% 내지 약 98%, 약 90% 내지 약 97%, 약 91% 내지 약 97%, 약 92% 내지 약 97%, 약 93% 내지 약 97%, 약 94% 내지 약 97%, 약 95% 내지 약 97%, 약 96% 내지 약 97%, 약 90% 내지 약 96%, 약 91% 내지 약 96%, 약 92% 내지 약 96%, 약 93% 내지 약 96%, 약 94% 내지 약 96%, 약 95% 내지 약 96%, 약 90% 내지 약 95%, 약 91% 내지 약 95%, 약 92% 내지 약 95%, 약 93% 내지 약 95%, 약 94% 내지 약 95%, 약 90% 내지 약 94%, 약 91% 내지 약 94%, 약 92% 내지 약 94%, 약 93% 내지 약 94%, 약 90% 내지 약 93%, 약 91% 내지 약 93%, 약 92% 내지 약 93%, 약 90% 내지 약 92%, 약 91% 내지 약 92%, 또는 약 90% 내지 약 91%이다.
실시양태에서, 프로테아제 절단은 결과적으로 재조합 융합 단백질로부터 관심 폴리펩티드를 유리시킨다. 실시양태에서, 재조합 융합 단백질은 적합하게 절단되어 관심 폴리펩티드를 적합하게 유리시킨다. 실시양태에서, 재조합 융합 단백질의 적합한 절단은 결과적으로 완전한(분해되지 않은) N-말단을 갖는 적합하게 유리된 관심 폴리펩티드를 가져온다. 실시양태에서, 재조합 융합 단백질의 적합한 절단은 결과적으로 첫째(N-말단) 아미노산을 포함하는 적합하게 유리된 관심 폴리펩티드를 가져온다. 실시양태에서, 프로테아제 절단 후 적합하게 유리된 폴리펩티드의 양은 약 90% 내지 약 100%이다. 실시양태에서, 프로테아제 절단 후 적합하게 유리된 폴리펩티드의 양은 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 약 100%, 약 91% 내지 약 100%, 약 92% 내지 약 100%, 약 93% 내지 약 100%, 약 94% 내지 약 100%, 약 95% 내지 약 100%, 약 96% 내지 약 100%, 약 97% 내지 약 100%, 약 98% 내지 약 100%, 약 99% 내지 약 100%, 약 90% 내지 약 99%, 약 91% 내지 약 99%, 약 92% 내지 약 99%, 약 93% 내지 약 99%, 약 94% 내지 약 99%, 약 95% 내지 약 99%, 약 96% 내지 약 99%, 약 97% 내지 약 99%, 약 98% 내지 약 99%, 약 90% 내지 약 98%, 약 91% 내지 약 98%, 약 92% 내지 약 98%, 약 93% 내지 약 98%, 약 94% 내지 약 98%, 약 95% 내지 약 98%, 약 96% 내지 약 98%, 약 97% 내지 약 98%, 약 90% 내지 약 97%, 약 91% 내지 약 97%, 약 92% 내지 약 97%, 약 93% 내지 약 97%, 약 94% 내지 약 97%, 약 95% 내지 약 97%, 약 96% 내지 약 97%, 약 90% 내지 약 96%, 약 91% 내지 약 96%, 약 92% 내지 약 96%, 약 93% 내지 약 96%, 약 94% 내지 약 96%, 약 95% 내지 약 96%, 약 90% 내지 약 95%, 약 91% 내지 약 95%, 약 92% 내지 약 95%, 약 93% 내지 약 95%, 약 94% 내지 약 95%, 약 90% 내지 약 94%, 약 91% 내지 약 94%, 약 92% 내지 약 94%, 약 93% 내지 약 94%, 약 90% 내지 약 93%, 약 91% 내지 약 93%, 약 92% 내지 약 93%, 약 90% 내지 약 92%, 약 91% 내지 약 92%, 또는 약 90% 내지 약 91%이다.
재조합 융합 단백질 평가 및 수율
생산된 융합 단백질 및/또는 관심 폴리펩티드는 단백질을 특성화하기 위한, 예를 들어 단백질의 수율 또는 품질을 평가하기 위한 당 업계에 공지되거나 문헌에 기재된 임의의 적합한 분석법을 이용하여 임의의 적합한 분획에서 특성화할 수 있다.
실시양태에서, LC-MS 또는 당 업계에 공지된 임의의 기타 적합한 방법을 이용하여 단백질 분해 클립핑, 탈아미드화, 산화, 및 단편화를 모니터하고 관심 폴리펩티드의 N-말단이 링커 절단 후 완전한지 확인한다. 재조합 융합 단백질 또는 관심 폴리펩티드의 수율은 당 업자에게 공지된 방법, 예를 들어, SDS-PAGE, 모세관 겔 정기영동(CGE: capillary gel electrophoresis), 또는 웨스턴 블롯 분석에 의해 결정할 수 있다. 실시양태에서, ELISA 방법을 이용하여 숙주 세포 단백질을 측정할 수 있다. 예를 들어, 숙주 세포 단백질(HCP) ELISA는 "슈도모나스 플루오레센스 숙주 세포 단백질 측정을 위한 면역효소적 분석" 키트(Cygnus Technologies, Inc., 카탈로그 번호 F450)를 이용하여 제조사의 프로토콜에 따라 실시할 수 있다. 플레이트는 소프트맥스 프로(Softmax Pro) v3.1.2 소프트웨어를 이용하여 스펙트라맥스 플러스(SPECTRAmax Plus)(Molecular Devices)에서 판독할 수 있다.
SDS-CGE는 HT 프로테인 익스프레스(Protein Express) v2 칩이 구비된 랩칩(LabChip) GXII 장치(Caliper LifeSciences, Hopkinton, MA) 및 해당 시약(각각 품번 760499 및 760328, Caliper LifeSciences)을 사용하여 수행할 수 있다. 시료는 제조사의 프로토콜(Protein User Guide Document No. 450589, Rev. 3)에 따라 제조하고 폴리아크릴아미드 겔에서 전기영동할 수 있다. 분리 후, 겔을 염색하고, 탈색하고, 디지털로 영상화하였다.
단백질, 예를 들어, 정제된 본원에서 기재된 재조합 융합 단백질 또는 관심 폴리펩티드의 농도는 당 업자에게 공지되고 문헌에 기재된 방법에 의한 흡광도 분광법으로 결정할 수 있다. 실시양태에서, 280 nm에서 단백질 시료의 흡광도를 측정하고(예를 들어, 에펜도르프 바이오포토미터(Eppendorf BioPhotometer)(Eppendorf, Hamburg, Germany)를 이용하여) 비어-람버트 법칙(Beer-Lambert Law)을 이용하여 단백질 농도를 계산한다. 단백질의 정확한 몰 흡수 계수는 공지된 방법에 의해, 예를 들어 본원에서 참고로 포함되는 문헌(Grimsley, G. R., and Pace, C. N., "Spectrophotometric Determination of Protein Concentration," in Current Protocols in Protein Science 3.1.1-3.1.9, Copyright ⓒ 2003 by John Wiley & Sons, Inc.)에 기재된 바와 같이 계산할 수 있다.
표 5는 벡터NTI(VectorNTI, Invitrogen)로 계산된 몰 흡광 계수를 이용하여 측정된 A280 1에서 본원에 기재된 단백질의 농도를 열거한다.
관심 폴리펩티드의 수율 또는 순도를 결정하기 위한 웨스턴 블롯 분석은 SDS-PAGE 겔 상에서 분리된 단백질을 니트로셀룰로오스 막으로 이동시키고, 관심 폴리펩티드에 특이적인 단클론 항체와 막을 인큐베이션함으로써 당 업계에 공지된 임의의 적합한 방법에 따라 수행할 수 있다. 본원에 기재된 임의의 분석 방법에 유용한 항체는 당 업자에게 공지된 적합한 절차에 의해 생성할 수 있다.
본원에 기재되고 당 업계에 공지된 활성 분석이 또한 단백질 수율과 관련한 정보를 제공할 수 있다. 실시양태에서, 당 업계에 공지된 이들 또는 임의의 기타 방법은 단백질의 적합한 프로세싱, 예를 들어 적합한 리더 절단을 평가하는데 이용된다.
재조합 융합 단백질 수율의 유용한 척도는 예를 들어, 배양 부피당 가용성 재조합 융합 단백질의 양(예를 들어, g 또는 mg의 단백질/리터의 배양물), 수득한 가용성 재조합 융합 단백질의 백분율 또는 분율(예를 들어, 가용성 재조합 융합 단백질의 양/전체 재조합 융합 단백질의 양), 전체 세포 단백질(tcp)의 백분율 또는 분율, 및 건조 생물량의 백분율 또는 비율을 포함한다. 실시양태에서, 본원에 기재된 재조합 융합 단백질 수율의 척도는 수득한 가용성 재조합 융합 단백질의 양을 기준으로 한다. 실시양태에서, 가용성 재조합 융합 단백질의 측정은 세포 용해 후 수득한 가용성 분획, 예를 들어, 하나 이상의 원심분리 단계 후 또는 재조합 융합 단백질의 정제 후 수득한 가용성 분획에서 실시한다.
관심 폴리펩티드 수율의 유용한 측정값은 예를 들어, 배양 부피당 수득한 가용성 폴리펩티드의 양(예를 들어, g 또는 mg의 단백질/리터의 배양물), 수득한 가용성 관심 폴리펩티드의 백분율 또는 분율(예를 들어, 가용성 관심 폴리펩티드의 양/전체 관심 폴리펩티드의 양), 수득한 활성의 관심 폴리펩티드의 백분율 또는 분율(예를 들어, 활성의 관심 폴리펩티드의 양/활성 분석에서 관심 폴리펩티드의 전체 양), 전체 세포 단백질(tcp)의 백분율 또는 분율, 및 건조 생물량의 백분율 또는 분율을 포함한다.
수율이 배양물 부피의 측면에서 표현되는 실시양태에서, 특히 상이한 배양물 사이의 수율을 비교할 때, 배양 세포 밀도를 고려할 수 있다. 실시양태에서, 본 발명의 방법을 이용하여 가용성 및/또는 활성 및/또는 적합하게 프로세싱된(예를 들어, 적합하게 절단된 분비 리더를 갖는) 재조합 융합 단백질 수율을 리터당 약 0.5 g 내지 리터당 약 25 g 얻을 수 있다. 실시양태에서, 재조합 융합 단백질은 열 충격 단백질 패밀리의 세포질 샤프론 또는 폴딩 조절 인자인 N-말단 융합 파트너를 포함하고, 융합 단백질은 발현 후 세포질로 향하게 된다. 실시양태에서, 재조합 융합 단백질은 주변세포질 펩티딜프로필 이소머라아제 패밀리의 주변세포질 샤프론 또는 폴딩 조절 인자인 N-말단 융합 파트너를 포함하고, 융합 단백질은 발현 후 주변세포질로 향하게 된다. 실시양태에서, 융합 단백질, 세포질에서 발현된 융합 단백질, 또는 주변세포질에서 발현된 융합 단백질의 수율은 약 0.5 g/L, 약 1 g/L, 약 1.5 g/L, 약 2 g/L, 약 2.5 g/L, 약 3 g/L, 약 3.5 g/L, 약 4 g/L, 약 4.5 g/L, 약 5 g/L, 약 6 g/L, 약 7 g/L, 약 8 g/L, 약 9 g/L, 약 10 g/L, 약 11 g/L, 약 12 g/L, 약 13 g/L, 약 14 g/L, 약 15 g/L, 약 16 g/L, 약 17 g/L, 약 18 g/L, 약 19 g/L, 약 20 g/L, 약 21 g/L, 약 22 g/L, 약 23 g/L, 약 24 g/L, 약 25 g/L, 약 0.5 g/L 내지 약 25 g/L, 약 0.5 g/L 내지 약 23 g/L, 약 1 g/L 내지 약 23 g/L, 약 1.5 g/L 내지 약 23 g/L, 약 2 g/L 내지 약 23 g/L, 약 2.5 g/L 내지 약 23 g/L, 약 3 g/L 내지 약 23 g/L, 약 3.5 g/L 내지 약 23 g/L, 약 4 g/L 내지 약 23 g/L, 약 4.5 g/L 내지 약 23 g/L, 약 5 g/L 내지 약 23 g/L, 약 6 g/L 내지 약 23 g/L, 약 7 g/L 내지 약 23 g/L, 약 8 g/L 내지 약 23 g/L, 약 9 g/L 내지 약 23 g/L, 약 10 g/L 내지 약 23 g/L, 약 15 g/L 내지 약 23 g/L, 약 20 g/L 내지 약 23 g/L, 약 0.5 g/L 내지 약 20 g/L, 약 1 g/L 내지 약 20 g/L, 약 1.5 g/L 내지 약 20 g/L, 약 2 g/L 내지 약 20 g/L, 약 2.5 g/L 내지 약 20 g/L, 약 3 g/L 내지 약 20 g/L, 약 3.5 g/L 내지 약 20 g/L, 약 4 g/L 내지 약 20 g/L, 약 4.5 g/L 내지 약 20 g/L, 약 5 g/L 내지 약 20 g/L, 약 6 g/L 내지 약 20 g/L, 약 7 g/L 내지 약 20 g/L, 약 8 g/L 내지 약 20 g/L, 약 9 g/L 내지 약 20 g/L, 약 10 g/L 내지 약 20 g/L, 약 15 g/L 내지 약 20 g/L, 약 0.5 g/L 내지 약 15 g/L, 약 1 g/L 내지 약 15 g/L, 약 1.5 g/L 내지 약 15 g/L, 약 2 g/L 내지 약 15 g/L, 약 2.5 g/L 내지 약 15 g/L, 약 3 g/L 내지 약 15 g/L, 약 3.5 g/L 내지 약 15 g/L, 약 4 g/L 내지 약 15 g/L, 약 4.5 g/L 내지 약 15 g/L, 약 5 g/L 내지 약 15 g/L, 약 6 g/L 내지 약 15 g/L, 약 7 g/L 내지 약 15 g/L, 약 8 g/L 내지 약 15 g/L, 약 9 g/L 내지 약 15 g/L, 약 10 g/L 내지 약 15 g/L, 약 0.5 g/L 내지 약 12 g/L, 약 1 g/L 내지 약 12 g/L, 약 1.5 g/L 내지 약 12 g/L, 약 2 g/L 내지 약 12 g/L, 약 2.5 g/L 내지 약 12 g/L, 약 3 g/L 내지 약 12 g/L, 약 3.5 g/L 내지 약 12 g/L, 약 4 g/L 내지 약 12 g/L, 약 4.5 g/L 내지 약 12 g/L, 약 5 g/L 내지 약 12 g/L, 약 6 g/L 내지 약 12 g/L, 약 7 g/L 내지 약 12 g/L, 약 8 g/L 내지 약 12 g/L, 약 9 g/L 내지 약 12 g/L, 약 10 g/L 내지 약 12 g/L, 약 0.5 g/L 내지 약 10 g/L, 약 1 g/L 내지 약 10 g/L, 약 1.5 g/L 내지 약 10 g/L, 약 2 g/L 내지 약 10 g/L, 약 2.5 g/L 내지 약 10 g/L, 약 3 g/L 내지 약 10 g/L, 약 3.5 g/L 내지 약 10 g/L, 약 4 g/L 내지 약 10 g/L, 약 4.5 g/L 내지 약 10 g/L, 약 5 g/L 내지 약 10 g/L, 약 6 g/L 내지 약 10 g/L, 약 7 g/L 내지 약 10 g/L, 약 8 g/L 내지 약 10 g/L, 약 9 g/L 내지 약 10 g/L, 약 0.5 g/L 내지 약 9 g/L, 약 1 g/L 내지 약 9 g/L, 약 1.5 g/L 내지 약 9 g/L, 약 2 g/L 내지 약 9 g/L, 약 2.5 g/L 내지 약 9 g/L, 약 3 g/L 내지 약 9 g/L, 약 3.5 g/L 내지 약 9 g/L, 약 4 g/L 내지 약 9 g/L, 약 4.5 g/L 내지 약 9 g/L, 약 5 g/L 내지 약 9 g/L, 약 6 g/L 내지 약 9 g/L, 약 7 g/L 내지 약 9 g/L, 약 8 g/L 내지 약 9 g/L, 약 0.5 g/L 내지 약 8 g/L, 약 1 g/L 내지 약 8 g/L, 약 1.5 g/L 내지 약 8 g/L, 약 2 g/L 내지 약 8 g/L, 약 2.5 g/L 내지 약 8 g/L, 약 3 g/L 내지 약 8 g/L, 약 3.5 g/L 내지 약 8 g/L, 약 4 g/L 내지 약 8 g/L, 약 4.5 g/L 내지 약 8 g/L, 약 5 g/L 내지 약 8 g/L, 약 6 g/L 내지 약 8 g/L, 약 7 g/L 내지 약 8 g/L, 약 0.5 g/L 내지 약 7 g/L, 약 1 g/L 내지 약 7 g/L, 약 1.5 g/L 내지 약 7 g/L, 약 2 g/L 내지 약 7 g/L, 약 2.5 g/L 내지 약 7 g/L, 약 3 g/L 내지 약 7 g/L, 약 3.5 g/L 내지 약 7 g/L, 약 4 g/L 내지 약 7 g/L, 약 4.5 g/L 내지 약 7 g/L, 약 5 g/L 내지 약 7 g/L, 약 6 g/L 내지 약 7 g/L, 약 0.5 g/L 내지 약 6 g/L, 약 1 g/L 내지 약 6 g/L, 약 1.5 g/L 내지 약 6 g/L, 약 2 g/L 내지 약 6 g/L, 약 2.5 g/L 내지 약 6 g/L, 약 3 g/L 내지 약 6 g/L, 약 3.5 g/L 내지 약 6 g/L, 약 4 g/L 내지 약 6 g/L, 약 4.5 g/L 내지 약 6 g/L, 약 5 g/L 내지 약 6 g/L, 약 0.5 g/L 내지 약 5 g/L, 약 1 g/L 내지 약 5 g/L, 약 1.5 g/L 내지 약 5 g/L, 약 2 g/L 내지 약 5 g/L, 약 2.5 g/L 내지 약 5 g/L, 약 3 g/L 내지 약 5 g/L, 약 3.5 g/L 내지 약 5 g/L, 약 4 g/L 내지 약 5 g/L, 약 4.5 g/L 내지 약 5 g/L, 약 0.5 g/L 내지 약 4 g/L, 약 1 g/L 내지 약 4 g/L, 약 1.5 g/L 내지 약 4 g/L, 약 2 g/L 내지 약 4 g/L, 약 2.5 g/L 내지 약 4 g/L, 약 3 g/L 내지 약 4 g/L, 약 0.5 g/L 내지 약 3 g/L, 약 1 g/L 내지 약 3 g/L, 약 1.5 g/L 내지 약 3 g/L, 약 2 g/L 내지 약 3 g/L, 약 0.5 g/L 내지 약 2 g/L, 약 1 g/L 내지 약 2 g/L, 또는 약 0.5 g/L 내지 약 1 g/L이다.
실시양태에서, 관심 폴리펩티드는 hPTH이고 세포질로 향하게 된 재조합 융합 단백질의 수율은 약 0.5 g/L 내지 약 2.4 g/L이다.
실시양태에서, 관심 폴리펩티드는 hPTH이고 주변세포질로 향하게 된 재조합 융합 단백질의 수율은 약 0.5 g/L 내지 약 6.7 g/L이다.
관심 폴리펩티드의 수율
실시양태에서, 관심 폴리펩티드는 링커 내에서 프로테아제 절단에 의해 전체 재조합 융합 단백질로부터 유리된다. 실시양태에서, 프로테아제로 절단 후 수득한 관심 폴리펩티드는 적합하게 유리된 관심 폴리펩티드이다. 실시양태에서, 관심 폴리펩티드의 수율-적합하게 유리된 단백질의 측정값을 기준으로 하거나 전체 융합 단백질에 대한 관심 폴리펩티드의 기지의 비율을 기준으로 하여 계산된-은 약 0.7 g/L 내지 약 25.0 g/L이다. 실시양태에서, 관심 폴리펩티드의 수율은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서 약 0.5 g/L (500 mg/L), 약 1 g/L, 약 1.5 g/L, 약 2 g/L, 약 2.5 g/L, 약 3 g/L, 약 3.5 g/L, 약 4 g/L, 약 4.5 g/L, 약 5 g/L, 약 6 g/L, 약 7 g/L, 약 8 g/L, 약 9 g/L, 약 10 g/L, 약 11 g/L, 약 12 g/L, 약 13 g/L, 약 14 g/L, 약 15 g/L, 약 16 g/L, 약 17 g/L, 약 18 g/L, 약 19 g/L, 약 20 g/L, 약 21 g/L, 약 22 g/L, 약 23 g/L, 약 24 g/L, 약 25 g/L, 약 0.5 g/L 내지 약 23 g/L, 약 1 g/L 내지 약 23 g/L, 약 1.5 g/L 내지 약 23 g/L, 약 2 g/L 내지 약 23 g/L, 약 2.5 g/L 내지 약 23 g/L, 약 3 g/L 내지 약 23 g/L, 약 3.5 g/L 내지 약 23 g/L, 약 4 g/L 내지 약 23 g/L, 약 4.5 g/L 내지 약 23 g/L, 약 5 g/L 내지 약 23 g/L, 약 6 g/L 내지 약 23 g/L, 약 7 g/L 내지 약 23 g/L, 약 8 g/L 내지 약 23 g/L, 약 9 g/L 내지 약 23 g/L, 약 10 g/L 내지 약 23 g/L, 약 15 g/L 내지 약 23 g/L, 약 20 g/L 내지 약 23 g/L, 약 0.5 g/L 내지 약 20 g/L, 약 1 g/L 내지 약 20 g/L, 약 1.5 g/L 내지 약 20 g/L, 약 2 g/L 내지 약 20 g/L, 약 2.5 g/L 내지 약 20 g/L, 약 3 g/L 내지 약 20 g/L, 약 3.5 g/L 내지 약 20 g/L, 약 4 g/L 내지 약 20 g/L, 약 4.5 g/L 내지 약 20 g/L, 약 5 g/L 내지 약 20 g/L, 약 6 g/L 내지 약 20 g/L, 약 7 g/L 내지 약 20 g/L, 약 8 g/L 내지 약 20 g/L, 약 9 g/L 내지 약 20 g/L, 약 10 g/L 내지 약 20 g/L, 약 15 g/L 내지 약 20 g/L, 약 0.5 g/L 내지 약 15 g/L, 약 1 g/L 내지 약 15 g/L, 약 1.5 g/L 내지 약 15 g/L, 약 2 g/L 내지 약 15 g/L, 약 2.5 g/L 내지 약 15 g/L, 약 3 g/L 내지 약 15 g/L, 약 3.5 g/L 내지 약 15 g/L, 약 4 g/L 내지 약 15 g/L, 약 4.5 g/L 내지 약 15 g/L, 약 5 g/L 내지 약 15 g/L, 약 6 g/L 내지 약 15 g/L, 약 7 g/L 내지 약 15 g/L, 약 8 g/L 내지 약 15 g/L, 약 9 g/L 내지 약 15 g/L, 약 10 g/L 내지 약 15 g/L, 약 0.5 g/L 내지 약 12 g/L, 약 1 g/L 내지 약 12 g/L, 약 1.5 g/L 내지 약 12 g/L, 약 2 g/L 내지 약 12 g/L, 약 2.5 g/L 내지 약 12 g/L, 약 3 g/L 내지 약 12 g/L, 약 3.5 g/L 내지 약 12 g/L, 약 4 g/L 내지 약 12 g/L, 약 4.5 g/L 내지 약 12 g/L, 약 5 g/L 내지 약 12 g/L, 약 6 g/L 내지 약 12 g/L, 약 7 g/L 내지 약 12 g/L, 약 8 g/L 내지 약 12 g/L, 약 9 g/L 내지 약 12 g/L, 약 10 g/L 내지 약 12 g/L, 약 0.5 g/L 내지 약 10 g/L, 약 1 g/L 내지 약 10 g/L, 약 1.5 g/L 내지 약 10 g/L, 약 2 g/L 내지 약 10 g/L, 약 2.5 g/L 내지 약 10 g/L, 약 3 g/L 내지 약 10 g/L, 약 3.5 g/L 내지 약 10 g/L, 약 4 g/L 내지 약 10 g/L, 약 4.5 g/L 내지 약 10 g/L, 약 5 g/L 내지 약 10 g/L, 약 6 g/L 내지 약 10 g/L, 약 7 g/L 내지 약 10 g/L, 약 8 g/L 내지 약 10 g/L, 약 9 g/L 내지 약 10 g/L, 약 0.5 g/L 내지 약 9 g/L, 약 1 g/L 내지 약 9 g/L, 약 1.5 g/L 내지 약 9 g/L, 약 2 g/L 내지 약 9 g/L, 약 2.5 g/L 내지 약 9 g/L, 약 3 g/L 내지 약 9 g/L, 약 3.5 g/L 내지 약 9 g/L, 약 4 g/L 내지 약 9 g/L, 약 4.5 g/L 내지 약 9 g/L, 약 5 g/L 내지 약 9 g/L, 약 6 g/L 내지 약 9 g/L, 약 7 g/L 내지 약 9 g/L, 약 8 g/L 내지 약 9 g/L, 약 0.5 g/L 내지 약 8 g/L, 약 1 g/L 내지 약 8 g/L, 약 1.5 g/L 내지 약 8 g/L, 약 2 g/L 내지 약 8 g/L, 약 2.5 g/L 내지 약 8 g/L, 약 3 g/L 내지 약 8 g/L, 약 3.5 g/L 내지 약 8 g/L, 약 4 g/L 내지 약 8 g/L, 약 4.5 g/L 내지 약 8 g/L, 약 5 g/L 내지 약 8 g/L, 약 6 g/L 내지 약 8 g/L, 약 7 g/L 내지 약 8 g/L, 약 0.5 g/L 내지 약 7 g/L, 약 1 g/L 내지 약 7 g/L, 약 1.5 g/L 내지 약 7 g/L, 약 2 g/L 내지 약 7 g/L, 약 2.5 g/L 내지 약 7 g/L, 약 3 g/L 내지 약 7 g/L, 약 3.5 g/L 내지 약 7 g/L, 약 4 g/L 내지 약 7 g/L, 약 4.5 g/L 내지 약 7 g/L, 약 5 g/L 내지 약 7 g/L, 약 6 g/L 내지 약 7 g/L, 약 0.5 g/L 내지 약 6 g/L, 약 1 g/L 내지 약 6 g/L, 약 1.5 g/L 내지 약 6 g/L, 약 2 g/L 내지 약 6 g/L, 약 2.5 g/L 내지 약 6 g/L, 약 3 g/L 내지 약 6 g/L, 약 3.5 g/L 내지 약 6 g/L, 약 4 g/L 내지 약 6 g/L, 약 4.5 g/L 내지 약 6 g/L, 약 5 g/L 내지 약 6 g/L, 약 0.5 g/L 내지 약 5 g/L, 약 1 g/L 내지 약 5 g/L, 약 1.5 g/L 내지 약 5 g/L, 약 2 g/L 내지 약 5 g/L, 약 2.5 g/L 내지 약 5 g/L, 약 3 g/L 내지 약 5 g/L, 약 3.5 g/L 내지 약 5 g/L, 약 4 g/L 내지 약 5 g/L, 약 4.5 g/L 내지 약 5 g/L, 약 0.5 g/L 내지 약 4 g/L, 약 1 g/L 내지 약 4 g/L, 약 1.5 g/L 내지 약 4 g/L, 약 2 g/L 내지 약 4 g/L, 약 2.5 g/L 내지 약 4 g/L, 약 3 g/L 내지 약 4 g/L, 약 0.5 g/L 내지 약 3 g/L, 약 1 g/L 내지 약 3 g/L, 약 1.5 g/L 내지 약 3 g/L, 약 2 g/L 내지 약 3 g/L, 약 0.5 g/L 내지 약 2 g/L, 약 1 g/L 내지 약 2 g/L, 또는 약 0.5 g/L 내지 약 1 g/L이다.
실시양태에서, hPTH는 표 8에 기재된 바와 같이 N-말단 융합 파트너 및 hPTH 구조물을 갖는 융합 단백질로서 생산된다. 실시양태에서, hPTH 융합 단백질의 발현은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 450, 적어도 500, 적어도 550, 적어도 600, 적어도 650, 또는 적어도 1000 mg/L 전체 hPTH 융합 단백질을 생산한다.
실시양태에서, 프로인슐린, 예를 들어, 인슐린 유사체, 예를 들어, 글라진을 위한 프로인슐린은 표 19에 기재된 바와 같이 N-말단 융합 파트너 및 C-펩티드 서열을 포함하는 프로인슐린 구조물을 갖는 프로인슐린 융합 단백질로서 생산된다. 실시양태에서, 본 발명의 방법에 따른 프로인슐린 융합 단백질의 발현은 0.5 mL 내지 100L, 50 mL, 100 mL, 1L, 2L 이상의 규모에서, 적합하게 유리될 때 측정되거나 융합 단백질 중 이의 기지의 비율을 기준으로 계산되는 바, 적어도 약 10, 적어도 약 20, 적어도 약 30, 적어도 약 40, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 110, 적어도 약 120, 적어도 약 130, 적어도 약 140, 적어도 약 150, 적어도 약 200, 또는 적어도 약 250 mg/L의 가용성 프로인슐린을 생산한다.
실시양태에서, 본 발명의 방법에 따른 프로인슐린 융합 단백질의 발현은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서, 적합하게 유리될 때 측정되거나 융합 단백질 중 이의 기지의 비율을 기준으로 계산되는 바, 약 10 내지 약 500, 약 15 내지 약 500, 약 20 내지 약 500, 약 30 내지 약 500, 약 40 내지 약 500, 약 50 내지 약 500, 약 60 내지 약 500, 약 70 내지 약 500, 약 80 내지 약 500, 약 90 내지 약 500, 약 100 내지 약 500, 약 200 내지 약 500, 약 10 내지 약 400, 약 15 내지 약 400, 약 20 내지 약 400, 약 30 내지 약 400, 약 40 내지 약 400, 약 50 내지 약 400, 약 60 내지 약 400, 약 70 내지 약 400, 약 80 내지 약 400, 약 90 내지 약 400, 약 100 내지 약 400, 약 200 내지 약 400, 약 10 내지 약 300, 약 15 내지 약 300, 약 20 내지 약 300, 약 30 내지 약 300, 약 40 내지 약 300, 약 50 내지 약 300, 약 60 내지 약 300, 약 70 내지 약 300, 약 80 내지 약 300, 약 90 내지 약 300, 약 100 내지 약 300, 약 200 내지 약 300, 약 10 내지 약 250, 약 15 내지 약 250, 약 20 내지 약 250, 약 30 내지 약 250, 약 40 내지 약 250, 약 50 내지 약 250, 약 60 내지 약 250, 약 70 내지 약 250, 약 80 내지 약 250, 약 90 내지 약 250, 약 100 내지 약 250, 약 10 내지 약 200, 약 15 내지 약 200, 약 20 내지 약 200, 약 30 내지 약 200, 약 40 내지 약 200, 약 50 내지 약 200, 약 60 내지 약 200, 약 70 내지 약 200, 약 80 내지 약 200, 약 90 내지 약 200, 또는 약 100 내지 약 200 mg/L 가용성 프로인슐린을 생산한다.
실시양태에서, 프로인슐린 융합 단백질의 발현은 적어도 약 100, 적어도 약 125, 적어도 약 150, 적어도 약 175, 적어도 약 200, 적어도 약 250, 적어도 약 300, 적어도 약 350, 적어도 약 400, 적어도 약 450, 적어도 약 500, 적어도 약 550, 적어도 약 600, 적어도 약 650, 또는 적어도 약 1000 mg/L의 전체 가용성 및 불용성 프로인슐린을 생산한다. 실시양태에서, 프로인슐린 융합 단백질의 발현은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서 약 100 내지 약 2000 mg/L, 약 100 내지 약 1500 mg/L, 약 100 내지 약 1000 mg/L, 약 100 내지 약 900 mg/L, 약 100 내지 약 800 mg/L, 약 100 내지 약 700 mg/L, 약 100 내지 약 600 mg/L, 약 100 내지 약 500 mg/L, 약 100 내지 약 400 mg/L, 약 200 내지 약 2000 mg/L, 약 200 내지 약 1500 mg/L, 약 200 내지 약 1000 mg/L, 약 200 내지 약 900 mg/L, 약 200 내지 약 800 mg/L, 약 200 내지 약 7000 mg/L, 약 200 내지 약 600 mg/L, 약 200 내지 약 500 mg/L, 약 300 내지 약 2000 mg/L, 약 300 내지 약 1500 mg/L, 약 300 내지 약 1000 mg/L, 약 300 내지 약 900 mg/L, 약 300 내지 약 800 mg/L, 약 300 내지 약 7000 mg/L, 또는 약 300 내지 약 600 mg/L의 전체 가용성 및 불용성 프로인슐린을 생산한다. 실시양태에서, 프로인슐린은 절단되어 C-펩티드를 유리시키고 성숙 인슐린을 생산한다. 실시양태에서, 프로인슐린 융합 단백질의 발현은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서, 적합하게 분비될 때 측정되거나 융합 단백질 중 이의 기지의 비율을 기준으로 계산되는 바, 적어도 약 100, 적어도 약 200, 적어도 약 250, 적어도 약 300, 적어도 약 400, 적어도 약 500, 약 100 내지 약 2000 mg/L, 약 200 내지 약 2000 mg/L, 약 300 내지 약 2000 mg/L, 약 400 내지 약 2000 mg/L, 약 500 내지 약 2000 mg/L, 약 100 내지 약 1000 mg/L, 약 200 내지 약 1000 mg/L, 약 300 내지 약 1000 mg/L, 약 400 내지 약 1000 mg/L, 약 500 내지 약 1000 mg/L의 성숙 인슐린을 생산한다.
실시양태에서, GCSF는 표 21에 기재된 바와 같이 N-말단 융합 파트너를 갖는 GCSF 융합 단백질로서 생산된다. 실시양태에서, 본 발명의 방법에 따른 GCSF 융합체의 발현은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서, 적합하게 유리될 때 측정되거나 융합 단백질 중 이의 기지의 비율을 기준으로 계산되는 바, 적어도 100, 적어도 200, 적어도 250, 적어도 300, 적어도 400, 적어도 500, 또는 적어도 1000, 약 100 내지 약 1000, 약 200 내지 약 1000, 약 300 내지 약 1000, 약 400 내지 약 1000, 또는 약 500 내지 약 1000 mg/L 가용성 GCSF를 포함하는 가용성 융합 단백질을 생산한다. 실시양태에서, 본 발명의 방법에 따른 GCSF 융합체의 발현은 적어도 100, 적어도 200, 적어도 250, 적어도 300, 적어도 400, 적어도 500, 또는 적어도 1000 mg/L 가용성 GCSF를 생산한다. 실시양태에서, GCSF 융합체의 발현은 0.5 mL 내지 100L, 0.5 mL, 50 mL, 100 mL, 1L, 2L 이상의 규모에서 적어도 300, 적어도 350, 적어도 400, 적어도 450, 적어도 500, 적어도 550, 적어도 600, 적어도 650, 적어도 700, 적어도 850, 적어도 550, 적어도 600, 적어도 650, 약 100 내지 약 1000, 약 200 내지 약 1000, 약 300 내지 약 1000, 약 400 내지 약 1000, 또는 약 500 내지 약 1000 mg/L의 전체 가용성 및 불용성 GCSF를 생산한다.
실시양태에서, 생산된 재조합 융합 단백질의 양은 전체 세포 단백질의 약 1% 내지 약 75%이다. 특정 실시양태에서, 생산된 재조합 융합 단백질의 양은 전체 세포 단백질의 약 1%, 약 2%, 약 3%, 약 4%, 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 1% 내지 약 5%, 약 1% 내지 약 10%, 약 1% 내지 약 20%, 약 1% 내지 약 30%, 약 1% 내지 약 40%, 약 1% 내지 약 50%, 약 1% 내지 약 60%, 약 1% 내지 약 75%, 약 2% 내지 약 5%, 약 2% 내지 약 10%, 약 2% 내지 약 20%, 약 2% 내지 약 30%, 약 2% 내지 약 40%, 약 2% 내지 약 50%, 약 2% 내지 약 60%, 약 2% 내지 약 75%, 약 3% 내지 약 5%, 약 3% 내지 약 10%, 약 3% 내지 약 20%, 약 3% 내지 약 30%, 약 3% 내지 약 40%, 약 3% 내지 약 50%, 약 3% 내지 약 60%, 약 3% 내지 약 75%, 약 4% 내지 약 10%, 약 4% 내지 약 20%, 약 4% 내지 약 30%, 약 4% 내지 약 40%, 약 4% 내지 약 50%, 약 4% 내지 약 60%, 약 4% 내지 약 75%, 약 5% 내지 약 10%, 약 5% 내지 약 20%, 약 5% 내지 약 30%, 약 5% 내지 약 40%, 약 5% 내지 약 50%, 약 5% 내지 약 60%, 약 5% 내지 약 75%, 약 10% 내지 약 20%, 약 10% 내지 약 30%, 약 10% 내지 약 40%, 약 10% 내지 약 50%, 약 10% 내지 약 60%, 약 10% 내지 약 75%, 약 20% 내지 약 30%, 약 20% 내지 약 40%, 약 20% 내지 약 50%, 약 20% 내지 약 60%, 약 20% 내지 약 75%, 약 30% 내지 약 40%, 약 30% 내지 약 50%, 약 30% 내지 약 60%, 약 30% 내지 약 75%, 약 40% 내지 약 50%, 약 40% 내지 약 60%, 약 40% 내지 약 75%, 약 50% 내지 약 60%, 약 50% 내지 약 75%, 약 60% 내지 약 75%, 또는 약 70% 내지 약 75%이다.
용해도 및 활성
단백질의 "용해도" 및 "활성"은 관련 성질이더라도 일반적으로 상이한 방법으로 결정된다. 단백질, 특히 소수성 단백질의 용해도는 소수성 아미노산 잔기가 폴딩된 단백질 밖에 부적합하게 위치한다는 것을 나타낸다. 당업자에 의해 관심 폴리펩티드에 적절하다고 결정된 방법을 이용하여 평가될 수 있는 단백질 활성은 적합한 단백질 입체 구조의 또 다른 표지이다. 본원에서 사용되는 "가용성, 활성, 또는 둘 다"는 당업자에게 공지된 방법에 의해 가용성, 활성 또는 가용성과 활성 둘다를 갖는다고 결정된 단백질을 언급한다.
일반적으로, 아미노산 서열과 관련하여, 용어 "변형"은 치환, 삽입, 연장, 결실 및 유도체화 단독 또는 조합하여 포함한다. 실시양태에서, 재조합 융합 단백질은 "비필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "비필수" 아미노산 잔기는 재조합 융합 단백질의 활성(예를 들어, 작용제 활성)의 제거 또는 실질적인 감소 없이 신규 아미노산 서열 내에서 변경, 예를 들어 결실 또는 치환될 수 있는 잔기이다. 예로서, 재조합 융합 단백질은 재조합 융합 단백질 분자에 걸쳐 연속적인 방식 또는 간격을 두고 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 치환을 포함할 수 있다. 단독으로 또는 치환과 함께, 재조합 융합 단백질은 역시 재조합 융합 단백질 분자에 걸쳐 연속적인 방식 또는 간격을 두고 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 삽입을 포함할 수 있다. 또한, 재조합 융합 단백질은 단독으로 또는 치환 및/또는 삽입과 함께, 역시 재조합 융합 단백질 분자에 걸쳐 연속적인 방식 또는 간격을 두고 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 결실을 포함할 수 있다. 또한, 재조합 융합 단백질은, 단독으로 또는 치환, 삽입 및/또 결실과 함께, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 첨가를 포함할 수 있다.
치환은 보존적 아미노산 치환을 포함한다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄, 또는 생리화학적 특성(예를 들어, 정전기, 수소 결합, 등전자, 소수성 특징)을 갖는 아미노산 잔기로 치환된 것이다. 아미노산은 천연이거나 천연이 아닐(비천연일) 수 있다. 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 당 업계에 공지되어 있다. 이들 패밀리는 염기성 측쇄(예를 들어 리신, 아르기닌, 히스티딘), 산성 측쇄(예를 들어, 아스파트산, 글루탐산), 비하전 극성 측쇄(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 메티오닌, 시스테인), 비극성 측쇄(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 트립토판), β-분지형 측쇄(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 가진 아미노산을 포함한다. 또한, 치환은 비보존적 변화를 포함할 수 있다.
본원에서 본 발명의 바람직한 실시양태를 제시하고 기재하였지만, 이러한 실시양태들은 단지 예시로 제공된다는 것은 당업자에게는 명백할 것이다. 이제 당업자들에게 본 발명으로부터 벗어나지 않으면서 다수의 변이, 변화 및 치환이 떠오를 것이다. 본원에 기재된 본 발명의 실시양태들의 여러 대안이 본 발명을 실시하는데 이용될 수 있음을 이해하여야 한다. 하기 특허 청구범위가 본 발명의 범위를 규정하고, 이로써 이들 청구범위 및 그의 등가물의 범위 내의 방법 및 구성을 포함하고자 한다.
실시예
실시예
I:
hPTH
1-34
융합체를
발현하는 균주의
고처리량
스크리닝
본 연구는, N-말단 융합 파트너로서 DnaJ-유사 단백질, FklB, 또는 FrnE를 포함하는 hPTH 1-34 융합 단백질을 발현하는 피. 플루오레센스 균주에 의해 생산된 재조합 단백질의 수준을 시험하기 위해 수행하였다.
재료 및 방법
PTH 1-34 융합 단백질 발현 플라스미드의 제작: PTH 1-34 융합 단백질을 코딩하는 유전자 단편은 DNA 2.0, 유전자 설계 및 합성 서비스(Menlo Park, CA)를 이용하여 합성하였다. 각 유전자 단편은 PTH 1-34의 코딩 서열에 융합된 피. 플루오레센스 폴딩 조절 인자(DnaJ-유사 단백질, FklB, 또는 FrnE)의 코딩 서열, 및 링커를 포함하였다. 또한, 각 유전자 단편은 제한 효소 SpeI 및 XhoI의 인식 서열, "Hi" 리보솜 결합 부위, 및 코딩 서열 상류에 첨가된, 리보솜 결합 부위 및 제한 부위를 포함하는 18개 염기쌍 스페이서(서열 번호 58) 및 3개의 정지 코돈을 포함하였다. 상기 PTH 1-34 융합 단백질을 코딩하는 뉴클레오티드 서열은 서열 번호 52-57에 제공한다.
발현 플라스미드 p708-004, -005 및 -006(표 6에 열거됨)를 생성하기 위해서, PTH 1-34 융합 단백질 유전자 단편을 SpeI 및 XhoI 제한 효소를 이용하여 분해하고, pTac 프로모터 및 rrnT1T2 전사 종결 인자를 포함하는 발현 벡터 pDOW1169에 서브클로닝하였다. pDOW1169는 문헌, 예를 들어 둘 다 본원에서 참고로 포함되는 미국 특허 출원 공개공보 제7,833,752호("Bacterial Leader Sequences for Increased Expression") 및 문헌(Schneider et al., 2005, "Auxotrophic markers pyrF and proC can replace antibiotic markers on protein production plasmids in high-cell-density Pseudomonas fluorescens fermentation," Biotechnol. Progress 21(2): 343-8)에 기재되어 있다. 플라스미드로 적격(competent) 피. 플루오레센스 DC454 숙주 세포(pyrF lsc::lacIQ1)에 전기천공을 수행하였다.
DNA 서열분석: 융합 단백질 발현 플라스미드에 클로닝된 단편의 존재는 빅다이(BigDye)® 터미네이터 v3.1 사이클 시퀀싱 키트(Terminator v3.1 Cycle Sequencing Kit)(Applied Biosystems, 4337455)를 이용한 DNA 서열분석으로 확인하였다. 50 fmol의 분석할 플라스미드 DNA를 함유하는 DNA 서열 분석 반응물은 1 ㎕의 서열분석 프리믹스, 0.5 ㎕의 100 μM 프라이머 저장 용액, 3.5 ㎕의 서열분석 완충액, 및 최종 부피 20 ㎕가 되도록 첨가된 물을 혼합하여 제조하였다. 결과물을 모아 시퀀셔(Sequencher)™ 소프트웨어(Gene Codes)를 이용하여 분석하였다.
96웰 형식( HTP )의 배양 및 발현: 융합 단백질 발현 플라스미드는 배열 형식의 피. 플루오레센스 숙주 균주에 형질전환시켰다. 35 ㎕의 피. 플루오레센스 적격 세포와 10 ㎕ 부피의 플라스미드 DNA(2.5 ng)를 혼합하여 형질전환 반응을 개시하였다. 25 ㎕의 혼합물 분액을 96-멀티-웰 뉴클레오베트(Nucleovette)® 플레이트(Lonza)에 옮겼다. 뉴클레오펙터(Nucleofector)™ 96웰 셔틀(Shuttle)™ 시스템(Lonza AG)을 이용하여 전기천공을 수행하고, 계속하여 전기천공된 세포를 1% 글루코오스가 보충된 500 ㎕ M9 염 배지, 및 미량 원소를 포함하는 새로운 96웰 깊은 웰 플레이트에 옮겼다. 플레이트는 30℃에서 진탕하면서 48시간 인큐베이션하여 종균 배양물을 생성하였다.
10 ㎕의 종균 배양물 분액을 2개의 96웰 깊은 웰 플레이트에 옮겼다. 각 웰은 미량 원소 및 5% 글리세롤이 보충된 500 ㎕의 HTP-YE 배지(Teknova)를 포함하였다. 글리세롤이 보충된 HTP 배지에 플레이팅된 종균 배양물을 30℃ 진탕기에서 24시간 인큐베이션하였다. 이소프로필-β-D-1-티오갈락토피라노시드(IPTG)는 각 웰에 최종 농도 0.3 mM이 되도록 첨가하여 PTH 1-34 융합 단백질의 발현을 유도하였다. 폴딩 조절 인자를 과발현하는 플라스미드를 포함하는 균주(표 4 참조)에 대해, IPTG에 최종 농도 1%의 만니톨(Sigma, M1902)을 보충하여 폴딩 조절 인자의 발현을 유도하였다. 또한, 0.01 ㎕의 250 unit/㎕ 저장 벤조나아제(Novagen, 70746-3)를 유도시 웰마다 첨가하여 배양 점도의 포텐셜을 감소시켰다. 유도 후 24시간에, 600 nm(OD600)에서 광학 밀도를 측정하여 세포 밀도를 계산하였다. 계속하여 세포를 수거하고 1X 인산완충 식염수(PBS)로 최종 부피 400 ㎕로 1:3 희석하고 이후의 공정을 위해 냉동하였다.
분석 특성화를 위한 가용성 용해물 시료의 제조: 수거한 세포 시료를 희석하고 24 프로브 팁 혼(probe tip horn)을 이용한 셀 라이시스 오토메이티드 소니케이션 시스템(Cell Lysis Automated Sonication System)(CLASS, Scinomix)으로 초음파 분해에 의해 용해 시켰다. 용해물은 5,500 x g 8℃에서 15분간 원심분리하였다. 상등액을 수집하고 가용성 분액으로 표지하였다. 펠렛을 수집하고 400 ㎕의 1X PBS pH 7.4에 또 한 차례 초음파 분해하여 재현탁하고 불용성 분획으로 표지하였다.
SDS- CGE 분석: 가용성 및 불용성 분획은 HT 프로테인 익스프레스 v2 칩이 구비된 랩칩 GXII 장치(Caliper LifeSciences) 및 해당 시약(각각 품번 760499 및 760328, Caliper LifeSciences)을 사용하여 HTP 마이크로칩 SDS 모세관 겔 전기영동에 의해 분석하였다. 시료는 제조사의 프로토콜(Protein User Guide Document No. 450589, Rev. 3)에 따라 제조하였다. 간략하게, 4 ㎕ 분액의 가용성 또는 불용성 분획 시료를 95℃에서 5분간 가열된 96웰 폴리프로필렌 원뿔형 웰 PCR 플레이트에 디티오트레이톨(DTT) 환원제를 포함하거나 포함하지 않은 14 ㎕의 완충액과 혼합하고, 70 ㎕의 탈이온수로 희석하였다. 융합 단백질 발현 플라스미드로 형질전환되지 않은 무표지(null) 숙주 균주의 용해물은 대조군으로서 시험 시료와 나란히 이동시키고, 시스템 내부 표준을 이용하여 정량하였다.
진탕 플라스크 발현: 평가되는 각 융합 단백질 발현 균주 각각의 종균 배양물을 M9 글루코오스(Teknova)에서 배양하여 중간 배양물을 얻고, 5 mL 부피의 각 중간 배양물을 사용하여 250 mL HTP 배지(Teknova 3H1129)를 포함하는 4개의 1 리터 배플 바닥 플라스크 각각에 접종하였다. 30℃에서 배양 24시간 후에, 배양물을 0.3 mM IPTG와 1% 만니톨로 유도하고, 30℃에서 추가 24시간 인큐베이션하였다. 그 후, 진탕 플라스크 브로쓰를 원심분리하여 세포를 수거하고 수거된 세포 페이스트를 나중에 사용하기 위해 냉동하였다.
기계적 분비 및 정제: 5 g 또는 10 g 양의 냉동된 세포 페이스트를 해동하여 3X PBS, 5% 글리세롤, 50 mM 이미다졸 pH 7.4에 재현탁하여 각각 최종 부피 50 mL 또는 100 mL를 준비하였다. 계속하여 현탁액은 마이크로플루다이저(Microfluidics, Inc., model M 110Y)를 15,000 psi에서 2회 통과시켜 균질화하였다. 용해물은 12,000 × g에서 30분간 원심분리하고 사르토리우스 사르토브란 150 (0.45/0.2 μm) 필터 캡슐을 통해 여과하였다.
크로마토그래피: 고속 단백질 액체 크로마토그래피(FPLC) 공정은 Frac-950 분획 수집기가 장착된 AKTA 익스플로러 100 크로마토그래피 시스템(GE Healthcare)을 이용하여 실시하였다. HTP 발현 브로쓰에서 제조된 가용성 분획 시료를 3X PBS, 5% 글리세롤, 50 mM 이미다졸 pH 7.4로 미리 평형화된 5 mL 히스트랩 FF 컬럼(GE Healthcare, 품번 17-5248-02)에 로딩하였다. 컬럼은 4배 컬럼 부피의 평형 완충액으로 세척하고, 융합 단백질은 10배 컬럼 부피의 용출 완충액을 이용하여, 0 mM 내지 200 mM의 이미다졸의 선형 구배를 적용하여 히스트랩 컬럼으로부터 용출하였다. 전체 공정은 1.5분의 체류 시간에 등가인 100 cm/h로 실시하였다. 정제 분획은 상기에 기재된 SDS-CGE 분석 방법을 이용하여 SDS-CGE에 의해 분석하였다.
엔테로키나아제 절단: 첫 세트의 시료는 융합 단백질을 함유하는 정제 분획을 7000 분자량 차단(MWCO) 슬라이드-A-라이저 카세트(Slide-A-Lyzer cassettes)(Pierce)를 이용하여 2 mM CaCl2가 보충된 1X PBS pH 7.4에 대해 4℃에서 하룻밤 투석하여 준비하였다. 투석된 시료는 약 1 mg/mL 농도로 유지하였다. 두 번째 세트의 시료는 융합 단백질을 함유하는 정제 분획을 물로 2X 희석하여 준비하고, 1.5X PBS, 2.5% 글리세롤, 및 ~30-70 mM 이미다졸을 포함하는 완충액에 0.5 mg/mL의 농도로 저장하였다. 돼지 엔테로키나아제 저장 용액(Sigma E0632-1.5KU)을 5X 또는 20X 희석으로 시료(각각 40 μg/mL 및 10 μg/mL의 엔테로키나아제 농도에 해당)에 첨가하였다. 또한, CaCl2을 2 mM 최종 농도로 첨가하고, 반응 혼합물을 실온에서 하룻밤 인큐베이션하였다.
액체 크로마토그래피-질량 분광법: 오토 샘플러, 컬럼 히터, 및 UV 검출기가 구비된 애질런트(Agilent) 1100 HPLC에 연결된 전자분무 계면(ESI: electrospray interface)을 이용한 Q-ToFmicro 질량 분광계(Waters)를 액체 크로마토그래피-질량 분석법(LC-MS) 분석에 사용하였다. 내경 2.1 mm ID, 길이 150 mm, 입자 크기 5 μm, 및 공극 크기 300 Å(Agilent, 카탈로그 번호 883750-905)를 가진 CN-역상 컬럼을 가드 컬럼(Agilent, 카탈로그 번호 820950-923)과 함께 사용하였다. HPLC는 온도 50℃에서 작동시키고 유속은 2℃에서 유지하였다. HPLC 완충액은 0.1% 포름산(이동상 A) 및 0.1% 포름산을 포함하는 90% 아세토니트릴(이동상 B)이었다. 대략 4 μg의 융합 단백질 시료를 HPLC 컬럼에 로딩하였다. 시료를 로딩하는 동안 HPLC 작동 조건은 95% 이동상에 설정하였다. 융합 단백질은 표 7에 예시된 역상 구배를 이용하여 용출하였다.
UV 흡광도 스펙트럼은 MS에 앞서 180 nm 내지 500 nm에서 수집하였다. ESI-MS 소스는 2.5 kV의 양성 모드에서 사용하였다. MS 스캔은 초당 2회 스캔으로 600-2600 m/z의 범위를 이용하여 수행하였다. MS 및 UV 데이터는 매스링스(MassLynx) 소프트웨어(Waters)를 이용하여 분석하였다. UV 크로마토그램 및 MS 전체 이온 전류(TIC) 크로마토그램을 얻었다. 목표 피크의 MS 스펙트럼을 합계하였다. 이들 스펙트럼을 2,800-6,000의 분자량 범위(이론 분자량이 4118 kDa일 PTH 1-34의 경우, 융합 단백질 또는 N-말단 융합 파트너일 경우 더 높은 범위), 채널 당 1 Da의 해상도, 및 0.25 Da의 가우시안 너비에 대해 MaxEnt 1(Waters) 스캐닝을 이용하여 디콘볼루션하였다.
결과
PTH 1-34 유전자 융합 단편의 설계: PTH 1-34 융합 단백질의 고수준 발현을 촉진하기 위해서, 높은 가용성 발현, 25 kDa 미만의 분자량 및 PTH 1-34(8.52의 pI를 가짐)와 상당히 다른 등전점(pI)을 기준으로 피. 플루오레센스로부터 3개의 폴딩 조절 인자, DnaJ-유사 단백질(서열 번호 2, 세포질 샤프론), FrnE(서열 번호 3, 세포질 PPI아제) 및 FklB(서열 번호 4, 주변세포질 PPI아제)를 선택하였다. 폴딩 조절 인자의 특성은 표 8에 나타낸다. 표 8에 나타낸 바와 같이, 4.6 내지 4.8의 DnaJ-유사 단백질, FklB와 FrnE의 pI는 PTH 1-34의 pI와 잘 분리되었다. 이는 이온 교환에 의한 예비 분리를 가능하게 하였다. 융합 단백질의 정제를 더 돕기 위해서, 헥사-히스티딘 태그를 링커에 포함 시켰다. 또한, 링커는 요망하는 관심의 PTH 1-34 폴리펩티드로부터 N-말단의 융합 파트너의 분리를 용이하게 하기 위해 엔테로키나아제 절단 부위(DDDDK)를 포함하였다. PTH 1-34 융합 단백질의 아미노산 서열은 도 2a에 나타낸다(DnaJ-유사 단백질-PTH, 서열 번호 45), 2b(FklB-PTH, 서열 번호 46), 및 2c(FrnE-PTH, 서열 번호 47)). 링커에 해당하는 아미노산은 밑줄로 나타내며 PTH 1-34에 해당하는 아미노산은 도 2a, b, 및 c에 기울임체로 나타낸다.
PTH 융합체 발현 벡터의 제작 및 HTP 발현 : 표 6에 열거된 3가지 PTH 융합 단백질 각각을 코딩하는 합성 유전자 단편은 DNA 2.0에서 합성하였다. 합성 유전자 단편은 SpeI 및 XhoI로 절단하고 pDOW1169(동일한 효소로 절단됨)에 결찰시켜, 발현 플라스미드 p708-004, p708-005 및 p708-006을 생성하였다. 삽입물를 확인한 후, 플라스미드를 사용하여 피. 플루오레센스 숙주 균주 배열에 전기천공을 수행하고 표 4에 열거된 발현 균주를 생성하였다. 생성된 형질전환 균주를 배양하고 재료 및 방법에 기재된 절차에 따라 IPTG와 만니톨로 유도하였다. 유도 후, 세포를 수거하고, 초음파 분해하고, 원심분리하여 가용성과 불용성 분획을 분리하였다. 가용성 및 불용성 분획을 수집하였다. 가용성 및 불용성 분획 둘 다는 PTH 1-34 융합 단백질 발현 수준을 측정하기 위해 환원 SDS-CGE를 이용하여 분석하였다. 진탕 플라스크 발현을 위해 3가지 PTH 1-34 융합 단백질 각각에 대해 2개의 높은 HTP 발현 균주를 포함하여 총 6개 균주를 선택하였다. 진탕 플라스크 발현 방법을 이용하여 스크리닝된 균주는 표 9에 열거한다.
진탕 플라스크 발현: 6개 균주 각각은 재료 및 방법(진탕 플라스크 발현) 부분에 기재된 바와 같이 250 mL 배양 규모(각각 4 x 250 mL 배양)로 배양하고 유도하였다. 유도 후, 각 배양물의 시료(전세포 브로쓰, WCB)를 계속 사용하였다; 시료 일부분은 PBS로 3X 희석하고, 초음파 분해하고, 원심분리하여 가용성 및 불용성 분획을 얻었다. 각 배양물의 나머지는 원심분리하여 세포 페이스트 및 상등액의 무세포 브로쓰(CFB)를 얻었다. 정제를 위해 세포 페이스트를 계속 사용하였다. WCB, CFB, 및 가용성 분획을 환원 SDS-CGE에 의해 분석하였다(도 3).
융합 단백질(DnaJ-유사 단백질-PTH 융합체 경우 약 14 kDa의 분자량, FrnE-PTH 및 FklB-PTH 융합체 경우 약 26 kDa의 분자량에 해당하는 밴드)이 WCB 및 가용성 분획에서 관찰되었다; CFB에서는 융합 단백질이 관찰되지 않았다. STR35984, STR36085, 및 STR36169에 대한 진탕 플라스크 발현 역가는 HTP 발현 역가의 50%였지만, 균주 STR35970, STR36034, 및 STR36150에 대한 진탕 플라스크 발현 역가는 HTP 규모에서 관찰된 것의 70-100%였다. HTP 및 진탕 플라스크 발현 역가는 표 9에 열거한다.
PTH 융합 단백질을 단리하기 위한 HTP 및 진탕 플라스크 규모로 배양된 PTH 융합 단백질 발현 균주의 IMAC 정제 : 6개 균주의 세포 페이스트는 기계적 용해 및 IMAC 정제를 거쳤다. 각 정제를 시행하여 결과적으로 매우 농축된 분획을 얻었다. DnaJ-유사 단백질-PTH 발현 균주 STR35970으로부터 유래한 피크 분획은 60-80% 순도를 보였으며, FklB-PTH 발현 균주 STR36034로부터 유래한 것은 60-90% 순도를 보였으며 FrnE-PTH 발현 균주 STR36150으로부터 유래한 것은 90-95% 순도를 보였다.
PTH 융합 단백질의 엔테로키나아제 절단: 엔테로키나아제 절단 반응을 위해, IMAC 정제를 시행하여 얻은, 융합 단백질을 포함하는 고순도의 농축된 분획을 선택하여, N-말단 융합 파트너가 PTH 1-34로부터 절단될 수 있는지를 확인하였다. 연구에 돼지 유래 엔테로키나아제를 사용하였다. 4 kDa 관심의 PTH 1-34 폴리펩티드는 SDS-CGE에 의해 쉽게 검출될 수 없었기 때문에, DnaJ-유사 단백질-PTH 융합 단백질일 경우 14 kDa에서 10 kDa로, FklB-PTH 및 FrnE-PTH 융합 단백질일 경우 26 kDa에서 22 kDa로 전체 융합 단백질의 분자량 이동을 엔테로키나아제 절단의 증거로 인정하였다. 시료에 40 μg/mL 또는 10 μg/mL 엔테로키나아제를 하룻밤 처리하였다. 엔테로키나아제 처리 후, 시료는 SDS-CGE에 의해 분석하였다. 절단되지 않은 시료(레인 1-6)와 비교하여 MW 이동으로 도 4에 나타난 바와 같이, PTH 1-34로부터 융합 파트너의 완전한 절단은 40 μg/mL 엔테로키나아제를 사용하였을 때 관찰되었고(레인 7-12), 부분 절단은 10 μg/mL 엔테로키나아제를 사용하였을 때 관찰되었다(레인 13-18).
엔테로키나아제 절단 후 PTH 융합 단백질의 원형 질량 분석 : 추가의 엔테로키나아제 절단 실험 및 원형 질량 분석에 균주 STR35970으로부터 정제된 DnaJ-유사 단백질-PTH 융합 단백질을 사용하였다. STR35970으로부터 유래한 DnaJ-유사 단백질-PTH 융합 단백질을 함유하는 정제 분획을 돼지 엔테로키나아제와 실온에서 1 내지 3시간 인큐베이션한 후 바로 원형 질량 분석을 실시하였다. 도 5에 나타난 바와 같이, C-말단 PTH 1-34 폴리펩티드가 확인되었다. 원형 질량 분석의 상세 내용은 표 10에 요약하였다. 전장의 PTH 1-34 이외에, 5 또는 8개 아미노산의 N-말단 결실에 해당하는 단편이 또한 확인되었다. 관찰된 단백질 분해는 아마도 돼지 엔테로키나아제 제조 시 숙주 세포 단백질 오염 물질 또는 오염 물질들에서 기인한 것 같았다. 또한, 재조합 엔테로키나아제를 사용하여 유사한 단계를 통해 절단을 평가하였다. 관찰 및 이론 분자량(MW)은 원형 질량 분석에 의해 확인된 주요 종에 대해 표 10에 나타낸다. 1 내지 3시간의 엔테로키나아제 절단을 거친 융합 단백질 경우 27분의 평균 체류시간과 비교하여 절단되지 않은 융합 단백질의 체류 시간은 약 33분이었다.
실시예
II.
PTH
1-34 융합 단백질의 대규모 발효 및 발현
PTH 1-34의 대규모 제조를 위한 생산성 높은 발현 균주를 확인하기 위해서 실시예 I에 기재된 PTH 1-34 융합 단백질을 피. 플루오레센스에서 대규모 발현에 대해서도 평가하였다. 본 연구에서 스크리닝된 피. 플루오레센스 균주는 표 11 및 12에 열거된 DnaJ-유사 단백질-PTH 융합체 발현 균주 STR35970, STR35984, STR35949, STR36005, STR35985, FklB-PTH 융합 단백질 발현 균주, STR36034, STR36085, STR36098, 및 FrnE-PTH 융합 단백질 발현 균주, STR36150, STR36169였다.
재료 및 방법
MBR 발효 : 효모 추출물이 보충된 배지를 포함하는 진탕 플라스크를 선택된 균주의 냉동 배양 저장액으로 접종하였다. 미니 생물반응기(MBR) 경우, 효모 추출물이 보충된 50 mL의 화학적으로 정의된 배지를 포함하는 250 mL 진탕 플라스크를 사용하였다. 진탕 플라스크 배양물은 30℃에서 진탕하면서 16 내지 24시간 인큐베이션하였다. 진탕 플라스크 배양물의 분액을 사용하여 MBR(Pall Micro-24)에 접종하였다. MBR 배양은 pH, 온도, 및 용존 산조가 조절되는 조건하에서 각 10 mL 웰의 1회용 미니 생물반응기 카세트에서 4 mL 부피로 실시하였다. 배지에 함유된 초기량의 글리세롤이 고갈될 때 배양물을 IPTG로 유도하였다. 발효를 16시간 지속하고, 시료를 수집하여 분석을 위해 냉동하였다.
CBR 배양: 효모 추출물과 글리세롤이 보충된 600 mL의 화학적으로 정의된 배지를 포함하는 진탕 플라스크를 선택된 균주의 냉동 배양 저장액으로 접종하여 1 리터 CBR(통상의 생물반응기) 발효 배양을 위한 접종물을 생성하였다. 32℃에서 진탕하면서 16 내지 24시간 인큐베이션 후, 각 진탕 플라스크 배양물의 동일한 분액을 2리터 생물 반응기(1 리터 작업량)를 포함하는 8 유닛 다중 발효 시스템 각각에 무균 상태로 옮겼다. 유가식의 높은 세포 밀도 발효 공정은 배양 단계, 이어서 배양물이 목표 광학 밀도에 도달하면 IPTG의 첨가로 개시되는 유도 단계로 이루어졌다.
발효의 유도 단계를 8시간 진행하도록 하였으며, 분석 시료를 발효기로부터 꺼내 575 nm(OD575)에서 세포 밀도를 결정하였다. 분석 시료는 융합 단백질의 발현 수준을 결정하는 후속 분석을 위해 냉동하였다. 8시간의 유도를 완료한 후에, 각 용기의 전체 발효 브로쓰(2 L 생물 반응기 당 대략 0.8 L 브로쓰)는 15,900 × g에서 60 내지 90분간 원심분리에 의해 수거하였다. 세포 페이스트와 상등액을 분리하고 페이스트를 -80℃에서 냉동하였다.
기계적 균질화 및 정제: 상기에 기재된 바와 같이 CBR 발효 공정으로부터 얻은 냉동된 세포 페이스트(20 g)를 해동하여 20 mM 인산나트륨, 5% 글리세롤, 500 mM 염화나트륨, 20 mM 이미다졸 pH 7.4에 재현탁하였다. 현탁액의 최종 부피는 고체 농도가 20%가 되도록 조정하였다. 그 후 물질은 마이크로플루다이저(Microfluidics, Inc., model M 110Y)를 15,000 psi에서 2회 통과시켜 균질화하였다. 용해물은 12,000 × g에서 30분간 원심분리하고 사르토리우스 사르토브란 150 (0.45/0.2 μm) 필터 캡슐을 통해 여과하였다.
크로마토그래피: 고속 단백질 액체 크로마토그래피(FPLC) 공정은 Frac-950 분획 수집기가 장착된 AKTA 익스플로러 100 크로마토그래피 시스템(GE Healthcare)을 이용하여 실시하였다. 시료는 10 mL 히스트랩 FF 컬럼(연속적으로 연결된 2개의 5 mL 히스트랩 FF 카트리지(GE Healthcare, 품번 17-5255-01))에 로딩하고, 세척하고, 이미다졸 농도를 0 mM 내지 200 mM로 변화시켜 10배 컬럼 부피의 선형 구배의 용출 완충액을 이용하여 용출하였다. 2 mL 부피의 분획을 수집하였다.
고정된 금속이온 친화성 크로마토그래피(IMAC) 정제는 니켈 IMAC(GE Healthcare, 품번 17-5318-01)를 이용하여 실시하였다. CBR 발효 후 수집된 분석 시료는 가용성 및 불용성 분획으로 분리하였다. 600 ㎕ 분액의 가용성 분획은 100 ㎕ IMAC 수지와 실온에서 진탕기에서 1시간 인큐베이션하고, 12,000 x g에서 1분간 원심분리하여 수지를 펠렛으로 만들었다. 상등액을 제거하고 통과액으로 표지하였다. 그 후 수지를 20 mM 인산나트륨 pH 7.3, 500 mM NaCl, 5% 글리세롤, 및 20 mM 이미다졸를 함유하는 1 mL의 세척 완충액으로 3회 세척하였다. 3번째 세척 후, 수지는 400 mM 이미다졸을 함유하는 200 ㎕의 세척 완충액에 재현탁하고 원심분리하였다. 상등액을 수집하고 용출액으로 표지하였다.
엔테로키나아제 절단: PTH 1-34 융합 단백질 정제 분획을 농축하고 20 mM 트리스 pH 7.4, 50 mM NaCl, 및 2 mM CaCl2을 함유하는 완충액에 재현탁하였다. 2 units의 엔테로키나아제(Novagen cat #69066-3, batch D00155747)를 100 ㎕ 반응물 내 100 μg 단백질에 첨가하였다. 융합 단백질 정제 분획과 엔테로키나아제의 혼합물을 실온에서 1시간 또는 하룻밤 인큐베이션하였다. 또한, 엔테로키나아제가 없는 대조 반응물은 실온에서 1시간 또는 하룻밤 인큐베이션하였다. 4-벤젠설포닐 플루오라이드 히드로클로라이드(AEBSF, Sigma cat# P8465)를 함유하는 완전 프로테아제 억제제 칵테일을 첨가하여 효소 반응을 정지하였다.
결과
DnaJ -유사 단백질- PTH , FklB - PTH 및 FrnE - PTH 융합체 발현 균주의 발효 평가: 표 9 및 10에 열거된 5개의 최고 발현 DnaJ-유사 단백질-PTH 융합체 균주, 3개의 FklB-PTH 발현 균주, 및 2개의 FrnE-PTH 발현 균주 각각을 발효, 우선 미니 생물발효기(MBR), 이어서 통상의 생물 발효기(CBR)에 대해 평가하였다.
DnaJ-유사 단백질-PTH 융합체 발현 균주의 각 MBR 발효로부터의 가용성 분획은 실시예 I의 재료 및 방법 부분에 기재된 프로토콜을 따라 SDS-CGE에 의해 분석하였다. DnaJ-유사 단백질-PTH 융합체 발현 균주의 MBR 발효 수율은 표 13에 열거한다. 종합적으로, 가용성 융합 단백질의 최고 MBR 발현 수준을 보이는 균주는 2.1 g/L의 STR35949였다.
DnaJ-유사 단백질-PTH 융합 단백질 균주는 통상의 생물 반응기(CBR)에서 1L 규모의 발효에 대해 평가하였다. DnaJ-유사 단백질-PTH 융합 단백질 균주의 CBR 발현 수준은 표 14에 나타난 바와 같이 MBR 수준과 비슷하였다. 발현 수준은 유도 후 24시간 시점에서보다 유도 후 8시간 시점에서 더 높았다.
FklB-PTH 및 FrnE-PTH 융합체 발현 균주의 MBR 발효로부터의 가용성 분획은 환원 조건하에서 SDS-CGE에 의해 분석하였다(결과는 표 15에 제시).
종합적으로, 가용성 융합 단백질의 최고 발현 수준을 보인 균주는 6.4 g/L의 STR36034였다. 또한, 동일한 균주를 통상의 생물 반응기(CBR)에서 대규모 발효에 대해 평가하였다(표 16에 결과 제시). CBR 발효에서 최대 수율을 보인 균주는 24시간의 유도 기간 후 FklB-PTH 융합 단백질을 6.7 g/L 발현하는 STR36034 였다.
DnaJ -유사 단백질- PTH 및 FklB - PTH 융합 단백질의 정제 및 엔테로키나아제 절단의 평가: DnaJ-유사 단백질-PTH 융합체 발현 균주 STR36005에서 발현 유도 및 배양 후 얻은 세포 페이스트는 재료 및 방법에 기재된 바와 같이 기계적 용해 및 IMAC 정제를 거쳤다. 각 정제를 시행하여 결과적으로 고도로 농축된 분획을 얻었다. 피크 분획의 순도는 90% 이상이었다.
균주 36005로부터 정제된 DnaJ-유사 단백질-PTH 융합 단백질의 고순도의 농축된 분획을 N-말단 융합 파트너가 관심의 PTH 1-34 폴리펩티드로부터 절단될 수 있는지를 확인하는 엔테로키나아제 절단 시험에 사용하였다. 절단 반응에 재조합 소 엔테로키나아제를 사용하였다. 분석 규모의 시료로부터의 가용성 분획을 IMAC 수지를 이용한 융합 단백질의 소규모 회분 농축에 사용하였다(도 6). 엔테로키나아제와 1시간 인큐베이션 후, DnaJ-유사 단백질 융합 파트너의 부분 절단이 관찰되었다(레인 2-4). 절단은 하룻밤 인큐베이션 후에 완전하였다(레인 6-8).
FklB-PTH 융합체 균주가 1 리터 규모에서 가장 강력한 것으로 나타냈다. 정제 시료를 추가로 분석하여 융합 단백질이 농축될 수 있고 엔테로키나아제로 절단될 수 있다는 것을 확인하였다. 분석 규모의 시료로부터의 가용성 분획을 IMAC 수지를 이용한 융합 단백질의 소규모 회분 농축에 사용하였다. 3개의 발현 균주, STR36034, STR36085, 및 STR36098 각각의 하나의 농축 시료를 엔테로키나아제로 처리하고 실시예 I에 기재된 방법을 이용하여 원형 질량 분석을 거쳤다. 도 7에 나타난 바와 같이, 관심의 PTH 1-34 폴리펩티드를 확인하였으며 각 시료에 대해 정확한 질량이 ~4118 Da임을 관찰하였다.
실시예
III. 엔테로키나아제
융합체의
제작
재조합 엔테로키나아제를 발현하는데 사용하기 위해 DnaJ-유사 단백질, FklB, 및 FrnE N-말단 융합 파트너-엔테로키나아제 융합 단백질을 설계하고 발현 구조물을 생성하였다(서열 번호 31).
엔테로키나아제 융합체 발현 플라스미드의 제작: 평가된 엔테로키나아제(EK) 융합체 코딩 영역은 표 17에 열거한다. 융합 단백질을 코딩하는 유전자 단편은 DNA2.0에서 합성하였다. 단편은 SpeI 및 XhoI의 제한 효소 부위, "Hi" 리보솜 결합 부위, 및 코딩 서열 상류에 첨가된 18개 염기쌍 스페이서(5'-actagtaggaggtctaga-3') 및 3개의 정지 코돈을 포함하였다.
표준 클로닝 방법을 이용하여 발현 플라스미드를 제작하였다. 각 엔테로키나아제 융합체 코딩 서열을 포함하는 플라스미드 DNA는 SpeI 및 XhoI 제한 효소를 이용하여 분해한 후, pTac 프로모터 및 rrnT1T2 전사 종결 인자를 포함하는 SpeI -XhoI 절단된 pDOW1169 발현 벡터에 서브클로닝하였다. 삽입물과 벡터를 T4 DNA 리가아제(Fermentas EL0011)와 하룻밤 결찰시켜, 결과적으로 엔테로키나아제 융합 단백질 발현 플라스미드를 얻었다. 플라스미드로 적격 피. 플루오레센스 DC454 숙주 세포에 전기천공을 수행하였다. Ptac 및 Term 서열 프라이머(AccuStart II, PCR SuperMix from Quanta, 95137-500)를 이용한 PCR에 의해 엔테로키나아제 융합 단백질 서열 삽입물의 존재에 대해 양성 클론을 스크리닝하였다.
실시예
IV. 엔테로키나아제 융합 단백질(
DnaJ
-유사,
FklB
,
FrnE
N-말단 파트너)의 대규모 발효
실시예 III에 기재된 발현 균주를 실시예 I에 기재된 방법과 유사한 방법에 따라 HTP 분석에 의해 재조합 단백질의 발현에 대해 시험한다.
발효 연구를 위해 가용성 융합 단백질 발현 수준을 기준으로 하여 발현 균주를 선택한다. PTH 1-34 융합 단백질에 대해 상기에 기재된 바와 같이 선택된 균주를 배양하고 유도하고, 유도한 세포를 원심분리하고, 용해시키고, 다시 원심분리한다. 생성된 불용성 분획 및 가용성 분획은 상기에 기재된 추출 조건을 이용하여 추출하고, EK 융합 단백질 추출 상등액은 SDS-CGE을 이용하여 정량한다.
실시예
V. 인슐린 융합 단백질을 발현하는 균주의
고처리량
스크리닝
N-말단 융합 파트너로서 DnaJ-유사 단백질, EcpD, FklB, FrnE, 또는 EcpD, FklB, FrnE의 절두형을 포함하는 프로인슐린 융합 단백질을 발현하는 피. 플루오레센스 균주에 의해 생산되는 재조합 단백질 수준을 시험하기 위해 본 연구를 실시하였다.
재료 및 방법
프로인슐린 발현 벡터의 제작 : 프로인슐린(인슐린 글라진)을 코딩하는 최적화된 유전자 단편은 DNA 2.0(Menlo Park, CA)에서 합성하였다. 유전자 단편 내에 포함된 프로인슐린 코딩 서열에 의해 코딩되는 유전자 단편 및 프로인슐린 아미노산 서열은 표 18에 열거한다. 각 유전자 단편은 펩티드 A 및 B 코딩 서열, 및 4개의 상이한 글라진 C 펩티드 서열: CP-A(MW = 9336.94 Da; pI = 5.2; A+B 글라진의 65%), CP-B(MW = 8806.42 Da; A+B 글라진의 69%), CP-C(MW = 8749.32 Da; A+B 글라진의 69%), 및 CP-D(MW = 7292.67 Da; A+B 글라진의 83%) 중 하나를 포함하였다. 유전자 단편은 프로인슐린 코딩 서열의 상류 및 하류에 첨가된 SapI 제한 효소 부위를 갖도록 설계하여 다양한 발현 벡터에 유전자 단편의 신속한 클로닝을 가능하게 하였다. 또한, 엔테로키나아제 절단 부위 또는 트립신 절단 부위를 각각 포함하는 발현 벡터에 결찰을 용이하게 하기 위해서, 유전자 단편은 5' 측면 영역에 리신 아미노산 코돈(AAG) 또는 아르기닌 아미노산 코돈(CGA)을 포함하였다. 또한, 3개의 정지 코돈(TGA, TAA, TAG)을 모든 유전자 단편의 3' 측면 영역에 포함시켰다.
그 후, 프로인슐린 코딩 서열은 T4 DNA 리가아제(New England Biolabs, M0202S)를 이용하여 코딩 서열을 발현 벡터에 결찰시켜 다양한 융합 파트너(표 19)를 포함하는 발현 벡터에 서브클로닝하였다. 결찰된 벡터로 96웰 형식의 적격 DC454 피. 플루오레센스 세포에 전기천공을 수행하였다.
96웰 형식( HTP ) 의 배양 및 발현 : 프로인슐린 코딩 서열 및 융합 파트너를 포함하는 플라스미드로 피. 플루오레센스 DC454 숙주 균주를 형질전환시켰다. 25 ㎕의 적격 세포를 해동하여 96-멀티-웰 뉴클레오베트® 플레이트(Lonza VHNP-1001)에 옮기고 이전 단계에서 준비된 결찰 혼합물과 혼합하였다. 뉴클레오펙터™ 96웰 셔틀™ 시스템(Lonza AG)을 이용하여 전기천공을 수행한 후 형질전환된 세포를 400 ㎕ M9 염 1% 글루코오스 배지 및 미량 원소를 포함한 96웰 깊은 웰 플레이트(종균 플레이트)에 옮겼다. 종균 플레이트를 30℃에서 진탕하면서 48시간 인큐베이션하여 종균 배양물을 생성하였다.
10 ㎕의 종균 배양물을 각 웰이 미량 원소 및 5% 글리세롤이 보충된 500 ㎕의 HTP 배지(Teknova 3H1129)를 포함하는 2개의 96웰 깊은 웰 플레이트에 옮기고, 30℃에서 진탕하면서 24시간 인큐베이션하였다. 이소프로필-β-D-1-티오갈락토피라노시드(IPTG)는 각 웰에 최종 농도 0.3 mM이 되도록 첨가하여 프로인슐린 융합 단백질의 발현을 유도하였다. 또한, 0.01 ㎕의 250 units/㎕ 저장 벤조나아제(Novagen, 70746-3)를 유도시 웰마다 첨가하여 배양 점도의 포텐셜을 감소시켰다. 유도 후 24시간에, 600 nm(OD600)에서 광학 밀도를 측정하여 세포 밀도를 정량하였다. 유도 후 24시간에, 세포를 수집하고 1X PBS로 최종 부피 400 ㎕로 1:3 희석한 후 이후의 공정을 위해 냉동하였다.
분석 특성화를 위한 가용성 용해물 시료의 제조: 상기에 기재된 바와 같이 제조하고 냉동 보관된 배양 브로쓰 시료를 해동하고, 희석하고, 초음파 분해하였다. 초음파 분해로 얻은 용해물은 5,500 x g, 8℃의 온도에서 15분간 원심분리하여, 가용성(상등액)과 불용성(펠렛) 분획을 분리하였다. 불용성 분획은 초음파 분해를 이용하여 PBS에 재현탁하였다.
SDS- CGE 분석: 상기에 논의된 바와 같이 제조된 시험 단백질 시료는 HT 프로테인 익스프레스 v2 칩이 구비된 랩칩 GXII 장치(PerkinElmer) 및 해당 시약(각각 품번 760499 및 760328, PerkinElmer)을 사용하여 HTP 마이크로칩 SDS 모세관 겔 전기영동에 의해 분석하였다. 시료는 제조사의 프로토콜(Protein User Guide Document No. 450589, Rev. 3)에 따라 제조하였다. 96웰 원뿔형 웰 PCR 플레이트에, 디티오트레이톨(DTT) 환원제를 포함하거나 포함하지 않은 14 ㎕의 시료 완충액과 4 ㎕ 시료를 혼합하였다. 혼합물은 95℃에서 5분간 가열하고, 70 ㎕의 탈이온수로 희석하였다.
90웰 규모에서 프로인슐린 역가는 프로인슐린을 포함하는 융합 단백질의 백분율로 곱해진 융합 단백질 역가를 기준으로 결정하였다. 전체 역가는 가용성 및 불용성 목표물의 발현의 합 (mg/L)을 나타낸다.
결과
표 20에 나타낸 바와 같이, N-말단 융합 파트너로서 DnaJ-유사 단백질을 가진 글라진 프로인슐린 융합 단백질이 최고의 프로인슐린 발현 수준을 보였다. 놀랍게도, EcpD 융합 파트너의 최소 형태인 50개 아미노산 융합 파트너 EcpD3을 포함하는 프로인슐린 융합 단백질은 전장의 융합 파트너 EcpD1 및 100개 아미노산이 절두된 형태 EcpD2와 비교하여 더 높은 발현 수준을 보였다. FklB 또는 FrnE N-말단 융합 파트너를 포함하는 프로인슐린 융합 단백질 경우, 최소 융합 파트너 단편, FklB3 및 FrnE3에 각각 융합된 프로인슐린의 발현은 더 긴 N-말단 융합 파트너를 가진 구조물의 발현과 동일하거나 그보다 약간 낮았다. 표 20은 고처리량 발현 연구 과정에서 관찰된, 가용성 및 전체 둘 다의 프로인슐린 단백질 역가를 요약한다.
따라서, 성숙 글라진이 트립신 절단 후에 정제된 융합 단백질(및 C-펩티드)로부터 성공적으로 유리된다는 것이 확인되었다. 선택된 융합 단백질(비-변성 농도의 요소 존재하에 정제된 DnaJ 구조물 G737-031 및 FklB 구조물 G737-009, 요소 없이 정제된 FrnE1 구조물 G737-018)에 실시된 트립신 절단에 이어 IMAC 농축은 융합 단백질이 글라진 표준과 비교하여 SDS-PAGE 또는 SDS-CGE에 의해 평가된 바와 같이 절단되어 성숙 인슐린을 생산하였다는 것을 증명하였다. 수용체 결합 분석은 활성을 추가로 나타냈다.
실시예
VI.
GCSF
융합 단백질의
고처리량
스크리닝
본 연구는, N-말단 융합 파트너로서 DnaJ-유사 단백질, 다양한 길이의 FklB(FklB, FklB2, 또는 FklB3), FrnE(FrnE, FrnE2, 또는 FrnE3), 또는 EcpD(EcpD1, EcpD2, 또는 EcpD3)를 포함하는 GCSF 융합 단백질을 발현하는 피. 플루오레센스 균주에 의해 생산된 재조합 GCSF 단백질의 수준을 시험하기 위해 수행하였다.
재료 및 방법
GCSF 발현 벡터의 제작: 최적화된 gcsf 코딩 서열, 코딩 서열의 하류 및 상류 모두에 제한 효소 SapI의 인식 서열, 및 코딩 서열에 하류에 3개의 정지 코돈을 포함하는 GCSF 유전자 단편(서열 번호 68)은 DNA2.0(Menlo Park, CA)에서 합성하였다. 플라스미드 pJ201:207232의 GCSF 유전자 단편은 제한 효소 SapI로 절단하여 최적화된 gcsf 코딩 서열을 포함하는 단편을 생성하였다. 그 후, gcsf 코딩 서열은 T4 DNA 리가아제(Fermentas EL0011)를 이용하여 GCSF 유전자 단편과 발현 벡터를 결찰시켜 다양한 융합 파트너를 포함하는 발현 벡터에 서브클로닝하고, 96웰 형식의 적격 피. 플루오레센스 DC454 숙주 세포에 전기천공을 수행하였다. 헥사히스티딘 태그는 GCSF로부터 N-말단 융합 파트너를 유리시키기 위한 엔테로키나아제 절단 부위(DDDK)와 함께 GCSF와 각 N-말단 융합 파트너 사이에 링커 내에 포함시켰다. 융합 단백질 구조물을 포함하는 생성 플라스미드는 표 21의 셋째 열에 열거한다.
96웰 형식( HTP )의 배양 및 발현 : gcsf 유전자의 코딩 서열 및 N-말단 융합 파트너를 포함하는 플라스미드를 피. 플루오레센스 숙주 균주 배열에 형질전환시켰다. 35 ㎕의 피. 플루오레센스 적격 세포를 해동하고 10 ㎕L의 10X 희석된 플라스미드 DNA(2.5 ng)와 혼합하였다. 25 ㎕의 혼합물을 뉴클레오펙터™ 96웰 셔틀™ 시스템(Lonza AG)을 이용하여 전기천공을 통한 형질전환을 위해 96-멀티-웰 뉴클레오베트® 플레이트(Lonza)에 옮긴 후, 형질전환된 세포를 500 ㎕ M9 염 1% 글루코오스 배지, 및 미량 원소를 포함하는 96웰 깊은 웰 플레이트에 옮겼다. 종균 플레이트(종균 플레이트)는 30℃에서 진탕하면서 48시간 인큐베이션하여 종균 배양물을 생성하였다.
10 ㎕의 종균 배양물을 각 웰이 미량 원소 및 5% 글리세롤이 보충된 500 ㎕의 HTP 배지(Teknova 3H1129)를 포함한 2개의 새로운 96웰 깊은 웰 플레이트에 옮겨 30℃에서 진탕하면서 24시간 인큐베이션하였다. 이소프로필-β-D-1-티오갈락토피라노시드(IPTG)는 각 웰에 최종 농도 0.3 mM이 되도록 첨가하여 GCSF 융합 단백질의 발현을 유도하였다. 폴딩(folding) 조절 인자를 과발현하는 슈도모나스 균주(FMO 균주)에서, 최종 농도 1%의 만니톨(Sigma, M1902)을 IPTG와 함께 첨가하여 폴딩 조절 인자의 발현을 유도하였다. 또한, 0.01 ㎕의 250 units/㎕ 저장 벤조나아제(Novagen, 70746-3)를 유도시 웰마다 첨가하여 배양 점도의 포텐셜을 감소시켰다. 유도 후 24시간에, 600 nm(OD600)에서 광학 밀도를 측정하여 세포 밀도를 정량하였다. 유도 후 24시간에, 세포를 수거하고 1X PBS로 최종 부피 400 ㎕로 1:3 희석한 후 이후의 공정을 위해 냉동하였다.
분석 특성화를 위한 가용성 용해물 시료의 제조: 상기에 기재된 바와 같이 제조하고 냉동된 배양 브로쓰 시료를 해동하고, 희석하고, 24 프로브 팁 혼을 이용한 셀 라이시스 오토메이티드 소니케이션 시스템(CLASS, Scinomix)을 이용하여 초음파 분해하였다. 초음파 분해로 얻은 용해물은 5,500 x g, 8℃의 온도에서 15분간 원심분리하여, 가용성(상등액)과 불용성(펠렛) 분획을 분리하였다. 불용성 분획은 400 ㎕의 PBS, pH 7.4에 다시 초음파 분해하여 재현탁하였다.
SDS- CGE 분석: 상기에 논의된 바와 같이 제조된 단백질 시료는 HT 프로테인 익스프레스 v2 칩이 구비된 랩칩 GXII 장치(Caliper LifeSciences) 및 해당 시약(각각 품번 760499 및 760328, Caliper LifeSciences)을 사용하여 HTP 마이크로칩 SDS 모세관 겔 전기영동에 의해 분석하였다. 시료는 제조사의 프로토콜(Protein User Guide Document No. 450589, Rev. 3)에 따라 제조하였다. 96웰 원뿔형 웰 PCR 플레이트에, 디티오트레이톨(DTT) 환원제를 포함하거나 포함하지 않은 14 ㎕의 시료 완충액과 4 ㎕ 시료를 혼합하였다. 혼합물은 95℃에서 5분간 가열하고, 70 ㎕의 탈이온수로 희석하였다. 시험 단백질 시료와 나란히, 융합 단백질을 포함하지 않는 균주(무표지 균주)의 용해물을 또한 분석하였다. 무표지 균주 용해물은 배경 차감 없이 시스템 내부 표준을 이용하여 정량하였다. 균주 당 하나의 시료를 HTP 스크리닝 과정에서 정량하였다; 전형적으로 SDS-CGE 방법의 표준 편차는 ~10%이다.
결과
N-말단의 Met-GCSF의 고수준 발현을 가능하게 하는 균주를 확인하기 위하여 프로테아제 결핍 균주 스크리닝의 대안을 제시하는 융합 파트너 접근법을 이용하여 96웰 규모에서 GCSF의 고수준 발현을 달성하였다. 융합 단백질 및 GCSF 역가(MW로 전체 융합 단백질의 GCSF 백분율을 기준으로 계산됨)를 표 22에 나타낸다. 야생형 균주 DC454는 484 mg/L의 융합 단백질, 및 305 mg/L의 dnaJ 융합 파트너를 가진 GCSF를 생산하였다. 모든 융합 파트너 구조물은 표 22에 나타낸 바와 같이 100 mg/L가 넘는 융합 단백질 역가를 얻었다. HTP 규모로 관찰된 이들의 고수준은 진탕 플라스크 또는 발효 규모에서 발현에 대해 더 큰 가능성을 보여준다. 게다가, HTP와 대규모 배양 사이에서 부피 측정 역가의 상당한 증가가 일반적으로 관찰된다. 앞선 연구에서, prtB 프로테아제 결핍 균주는 0.5mL 규모에서 ~247mg/L Met-GCSF를 발현할 수 있다는 것을 보였다(문헌(H. Jin et al., 2011, Protein Expression and Purification 78:69-77), 및 미국 특허 제8,455,218호). 본 연구에서, 기재된 바와 같이, 프로테아제가 결핍되지 않은 숙주 세포에서도 융합 단백질의 일부로서 Met-GCSF의 고수준의 발현이 관찰되었다. 임의의 기재된 융합 단백질의 일부로서 발현하고 프로테아제 절단에 의해 유리시킴으로써 얻은 Met-GCSF의 제조물은 임의의 프로테아제의 제거 후 절단을 수행할 때 사실상 100% Met-GCSF(그리고 des-Met-GCSF 없음)를 포함한다는 것이 주목된다.
본원에서 본 발명의 바람직한 실시양태를 제시하고 기재하였지만, 이러한 실시양태는 단지 예로서 제공된다는 것은 당 업자에게 명백할 것이다. 이제 당업자들에게 본 발명으로부터 벗어나지 않으면서 다수의 변이, 변화 및 치환이 떠오를 것이다. 본원에 기재된 본 발명의 실시양태들의 여러 대안이 본 발명을 실시하는데 이용될 수 있음을 이해하여야 한다. 하기 특허 청구범위가 본 발명의 범위를 규정하며, 이로써 이들 청구범위 및 그의 등가물의 범위 내의 방법 및 구성을 포함하고자 한다.
SEQUENCE LISTING
<110> PFENEX INC.
<120> FUSION PARTNERS FOR PEPTIDE PRODUCTION
<130> 38194-745.601
<140> PCT/US2015/063027
<141> 2015-11-30
<150> 62/086,119
<151> 2014-12-01
<160> 242
<170> PatentIn version 3.5
<210> 1
<211> 34
<212> PRT
<213> Homo sapiens
<400> 1
Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn
1 5 10 15
Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His
20 25 30
Asn Phe
<210> 2
<211> 78
<212> PRT
<213> Pseudomonas fluorescens
<400> 2
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln
65 70 75
<210> 3
<211> 217
<212> PRT
<213> Pseudomonas fluorescens
<400> 3
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser
210 215
<210> 4
<211> 205
<212> PRT
<213> Pseudomonas fluorescens
<400> 4
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu
195 200 205
<210> 5
<211> 225
<212> PRT
<213> Pseudomonas fluorescens
<400> 5
Met Ser Arg Tyr Leu Phe Leu Val Phe Gly Leu Ala Ile Cys Val Ala
1 5 10 15
Asp Ala Ser Glu Gln Pro Ser Ser Asn Ile Thr Asp Ala Thr Pro His
20 25 30
Asp Leu Ala Tyr Ser Leu Gly Ala Ser Leu Gly Glu Arg Leu Arg Gln
35 40 45
Glu Val Pro Asp Leu Gln Ile Gln Ala Leu Leu Asp Gly Leu Lys Gln
50 55 60
Ala Tyr Gln Gly Lys Pro Leu Ala Leu Asp Lys Ala Arg Ile Glu Gln
65 70 75 80
Ile Leu Ser Gln His Glu Ala Gln Asn Thr Ala Asp Ala Gln Leu Pro
85 90 95
Gln Ser Glu Lys Ala Leu Ala Ala Glu Gln Gln Phe Leu Thr Arg Glu
100 105 110
Lys Ala Ala Ala Gly Val Arg Gln Leu Ala Asp Gly Ile Leu Leu Thr
115 120 125
Glu Leu Ala Pro Gly Thr Gly Asn Lys Pro Leu Ala Ser Asp Glu Val
130 135 140
Gln Val Lys Tyr Val Gly Arg Leu Pro Asp Gly Thr Val Phe Asp Lys
145 150 155 160
Ser Thr Gln Pro Gln Trp Phe Arg Val Asn Ser Val Ile Ser Gly Trp
165 170 175
Ser Ser Ala Leu Gln Gln Met Pro Val Gly Ala Lys Trp Arg Leu Val
180 185 190
Ile Pro Ser Ala Gln Ala Tyr Gly Ala Asp Gly Ala Gly Glu Leu Ile
195 200 205
Pro Pro Tyr Thr Pro Leu Val Phe Glu Ile Glu Leu Leu Gly Thr Arg
210 215 220
His
225
<210> 6
<211> 159
<212> PRT
<213> Pseudomonas fluorescens
<400> 6
Met Thr Asp Gln Gln Asn Thr Glu Ala Ala Gln Asp Gln Gly Pro Gln
1 5 10 15
Phe Ser Leu Gln Arg Ile Tyr Val Arg Asp Leu Ser Phe Glu Ala Pro
20 25 30
Lys Ser Pro Ala Ile Phe Arg Gln Glu Trp Thr Pro Ser Val Ala Leu
35 40 45
Asp Leu Asn Thr Arg Gln Lys Ser Leu Glu Gly Asp Phe His Glu Val
50 55 60
Val Leu Thr Leu Ser Val Thr Val Lys Asn Gly Glu Glu Val Ala Phe
65 70 75 80
Ile Ala Glu Val Gln Gln Ala Gly Ile Phe Leu Ile Gln Gly Leu Asp
85 90 95
Glu Ala Ser Met Ser His Thr Leu Gly Ala Phe Cys Pro Asn Ile Leu
100 105 110
Phe Pro Tyr Ala Arg Glu Thr Leu Asp Ser Leu Val Thr Arg Gly Ser
115 120 125
Phe Pro Ala Leu Met Leu Ala Pro Val Asn Phe Asp Ala Leu Tyr Ala
130 135 140
Gln Glu Leu Gln Arg Met Gln Gln Glu Gly Ala Pro Thr Val Gln
145 150 155
<210> 7
<211> 241
<212> PRT
<213> Pseudomonas fluorescens
<400> 7
Met Gly Cys Val Pro Leu Pro Asp His Gly Ile Thr Val Phe Met Phe
1 5 10 15
Leu Leu Arg Met Val Leu Leu Ala Cys Gly Leu Leu Val Leu Ala Pro
20 25 30
Pro Pro Ala Asp Ala Ala Leu Lys Ile Glu Gly Thr Arg Leu Ile Tyr
35 40 45
Phe Gly Gln Asp Lys Ala Ala Gly Ile Ser Val Val Asn Gln Ala Ser
50 55 60
Arg Glu Val Val Val Gln Thr Trp Ile Thr Gly Glu Asp Glu Ser Ala
65 70 75 80
Asp Arg Thr Val Pro Phe Ala Ala Thr Glu Pro Leu Val Gln Leu Gly
85 90 95
Ala Gly Glu His His Lys Leu Arg Ile Leu Tyr Ala Gly Glu Gly Leu
100 105 110
Pro Ser Asp Arg Glu Ser Leu Phe Trp Leu Asn Ile Met Glu Ile Pro
115 120 125
Leu Lys Pro Glu Asp Pro Asn Ser Val Gln Phe Ala Ile Arg Gln Arg
130 135 140
Leu Lys Leu Phe Tyr Arg Pro Pro Ala Leu Gln Gly Gly Ser Ala Glu
145 150 155 160
Ala Val Gln Gln Leu Val Trp Ser Ser Asp Gly Arg Thr Val Thr Val
165 170 175
Asn Asn Pro Ser Ala Phe His Leu Ser Leu Val Asn Leu Arg Ile Asp
180 185 190
Ser Gln Thr Leu Ser Asp Tyr Leu Leu Leu Lys Pro His Glu Arg Lys
195 200 205
Thr Leu Thr Ala Leu Asp Ala Val Pro Lys Gly Ala Thr Leu His Phe
210 215 220
Thr Glu Ile Thr Asp Ile Gly Leu Gln Ala Arg His Ser Thr Ala Leu
225 230 235 240
Asn
<210> 8
<211> 141
<212> PRT
<213> Escherichia coli
<400> 8
Ala Asp Lys Ile Ala Ile Val Asn Met Gly Ser Leu Phe Gln Gln Val
1 5 10 15
Ala Gln Lys Thr Gly Val Ser Asn Thr Leu Glu Asn Glu Phe Lys Gly
20 25 30
Arg Ala Ser Glu Leu Gln Arg Met Glu Thr Asp Leu Gln Ala Lys Met
35 40 45
Lys Lys Leu Gln Ser Met Lys Ala Gly Ser Asp Arg Thr Lys Leu Glu
50 55 60
Lys Asp Val Met Ala Gln Arg Gln Thr Phe Ala Gln Lys Ala Gln Ala
65 70 75 80
Phe Glu Gln Asp Arg Ala Arg Arg Ser Asn Glu Glu Arg Gly Lys Leu
85 90 95
Val Thr Arg Ile Gln Thr Ala Val Lys Ser Val Ala Asn Ser Gln Asp
100 105 110
Ile Asp Leu Val Val Asp Ala Asn Ala Val Ala Tyr Asn Ser Ser Asp
115 120 125
Val Lys Asp Ile Thr Ala Asp Val Leu Lys Gln Val Lys
130 135 140
<210> 9
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 9
Gly Gly Gly Gly Ser Gly Gly Gly Gly His His His His His His Asp
1 5 10 15
Asp Asp Asp Lys
20
<210> 10
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 10
Gly Gly Gly Gly Ser Gly Gly Gly Gly His His His His His His Arg
1 5 10 15
Lys Arg
<210> 11
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 11
Gly Gly Gly Gly Ser Gly Gly Gly Gly His His His His His His Arg
1 5 10 15
Arg Arg
<210> 12
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 12
Gly Gly Gly Gly Ser Gly Gly Gly Gly His His His His His His Leu
1 5 10 15
Val Pro Arg
<210> 13
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Enterokinase cleavage site sequence
<400> 13
Asp Asp Asp Asp Lys
1 5
<210> 14
<211> 798
<212> PRT
<213> Pseudomonas fluorescens
<400> 14
Met Lys Thr Thr Ile Glu Leu Pro Leu Leu Pro Leu Arg Asp Val Val
1 5 10 15
Val Tyr Pro His Met Val Ile Pro Leu Phe Val Gly Arg Glu Lys Ser
20 25 30
Ile Glu Ala Leu Glu Ala Ala Met Thr Gly Asp Lys Gln Ile Leu Leu
35 40 45
Leu Ala Gln Lys Asn Pro Ala Asp Asp Asp Pro Gly Glu Asp Ala Leu
50 55 60
Tyr Arg Val Gly Thr Ile Ala Thr Val Leu Gln Leu Leu Lys Leu Pro
65 70 75 80
Asp Gly Thr Val Lys Val Leu Val Glu Gly Glu Gln Arg Gly Ala Val
85 90 95
Glu Arg Phe Met Glu Val Asp Gly His Leu Arg Ala Glu Val Ala Leu
100 105 110
Ile Glu Glu Val Glu Ala Pro Glu Arg Glu Ser Glu Val Phe Val Arg
115 120 125
Ser Leu Leu Ser Gln Phe Glu Gln Tyr Val Gln Leu Gly Lys Lys Val
130 135 140
Pro Ala Glu Val Leu Ser Ser Leu Asn Ser Ile Asp Glu Pro Ser Arg
145 150 155 160
Leu Val Asp Thr Met Ala Ala His Met Ala Leu Lys Ile Glu Gln Lys
165 170 175
Gln Asp Ile Leu Glu Ile Ile Asp Leu Ser Ala Arg Val Glu His Val
180 185 190
Leu Ala Met Leu Asp Gly Glu Ile Asp Leu Leu Gln Val Glu Lys Arg
195 200 205
Ile Arg Gly Arg Val Lys Lys Gln Met Glu Arg Ser Gln Arg Glu Tyr
210 215 220
Tyr Leu Asn Glu Gln Met Lys Ala Ile Gln Lys Glu Leu Gly Asp Gly
225 230 235 240
Glu Glu Gly His Asn Glu Ile Glu Glu Leu Lys Lys Arg Ile Asp Ala
245 250 255
Ala Gly Leu Pro Lys Asp Ala Leu Thr Lys Ala Thr Ala Glu Leu Asn
260 265 270
Lys Leu Lys Gln Met Ser Pro Met Ser Ala Glu Ala Thr Val Val Arg
275 280 285
Ser Tyr Ile Asp Trp Leu Val Gln Val Pro Trp Lys Ala Gln Thr Lys
290 295 300
Val Arg Leu Asp Leu Ala Arg Ala Glu Glu Ile Leu Asp Ala Asp His
305 310 315 320
Tyr Gly Leu Glu Glu Val Lys Glu Arg Ile Leu Glu Tyr Leu Ala Val
325 330 335
Gln Lys Arg Val Lys Lys Ile Arg Gly Pro Val Leu Cys Leu Val Gly
340 345 350
Pro Pro Gly Val Gly Lys Thr Ser Leu Ala Glu Ser Ile Ala Ser Ala
355 360 365
Thr Asn Arg Lys Phe Val Arg Met Ala Leu Gly Gly Val Arg Asp Glu
370 375 380
Ala Glu Ile Arg Gly His Arg Arg Thr Tyr Ile Gly Ser Met Pro Gly
385 390 395 400
Arg Leu Ile Gln Lys Met Thr Lys Val Gly Val Arg Asn Pro Leu Phe
405 410 415
Leu Leu Asp Glu Ile Asp Lys Met Gly Ser Asp Met Arg Gly Asp Pro
420 425 430
Ala Ser Ala Leu Leu Glu Val Leu Asp Pro Glu Gln Asn His Asn Phe
435 440 445
Asn Asp His Tyr Leu Glu Val Asp Tyr Asp Leu Ser Asp Val Met Phe
450 455 460
Leu Cys Thr Ser Asn Ser Met Asn Ile Pro Pro Ala Leu Leu Asp Arg
465 470 475 480
Met Glu Val Ile Arg Leu Pro Gly Tyr Thr Glu Asp Glu Lys Ile Asn
485 490 495
Ile Ala Val Lys Tyr Leu Ala Pro Lys Gln Ile Ser Ala Asn Gly Leu
500 505 510
Lys Lys Gly Glu Ile Glu Phe Glu Val Glu Ala Ile Arg Asp Ile Val
515 520 525
Arg Tyr Tyr Thr Arg Glu Ala Gly Val Arg Gly Leu Glu Arg Gln Ile
530 535 540
Ala Lys Ile Cys Arg Lys Ala Val Lys Glu His Ala Leu Glu Lys Arg
545 550 555 560
Phe Ser Val Lys Val Val Ala Asp Ser Leu Glu His Phe Leu Gly Val
565 570 575
Lys Lys Phe Arg Tyr Gly Leu Ala Glu Gln Gln Asp Gln Val Gly Gln
580 585 590
Val Thr Gly Leu Ala Trp Thr Gln Val Gly Gly Glu Leu Leu Thr Ile
595 600 605
Glu Ala Ala Val Ile Pro Gly Lys Gly Gln Leu Ile Lys Thr Gly Ser
610 615 620
Leu Gly Asp Val Met Val Glu Ser Ile Thr Ala Ala Gln Thr Val Val
625 630 635 640
Arg Ser Arg Ala Arg Ser Leu Gly Ile Pro Leu Asp Phe His Glu Lys
645 650 655
His Asp Thr His Ile His Met Pro Glu Gly Ala Thr Pro Lys Asp Gly
660 665 670
Pro Ser Ala Gly Val Gly Met Cys Thr Ala Leu Val Ser Ala Leu Thr
675 680 685
Gly Ile Pro Val Arg Ala Asp Val Ala Met Thr Gly Glu Ile Thr Leu
690 695 700
Arg Gly Gln Val Leu Ala Ile Gly Gly Leu Lys Glu Lys Leu Leu Ala
705 710 715 720
Ala His Arg Gly Gly Ile Lys Thr Val Ile Ile Pro Glu Glu Asn Val
725 730 735
Arg Asp Leu Lys Glu Ile Pro Asp Asn Ile Lys Gln Asp Leu Gln Ile
740 745 750
Lys Pro Val Lys Trp Ile Asp Glu Val Leu Gln Ile Ala Leu Gln Tyr
755 760 765
Ala Pro Glu Pro Leu Pro Asp Val Ala Pro Glu Ile Val Ala Lys Asp
770 775 780
Glu Lys Arg Glu Ser Asp Ser Lys Glu Arg Ile Ser Thr His
785 790 795
<210> 15
<211> 806
<212> PRT
<213> Pseudomonas fluorescens
<400> 15
Met Ser Asp Gln Gln Glu Phe Pro Asp Tyr Asp Leu Asn Asp Tyr Ala
1 5 10 15
Asp Pro Glu Asn Ala Glu Ala Pro Ser Ser Asn Thr Gly Leu Ala Leu
20 25 30
Pro Gly Gln Asn Leu Pro Asp Lys Val Tyr Ile Ile Pro Ile His Asn
35 40 45
Arg Pro Phe Phe Pro Ala Gln Val Leu Pro Val Ile Val Asn Glu Glu
50 55 60
Pro Trp Ala Glu Thr Leu Glu Leu Val Ser Lys Ser Asp His His Ser
65 70 75 80
Leu Ala Leu Phe Phe Met Asp Thr Pro Pro Asp Asp Pro Arg His Phe
85 90 95
Asp Thr Ser Ala Leu Pro Leu Tyr Gly Thr Leu Val Lys Val His His
100 105 110
Ala Ser Arg Glu Asn Gly Lys Leu Gln Phe Val Ala Gln Gly Leu Thr
115 120 125
Arg Val Arg Ile Lys Thr Trp Leu Lys His His Arg Pro Pro Tyr Leu
130 135 140
Val Glu Val Glu Tyr Pro His Gln Pro Ser Glu Pro Thr Asp Glu Val
145 150 155 160
Lys Ala Tyr Gly Met Ala Leu Ile Asn Ala Ile Lys Glu Leu Leu Pro
165 170 175
Leu Asn Pro Leu Tyr Ser Glu Glu Leu Lys Asn Tyr Leu Asn Arg Phe
180 185 190
Ser Pro Asn Asp Pro Ser Pro Leu Thr Asp Phe Ala Ala Ala Leu Thr
195 200 205
Ser Ala Thr Gly Asn Glu Leu Gln Glu Val Leu Asp Cys Val Pro Met
210 215 220
Leu Lys Arg Met Glu Lys Val Leu Pro Met Leu Arg Lys Glu Val Glu
225 230 235 240
Val Ala Arg Leu Gln Lys Glu Leu Ser Ala Glu Val Asn Arg Lys Ile
245 250 255
Gly Glu His Gln Arg Glu Phe Phe Leu Lys Glu Gln Leu Lys Val Ile
260 265 270
Gln Gln Glu Leu Gly Leu Thr Lys Asp Asp Arg Ser Ala Asp Val Glu
275 280 285
Gln Phe Glu Gln Arg Leu Gln Gly Lys Val Leu Pro Ala Gln Ala Gln
290 295 300
Lys Arg Ile Asp Glu Glu Leu Asn Lys Leu Ser Ile Leu Glu Thr Gly
305 310 315 320
Ser Pro Glu Tyr Ala Val Thr Arg Asn Tyr Leu Asp Trp Ala Thr Ser
325 330 335
Val Pro Trp Gly Val Tyr Gly Ala Asp Lys Leu Asp Leu Lys His Ala
340 345 350
Arg Lys Val Leu Asp Lys His His Ala Gly Leu Asp Asp Ile Lys Ser
355 360 365
Arg Ile Leu Glu Phe Leu Ala Val Gly Ala Tyr Lys Gly Glu Val Ala
370 375 380
Gly Ser Ile Val Leu Leu Val Gly Pro Pro Gly Val Gly Lys Thr Ser
385 390 395 400
Val Gly Lys Ser Ile Ala Glu Ser Leu Gly Arg Pro Phe Tyr Arg Phe
405 410 415
Ser Val Gly Gly Met Arg Asp Glu Ala Glu Ile Lys Gly His Arg Arg
420 425 430
Thr Tyr Ile Gly Ala Leu Pro Gly Lys Leu Val Gln Ala Leu Lys Asp
435 440 445
Val Glu Val Met Asn Pro Val Ile Met Leu Asp Glu Ile Asp Lys Met
450 455 460
Gly Gln Ser Phe Gln Gly Asp Pro Ala Ser Ala Leu Leu Glu Thr Leu
465 470 475 480
Asp Pro Glu Gln Asn Val Glu Phe Leu Asp His Tyr Leu Asp Leu Arg
485 490 495
Leu Asp Leu Ser Lys Val Leu Phe Val Cys Thr Ala Asn Thr Leu Asp
500 505 510
Ser Ile Pro Gly Pro Leu Leu Asp Arg Met Glu Val Ile Arg Leu Ser
515 520 525
Gly Tyr Ile Thr Glu Glu Lys Val Ala Ile Ala Lys Arg His Leu Trp
530 535 540
Pro Lys Gln Leu Glu Lys Ala Gly Val Ala Lys Asn Ser Leu Thr Ile
545 550 555 560
Ser Asp Gly Ala Leu Arg Ala Leu Ile Asp Gly Tyr Ala Arg Glu Ala
565 570 575
Gly Val Arg Gln Leu Glu Lys Gln Leu Gly Lys Leu Val Arg Lys Ala
580 585 590
Val Val Lys Leu Leu Asp Glu Pro Asp Ser Val Ile Lys Ile Gly Asn
595 600 605
Lys Asp Leu Glu Ser Ser Leu Gly Met Pro Val Phe Arg Asn Glu Gln
610 615 620
Val Leu Ser Gly Thr Gly Val Ile Thr Gly Leu Ala Trp Thr Ser Met
625 630 635 640
Gly Gly Ala Thr Leu Pro Ile Glu Ala Thr Arg Ile His Thr Leu Asn
645 650 655
Arg Gly Phe Lys Leu Thr Gly Gln Leu Gly Glu Val Met Lys Glu Ser
660 665 670
Ala Glu Ile Ala Tyr Ser Tyr Ile Ser Ser Asn Leu Lys Ser Phe Gly
675 680 685
Gly Asp Ala Lys Phe Phe Asp Glu Ala Phe Val His Leu His Val Pro
690 695 700
Glu Gly Ala Thr Pro Lys Asp Gly Pro Ser Ala Gly Val Thr Met Ala
705 710 715 720
Ser Ala Leu Leu Ser Leu Ala Arg Asn Gln Pro Pro Lys Lys Gly Val
725 730 735
Ala Met Thr Gly Glu Leu Thr Leu Thr Gly His Val Leu Pro Ile Gly
740 745 750
Gly Val Arg Glu Lys Val Ile Ala Ala Arg Arg Gln Lys Ile His Glu
755 760 765
Leu Ile Leu Pro Glu Pro Asn Arg Gly Ser Phe Glu Glu Leu Pro Asp
770 775 780
Tyr Leu Lys Glu Gly Met Thr Val His Phe Ala Lys Arg Phe Ala Asp
785 790 795 800
Val Ala Lys Val Leu Phe
805
<210> 16
<211> 477
<212> PRT
<213> Pseudomonas fluorescens
<400> 16
Met Ser Lys Val Lys Asp Lys Ala Ile Val Ser Ala Ala Gln Ala Ser
1 5 10 15
Thr Ala Tyr Ser Gln Ile Asp Ser Phe Ser His Leu Tyr Asp Arg Gly
20 25 30
Gly Asn Leu Thr Val Asn Gly Lys Pro Ser Tyr Thr Val Asp Gln Ala
35 40 45
Ala Thr Gln Leu Leu Arg Asp Gly Ala Ala Tyr Arg Asp Phe Asp Gly
50 55 60
Asn Gly Lys Ile Asp Leu Thr Tyr Thr Phe Leu Thr Ser Ala Thr Gln
65 70 75 80
Ser Thr Met Asn Lys His Gly Ile Ser Gly Phe Ser Gln Phe Asn Thr
85 90 95
Gln Gln Lys Ala Gln Ala Ala Leu Ala Met Gln Ser Trp Ala Asp Val
100 105 110
Ala Asn Val Thr Phe Thr Glu Lys Ala Ser Gly Gly Asp Gly His Met
115 120 125
Thr Phe Gly Asn Tyr Ser Ser Gly Gln Asp Gly Ala Ala Ala Phe Ala
130 135 140
Tyr Leu Pro Gly Thr Gly Ala Gly Tyr Asp Gly Thr Ser Trp Tyr Leu
145 150 155 160
Thr Asn Asn Ser Tyr Thr Pro Asn Lys Thr Pro Asp Leu Asn Asn Tyr
165 170 175
Gly Arg Gln Thr Leu Thr His Glu Ile Gly His Thr Leu Gly Leu Ala
180 185 190
His Pro Gly Asp Tyr Asn Ala Gly Asn Gly Asn Pro Thr Tyr Asn Asp
195 200 205
Ala Thr Tyr Gly Gln Asp Thr Arg Gly Tyr Ser Leu Met Ser Tyr Trp
210 215 220
Ser Glu Ser Asn Thr Asn Gln Asn Phe Ser Lys Gly Gly Val Glu Ala
225 230 235 240
Tyr Ala Ser Gly Pro Leu Ile Asp Asp Ile Ala Ala Ile Gln Lys Leu
245 250 255
Tyr Gly Ala Asn Leu Ser Thr Arg Ala Thr Asp Thr Thr Tyr Gly Phe
260 265 270
Asn Ser Asn Thr Gly Arg Asp Phe Leu Ser Ala Thr Ser Asn Ala Asp
275 280 285
Lys Leu Val Phe Ser Val Trp Asp Gly Gly Gly Asn Asp Thr Leu Asp
290 295 300
Phe Ser Gly Phe Thr Gln Asn Gln Lys Ile Asn Leu Thr Ala Thr Ser
305 310 315 320
Phe Ser Asp Val Gly Gly Leu Val Gly Asn Val Ser Ile Ala Lys Gly
325 330 335
Val Thr Ile Glu Asn Ala Phe Gly Gly Ala Gly Asn Asp Leu Ile Ile
340 345 350
Gly Asn Gln Val Ala Asn Thr Ile Lys Gly Gly Ala Gly Asn Asp Leu
355 360 365
Ile Tyr Gly Gly Gly Gly Ala Asp Gln Leu Trp Gly Gly Ala Gly Ser
370 375 380
Asp Thr Phe Val Tyr Gly Ala Ser Ser Asp Ser Lys Pro Gly Ala Ala
385 390 395 400
Asp Lys Ile Phe Asp Phe Thr Ser Gly Ser Asp Lys Ile Asp Leu Ser
405 410 415
Gly Ile Thr Lys Gly Ala Gly Val Thr Phe Val Asn Ala Phe Thr Gly
420 425 430
His Ala Gly Asp Ala Val Leu Ser Tyr Ala Ser Gly Thr Asn Leu Gly
435 440 445
Thr Leu Ala Val Asp Phe Ser Gly His Gly Val Ala Asp Phe Leu Val
450 455 460
Thr Thr Val Gly Gln Ala Ala Ala Ser Asp Ile Val Ala
465 470 475
<210> 17
<211> 295
<212> PRT
<213> Pseudomonas fluorescens
<400> 17
Met Met Arg Ile Leu Leu Phe Leu Ala Thr Asn Leu Ala Val Val Leu
1 5 10 15
Ile Ala Ser Val Thr Leu Ser Leu Phe Gly Phe Asn Gly Phe Met Ala
20 25 30
Ala Asn Gly Val Asp Leu Asn Leu Asn Gln Leu Leu Ile Phe Cys Ala
35 40 45
Val Phe Gly Phe Ala Gly Ser Leu Phe Ser Leu Phe Ile Ser Lys Trp
50 55 60
Met Ala Lys Met Ser Thr Ser Thr Gln Ile Ile Thr Gln Pro Arg Thr
65 70 75 80
Arg His Glu Gln Trp Leu Met Gln Thr Val Glu Gln Leu Ser Gln Glu
85 90 95
Ala Gly Ile Lys Met Pro Glu Val Gly Ile Phe Pro Ala Tyr Glu Ala
100 105 110
Asn Ala Phe Ala Thr Gly Trp Asn Lys Asn Asp Ala Leu Val Ala Val
115 120 125
Ser Gln Gly Leu Leu Glu Arg Phe Ser Pro Asp Glu Val Lys Ala Val
130 135 140
Leu Ala His Glu Ile Gly His Val Ala Asn Gly Asp Met Val Thr Leu
145 150 155 160
Ala Leu Val Gln Gly Val Val Asn Thr Phe Val Met Phe Phe Ala Arg
165 170 175
Ile Ile Gly Asn Phe Val Asp Lys Val Ile Phe Lys Asn Glu Glu Gly
180 185 190
Arg Gly Ile Ala Tyr Phe Val Ala Thr Ile Phe Ala Glu Leu Val Leu
195 200 205
Gly Phe Leu Ala Ser Ala Ile Val Met Trp Phe Ser Arg Lys Arg Glu
210 215 220
Phe Arg Ala Asp Glu Ala Gly Ala Arg Leu Ala Gly Thr Ser Ala Met
225 230 235 240
Ile Gly Ala Leu Gln Arg Leu Arg Ser Glu Gln Gly Leu Pro Val His
245 250 255
Met Pro Asp Ser Leu Thr Ala Phe Gly Ile Asn Gly Gly Ile Lys Gln
260 265 270
Gly Leu Ala Arg Leu Phe Met Ser His Pro Pro Leu Glu Glu Arg Ile
275 280 285
Asp Ala Leu Arg Arg Arg Gly
290 295
<210> 18
<211> 386
<212> PRT
<213> Pseudomonas fluorescens
<400> 18
Met Leu Lys Ala Leu Arg Phe Phe Gly Trp Pro Leu Leu Ala Gly Val
1 5 10 15
Leu Ile Ala Met Leu Ile Ile Gln Arg Tyr Pro Gln Trp Val Gly Leu
20 25 30
Pro Thr Leu Asp Val Asn Leu Gln Gln Ala Pro Gln Thr Asn Thr Val
35 40 45
Val Gln Gly Pro Val Thr Tyr Ala Asp Ala Val Val Ile Ala Ala Pro
50 55 60
Ala Val Val Asn Leu Tyr Thr Thr Lys Val Ile Asn Lys Pro Ala His
65 70 75 80
Pro Leu Phe Glu Asp Pro Gln Phe Arg Arg Tyr Phe Gly Asp Asn Gly
85 90 95
Pro Lys Gln Arg Arg Met Glu Ser Ser Leu Gly Ser Gly Val Ile Met
100 105 110
Ser Pro Glu Gly Tyr Ile Leu Thr Asn Asn His Val Thr Thr Gly Ala
115 120 125
Asp Gln Ile Val Val Ala Leu Arg Asp Gly Arg Glu Thr Leu Ala Arg
130 135 140
Val Val Gly Ser Asp Pro Glu Thr Asp Leu Ala Val Leu Lys Ile Asp
145 150 155 160
Leu Lys Asn Leu Pro Ala Ile Thr Leu Gly Arg Ser Asp Gly Leu Arg
165 170 175
Val Gly Asp Val Ala Leu Ala Ile Gly Asn Pro Phe Gly Val Gly Gln
180 185 190
Thr Val Thr Met Gly Ile Ile Ser Ala Thr Gly Arg Asn Gln Leu Gly
195 200 205
Leu Asn Ser Tyr Glu Asp Phe Ile Gln Thr Asp Ala Ala Ile Asn Pro
210 215 220
Gly Asn Ser Gly Gly Ala Leu Val Asp Ala Asn Gly Asn Leu Thr Gly
225 230 235 240
Ile Asn Thr Ala Ile Phe Ser Lys Ser Gly Gly Ser Gln Gly Ile Gly
245 250 255
Phe Ala Ile Pro Val Lys Leu Ala Met Glu Val Met Lys Ser Ile Ile
260 265 270
Glu His Gly Gln Val Ile Arg Gly Trp Leu Gly Ile Glu Val Gln Pro
275 280 285
Leu Thr Lys Glu Leu Ala Glu Ser Phe Gly Leu Thr Gly Arg Pro Gly
290 295 300
Ile Val Val Ala Gly Ile Phe Arg Asp Gly Pro Ala Gln Lys Ala Gly
305 310 315 320
Leu Gln Leu Gly Asp Val Ile Leu Ser Ile Asp Gly Ala Pro Ala Gly
325 330 335
Asp Gly Arg Lys Ser Met Asn Gln Val Ala Arg Ile Lys Pro Thr Asp
340 345 350
Lys Val Ala Ile Leu Val Met Arg Asn Gly Lys Glu Ile Lys Leu Ser
355 360 365
Ala Glu Ile Gly Leu Arg Pro Pro Pro Ala Thr Ala Pro Val Lys Glu
370 375 380
Glu Gln
385
<210> 19
<211> 478
<212> PRT
<213> Pseudomonas fluorescens
<400> 19
Met Ser Ile Pro Arg Leu Lys Ser Tyr Leu Ser Ile Val Ala Thr Val
1 5 10 15
Leu Val Leu Gly Gln Ala Leu Pro Ala Gln Ala Val Glu Leu Pro Asp
20 25 30
Phe Thr Gln Leu Val Glu Gln Ala Ser Pro Ala Val Val Asn Ile Ser
35 40 45
Thr Thr Gln Lys Leu Pro Asp Arg Lys Val Ser Asn Gln Gln Met Pro
50 55 60
Asp Leu Glu Gly Leu Pro Pro Met Leu Arg Glu Phe Phe Glu Arg Gly
65 70 75 80
Met Pro Gln Pro Arg Ser Pro Arg Gly Gly Gly Gly Gln Arg Glu Ala
85 90 95
Gln Ser Leu Gly Ser Gly Phe Ile Ile Ser Pro Asp Gly Tyr Ile Leu
100 105 110
Thr Asn Asn His Val Ile Ala Asp Ala Asp Glu Ile Leu Val Arg Leu
115 120 125
Ala Asp Arg Ser Glu Leu Lys Ala Lys Leu Ile Gly Thr Asp Pro Arg
130 135 140
Ser Asp Val Ala Leu Leu Lys Ile Glu Gly Lys Asp Leu Pro Val Leu
145 150 155 160
Lys Leu Gly Lys Ser Gln Asp Leu Lys Ala Gly Gln Trp Val Val Ala
165 170 175
Ile Gly Ser Pro Phe Gly Phe Asp His Thr Val Thr Gln Gly Ile Val
180 185 190
Ser Ala Ile Gly Arg Ser Leu Pro Asn Glu Asn Tyr Val Pro Phe Ile
195 200 205
Gln Thr Asp Val Pro Ile Asn Pro Gly Asn Ser Gly Gly Pro Leu Phe
210 215 220
Asn Leu Ala Gly Glu Val Val Gly Ile Asn Ser Gln Ile Tyr Thr Arg
225 230 235 240
Ser Gly Gly Phe Met Gly Val Ser Phe Ala Ile Pro Ile Asp Val Ala
245 250 255
Met Asp Val Ser Asn Gln Leu Lys Ser Gly Gly Lys Val Ser Arg Gly
260 265 270
Trp Leu Gly Val Val Ile Gln Glu Val Asn Lys Asp Leu Ala Glu Ser
275 280 285
Phe Gly Leu Asp Lys Pro Ala Gly Ala Leu Val Ala Gln Ile Gln Asp
290 295 300
Asn Gly Pro Ala Ala Lys Gly Gly Leu Lys Val Gly Asp Val Ile Leu
305 310 315 320
Ser Met Asn Gly Gln Pro Ile Ile Met Ser Ala Asp Leu Pro His Leu
325 330 335
Val Gly Ala Leu Lys Ala Gly Gly Lys Ala Lys Leu Glu Val Ile Arg
340 345 350
Asp Gly Lys Arg Gln Asn Val Glu Leu Thr Val Gly Ala Ile Pro Glu
355 360 365
Glu Gly Ala Thr Leu Asp Ala Leu Gly Asn Ala Lys Pro Gly Ala Glu
370 375 380
Arg Ser Ser Asn Arg Leu Gly Ile Ala Val Val Glu Leu Thr Ala Glu
385 390 395 400
Gln Lys Lys Thr Phe Asp Leu Gln Ser Gly Val Val Ile Lys Glu Val
405 410 415
Gln Asp Gly Pro Ala Ala Leu Ile Gly Leu Gln Pro Gly Asp Val Ile
420 425 430
Thr His Leu Asn Asn Gln Ala Ile Asp Thr Thr Lys Glu Phe Ala Asp
435 440 445
Ile Ala Lys Ala Leu Pro Lys Asn Arg Ser Val Ser Met Arg Val Leu
450 455 460
Arg Gln Gly Arg Ala Ser Phe Ile Thr Phe Lys Leu Ala Glu
465 470 475
<210> 20
<211> 353
<212> PRT
<213> Pseudomonas fluorescens
<400> 20
Met Cys Val Arg Gln Pro Arg Asn Pro Ile Phe Cys Leu Ile Pro Pro
1 5 10 15
Tyr Met Leu Asp Gln Ile Ala Arg His Gly Asp Lys Ala Gln Arg Glu
20 25 30
Val Ala Leu Arg Thr Arg Ala Lys Asp Ser Thr Phe Arg Ser Leu Arg
35 40 45
Met Val Ala Val Pro Ala Lys Gly Pro Ala Arg Met Ala Leu Ala Val
50 55 60
Gly Ala Glu Lys Gln Arg Ser Ile Tyr Ser Ala Glu Asn Thr Asp Ser
65 70 75 80
Leu Pro Gly Lys Leu Ile Arg Gly Glu Gly Gln Pro Ala Ser Gly Asp
85 90 95
Ala Ala Val Asp Glu Ala Tyr Asp Gly Leu Gly Ala Thr Phe Asp Phe
100 105 110
Phe Asp Gln Val Phe Asp Arg Asn Ser Ile Asp Asp Ala Gly Met Ala
115 120 125
Leu Asp Ala Thr Val His Phe Gly Gln Asp Tyr Asn Asn Ala Phe Trp
130 135 140
Asn Ser Thr Gln Met Val Phe Gly Asp Gly Asp Gln Gln Leu Phe Asn
145 150 155 160
Arg Phe Thr Val Ala Leu Asp Val Ile Gly His Glu Leu Ala His Gly
165 170 175
Val Thr Glu Asp Glu Ala Lys Leu Met Tyr Phe Asn Gln Ser Gly Ala
180 185 190
Leu Asn Glu Ser Leu Ser Asp Val Phe Gly Ser Leu Ile Lys Gln Tyr
195 200 205
Ala Leu Lys Gln Thr Ala Glu Asp Ala Asp Trp Leu Ile Gly Lys Gly
210 215 220
Leu Phe Thr Lys Lys Ile Lys Gly Thr Ala Leu Arg Ser Met Lys Ala
225 230 235 240
Pro Gly Thr Ala Phe Asp Asp Lys Leu Leu Gly Lys Asp Pro Gln Pro
245 250 255
Gly His Met Asp Asp Phe Val Gln Thr Tyr Glu Asp Asn Gly Gly Val
260 265 270
His Ile Asn Ser Gly Ile Pro Asn His Ala Phe Tyr Gln Val Ala Ile
275 280 285
Asn Ile Gly Gly Phe Ala Trp Glu Arg Ala Gly Arg Ile Trp Tyr Asp
290 295 300
Ala Leu Arg Asp Ser Arg Leu Arg Pro Asn Ser Gly Phe Leu Arg Phe
305 310 315 320
Ala Arg Ile Thr His Asp Ile Ala Gly Gln Leu Tyr Gly Val Asn Lys
325 330 335
Ala Glu Gln Lys Ala Val Lys Glu Gly Trp Lys Ala Val Gly Ile Asn
340 345 350
Val
<210> 21
<211> 704
<212> PRT
<213> Pseudomonas fluorescens
<400> 21
Met Arg Tyr Gln Leu Pro Pro Arg Arg Ile Ser Met Lys His Leu Phe
1 5 10 15
Pro Ser Thr Ala Leu Ala Phe Phe Ile Gly Leu Gly Phe Ala Ser Met
20 25 30
Ser Thr Asn Thr Phe Ala Ala Asn Ser Trp Asp Asn Leu Gln Pro Asp
35 40 45
Arg Asp Glu Val Ile Ala Ser Leu Asn Val Val Glu Leu Leu Lys Arg
50 55 60
His His Tyr Ser Lys Pro Pro Leu Asp Asp Ala Arg Ser Val Ile Ile
65 70 75 80
Tyr Asp Ser Tyr Leu Lys Leu Leu Asp Pro Ser Arg Ser Tyr Phe Leu
85 90 95
Ala Ser Asp Ile Ala Glu Phe Asp Lys Trp Lys Thr Gln Phe Asp Asp
100 105 110
Phe Leu Lys Ser Gly Asp Leu Gln Pro Gly Phe Thr Ile Tyr Lys Arg
115 120 125
Tyr Leu Asp Arg Val Lys Ala Arg Leu Asp Phe Ala Leu Gly Glu Leu
130 135 140
Asn Lys Gly Val Asp Lys Leu Asp Phe Thr Gln Lys Glu Thr Leu Leu
145 150 155 160
Val Asp Arg Lys Asp Ala Pro Trp Leu Thr Ser Thr Ala Ala Leu Asp
165 170 175
Asp Leu Trp Arg Lys Arg Val Lys Asp Glu Val Leu Arg Leu Lys Ile
180 185 190
Ala Gly Lys Glu Pro Lys Ala Ile Gln Glu Leu Leu Thr Lys Arg Tyr
195 200 205
Lys Asn Gln Leu Ala Arg Leu Asp Gln Thr Arg Ala Glu Asp Ile Phe
210 215 220
Gln Ala Tyr Ile Asn Thr Phe Ala Met Ser Tyr Asp Pro His Thr Asn
225 230 235 240
Tyr Leu Ser Pro Asp Asn Ala Glu Asn Phe Asp Ile Asn Met Ser Leu
245 250 255
Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Ser Asp Asn Asp Gln Val
260 265 270
Lys Ile Val Arg Leu Val Pro Ala Gly Pro Ala Asp Lys Thr Lys Gln
275 280 285
Val Ala Pro Ala Asp Lys Ile Ile Gly Val Ala Gln Ala Asp Lys Glu
290 295 300
Met Val Asp Val Val Gly Trp Arg Leu Asp Glu Val Val Lys Leu Ile
305 310 315 320
Arg Gly Pro Lys Gly Ser Val Val Arg Leu Glu Val Ile Pro His Thr
325 330 335
Asn Ala Pro Asn Asp Gln Thr Ser Lys Ile Val Ser Ile Thr Arg Glu
340 345 350
Ala Val Lys Leu Glu Asp Gln Ala Val Gln Lys Lys Val Leu Asn Leu
355 360 365
Lys Gln Asp Gly Lys Asp Tyr Lys Leu Gly Val Ile Glu Ile Pro Ala
370 375 380
Phe Tyr Leu Asp Phe Lys Ala Phe Arg Ala Gly Asp Pro Asp Tyr Lys
385 390 395 400
Ser Thr Thr Arg Asp Val Lys Lys Ile Leu Thr Glu Leu Gln Lys Glu
405 410 415
Lys Val Asp Gly Val Val Ile Asp Leu Arg Asn Asn Gly Gly Gly Ser
420 425 430
Leu Gln Glu Ala Thr Glu Leu Thr Ser Leu Phe Ile Asp Lys Gly Pro
435 440 445
Thr Val Leu Val Arg Asn Ala Asp Gly Arg Val Asp Val Leu Glu Asp
450 455 460
Glu Asn Pro Gly Ala Phe Tyr Lys Gly Pro Met Ala Leu Leu Val Asn
465 470 475 480
Arg Leu Ser Ala Ser Ala Ser Glu Ile Phe Ala Gly Ala Met Gln Asp
485 490 495
Tyr His Arg Ala Leu Ile Ile Gly Gly Gln Thr Phe Gly Lys Gly Thr
500 505 510
Val Gln Thr Ile Gln Pro Leu Asn His Gly Glu Leu Lys Leu Thr Leu
515 520 525
Ala Lys Phe Tyr Arg Val Ser Gly Gln Ser Thr Gln His Gln Gly Val
530 535 540
Leu Pro Asp Ile Asp Phe Pro Ser Ile Ile Asp Thr Lys Glu Ile Gly
545 550 555 560
Glu Ser Ala Leu Pro Glu Ala Met Pro Trp Asp Thr Ile Arg Pro Ala
565 570 575
Ile Lys Pro Ala Ser Asp Pro Phe Lys Pro Phe Leu Ala Gln Leu Lys
580 585 590
Ala Asp His Asp Thr Arg Ser Ala Lys Asp Ala Glu Phe Val Phe Ile
595 600 605
Arg Asp Lys Leu Ala Leu Ala Lys Lys Leu Met Glu Glu Lys Thr Val
610 615 620
Ser Leu Asn Glu Ala Asp Arg Arg Ala Gln His Ser Ser Ile Glu Asn
625 630 635 640
Gln Gln Leu Val Leu Glu Asn Thr Arg Arg Lys Ala Lys Gly Glu Asp
645 650 655
Pro Leu Lys Glu Leu Lys Lys Glu Asp Glu Asp Ala Leu Pro Thr Glu
660 665 670
Ala Asp Lys Thr Lys Pro Glu Asp Asp Ala Tyr Leu Ala Glu Thr Gly
675 680 685
Arg Ile Leu Leu Asp Tyr Leu Lys Ile Thr Lys Gln Val Ala Lys Gln
690 695 700
<210> 22
<211> 437
<212> PRT
<213> Pseudomonas fluorescens
<400> 22
Met Leu His Leu Ser Arg Leu Thr Ser Leu Ala Leu Thr Ile Ala Leu
1 5 10 15
Val Ile Gly Ala Pro Leu Ala Phe Ala Asp Gln Ala Ala Pro Ala Ala
20 25 30
Pro Ala Thr Ala Ala Thr Thr Lys Ala Pro Leu Pro Leu Asp Glu Leu
35 40 45
Arg Thr Phe Ala Glu Val Met Asp Arg Ile Lys Ala Ala Tyr Val Glu
50 55 60
Pro Val Asp Asp Lys Ala Leu Leu Glu Asn Ala Ile Lys Gly Met Leu
65 70 75 80
Ser Asn Leu Asp Pro His Ser Ala Tyr Leu Gly Pro Glu Asp Phe Ala
85 90 95
Glu Leu Gln Glu Ser Thr Ser Gly Glu Phe Gly Gly Leu Gly Ile Glu
100 105 110
Val Gly Ser Glu Asp Gly Gln Ile Lys Val Val Ser Pro Ile Asp Asp
115 120 125
Thr Pro Ala Ser Lys Ala Gly Ile Gln Ala Gly Asp Leu Ile Val Lys
130 135 140
Ile Asn Gly Gln Pro Thr Arg Gly Gln Thr Met Thr Glu Ala Val Asp
145 150 155 160
Lys Met Arg Gly Lys Leu Gly Gln Lys Ile Thr Leu Thr Leu Val Arg
165 170 175
Asp Gly Gly Asn Pro Phe Asp Val Thr Leu Ala Arg Ala Thr Ile Thr
180 185 190
Val Lys Ser Val Lys Ser Gln Leu Leu Glu Ser Gly Tyr Gly Tyr Ile
195 200 205
Arg Ile Thr Gln Phe Gln Val Lys Thr Gly Asp Glu Val Ala Lys Ala
210 215 220
Leu Ala Lys Leu Arg Lys Asp Asn Gly Lys Lys Leu Asn Gly Ile Val
225 230 235 240
Leu Asp Leu Arg Asn Asn Pro Gly Gly Val Leu Gln Ser Ala Val Glu
245 250 255
Val Val Asp His Phe Val Thr Lys Gly Leu Ile Val Tyr Thr Lys Gly
260 265 270
Arg Ile Ala Asn Ser Glu Leu Arg Phe Ser Ala Thr Gly Asn Asp Leu
275 280 285
Ser Glu Asn Val Pro Leu Ala Val Leu Ile Asn Gly Gly Ser Ala Ser
290 295 300
Ala Ser Glu Ile Val Ala Gly Ala Leu Gln Asp Leu Lys Arg Gly Val
305 310 315 320
Leu Met Gly Thr Thr Ser Phe Gly Lys Gly Ser Val Gln Thr Val Leu
325 330 335
Pro Leu Asn Asn Glu Arg Ala Leu Lys Ile Thr Thr Ala Leu Tyr Tyr
340 345 350
Thr Pro Asn Gly Arg Ser Ile Gln Ala Gln Gly Ile Val Pro Asp Ile
355 360 365
Glu Val Arg Arg Ala Lys Ile Thr Asn Glu Ile Asp Gly Glu Tyr Tyr
370 375 380
Lys Glu Ala Asp Leu Gln Gly His Leu Gly Asn Gly Asn Gly Gly Ala
385 390 395 400
Asp Gln Pro Thr Gly Ser Arg Ala Lys Ala Lys Pro Met Pro Gln Asp
405 410 415
Asp Asp Tyr Gln Leu Ala Gln Ala Leu Ser Leu Leu Lys Gly Leu Ser
420 425 430
Ile Thr Arg Ser Arg
435
<210> 23
<211> 1242
<212> PRT
<213> Pseudomonas fluorescens
<400> 23
Met Asp Val Ala Gly Asn Gly Phe Thr Val Ser Gln Arg Asn Arg Thr
1 5 10 15
Pro Arg Phe Lys Thr Thr Pro Leu Thr Pro Ile Ala Leu Gly Leu Ala
20 25 30
Leu Trp Leu Gly His Gly Ser Val Ala Arg Ala Asp Asp Asn Pro Tyr
35 40 45
Thr Pro Gln Val Leu Glu Ser Ala Phe Arg Thr Ala Val Ala Ser Phe
50 55 60
Gly Pro Glu Thr Ala Val Tyr Lys Asn Leu Arg Phe Ala Tyr Ala Asp
65 70 75 80
Ile Val Asp Leu Ala Ala Lys Asp Phe Ala Ala Gln Ser Gly Lys Phe
85 90 95
Asp Ser Ala Leu Lys Gln Asn Tyr Glu Leu Gln Pro Glu Asn Leu Thr
100 105 110
Ile Gly Ala Met Leu Gly Asp Thr Arg Arg Pro Leu Asp Tyr Ala Ser
115 120 125
Arg Leu Asp Tyr Tyr Arg Ser Arg Leu Phe Ser Asn Ser Gly Arg Tyr
130 135 140
Thr Thr Asn Ile Leu Asp Phe Ser Lys Ala Ile Ile Ala Asn Leu Pro
145 150 155 160
Ala Ala Lys Pro Tyr Thr Tyr Val Glu Pro Gly Val Ser Ser Asn Leu
165 170 175
Asn Gly Gln Leu Asn Ala Gly Gln Ser Trp Ala Gly Ala Thr Arg Asp
180 185 190
Trp Ser Ala Asn Ala Gln Thr Trp Lys Thr Pro Glu Ala Gln Val Asn
195 200 205
Ser Gly Leu Asp Arg Thr Asn Ala Tyr Tyr Ala Tyr Ala Leu Gly Ile
210 215 220
Thr Gly Lys Gly Val Asn Val Gly Val Leu Asp Ser Gly Ile Phe Thr
225 230 235 240
Glu His Ser Glu Phe Gln Gly Lys Asn Ala Gln Gly Gln Asp Arg Val
245 250 255
Gln Ala Val Thr Ser Thr Gly Glu Tyr Tyr Ala Thr His Pro Arg Tyr
260 265 270
Arg Leu Glu Val Pro Ser Gly Glu Phe Lys Gln Gly Glu His Phe Ser
275 280 285
Ile Pro Gly Glu Tyr Asp Pro Ala Phe Asn Asp Gly His Gly Thr Glu
290 295 300
Met Ser Gly Val Leu Ala Ala Asn Arg Asn Gly Thr Gly Met His Gly
305 310 315 320
Ile Ala Phe Asp Ala Asn Leu Phe Val Ala Asn Thr Gly Gly Ser Asp
325 330 335
Asn Asp Arg Tyr Gln Gly Ser Asn Asp Leu Asp Tyr Asn Ala Phe Met
340 345 350
Ala Ser Tyr Asn Ala Leu Ala Ala Lys Asn Val Ala Ile Val Asn Gln
355 360 365
Ser Trp Gly Gln Ser Ser Arg Asp Asp Val Glu Asn His Phe Gly Asn
370 375 380
Val Gly Asp Ser Ala Ala Gln Asn Leu Arg Asp Met Thr Ala Ala Tyr
385 390 395 400
Arg Pro Phe Trp Asp Lys Ala His Ala Gly His Lys Thr Trp Met Asp
405 410 415
Ala Met Ala Asp Ala Ala Arg Gln Asn Thr Phe Ile Gln Ile Ile Ser
420 425 430
Ala Gly Asn Asp Ser His Gly Ala Asn Pro Asp Thr Asn Ser Asn Leu
435 440 445
Pro Phe Phe Lys Pro Asp Ile Glu Ala Lys Phe Leu Ser Ile Thr Gly
450 455 460
Tyr Asp Glu Thr Ser Ala Gln Val Tyr Asn Arg Cys Gly Thr Ser Lys
465 470 475 480
Trp Trp Cys Val Met Gly Ile Ser Gly Ile Pro Ser Ala Gly Pro Glu
485 490 495
Gly Glu Ile Ile Pro Asn Ala Asn Gly Thr Ser Ala Ala Ala Pro Ser
500 505 510
Val Ser Gly Ala Leu Ala Leu Val Met Gln Arg Phe Pro Tyr Met Thr
515 520 525
Ala Ser Gln Ala Arg Asp Val Leu Leu Thr Thr Ser Ser Leu Gln Ala
530 535 540
Pro Asp Gly Pro Asp Thr Pro Val Gly Thr Leu Thr Gly Gly Arg Thr
545 550 555 560
Tyr Asp Asn Leu Gln Pro Val His Asp Ala Ala Pro Gly Leu Pro Gln
565 570 575
Val Pro Gly Val Val Ser Gly Trp Gly Leu Pro Asn Leu Gln Lys Ala
580 585 590
Met Gln Gly Pro Gly Gln Phe Leu Gly Ala Val Ala Val Ala Leu Pro
595 600 605
Ser Gly Thr Arg Asp Ile Trp Ala Asn Pro Ile Ser Asp Glu Ala Ile
610 615 620
Arg Ala Arg Arg Val Glu Asp Ala Ala Glu Gln Ala Thr Trp Ala Ala
625 630 635 640
Thr Lys Gln Gln Lys Gly Trp Leu Ser Gly Leu Pro Ala Asn Ala Ser
645 650 655
Ala Asp Asp Gln Phe Glu Tyr Asp Ile Gly His Ala Arg Glu Gln Ala
660 665 670
Thr Leu Thr Arg Gly Gln Asp Val Leu Thr Gly Ser Thr Tyr Val Gly
675 680 685
Ser Leu Val Lys Ser Gly Asp Gly Glu Leu Val Leu Glu Gly Gln Asn
690 695 700
Thr Tyr Ser Gly Ser Thr Trp Val Arg Gly Gly Lys Leu Ser Val Asp
705 710 715 720
Gly Ala Leu Thr Ser Ala Val Thr Val Asp Ser Ser Ala Val Gly Thr
725 730 735
Arg Asn Ala Asp Asn Gly Val Met Thr Thr Leu Gly Gly Thr Leu Ala
740 745 750
Gly Asn Gly Thr Val Gly Ala Leu Thr Val Asn Asn Gly Gly Arg Val
755 760 765
Ala Pro Gly His Ser Ile Gly Thr Leu Arg Thr Gly Asp Val Thr Phe
770 775 780
Asn Pro Gly Ser Val Tyr Ala Val Glu Val Gly Ala Asp Gly Arg Ser
785 790 795 800
Asp Gln Leu Gln Ser Ser Gly Val Ala Thr Leu Asn Gly Gly Val Val
805 810 815
Ser Val Ser Leu Glu Asn Ser Pro Asn Leu Leu Thr Ala Thr Glu Ala
820 825 830
Arg Ser Leu Leu Gly Gln Gln Phe Asn Ile Leu Ser Ala Ser Gln Gly
835 840 845
Ile Gln Gly Gln Phe Ala Ala Phe Ala Pro Asn Tyr Leu Phe Ile Gly
850 855 860
Thr Ala Leu Asn Tyr Gln Pro Asn Gln Leu Thr Leu Ala Ile Ala Arg
865 870 875 880
Asn Gln Thr Thr Phe Ala Ser Val Ala Gln Thr Arg Asn Glu Arg Ser
885 890 895
Val Ala Thr Val Ala Glu Thr Leu Gly Ala Gly Ser Pro Val Tyr Glu
900 905 910
Ser Leu Leu Ala Ser Asp Ser Ala Ala Gln Ala Arg Glu Gly Phe Lys
915 920 925
Gln Leu Ser Gly Gln Leu His Ser Asp Val Ala Ala Ala Gln Met Ala
930 935 940
Asp Ser Arg Tyr Leu Arg Glu Ala Val Asn Ala Arg Leu Gln Gln Ala
945 950 955 960
Gln Ala Leu Asp Ser Ser Ala Gln Ile Asp Ser Arg Asp Asn Gly Gly
965 970 975
Trp Val Gln Leu Leu Gly Gly Arg Asn Asn Val Ser Gly Asp Asn Asn
980 985 990
Ala Ser Gly Tyr Ser Ser Ser Thr Ser Gly Val Leu Leu Gly Leu Asp
995 1000 1005
Thr Glu Val Asn Asp Gly Trp Arg Val Gly Ala Ala Thr Gly Tyr
1010 1015 1020
Thr Gln Ser His Leu Asn Gly Gln Ser Ala Ser Ala Asp Ser Asp
1025 1030 1035
Asn Tyr His Leu Ser Val Tyr Gly Gly Lys Arg Phe Glu Ala Ile
1040 1045 1050
Ala Leu Arg Leu Gly Gly Ala Ser Thr Trp His Arg Leu Asp Thr
1055 1060 1065
Ser Arg Arg Val Ala Tyr Ala Asn Gln Ser Asp His Ala Lys Ala
1070 1075 1080
Asp Tyr Asn Ala Arg Thr Asp Gln Val Phe Ala Glu Ile Gly Tyr
1085 1090 1095
Thr Gln Trp Thr Val Phe Glu Pro Phe Ala Asn Leu Thr Tyr Leu
1100 1105 1110
Asn Tyr Gln Ser Asp Ser Phe Lys Glu Lys Gly Gly Ala Ala Ala
1115 1120 1125
Leu His Ala Ser Gln Gln Ser Gln Asp Ala Thr Leu Ser Thr Leu
1130 1135 1140
Gly Val Arg Gly His Thr Gln Leu Pro Leu Thr Ser Thr Ser Ala
1145 1150 1155
Val Thr Leu Arg Gly Glu Leu Gly Trp Glu His Gln Phe Gly Asp
1160 1165 1170
Thr Asp Arg Glu Ala Ser Leu Lys Phe Ala Gly Ser Asp Thr Ala
1175 1180 1185
Phe Ala Val Asn Ser Val Pro Val Ala Arg Asp Gly Ala Val Ile
1190 1195 1200
Lys Ala Ser Ala Glu Met Ala Leu Thr Lys Asp Thr Leu Val Ser
1205 1210 1215
Leu Asn Tyr Ser Gly Leu Leu Ser Asn Arg Gly Asn Asn Asn Gly
1220 1225 1230
Ile Asn Ala Gly Phe Thr Phe Leu Phe
1235 1240
<210> 24
<211> 450
<212> PRT
<213> Pseudomonas fluorescens
<400> 24
Met Ser Ala Leu Tyr Met Ile Val Gly Thr Leu Val Ala Leu Gly Val
1 5 10 15
Leu Val Thr Phe His Glu Phe Gly His Phe Trp Val Ala Arg Arg Cys
20 25 30
Gly Val Lys Val Leu Arg Phe Ser Val Gly Phe Gly Met Pro Leu Leu
35 40 45
Arg Trp His Asp Arg Arg Gly Thr Glu Phe Val Ile Ala Ala Ile Pro
50 55 60
Leu Gly Gly Tyr Val Lys Met Leu Asp Glu Arg Glu Gly Glu Val Pro
65 70 75 80
Ala Asp Gln Leu Asp Gln Ser Phe Asn Arg Lys Thr Val Arg Gln Arg
85 90 95
Ile Ala Ile Val Ala Ala Gly Pro Ile Ala Asn Phe Leu Leu Ala Met
100 105 110
Val Phe Phe Trp Val Leu Ala Met Leu Gly Ser Gln Gln Val Arg Pro
115 120 125
Val Ile Gly Ala Val Glu Ala Asp Ser Ile Ala Ala Lys Ala Gly Leu
130 135 140
Thr Ala Gly Gln Glu Ile Val Ser Ile Asp Gly Glu Pro Thr Thr Gly
145 150 155 160
Trp Gly Ala Val Asn Leu Gln Leu Val Arg Arg Leu Gly Glu Ser Gly
165 170 175
Thr Val Asn Val Val Val Arg Asp Gln Asp Ser Ser Ala Glu Thr Pro
180 185 190
Arg Ala Leu Ala Leu Asp His Trp Leu Lys Gly Ala Asp Glu Pro Asp
195 200 205
Pro Ile Lys Ser Leu Gly Ile Arg Pro Trp Arg Pro Ala Leu Pro Pro
210 215 220
Val Leu Ala Glu Leu Asp Pro Lys Gly Pro Ala Gln Ala Ala Gly Leu
225 230 235 240
Lys Thr Gly Asp Arg Leu Leu Ala Leu Asp Gly Gln Ala Leu Gly Asp
245 250 255
Trp Gln Gln Val Val Asp Leu Val Arg Val Arg Pro Asp Thr Lys Ile
260 265 270
Val Leu Lys Val Glu Arg Glu Gly Ala Gln Ile Asp Val Pro Val Thr
275 280 285
Leu Ser Val Arg Gly Glu Ala Lys Ala Ala Gly Gly Tyr Leu Gly Ala
290 295 300
Gly Val Lys Gly Val Glu Trp Pro Pro Ser Met Val Arg Glu Val Ser
305 310 315 320
Tyr Gly Pro Leu Ala Ala Ile Gly Glu Gly Ala Lys Arg Thr Trp Thr
325 330 335
Met Ser Val Leu Thr Leu Glu Ser Leu Lys Lys Met Leu Phe Gly Glu
340 345 350
Leu Ser Val Lys Asn Leu Ser Gly Pro Ile Thr Ile Ala Lys Val Ala
355 360 365
Gly Ala Ser Ala Gln Ser Gly Val Ala Asp Phe Leu Asn Phe Leu Ala
370 375 380
Tyr Leu Ser Ile Ser Leu Gly Val Leu Asn Leu Leu Pro Ile Pro Val
385 390 395 400
Leu Asp Gly Gly His Leu Leu Phe Tyr Leu Val Glu Trp Val Arg Gly
405 410 415
Arg Pro Leu Ser Asp Arg Val Gln Gly Trp Gly Ile Gln Ile Gly Ile
420 425 430
Ser Leu Val Val Gly Val Met Leu Leu Ala Leu Val Asn Asp Leu Gly
435 440 445
Arg Leu
450
<210> 25
<211> 246
<212> PRT
<213> Pseudomonas fluorescens
<400> 25
Met Lys Gln His Arg Leu Ala Ala Ala Val Ala Leu Val Ser Leu Val
1 5 10 15
Leu Ala Gly Cys Asp Ser Gln Thr Ser Val Glu Leu Lys Thr Pro Ala
20 25 30
Gln Lys Ala Ser Tyr Gly Ile Gly Leu Asn Met Gly Lys Ser Leu Ala
35 40 45
Gln Glu Gly Met Asp Asp Leu Asp Ser Lys Ala Val Ala Gln Gly Ile
50 55 60
Glu Asp Ala Val Gly Lys Lys Glu Gln Lys Leu Lys Asp Asp Glu Leu
65 70 75 80
Val Glu Ala Phe Ala Ala Leu Gln Lys Arg Ala Glu Glu Arg Met Thr
85 90 95
Lys Met Ser Glu Glu Ser Ala Ala Ala Gly Lys Lys Phe Leu Glu Asp
100 105 110
Asn Ala Lys Lys Asp Gly Val Val Thr Thr Ala Ser Gly Leu Gln Tyr
115 120 125
Lys Ile Val Lys Lys Ala Asp Gly Ala Gln Pro Lys Pro Thr Asp Val
130 135 140
Val Thr Val His Tyr Thr Gly Lys Leu Thr Asn Gly Thr Thr Phe Asp
145 150 155 160
Ser Ser Val Asp Arg Gly Ser Pro Ile Asp Leu Pro Val Ser Gly Val
165 170 175
Ile Pro Gly Trp Val Glu Gly Leu Gln Leu Met His Val Gly Glu Lys
180 185 190
Val Glu Leu Tyr Ile Pro Ser Asp Leu Ala Tyr Gly Ala Gln Ser Pro
195 200 205
Ser Pro Ala Ile Pro Ala Asn Ser Val Leu Val Phe Asp Leu Glu Leu
210 215 220
Leu Gly Ile Lys Asp Pro Ala Lys Ala Glu Ala Ala Asp Ala Pro Ala
225 230 235 240
Ala Pro Ala Ala Lys Lys
245
<210> 26
<211> 427
<212> PRT
<213> Pseudomonas fluorescens
<400> 26
Met Thr Asp Thr Arg Asn Gly Glu Asp Asn Gly Lys Leu Leu Tyr Cys
1 5 10 15
Ser Phe Cys Gly Lys Ser Gln His Glu Val Arg Lys Leu Ile Ala Gly
20 25 30
Pro Ser Val Phe Ile Cys Asp Glu Cys Val Asp Leu Cys Asn Asp Ile
35 40 45
Ile Arg Glu Glu Val Gln Glu Ala Gln Ala Glu Ser Ser Ala His Lys
50 55 60
Leu Pro Ser Pro Lys Glu Ile Ser Gly Ile Leu Asp Gln Tyr Val Ile
65 70 75 80
Gly Gln Glu Arg Ala Lys Lys Val Leu Ala Val Ala Val Tyr Asn His
85 90 95
Tyr Lys Arg Leu Asn Gln Arg Asp Lys Lys Gly Asp Glu Val Glu Leu
100 105 110
Gly Lys Ser Asn Ile Leu Leu Ile Gly Pro Thr Gly Ser Gly Lys Thr
115 120 125
Leu Leu Ala Glu Thr Leu Ala Arg Leu Leu Asn Val Pro Phe Thr Ile
130 135 140
Ala Asp Ala Thr Thr Leu Thr Glu Ala Gly Tyr Val Gly Glu Asp Val
145 150 155 160
Glu Asn Ile Ile Gln Lys Leu Leu Gln Lys Cys Asp Tyr Asp Val Glu
165 170 175
Lys Ala Gln Met Gly Ile Val Tyr Ile Asp Glu Ile Asp Lys Ile Ser
180 185 190
Arg Lys Ser Asp Asn Pro Ser Ile Thr Arg Asp Val Ser Gly Glu Gly
195 200 205
Val Gln Gln Ala Leu Leu Lys Leu Ile Glu Gly Thr Val Ala Ser Val
210 215 220
Pro Pro Gln Gly Gly Arg Lys His Pro Gln Gln Glu Phe Leu Gln Val
225 230 235 240
Asp Thr Arg Asn Ile Leu Phe Ile Cys Gly Gly Ala Phe Ser Gly Leu
245 250 255
Glu Lys Val Ile Gln Gln Arg Ser Thr Arg Gly Gly Ile Gly Phe Ser
260 265 270
Ala Glu Val Arg Ser Lys Glu Glu Gly Lys Lys Val Gly Glu Ser Leu
275 280 285
Arg Glu Val Glu Pro Asp Asp Leu Val Lys Phe Gly Leu Ile Pro Glu
290 295 300
Phe Val Gly Arg Leu Pro Val Leu Ala Thr Leu Asp Glu Leu Asp Glu
305 310 315 320
Ala Ala Leu Ile Gln Ile Leu Thr Glu Pro Lys Asn Ala Leu Thr Lys
325 330 335
Gln Tyr Gly Lys Leu Phe Glu Met Glu Gly Val Asp Leu Glu Phe Arg
340 345 350
Thr Asp Ala Leu Lys Ser Val Ala Lys Arg Ala Leu Glu Arg Lys Thr
355 360 365
Gly Ala Arg Gly Leu Arg Ser Ile Leu Glu Gly Val Leu Leu Asp Thr
370 375 380
Met Tyr Glu Ile Pro Ser Gln Ser Glu Val Ser Lys Val Val Ile Asp
385 390 395 400
Glu Ser Val Ile Glu Gly Lys Ser Lys Pro Leu Tyr Ile Tyr Glu Asn
405 410 415
Ser Glu Pro Ala Ala Lys Ala Ala Pro Asp Ala
420 425
<210> 27
<211> 756
<212> PRT
<213> Pseudomonas fluorescens
<400> 27
Met Leu Asn Arg Glu Leu Glu Val Thr Leu Asn Leu Ala Phe Lys Glu
1 5 10 15
Ala Arg Ser Lys Arg His Glu Phe Met Thr Val Glu His Leu Leu Leu
20 25 30
Ala Leu Leu Asp Asn Glu Ala Ala Ala Thr Val Leu Arg Ala Cys Gly
35 40 45
Ala Asn Leu Asp Lys Leu Lys His Asp Leu Gln Glu Phe Ile Asp Ser
50 55 60
Thr Thr Pro Leu Ile Pro Val His Asp Glu Asp Arg Glu Thr Gln Pro
65 70 75 80
Thr Leu Gly Phe Gln Arg Val Leu Gln Arg Ala Val Phe His Val Gln
85 90 95
Ser Ser Gly Lys Arg Glu Val Thr Gly Ala Asn Val Leu Val Ala Ile
100 105 110
Phe Ser Glu Gln Glu Ser Gln Ala Val Phe Leu Leu Lys Gln Gln Ser
115 120 125
Val Ala Arg Ile Asp Val Val Asn Tyr Ile Ala His Gly Ile Ser Lys
130 135 140
Val Pro Gly His Gly Asp His Ser Glu Gly Glu Gln Asp Met Gln Asp
145 150 155 160
Glu Glu Gly Gly Glu Ser Ser Ser Ser Ser Asn Pro Leu Asp Ala Tyr
165 170 175
Ala Ser Asn Leu Asn Glu Met Ala Arg Gln Gly Arg Ile Asp Pro Leu
180 185 190
Val Gly Arg Glu His Glu Val Glu Arg Val Ala Gln Ile Leu Ala Arg
195 200 205
Arg Arg Lys Asn Asn Pro Leu Leu Val Gly Glu Ala Gly Val Gly Lys
210 215 220
Thr Ala Ile Ala Glu Gly Leu Ala Lys Arg Ile Val Asp Asn Gln Val
225 230 235 240
Pro Asp Leu Leu Ala Ser Ser Val Val Tyr Ser Leu Asp Leu Gly Ala
245 250 255
Leu Leu Ala Gly Thr Lys Tyr Arg Gly Asp Phe Glu Lys Arg Phe Lys
260 265 270
Ala Leu Leu Gly Glu Leu Lys Lys Arg Pro Gln Ala Ile Leu Phe Ile
275 280 285
Asp Glu Ile His Thr Ile Ile Gly Ala Gly Ala Ala Ser Gly Gly Val
290 295 300
Met Asp Ala Ser Asn Leu Leu Lys Pro Leu Leu Ser Ser Gly Asp Ile
305 310 315 320
Arg Cys Ile Gly Ser Thr Thr Phe Gln Glu Phe Arg Gly Ile Phe Glu
325 330 335
Lys Asp Arg Ala Leu Ala Arg Arg Phe Gln Lys Val Asp Val Ser Glu
340 345 350
Pro Ser Val Glu Asp Thr Ile Gly Ile Leu Arg Gly Leu Lys Gly Arg
355 360 365
Phe Glu Ala His His Gly Ile Glu Tyr Thr Asp Glu Ala Leu Arg Ala
370 375 380
Ala Ala Glu Leu Ala Ser Arg Tyr Ile Asn Asp Arg His Met Pro Asp
385 390 395 400
Lys Ala Ile Asp Val Ile Asp Glu Ala Gly Ala Tyr Gln Arg Leu Gln
405 410 415
Pro Val Glu Lys Arg Val Lys Arg Ile Asp Val Pro Gln Val Glu Asp
420 425 430
Ile Val Ala Lys Ile Ala Arg Ile Pro Pro Lys His Val Thr Ser Ser
435 440 445
Asp Lys Glu Leu Leu Arg Asn Leu Glu Arg Asp Leu Lys Leu Thr Val
450 455 460
Phe Gly Gln Asp Ala Ala Ile Asp Ser Leu Ser Thr Ala Ile Lys Leu
465 470 475 480
Ser Arg Ala Gly Leu Lys Ser Pro Asp Lys Pro Val Gly Ser Phe Leu
485 490 495
Phe Ala Gly Pro Thr Gly Val Gly Lys Thr Glu Ala Ala Arg Gln Leu
500 505 510
Ala Lys Ala Met Gly Ile Glu Leu Val Arg Phe Asp Met Ser Glu Tyr
515 520 525
Met Glu Arg His Thr Val Ser Arg Leu Ile Gly Ala Pro Pro Gly Tyr
530 535 540
Val Gly Phe Asp Gln Gly Gly Leu Leu Thr Glu Ala Ile Thr Lys Gln
545 550 555 560
Pro His Cys Val Leu Leu Leu Asp Glu Ile Glu Lys Ala His Pro Glu
565 570 575
Val Phe Asn Leu Leu Leu Gln Val Met Asp His Gly Thr Leu Thr Asp
580 585 590
Asn Asn Gly Arg Lys Ala Asp Phe Arg Asn Val Ile Val Ile Met Thr
595 600 605
Thr Asn Ala Gly Ala Glu Thr Ala Ala Arg Ala Ser Ile Gly Phe Thr
610 615 620
His Gln Asp His Ser Ser Asp Ala Met Glu Val Ile Lys Lys Ser Phe
625 630 635 640
Thr Pro Glu Phe Arg Asn Arg Leu Asp Thr Ile Ile Gln Phe Gly Arg
645 650 655
Leu Ser His Glu Val Ile Lys Ser Val Val Asp Lys Phe Leu Thr Glu
660 665 670
Leu Gln Ala Gln Leu Glu Asp Lys Arg Val Gln Leu Asp Val Thr Glu
675 680 685
Ala Ala Arg Ser Trp Ile Ala Glu Gly Gly Tyr Asp Ala Ala Met Gly
690 695 700
Ala Arg Pro Met Ala Arg Leu Ile Gln Asp Lys Ile Lys Arg Pro Leu
705 710 715 720
Ala Glu Glu Ile Leu Phe Gly Glu Leu Ser Asp His Gly Gly Val Val
725 730 735
His Ile Asp Leu Lys Asp Gly Glu Leu Thr Phe Glu Phe Glu Thr Thr
740 745 750
Ala Glu Met Ala
755
<210> 28
<211> 243
<212> PRT
<213> Pseudomonas fluorescens
<400> 28
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Tyr Ser Thr Ser Ser Cys Ser Thr Phe Cys Lys Thr Cys
195 200 205
Trp Leu Pro Val Gly Thr Asn Ala Phe Ala Pro Thr Gly Val Cys Gln
210 215 220
Phe Leu His Gly Trp Asn Leu Pro Leu Ser Ser Val Ala Gly Arg Asn
225 230 235 240
Ala Arg Ala
<210> 29
<211> 187
<212> PRT
<213> Pseudomonas fluorescens
<400> 29
Met Leu Lys Lys Ile Ala Leu Phe Ala Gly Ser Ala Leu Phe Ala Ala
1 5 10 15
Asn Leu Met Ala Ala Glu Pro Ala Lys Ala Pro His Val Leu Leu Asp
20 25 30
Thr Thr Asn Gly Gln Ile Glu Ile Glu Leu Asp Pro Val Lys Ala Pro
35 40 45
Ile Ser Thr Lys Asn Phe Leu Glu Tyr Val Asp Ser Gly Phe Tyr Thr
50 55 60
Asn Thr Ile Phe His Arg Val Ile Pro Gly Phe Met Val Gln Gly Gly
65 70 75 80
Gly Phe Thr Gln Gln Met Gln Gln Lys Asp Thr Lys Ala Pro Ile Lys
85 90 95
Asn Glu Ala Ser Asn Gly Leu His Asn Val Arg Gly Thr Leu Ser Met
100 105 110
Ala Arg Thr Ser Asn Pro Asn Ser Ala Thr Ser Gln Phe Phe Ile Asn
115 120 125
Val Ala Asp Asn Ala Phe Leu Asp Pro Gly Arg Asp Ala Gly Tyr Ala
130 135 140
Val Phe Ala Lys Val Val Lys Gly Met Asp Val Val Asp Ile Ile Val
145 150 155 160
Asn Ser Gln Thr Thr Thr Lys Gln Gly Met Gln Asn Val Pro Ile Asp
165 170 175
Pro Val Leu Ile Lys Ser Ala Lys Arg Ile Asp
180 185
<210> 30
<211> 674
<212> PRT
<213> Pseudomonas fluorescens
<400> 30
Met Pro Glu Ser Asn Pro Leu Leu Leu Pro Tyr Asp Leu Pro Pro Phe
1 5 10 15
Ser Ala Ile Arg Ala Glu His Leu Val Pro Ala Ile Glu Gln Ile Ile
20 25 30
Thr Glu Ser Arg Asn Thr Thr Ala Thr Ile Ile Ala Ser Gln Thr Pro
35 40 45
Phe Pro Thr Trp Asp Asp Leu Val Gln Ala Val Glu Ala Leu Glu Ala
50 55 60
Arg Leu Asp Gly Val Leu Lys Ile Ile Glu Leu Leu Asp Ser His Pro
65 70 75 80
Gln Gly Pro Ala Trp Thr Leu Ala Ser His Arg Ser Tyr Glu Leu Ala
85 90 95
Met Gln Tyr Arg Val Glu Leu Ala Gly Asn Asn Asp Leu Tyr Gln Leu
100 105 110
His Arg Gln Leu Ala Asp Ser Pro Ile Ala Thr Leu Phe Asn Glu Gln
115 120 125
Arg His Ser Ala Leu Arg Lys Ile Leu Arg Lys Tyr His Leu Ala Gly
130 135 140
Leu Asp Leu Ser Pro Glu Lys Gln Arg Arg Leu Lys Ala Leu Asn Leu
145 150 155 160
Gln Ile Asp Glu Phe Ser His Glu Phe Leu Arg Arg Val Ser Asp Ser
165 170 175
Ser Asp Ala Trp Arg Lys His Ile Gln Asp Lys Ala Leu Leu Ser Gly
180 185 190
Leu Pro Asp Ala Ala Leu Ala Arg Leu Glu Phe Ala Ala Arg Asp Ala
195 200 205
Gly Leu Gly Gly Trp Leu Leu Thr Leu Ser Lys Gln Ser Phe Gln Glu
210 215 220
Val Met Ser Tyr Ala Asp His Arg Ala Leu Arg Gln Glu Met Met Leu
225 230 235 240
Ala Tyr Tyr Ser Arg Ala Val Gly Thr Gly Pro Asp Ala Ile Ala Thr
245 250 255
Asp Asn Glu Ala Val Leu Thr Val Leu Leu Asp Ser Arg His Gln Lys
260 265 270
Ala Gln Leu Leu Gly Tyr Ala Asn Phe Ala Glu Leu Ala Leu Val Glu
275 280 285
Gln Met Ala Glu Thr Thr Asp Glu Val Thr Ala Cys Val His Gln Gln
290 295 300
Ile Asp Gln Ala Arg Thr Thr Phe Ala His Asp Ala Gln Gln Leu Gln
305 310 315 320
Arg Tyr Ala Ala Gln Arg Gly Val Asp Ala Leu Glu Pro Trp Asp Tyr
325 330 335
Asp Phe Phe Ala Glu Lys Ile Arg Gln Asp Val Ala Gly Val Ser Gln
340 345 350
Asp Ala Val Arg Leu Tyr Phe Pro Leu Glu Thr Val Leu Gln Arg Leu
355 360 365
Cys Thr Phe Thr Gln Thr Leu Phe Gly Val Glu Leu Ile Glu Gln Ala
370 375 380
Thr Val Asp Thr Trp His Pro Asp Val Arg Val Phe Glu Leu Arg Glu
385 390 395 400
Tyr Ala Gln Pro Ile Gly His Leu Phe Ile Asp Pro Tyr Arg Arg Val
405 410 415
Ala Gly Gly Glu Ile Gly Ala Ala Met Gly Leu Arg Asn His Arg Met
420 425 430
Thr Ala Glu Gly Arg Pro Gln Arg Pro Ile Ala Val Leu Arg Ser Gln
435 440 445
Leu Pro Arg Pro Thr Ala Ala Gln Pro Cys Leu Leu Asp His Leu Gln
450 455 460
Leu Arg Val Leu Leu His Glu Phe Gly His Cys Leu Gln His Leu Leu
465 470 475 480
Ser Ala Ala Pro Tyr Arg Ala Ile Ser Gly Met Gly Gln Leu Ser His
485 490 495
Asp Thr Thr Glu Phe Phe Gly Leu Val Leu Glu Gln Phe Cys Leu Thr
500 505 510
Pro Ser Phe Leu Ile Tyr Leu Ser Gly His Val Gln Thr Gly Asp Pro
515 520 525
Leu Pro Asp Lys Met Ala Thr Gln Met Ser Arg Phe Ala His Thr Gln
530 535 540
Thr Ser Gln Glu Thr Ala Ser Ile Leu Leu Thr Gly Leu Val Asp Phe
545 550 555 560
Glu Leu His Arg Thr Tyr Gly Asp Gly Arg Thr Pro His Glu Val Phe
565 570 575
Thr Asp Ala Asn Val Glu Val Gly His Leu Gln Trp Pro Asp Gly Ala
580 585 590
Arg Pro Ile Asn Ser Phe Glu Gln Pro Met Gly Ser Tyr Gly Ala Lys
595 600 605
Leu Tyr Ser Tyr Thr Trp Ser Gly Val Leu Ala Arg Gln Ala Phe Glu
610 615 620
Arg Phe Glu Arg Asp Gly Leu Phe Asn Pro Gln Thr Gly Lys Ala Phe
625 630 635 640
Arg Asp Ala Phe Ile Thr Glu Gly Asp Thr Gly Thr Leu Leu Ser Ala
645 650 655
Leu Ala Leu Phe Arg Gly Asp Gly Ala Gly Cys Val Gly His Ser Thr
660 665 670
Gly Val
<210> 31
<211> 235
<212> PRT
<213> Bos taurus
<400> 31
Ile Val Gly Gly Ser Asp Ser Arg Glu Gly Ala Trp Pro Trp Val Val
1 5 10 15
Ala Leu Tyr Phe Asp Asp Gln Gln Val Cys Gly Ala Ser Leu Val Ser
20 25 30
Arg Asp Trp Leu Val Ser Ala Ala His Cys Val Tyr Gly Arg Asn Met
35 40 45
Glu Pro Ser Lys Trp Lys Ala Val Leu Gly Leu His Met Ala Ser Asn
50 55 60
Leu Thr Ser Pro Gln Ile Glu Thr Arg Leu Ile Asp Gln Ile Val Ile
65 70 75 80
Asn Arg His Tyr Asn Lys Arg Arg Lys Asn Asn Asp Ile Ala Met Met
85 90 95
His Leu Glu Met Lys Val Asn Tyr Thr Asp Tyr Ile Gln Pro Ile Cys
100 105 110
Leu Pro Glu Glu Asn Gln Val Phe Pro Pro Gly Arg Ile Cys Ser Ile
115 120 125
Ala Gly Trp Gly Ala Leu Ile Tyr Gln Gly Ser Thr Ala Asp Val Leu
130 135 140
Gln Glu Ala Asp Val Pro Leu Leu Ser Asn Glu Lys Cys Gln Gln Gln
145 150 155 160
Met Pro Glu Tyr Asn Ile Thr Glu Asn Met Val Cys Ala Gly Tyr Asp
165 170 175
Ala Gly Gly Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Met
180 185 190
Cys Gln Glu Asn Asn Arg Trp Leu Leu Ala Gly Val Thr Ser Phe Gly
195 200 205
Tyr Gln Cys Ala Leu Pro Asn Arg Pro Gly Val Tyr Ala Arg Val Pro
210 215 220
Arg Phe Thr Glu Trp Ile Gln Ser Phe Leu His
225 230 235
<210> 32
<211> 86
<212> PRT
<213> Homo sapiens
<400> 32
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro
35 40 45
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
50 55 60
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
65 70 75 80
Leu Glu Asn Tyr Cys Asn
85
<210> 33
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Lys Pro Thr Glu Ala
20 25 30
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
35 40 45
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
50 55 60
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
65 70 75 80
Asn Tyr Cys Asn
<210> 34
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 34
Phe Val Lys Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Glu Thr Arg Arg
20 25 30
Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro
35 40 45
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
50 55 60
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
65 70 75 80
Leu Glu Asn Tyr Cys Asn
85
<210> 35
<211> 70
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Gly Pro Glu Thr Leu Cys Gly Ala Glu Leu Val Asp Ala Leu Gln Phe
1 5 10 15
Val Cys Gly Asp Arg Gly Phe Tyr Phe Asn Lys Pro Thr Gly Tyr Gly
20 25 30
Ser Ser Ser Arg Arg Ala Pro Gln Thr Gly Ile Val Asp Glu Cys Cys
35 40 45
Phe Arg Ser Cys Asp Leu Arg Arg Leu Glu Met Tyr Cys Ala Pro Leu
50 55 60
Lys Pro Ala Lys Ser Ala
65 70
<210> 36
<211> 31
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
GLP-1 sequence
<400> 36
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 37
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu
1 5 10 15
Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser
20 25 30
Ser Gly Ala Pro Pro Pro Ser
35
<210> 38
<211> 33
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
GLP-2 sequence
<400> 38
His Ala Asp Gly Ser Phe Ser Asp Glu Met Asn Thr Ile Leu Asp Asn
1 5 10 15
Leu Ala Ala Arg Asp Phe Ile Asn Trp Leu Ile Gln Thr Lys Ile Thr
20 25 30
Asp
<210> 39
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 39
His Gly Asp Gly Ser Phe Ser Asp Glu Met Asn Thr Ile Leu Asp Asn
1 5 10 15
Leu Ala Ala Arg Asp Phe Ile Asn Trp Leu Ile Gln Thr Lys Ile Thr
20 25 30
Asp
<210> 40
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 40
Lys Cys Asn Thr Ala Thr Cys Ala Thr Gln Arg Leu Ala Asn Phe Leu
1 5 10 15
Val His Ser Ser Asn Asn Phe Gly Pro Ile Leu Pro Pro Thr Asn Val
20 25 30
Gly Ser Asn Thr Tyr
35
<210> 41
<211> 71
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 41
Met Lys Leu Thr Cys Val Val Ile Val Ala Val Leu Leu Leu Thr Ala
1 5 10 15
Cys Gln Leu Ile Thr Ala Asp Asp Ser Arg Gly Thr Gln Lys His Arg
20 25 30
Ala Leu Arg Ser Thr Thr Lys Leu Ser Thr Ser Thr Arg Cys Lys Gly
35 40 45
Lys Gly Ala Lys Cys Ser Arg Leu Met Tyr Asp Cys Cys Thr Gly Ser
50 55 60
Cys Arg Ser Gly Lys Cys Gly
65 70
<210> 42
<211> 109
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 42
Ser Leu Gly Ser Leu Thr Ile Ala Glu Pro Ala Met Ile Ala Glu Cys
1 5 10 15
Lys Thr Arg Thr Glu Val Phe Glu Ile Ser Arg Arg Leu Ile Asp Arg
20 25 30
Thr Asn Ala Asn Phe Leu Val Trp Pro Pro Cys Val Glu Val Gln Arg
35 40 45
Cys Ser Gly Cys Cys Asn Asn Arg Asn Val Gln Cys Arg Pro Thr Gln
50 55 60
Val Gln Leu Arg Pro Val Gln Val Arg Lys Ile Glu Ile Val Arg Lys
65 70 75 80
Lys Pro Ile Phe Lys Lys Ala Thr Val Thr Leu Glu Asp His Leu Ala
85 90 95
Cys Lys Cys Glu Thr Val Ala Ala Ala Arg Pro Val Thr
100 105
<210> 43
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 43
Tyr Thr Ser Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln
1 5 10 15
Glu Lys Asn Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu
20 25 30
Trp Asn Trp Phe
35
<210> 44
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 44
Ser Pro Lys Met Val Gln Gly Ser Gly Cys Phe Gly Arg Lys Met Asp
1 5 10 15
Arg Ile Ser Ser Ser Ser Gly Leu Gly Cys Lys Val Leu Arg Arg His
20 25 30
<210> 45
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 45
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys
100 105 110
His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln
115 120 125
Asp Val His Asn Phe
130
<210> 46
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His
225 230 235 240
Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp
245 250 255
Val His Asn Phe
260
<210> 47
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 47
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys Ser Val
225 230 235 240
Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn Ser Met
245 250 255
Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His Asn Phe
260 265 270
<210> 48
<211> 334
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser Asp Asp Asp Asp Lys Ile Val Gly
85 90 95
Gly Ser Asp Ser Arg Glu Gly Ala Trp Pro Trp Val Val Ala Leu Tyr
100 105 110
Phe Asp Asp Gln Gln Val Cys Gly Ala Ser Leu Val Ser Arg Asp Trp
115 120 125
Leu Val Ser Ala Ala His Cys Val Tyr Gly Arg Asn Met Glu Pro Ser
130 135 140
Lys Trp Lys Ala Val Leu Gly Leu His Met Ala Ser Asn Leu Thr Ser
145 150 155 160
Pro Gln Ile Glu Thr Arg Leu Ile Asp Gln Ile Val Ile Asn Arg His
165 170 175
Tyr Asn Lys Arg Arg Lys Asn Asn Asp Ile Ala Met Met His Leu Glu
180 185 190
Met Lys Val Asn Tyr Thr Asp Tyr Ile Gln Pro Ile Cys Leu Pro Glu
195 200 205
Glu Asn Gln Val Phe Pro Pro Gly Arg Ile Cys Ser Ile Ala Gly Trp
210 215 220
Gly Ala Leu Ile Tyr Gln Gly Ser Thr Ala Asp Val Leu Gln Glu Ala
225 230 235 240
Asp Val Pro Leu Leu Ser Asn Glu Lys Cys Gln Gln Gln Met Pro Glu
245 250 255
Tyr Asn Ile Thr Glu Asn Met Val Cys Ala Gly Tyr Asp Ala Gly Gly
260 265 270
Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Met Cys Gln Glu
275 280 285
Asn Asn Arg Trp Leu Leu Ala Gly Val Thr Ser Phe Gly Tyr Gln Cys
290 295 300
Ala Leu Pro Asn Arg Pro Gly Val Tyr Ala Arg Val Pro Arg Phe Thr
305 310 315 320
Glu Trp Ile Gln Ser Phe Leu His His His His His His His
325 330
<210> 49
<211> 461
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 49
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser Asp Asp Asp Asp Lys Ile Val Gly Gly
210 215 220
Ser Asp Ser Arg Glu Gly Ala Trp Pro Trp Val Val Ala Leu Tyr Phe
225 230 235 240
Asp Asp Gln Gln Val Cys Gly Ala Ser Leu Val Ser Arg Asp Trp Leu
245 250 255
Val Ser Ala Ala His Cys Val Tyr Gly Arg Asn Met Glu Pro Ser Lys
260 265 270
Trp Lys Ala Val Leu Gly Leu His Met Ala Ser Asn Leu Thr Ser Pro
275 280 285
Gln Ile Glu Thr Arg Leu Ile Asp Gln Ile Val Ile Asn Arg His Tyr
290 295 300
Asn Lys Arg Arg Lys Asn Asn Asp Ile Ala Met Met His Leu Glu Met
305 310 315 320
Lys Val Asn Tyr Thr Asp Tyr Ile Gln Pro Ile Cys Leu Pro Glu Glu
325 330 335
Asn Gln Val Phe Pro Pro Gly Arg Ile Cys Ser Ile Ala Gly Trp Gly
340 345 350
Ala Leu Ile Tyr Gln Gly Ser Thr Ala Asp Val Leu Gln Glu Ala Asp
355 360 365
Val Pro Leu Leu Ser Asn Glu Lys Cys Gln Gln Gln Met Pro Glu Tyr
370 375 380
Asn Ile Thr Glu Asn Met Val Cys Ala Gly Tyr Asp Ala Gly Gly Val
385 390 395 400
Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Met Cys Gln Glu Asn
405 410 415
Asn Arg Trp Leu Leu Ala Gly Val Thr Ser Phe Gly Tyr Gln Cys Ala
420 425 430
Leu Pro Asn Arg Pro Gly Val Tyr Ala Arg Val Pro Arg Phe Thr Glu
435 440 445
Trp Ile Gln Ser Phe Leu His His His His His His His
450 455 460
<210> 50
<211> 499
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 50
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Asp Asp Asp
245 250 255
Asp Lys Ile Val Gly Gly Ser Asp Ser Arg Glu Gly Ala Trp Pro Trp
260 265 270
Val Val Ala Leu Tyr Phe Asp Asp Gln Gln Val Cys Gly Ala Ser Leu
275 280 285
Val Ser Arg Asp Trp Leu Val Ser Ala Ala His Cys Val Tyr Gly Arg
290 295 300
Asn Met Glu Pro Ser Lys Trp Lys Ala Val Leu Gly Leu His Met Ala
305 310 315 320
Ser Asn Leu Thr Ser Pro Gln Ile Glu Thr Arg Leu Ile Asp Gln Ile
325 330 335
Val Ile Asn Arg His Tyr Asn Lys Arg Arg Lys Asn Asn Asp Ile Ala
340 345 350
Met Met His Leu Glu Met Lys Val Asn Tyr Thr Asp Tyr Ile Gln Pro
355 360 365
Ile Cys Leu Pro Glu Glu Asn Gln Val Phe Pro Pro Gly Arg Ile Cys
370 375 380
Ser Ile Ala Gly Trp Gly Ala Leu Ile Tyr Gln Gly Ser Thr Ala Asp
385 390 395 400
Val Leu Gln Glu Ala Asp Val Pro Leu Leu Ser Asn Glu Lys Cys Gln
405 410 415
Gln Gln Met Pro Glu Tyr Asn Ile Thr Glu Asn Met Val Cys Ala Gly
420 425 430
Tyr Asp Ala Gly Gly Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro
435 440 445
Leu Met Cys Gln Glu Asn Asn Arg Trp Leu Leu Ala Gly Val Thr Ser
450 455 460
Phe Gly Tyr Gln Cys Ala Leu Pro Asn Arg Pro Gly Val Tyr Ala Arg
465 470 475 480
Val Pro Arg Phe Thr Glu Trp Ile Gln Ser Phe Leu His His His His
485 490 495
His His His
<210> 51
<211> 241
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 51
Ile Val Gly Gly Ser Asp Ser Arg Glu Gly Ala Trp Pro Trp Val Val
1 5 10 15
Ala Leu Tyr Phe Asp Asp Gln Gln Val Cys Gly Ala Ser Leu Val Ser
20 25 30
Arg Asp Trp Leu Val Ser Ala Ala His Cys Val Tyr Gly Arg Asn Met
35 40 45
Glu Pro Ser Lys Trp Lys Ala Val Leu Gly Leu His Met Ala Ser Asn
50 55 60
Leu Thr Ser Pro Gln Ile Glu Thr Arg Leu Ile Asp Gln Ile Val Ile
65 70 75 80
Asn Arg His Tyr Asn Lys Arg Arg Lys Asn Asn Asp Ile Ala Met Met
85 90 95
His Leu Glu Met Lys Val Asn Tyr Thr Asp Tyr Ile Gln Pro Ile Cys
100 105 110
Leu Pro Glu Glu Asn Gln Val Phe Pro Pro Gly Arg Ile Cys Ser Ile
115 120 125
Ala Gly Trp Gly Ala Leu Ile Tyr Gln Gly Ser Thr Ala Asp Val Leu
130 135 140
Gln Glu Ala Asp Val Pro Leu Leu Ser Asn Glu Lys Cys Gln Gln Gln
145 150 155 160
Met Pro Glu Tyr Asn Ile Thr Glu Asn Met Val Cys Ala Gly Tyr Asp
165 170 175
Ala Gly Gly Val Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Met
180 185 190
Cys Gln Glu Asn Asn Arg Trp Leu Leu Ala Gly Val Thr Ser Phe Gly
195 200 205
Tyr Gln Cys Ala Leu Pro Asn Arg Pro Gly Val Tyr Ala Arg Val Pro
210 215 220
Arg Phe Thr Glu Trp Ile Gln Ser Phe Leu His His His His His His
225 230 235 240
His
<210> 52
<211> 431
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
actagtagga ggtctagaat gaaagtcgaa ccgggtctgt accagcatta caagggtccc 60
caatatcgcg tgttttcggt agcgcggcac agcgaaaccg aagaagaagt ggtgttctac 120
caagcgctct acggcgagta cggcttctgg gtgcgtccgc tgtcgatgtt cctggagact 180
gtcgaggtag acggtgagca agtcccgcgc ttcgccctgg tgacggccga gcccagcctg 240
ttcaccggcc agggcggggg cggcagcggc gtgggggctc gcatcaccac caccatcacg 300
acgacgacga taagagcgtg tccgagatcc agctcatgca taatctgggc aagcacttga 360
acagcatgga gcgcgtggag tggctccgga agaaactgca agatgtccac aacttttaat 420
gatagctcga g 431
<210> 53
<211> 431
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
actagtagga ggtctagaat gaaagtcgaa ccagggctct accagcatta caaggggccg 60
cagtaccgtg ttttcagcgt ggcgcgccac tctgaaaccg aagaagaagt ggtgttttac 120
caagcgctgt atggcgaata cggcttttgg gtgcgccctt tgagcatgtt cctggagacc 180
gtcgaagttg acggcgagca ggtcccgcgc tttgctttgg tcacggccga acccagtctt 240
tttacagggc aaggtggcgg tggttcgggc gtggcggcag ccatcatcac caccaccacg 300
acgacgatga taagagcgtg tccgagatcc aactgatgca taatctgggc aagcacctga 360
actcgatgga gcgggtagag tggctccgga aaaagctcca agacgtgcac aacttctaat 420
gatagctcga g 431
<210> 54
<211> 815
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 54
actagtagga ggtctagaat gagcgaagtc aacttgagca ctgatgaaac ccgggtaagc 60
tatggtattg ggcggcagct gggggaccaa ctgcgggaca acccgcctcc cggcgtgagc 120
ctcgacgcga tcctcgcggg tctgaccgac gccttcgccg gcaagccgag ccgcgtggac 180
caagaacaga tggccgcctc gttcaaggtc atccgcgaaa tcatgcaggc cgaagcggca 240
gcgaaggccg aggccgcagc gggtgccggc ctggcgttcc tggccgagaa cgccaagcgt 300
gacggcatca cgaccctggc gtcgggcctc caattcgaag tcctgacggc cggtactggc 360
gcgaagccca ctcgcgagga tcaggtgcgc acccacctac catggcacgc tgatcgatgg 420
caccgtattc gacagcagct acgagcgtgg ccaaccggcg gagtttccgg tgggcggtgt 480
gatcgccggc tggaccgagg ccctgcaact catgaacgcg gggctcgaag tggcgcgtgt 540
acgtccccag cgagctggcg tacggtgcgc aaggcgtggg ctcgattccg ccccacagcg 600
tactcgtctt tgacgtggaa ctgctggatg tgctgggcgg tggcgggagt gggggtggcg 660
gctcccacca ccatcaccac catgatgacg atgacaagtc cgtgtcggag atccagctga 720
tgcataatct cggcaagcac ctgaactcga tggagcgcgt cgagtggctc cgcaaaaagc 780
tccaagacgt gcacaacttc taatgatagc tcgag 815
<210> 55
<211> 815
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 55
actagtagga ggtctagaat gtccgaagtt aatctgtcca ccgacgaaac ccgcgtcagc 60
tacggtatcg gccgtcagtt gggcgaccaa ctgcgtgaca acccgccacc gggcgtcagc 120
ctggacgcga tcctggccgg cctgaccgac gcgttcgcag gcaagccaag ccgtgttgac 180
caagagcaaa tggcggccag cttcaaagtg atccgcgaaa tcatgcaagc cgaagccgct 240
gccaaggctg aagctgcagc aggcgctggc ctggctttcc tggcggaaaa cgccaagcgt 300
gatggcatca ccaccctggc ttccggcctg caatttgaag tgctgacggc tggtaccggc 360
gccaagccga cccgtgaaga ccaagtgcgt actcacctac cacggcaccc tgatcgacgg 420
cactgtgttc gacagctcct acgagcgcgg ccagcctgca gaattcccgg ttggcggcgt 480
gatcgccggc tggaccgaag ccctgcaact gatgaatgcc gggcagcaaa tggcgcgtgt 540
acgtgccgag cgaactggct tacggcgctc aaggcgttgg cagcatcccg ccgcacagcg 600
ttctggtatt cgacgtcgag ctgctcgacg ttctgggtgg gggtgggtcg ggtggtggtg 660
ggtcgcatca tcatcaccac cacgatgatg atgataagag tgtctcggag attcagctca 720
tgcacaacct cggtaagcat ctcaactcga tggagcgggt agagtggctc cggaagaaac 780
tccaagatgt gcacaacttt taatgatagc tcgag 815
<210> 56
<211> 847
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 56
actagtagga ggtctagaat gtccaccccc ctgaagattg attttgtctc cgacgtatcg 60
tgcccgtggt gtatcatcgg cctgcgtggc ctgactgaag ccctcgacca actgggcagc 120
gaagtccagg ccgagatcca cttccaaccg tttgagctga accccaacat gcctgccgag 180
ggccaaaaca tcgtggagca tatcacggag aagtacggca gcaccgccga ggaatcgcag 240
gcgaaccgtg cgcggatccg ggatatgggt ccgcactcgg gttcgcgttc cgcacggacg 300
gccagtcgcg catctacaat actttcgatg cccaccggct cctgcattgg gccggtctgg 360
aaggcctgca atacaacctg aaagaagcgc tgttcaaggc ctacttctcg gacggccaag 420
acccgtcgga ccacgcgacc ctcgcgatca tcgccgagag tgtagggctg gacttggccc 480
gcgcggccga aattctcgcg agcgacgagt atgccgcgga agtccgggag caagagcagc 540
tctgggtgag ccgcggtgtg agcagcgtcc ccaccatcgt gttcaacgat cagtacgccg 600
tgagcggtgg ccaacccgcg gaagccttcg tgggcgcgat ccgccagaca tcaacgagtc 660
aaagtcgggc ggtggcggca gcggcggtgg tggcagccat caccatcatc accacgacga 720
cgatgataag tccgtgtcgg agatccaact gatgcacaat ctcgggaagc acctgaacag 780
catggagcgc gtcgaatggc tgcgcaagaa actgcaagac gtgcacaact tttaatgata 840
gctcgag 847
<210> 57
<211> 848
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 57
actagtagga ggtctagaat gagtactccc ctgaaaatcg atttcgtcag cgacgtatcc 60
tgcccctggt gcatcatcgg cctgcgcggc ttgaccgaag ccctcgacca gctcggcagc 120
gaggtgcagg ccgagattca ttttcaaccg ttcgaactga acccgaacat gcccgccgaa 180
ggtcagaaca tcgtcgagca cattaccgaa aagtacggct ccacggctga agagtcccag 240
gctaatcgtg cgcgtatccg tgacatgggc ccgcgttggg ctttgctttt cgcaccgatg 300
gccagagccg tatctacaac accttcgacg cgcaccgtct gttgcactgg gccgggttgg 360
aaggcttgca gtacaacctc aaggaagcgc tgttcaaggc gtacttcagc gatggccagg 420
acccttccga ccacgcgacc ttggcgatca tcgccgaaag cgtcgggctg gaccttgcgc 480
gcgccgccga gattcttgcc agcgatgaat acgccgccga ggtccgcgag caggagcagc 540
tgtgggtttc ccgtggggtg agttcggtgc cgaccattgt cttcaatgac caatatgcgg 600
tgagcggtgg gcaaccggct gaagccttcg tgggtgcgat tcgccagatc atcaacgaat 660
ccaaatccgg tggtggcggc tcgggcggtg gtggctcgca tcatcatcac caccacgatg 720
acgatgacaa gagcgtatcg gagatccaac tcatgcacaa cctgggcaag cacctcaact 780
cgatggagcg ggtggagtgg ctgcggaaga aactgcaaga cgtgcataac ttctaatgat 840
agctcgag 848
<210> 58
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 58
actagtagga ggtctaga 18
<210> 59
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 60
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 60
aggagg 6
<210> 61
<211> 100
<212> PRT
<213> Pseudomonas fluorescens
<400> 61
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu
100
<210> 62
<211> 50
<212> PRT
<213> Pseudomonas fluorescens
<400> 62
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro
50
<210> 63
<211> 100
<212> PRT
<213> Pseudomonas fluorescens
<400> 63
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr
100
<210> 64
<211> 50
<212> PRT
<213> Pseudomonas fluorescens
<400> 64
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn
50
<210> 65
<211> 248
<212> PRT
<213> Pseudomonas fluorescens
<400> 65
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro
245
<210> 66
<211> 99
<212> PRT
<213> Pseudomonas fluorescens
<400> 66
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr
<210> 67
<211> 50
<212> PRT
<213> Pseudomonas fluorescens
<400> 67
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn
50
<210> 68
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 68
atatgctctt caaagatgac tcctctgggt cctgcaagta gtctgccgca aagttttctc 60
ctgaagtgcc tggaacaggt gcgcaaaatt cagggcgacg gcgcagcact gcaggaaaaa 120
ctgtgcgcga cctataagtt gtgccacccc gaagaactgg tgctgctggg ccatagcctg 180
gggattccat gggcgccgct gtcgtcctgt cctagtcaag ccttgcaatt ggccggttgc 240
ctctcgcaac tgcatagcgg cctgttcctg taccaaggcc tgctgcaggc cttggaaggc 300
atctccccgg aactgggccc gacgctggat accctgcaac tggacgtagc agatttcgcc 360
acgaccatct ggcagcagat ggaagaactg ggcatggccc cggccctcca gcccacgcaa 420
ggcgcgatgc ctgcattcgc ctcggcgttt caacgccgtg cgggtggcgt gctggtagcc 480
agccatttgc agagctttct ggaggtgagc tatcgcgtcc tccgtcatct cgcccaaccg 540
tgataatagt tcagaagagc atat 564
<210> 69
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 69
Met Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu
1 5 10 15
Lys Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu
20 25 30
Gln Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu
35 40 45
Val Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser
50 55 60
Cys Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His
65 70 75 80
Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile
85 90 95
Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala
100 105 110
Asp Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala
115 120 125
Pro Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala
130 135 140
Phe Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser
145 150 155 160
Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
165 170 175
<210> 70
<211> 274
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 70
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys Met Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser
100 105 110
Phe Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly
115 120 125
Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro
130 135 140
Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro
145 150 155 160
Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser
165 170 175
Gln Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu
180 185 190
Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu
195 200 205
Asp Val Ala Asp Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu
210 215 220
Gly Met Ala Pro Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe
225 230 235 240
Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His
245 250 255
Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala
260 265 270
Gln Pro
<210> 71
<211> 444
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 71
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Asp Asp Asp Asp Lys Met Thr Pro
260 265 270
Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu
275 280 285
Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys
290 295 300
Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu Leu
305 310 315 320
Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser
325 330 335
Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly Leu
340 345 350
Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu
355 360 365
Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe Ala
370 375 380
Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala Leu
385 390 395 400
Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln Arg
405 410 415
Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe Leu Glu
420 425 430
Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
435 440
<210> 72
<211> 296
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 72
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Met Thr Pro Leu Gly Pro Ala
115 120 125
Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg
130 135 140
Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr
145 150 155 160
Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu
165 170 175
Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln
180 185 190
Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly Leu Phe Leu Tyr Gln
195 200 205
Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr
210 215 220
Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe Ala Thr Thr Ile Trp
225 230 235 240
Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gln Pro Thr Gln
245 250 255
Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly
260 265 270
Val Leu Val Ala Ser His Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg
275 280 285
Val Leu Arg His Leu Ala Gln Pro
290 295
<210> 73
<211> 246
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 73
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Met Thr Pro Leu Gly Pro Ala Ser Ser
65 70 75 80
Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Ile
85 90 95
Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr Tyr Lys
100 105 110
Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly Ile
115 120 125
Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln Leu Ala
130 135 140
Gly Cys Leu Ser Gln Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu
145 150 155 160
Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr Leu Asp
165 170 175
Thr Leu Gln Leu Asp Val Ala Asp Phe Ala Thr Thr Ile Trp Gln Gln
180 185 190
Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gln Pro Thr Gln Gly Ala
195 200 205
Met Pro Ala Phe Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly Val Leu
210 215 220
Val Ala Ser His Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg Val Leu
225 230 235 240
Arg His Leu Ala Gln Pro
245
<210> 74
<211> 401
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 74
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys Met Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe
225 230 235 240
Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala
245 250 255
Ala Leu Gln Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu
260 265 270
Glu Leu Val Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu
275 280 285
Ser Ser Cys Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln
290 295 300
Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu
305 310 315 320
Gly Ile Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp
325 330 335
Val Ala Asp Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly
340 345 350
Met Ala Pro Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala
355 360 365
Ser Ala Phe Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu
370 375 380
Gln Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln
385 390 395 400
Pro
<210> 75
<211> 296
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 75
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Met Thr Pro Leu Gly Pro Ala
115 120 125
Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg
130 135 140
Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr
145 150 155 160
Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu
165 170 175
Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln
180 185 190
Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly Leu Phe Leu Tyr Gln
195 200 205
Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr
210 215 220
Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe Ala Thr Thr Ile Trp
225 230 235 240
Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gln Pro Thr Gln
245 250 255
Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly
260 265 270
Val Leu Val Ala Ser His Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg
275 280 285
Val Leu Arg His Leu Ala Gln Pro
290 295
<210> 76
<211> 246
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 76
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Met Thr Pro Leu Gly Pro Ala Ser Ser
65 70 75 80
Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Ile
85 90 95
Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr Tyr Lys
100 105 110
Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly Ile
115 120 125
Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln Leu Ala
130 135 140
Gly Cys Leu Ser Gln Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu
145 150 155 160
Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr Leu Asp
165 170 175
Thr Leu Gln Leu Asp Val Ala Asp Phe Ala Thr Thr Ile Trp Gln Gln
180 185 190
Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gln Pro Thr Gln Gly Ala
195 200 205
Met Pro Ala Phe Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly Val Leu
210 215 220
Val Ala Ser His Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg Val Leu
225 230 235 240
Arg His Leu Ala Gln Pro
245
<210> 77
<211> 413
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 77
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys Met Thr
225 230 235 240
Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys Cys
245 250 255
Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu
260 265 270
Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu
275 280 285
Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro
290 295 300
Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly
305 310 315 320
Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro
325 330 335
Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe
340 345 350
Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala
355 360 365
Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln
370 375 380
Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe Leu
385 390 395 400
Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
405 410
<210> 78
<211> 296
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 78
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Met Thr Pro Leu Gly Pro Ala
115 120 125
Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg
130 135 140
Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr
145 150 155 160
Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu
165 170 175
Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln
180 185 190
Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly Leu Phe Leu Tyr Gln
195 200 205
Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr
210 215 220
Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe Ala Thr Thr Ile Trp
225 230 235 240
Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gln Pro Thr Gln
245 250 255
Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly
260 265 270
Val Leu Val Ala Ser His Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg
275 280 285
Val Leu Arg His Leu Ala Gln Pro
290 295
<210> 79
<211> 246
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 79
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Met Thr Pro Leu Gly Pro Ala Ser Ser
65 70 75 80
Leu Pro Gln Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Ile
85 90 95
Gln Gly Asp Gly Ala Ala Leu Gln Glu Lys Leu Cys Ala Thr Tyr Lys
100 105 110
Leu Cys His Pro Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly Ile
115 120 125
Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gln Ala Leu Gln Leu Ala
130 135 140
Gly Cys Leu Ser Gln Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu
145 150 155 160
Leu Gln Ala Leu Glu Gly Ile Ser Pro Glu Leu Gly Pro Thr Leu Asp
165 170 175
Thr Leu Gln Leu Asp Val Ala Asp Phe Ala Thr Thr Ile Trp Gln Gln
180 185 190
Met Glu Glu Leu Gly Met Ala Pro Ala Leu Gln Pro Thr Gln Gly Ala
195 200 205
Met Pro Ala Phe Ala Ser Ala Phe Gln Arg Arg Ala Gly Gly Val Leu
210 215 220
Val Ala Ser His Leu Gln Ser Phe Leu Glu Val Ser Tyr Arg Val Leu
225 230 235 240
Arg His Leu Ala Gln Pro
245
<210> 80
<211> 297
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 80
atatgctctt caaagtttgt aaaccaacac ctgtgtggct cccatctcgt cgaagccctg 60
tacctcgtct gcggtgagcg cggcttcttc tacactccca agacccggcg tgaagccgag 120
gacttgcaag tgggccaagt ggagctcggc ggtggtcccg gtgcgggcag cctgcaaccg 180
ctcgcgctgg aagggtcgct gcagaagcgc ggcatcgtgg agcagtgctg cacgagcatc 240
tgctcgctgt accagctgga gaactactgc ggctgataat agttcagaag agcatat 297
<210> 81
<211> 282
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 81
atatgctctt caaagttcgt aaaccaacat ctgtgtggct cccacctcgt cgaagccctg 60
tacctcgtct gcggtgagcg cggcttcttt tacacgccca agacccggcg tgacgtgccg 120
caagtggagc tggggggtgg ccccggcgcg ggtagcctgc agccgctggc cctggaaggc 180
tcgctccaaa agcgcggcat cgtggagcag tgctgcacta gcatctgctc gctgtaccag 240
ttggagaact actgcggctg ataatagttc agaagagcat at 282
<210> 82
<211> 282
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 82
atatgctctt caaagttcgt caaccaacac ctgtgcggct cccatctcgt cgaagccctg 60
tacctcgtat gcggtgagcg cgggtttttc tacacgccca agactcgccg ggacgtgccg 120
caagtggagc tgggcggtgg cccgggcgcg ggctcgctgc agcccctggc gctggaaggc 180
agcttgcaag cccgtggcat cgtggagcag tgctgtacct cgatctgcag cctctaccag 240
ctggagaact actgcggttg ataatagttc agaagagcat at 282
<210> 83
<211> 231
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 83
atatgctctt caaagttcgt caaccaacac ctgtgtggct cccatctcgt cgaagcgctg 60
tacctcgtat gcggtgagcg gggtttcttt tacacgccca agacccgtcg cgaggccgag 120
gaccagggct cgctgcagaa gcgcgggatc gtggaacaat gctgcactag catctgcagc 180
ctgtaccaac tggagaacta ctgcggctga taatagttca gaagagcata t 231
<210> 84
<211> 297
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 84
atatgctctt cacgattcgt caaccaacac ctctgcggca gccatctcgt cgaagccctc 60
tacctcgtat gtggcgaacg gggcttcttt tacaccccca agacgcgccg tgaggccgag 120
gacttgcaag tgggccaagt ggagctgggc ggtggtcccg gtgcgggctc gctgcaaccg 180
ctggcgctgg aagggtcgct gcagaagcgc ggcatcgtgg agcagtgctg cactagcatc 240
tgctccctgt accagctgga gaactactgc ggctgataat agttcagaag agcatat 297
<210> 85
<211> 282
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 85
atatgctctt cacgattcgt aaaccaacac ctctgcggct cccatttggt cgaagccctc 60
tacctcgtct gcggtgagcg ggggtttttc tacactccca agacccgtcg cgacgtgccg 120
caagtggagc tgggcggtgg ccccggcgcc ggctcgctgc aaccgctggc gctggaaggt 180
tcgctgcaga agcgcggcat cgtggagcag tgctgcacga gcatctgcag cctgtaccag 240
ctggagaact actgtggctg ataatagttc agaagagcat at 282
<210> 86
<211> 282
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 86
atatgctctt cacgattcgt caaccaacat ctctgcggct cccacctggt cgaagccctc 60
tacctcgtat gcggcgaacg cggctttttc tacaccccca agactcggcg cgacgtgccg 120
caagtggagc tgggcggtgg tcccggtgcg ggctcgctgc agccgttggc cctggaaggg 180
agcctgcagg cgcgtggcat cgtggagcaa tgctgcacgt cgatctgtag cctgtaccag 240
ctggagaact actgcggctg ataatagttc agaagagcat at 282
<210> 87
<211> 231
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 87
atatgctctt cacgattcgt caaccaacac ctgtgcggct cccatctggt cgaagccctc 60
tacctcgtat gcggcgagcg cggcttcttt tacaccccca agacgcgtcg ggaagcggaa 120
gatcagggta gcctgcaaaa gcgcggtatc gtggagcagt gctgcacttc gatctgtagc 180
ctgtaccaac tggagaacta ctgcgggtga taatagttca gaagagcata t 231
<210> 88
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 88
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro
35 40 45
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
50 55 60
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
65 70 75 80
Leu Glu Asn Tyr Cys Gly
85
<210> 89
<211> 81
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 89
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu
35 40 45
Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu
50 55 60
Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys
65 70 75 80
Gly
<210> 90
<211> 81
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 90
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu
35 40 45
Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly Ile Val Glu
50 55 60
Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys
65 70 75 80
Gly
<210> 91
<211> 64
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 91
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln
35 40 45
Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
50 55 60
<210> 92
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 92
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Gly
20
<210> 93
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 93
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
<210> 94
<211> 84
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 94
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Asp Lys Thr Glu Ala
20 25 30
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
35 40 45
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
50 55 60
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
65 70 75 80
Asn Tyr Cys Asn
<210> 95
<211> 21
<212> PRT
<213> Homo sapiens
<400> 95
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
<210> 96
<211> 30
<212> PRT
<213> Homo sapiens
<400> 96
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
20 25 30
<210> 97
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 97
Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro
1 5 10 15
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
20 25 30
Arg
<210> 98
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 98
Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu
1 5 10 15
Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg
20 25
<210> 99
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 99
Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu
1 5 10 15
Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg
20 25
<210> 100
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 100
Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg
1 5 10
<210> 101
<211> 95
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 101
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg
85 90 95
<210> 102
<211> 264
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 102
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val Ala
180 185 190
Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly Glu
195 200 205
Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser Gln
210 215 220
Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val Pro
225 230 235 240
Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly
245 250 255
Ser His His His His His His Arg
260
<210> 103
<211> 265
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 103
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Arg
260 265
<210> 104
<211> 117
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 104
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg
115
<210> 105
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 105
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg
65
<210> 106
<211> 222
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 106
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg
210 215 220
<210> 107
<211> 117
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 107
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg
115
<210> 108
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 108
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg
65
<210> 109
<211> 234
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 109
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Arg
225 230
<210> 110
<211> 117
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 110
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg
115
<210> 111
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 111
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg
65
<210> 112
<211> 99
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 112
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys
<210> 113
<211> 269
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 113
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Asp Asp Asp Asp Lys
260 265
<210> 114
<211> 121
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 114
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys
115 120
<210> 115
<211> 71
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 115
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys
65 70
<210> 116
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 116
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys
225
<210> 117
<211> 121
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 117
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys
115 120
<210> 118
<211> 71
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 118
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys
65 70
<210> 119
<211> 238
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 119
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys
225 230 235
<210> 120
<211> 121
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 120
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys
115 120
<210> 121
<211> 71
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 121
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys
65 70
<210> 122
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 122
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
100 105 110
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
115 120 125
Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly
130 135 140
Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser
145 150 155 160
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
165 170 175
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
180 185
<210> 123
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 123
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
100 105 110
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
115 120 125
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
130 135 140
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
145 150 155 160
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
165 170 175
Asn Tyr Cys Gly
180
<210> 124
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 124
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
100 105 110
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
115 120 125
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
130 135 140
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly
145 150 155 160
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
165 170 175
Asn Tyr Cys Gly
180
<210> 125
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 125
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe
85 90 95
Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu
100 105 110
Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu
115 120 125
Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly
130 135 140
Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg
145 150 155 160
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
165 170 175
Glu Asn Tyr Cys Gly
180
<210> 126
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 126
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe
85 90 95
Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu
100 105 110
Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp
115 120 125
Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
130 135 140
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln
145 150 155 160
Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
165 170 175
<210> 127
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 127
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe
85 90 95
Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu
100 105 110
Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp
115 120 125
Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
130 135 140
Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly Ile Val Glu Gln
145 150 155 160
Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
165 170 175
<210> 128
<211> 163
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 128
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp
85 90 95
Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
100 105 110
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
115 120 125
Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile
130 135 140
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
145 150 155 160
Tyr Cys Gly
<210> 129
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 129
Met Lys Val Glu Pro Gly Leu Tyr Gln His Tyr Lys Gly Pro Gln Tyr
1 5 10 15
Arg Val Phe Ser Val Ala Arg His Ser Glu Thr Glu Glu Glu Val Val
20 25 30
Phe Tyr Gln Ala Leu Tyr Gly Glu Tyr Gly Phe Trp Val Arg Pro Leu
35 40 45
Ser Met Phe Leu Glu Thr Val Glu Val Asp Gly Glu Gln Val Pro Arg
50 55 60
Phe Ala Leu Val Thr Ala Glu Pro Ser Leu Phe Thr Gly Gln Gly Gly
65 70 75 80
Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe
85 90 95
Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu
100 105 110
Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu
115 120 125
Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
130 135 140
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150 155
<210> 130
<211> 312
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 130
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala
225 230 235 240
Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
245 250 255
Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly
260 265 270
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
275 280 285
Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
290 295 300
Tyr Gln Leu Glu Asn Tyr Cys Gly
305 310
<210> 131
<211> 307
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 131
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala
225 230 235 240
Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
245 250 255
Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly
260 265 270
Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile
275 280 285
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
290 295 300
Tyr Cys Gly
305
<210> 132
<211> 307
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 132
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala
225 230 235 240
Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
245 250 255
Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly
260 265 270
Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly Ile
275 280 285
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
290 295 300
Tyr Cys Gly
305
<210> 133
<211> 308
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 133
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe Val
210 215 220
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
225 230 235 240
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala
245 250 255
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
260 265 270
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
275 280 285
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
290 295 300
Asn Tyr Cys Gly
305
<210> 134
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 134
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe Val
210 215 220
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
225 230 235 240
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val
245 250 255
Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
260 265 270
Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
275 280 285
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
290 295 300
<210> 135
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 135
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe Val
210 215 220
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
225 230 235 240
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val
245 250 255
Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
260 265 270
Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys
275 280 285
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
290 295 300
<210> 136
<211> 290
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 136
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Asp Asp Asp
210 215 220
Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala
225 230 235 240
Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
245 250 255
Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile Val
260 265 270
Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr
275 280 285
Cys Gly
290
<210> 137
<211> 286
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 137
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Ala Ser Gly Leu Gln Phe Glu Val Leu Thr Ala Gly
100 105 110
Thr Gly Ala Lys Pro Thr Arg Glu Asp Gln Val Arg Thr His Tyr His
115 120 125
Gly Thr Leu Ile Asp Gly Thr Val Phe Asp Ser Ser Tyr Glu Arg Gly
130 135 140
Gln Pro Ala Glu Phe Pro Val Gly Gly Val Ile Ala Gly Trp Thr Glu
145 150 155 160
Ala Leu Gln Leu Met Asn Ala Gly Ser Lys Trp Arg Val Tyr Val Pro
165 170 175
Ser Glu Leu Ala Tyr Gly Ala Gln Gly Val Gly Ser Ile Pro Pro His
180 185 190
Ser Val Leu Val Phe Asp Val Glu Leu Leu Asp Val Leu Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser His His His His His His Arg Phe Val
210 215 220
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
225 230 235 240
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala
245 250 255
Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys
260 265 270
Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
275 280 285
<210> 138
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 138
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val
145 150 155 160
Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
165 170 175
Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
180 185 190
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200 205
<210> 139
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 139
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 140
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 140
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 141
<211> 203
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 141
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu
145 150 155 160
Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu
165 170 175
Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile
180 185 190
Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 142
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 142
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro
145 150 155 160
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
165 170 175
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
180 185 190
Leu Glu Asn Tyr Cys Gly
195
<210> 143
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 143
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro
145 150 155 160
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala
165 170 175
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
180 185 190
Leu Glu Asn Tyr Cys Gly
195
<210> 144
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 144
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser
145 150 155 160
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
165 170 175
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
180 185
<210> 145
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 145
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Ser Arg Val Asp Gln Glu Gln Met Ala Ala Ser Phe Lys Val
50 55 60
Ile Arg Glu Ile Met Gln Ala Glu Ala Ala Ala Lys Ala Glu Ala Ala
65 70 75 80
Ala Gly Ala Gly Leu Ala Phe Leu Ala Glu Asn Ala Lys Arg Asp Gly
85 90 95
Ile Thr Thr Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg
145 150 155 160
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
165 170 175
Glu Asn Tyr Cys Gly
180
<210> 146
<211> 157
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 146
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln
100 105 110
Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala
115 120 125
Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr
130 135 140
Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150 155
<210> 147
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 147
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly
100 105 110
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
115 120 125
Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
130 135 140
Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 148
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 148
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly
100 105 110
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
115 120 125
Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
130 135 140
Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 149
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 149
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly
100 105 110
Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser
115 120 125
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
130 135 140
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 150
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 150
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
100 105 110
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
115 120 125
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
130 135 140
Asn Tyr Cys Gly
145
<210> 151
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 151
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
100 105 110
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly
115 120 125
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
130 135 140
Asn Tyr Cys Gly
145
<210> 152
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 152
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln
100 105 110
Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr
115 120 125
Gln Leu Glu Asn Tyr Cys Gly
130 135
<210> 153
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 153
Met Ser Glu Val Asn Leu Ser Thr Asp Glu Thr Arg Val Ser Tyr Gly
1 5 10 15
Ile Gly Arg Gln Leu Gly Asp Gln Leu Arg Asp Asn Pro Pro Pro Gly
20 25 30
Val Ser Leu Asp Ala Ile Leu Ala Gly Leu Thr Asp Ala Phe Ala Gly
35 40 45
Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile
100 105 110
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
115 120 125
Tyr Cys Gly
130
<210> 154
<211> 324
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 154
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val
225 230 235 240
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
245 250 255
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala
260 265 270
Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
275 280 285
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
290 295 300
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
305 310 315 320
Asn Tyr Cys Gly
<210> 155
<211> 319
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 155
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val
225 230 235 240
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
245 250 255
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val
260 265 270
Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
275 280 285
Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
290 295 300
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
305 310 315
<210> 156
<211> 319
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 156
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val
225 230 235 240
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
245 250 255
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val
260 265 270
Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
275 280 285
Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys
290 295 300
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
305 310 315
<210> 157
<211> 320
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 157
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu
225 230 235 240
Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg
245 250 255
Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln
260 265 270
Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln
275 280 285
Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln
290 295 300
Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
305 310 315 320
<210> 158
<211> 315
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 158
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu
225 230 235 240
Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg
245 250 255
Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu
260 265 270
Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu
275 280 285
Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile
290 295 300
Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
305 310 315
<210> 159
<211> 315
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 159
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu
225 230 235 240
Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg
245 250 255
Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu
260 265 270
Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu
275 280 285
Gly Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile
290 295 300
Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
305 310 315
<210> 160
<211> 302
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 160
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val
225 230 235 240
Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val
245 250 255
Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala
260 265 270
Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys
275 280 285
Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
290 295 300
<210> 161
<211> 298
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 161
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser Gly Gly Gly Gly Ser Gly Gly
210 215 220
Gly Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu
225 230 235 240
Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg
245 250 255
Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly
260 265 270
Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
275 280 285
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
290 295
<210> 162
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 162
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val
145 150 155 160
Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
165 170 175
Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
180 185 190
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200 205
<210> 163
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 163
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 164
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 164
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 165
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 165
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His
100 105 110
His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val
115 120 125
Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro
130 135 140
Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 166
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 166
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro
145 150 155 160
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
165 170 175
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
180 185 190
Leu Glu Asn Tyr Cys Gly
195
<210> 167
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 167
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro
145 150 155 160
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala
165 170 175
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
180 185 190
Leu Glu Asn Tyr Cys Gly
195
<210> 168
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 168
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser
145 150 155 160
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
165 170 175
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
180 185
<210> 169
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 169
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg
145 150 155 160
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
165 170 175
Glu Asn Tyr Cys Gly
180
<210> 170
<211> 157
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 170
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln
100 105 110
Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala
115 120 125
Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr
130 135 140
Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150 155
<210> 171
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 171
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly
100 105 110
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
115 120 125
Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
130 135 140
Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 172
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 172
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly
100 105 110
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
115 120 125
Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
130 135 140
Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 173
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 173
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly
100 105 110
Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser
115 120 125
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
130 135 140
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 174
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 174
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
100 105 110
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
115 120 125
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
130 135 140
Asn Tyr Cys Gly
145
<210> 175
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 175
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
100 105 110
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly
115 120 125
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
130 135 140
Asn Tyr Cys Gly
145
<210> 176
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 176
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln
100 105 110
Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr
115 120 125
Gln Leu Glu Asn Tyr Cys Gly
130 135
<210> 177
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 177
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile
100 105 110
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
115 120 125
Tyr Cys Gly
130
<210> 178
<211> 355
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 178
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val Asn
260 265 270
Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys
275 280 285
Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu
290 295 300
Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly
305 310 315 320
Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile
325 330 335
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
340 345 350
Tyr Cys Gly
355
<210> 179
<211> 350
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 179
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val Asn
260 265 270
Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys
275 280 285
Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro
290 295 300
Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu
305 310 315 320
Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys
325 330 335
Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
340 345 350
<210> 180
<211> 350
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 180
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val Asn
260 265 270
Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys
275 280 285
Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro
290 295 300
Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu
305 310 315 320
Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys Cys
325 330 335
Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
340 345 350
<210> 181
<211> 333
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 181
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Asp Asp Asp Asp Lys Phe Val Asn
260 265 270
Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys
275 280 285
Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu
290 295 300
Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr
305 310 315 320
Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
325 330
<210> 182
<211> 351
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 182
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu Cys
260 265 270
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
275 280 285
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val
290 295 300
Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
305 310 315 320
Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
325 330 335
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
340 345 350
<210> 183
<211> 346
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 183
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu Cys
260 265 270
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
275 280 285
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
290 295 300
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
305 310 315 320
Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
325 330 335
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
340 345
<210> 184
<211> 346
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 184
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu Cys
260 265 270
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
275 280 285
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
290 295 300
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
305 310 315 320
Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
325 330 335
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
340 345
<210> 185
<211> 329
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 185
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Ala Pro Leu Ala Gln Asp Lys Glu Ser Val Phe Trp
100 105 110
Leu Asn Val Leu Glu Ile Pro Pro Lys Pro Glu Ala Gly Ala Asp Leu
115 120 125
Asn Thr Leu Gln Met Ala Phe Arg Ser Arg Ile Lys Leu Phe Tyr Arg
130 135 140
Pro Val Gly Leu Pro Gly Asn Pro Asn Glu Ala Val Glu Gln Val Gln
145 150 155 160
Trp Gln Leu Val Thr Ala Arg Asp Gly Gln Gly Leu Ala Leu Lys Ala
165 170 175
Tyr Asn Pro Ser Ala Phe His Val Ser Leu Ile Glu Leu Asp Leu Val
180 185 190
Ala Gly Asn Gln Arg Tyr Arg Ser Glu Asp Gly Met Val Gly Pro Gly
195 200 205
Glu Thr Arg Gln Phe Ala Leu Pro Thr Leu Lys Ala Arg Pro Ser Ser
210 215 220
Gln Ala Gln Val Glu Phe Ser Ala Ile Asn Asp Tyr Gly Ala Leu Val
225 230 235 240
Pro Thr Arg Asn Thr Leu Gln Pro Gly Gly Gly Gly Ser Gly Gly Gly
245 250 255
Gly Ser His His His His His His Arg Phe Val Asn Gln His Leu Cys
260 265 270
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
275 280 285
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser
290 295 300
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
305 310 315 320
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
325
<210> 186
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 186
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val
145 150 155 160
Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro
165 170 175
Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys
180 185 190
Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200 205
<210> 187
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 187
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 188
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 188
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu
145 150 155 160
Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly
165 170 175
Ser Leu Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
180 185 190
Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 189
<211> 203
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 189
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu
145 150 155 160
Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu
165 170 175
Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile
180 185 190
Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
195 200
<210> 190
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 190
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro
145 150 155 160
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys
165 170 175
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
180 185 190
Leu Glu Asn Tyr Cys Gly
195
<210> 191
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 191
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro
145 150 155 160
Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala
165 170 175
Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln
180 185 190
Leu Glu Asn Tyr Cys Gly
195
<210> 192
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 192
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys
115 120 125
Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly
130 135 140
Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser
145 150 155 160
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
165 170 175
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
180 185
<210> 193
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 193
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Thr Leu Pro Ala Leu Val Gln Ser Trp Ile Asp Thr Gly
50 55 60
Ser Val Glu Ser Thr Pro Thr Ser Ser Lys Ala Pro Phe Leu Leu Ser
65 70 75 80
Pro Pro Val Ala Arg Ile Asp Pro Thr Lys Gly Gln Ser Leu Arg Val
85 90 95
Leu Phe Thr Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His
100 105 110
His His His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu
115 120 125
Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
130 135 140
Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg
145 150 155 160
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
165 170 175
Glu Asn Tyr Cys Gly
180
<210> 194
<211> 157
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 194
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln
100 105 110
Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala
115 120 125
Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr
130 135 140
Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150 155
<210> 195
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 195
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly
100 105 110
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
115 120 125
Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
130 135 140
Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 196
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 196
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly
100 105 110
Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu
115 120 125
Gln Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu
130 135 140
Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 197
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 197
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly
100 105 110
Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser
115 120 125
Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser
130 135 140
Leu Tyr Gln Leu Glu Asn Tyr Cys Gly
145 150
<210> 198
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 198
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
100 105 110
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly
115 120 125
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
130 135 140
Asn Tyr Cys Gly
145
<210> 199
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 199
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Asp Val Pro Gln Val Glu Leu Gly Gly Gly Pro Gly Ala
100 105 110
Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Ala Arg Gly
115 120 125
Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu
130 135 140
Asn Tyr Cys Gly
145
<210> 200
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 200
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Asp Asp Asp Asp Lys Phe Val Asn Gln His Leu Cys Gly Ser
65 70 75 80
His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe
85 90 95
Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln
100 105 110
Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr
115 120 125
Gln Leu Glu Asn Tyr Cys Gly
130 135
<210> 201
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 201
Met Ser Cys Thr Arg Ala Phe Lys Pro Leu Leu Leu Ile Gly Leu Ala
1 5 10 15
Thr Leu Met Cys Ser His Ala Phe Ala Ala Val Val Ile Thr Gly Thr
20 25 30
Arg Leu Val Tyr Pro Ala Asp Gln Lys Glu Ile Thr Val Lys Leu Asn
35 40 45
Asn Asn Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His
50 55 60
His His Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
65 70 75 80
Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
85 90 95
Thr Arg Arg Glu Ala Glu Asp Gln Gly Ser Leu Gln Lys Arg Gly Ile
100 105 110
Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn
115 120 125
Tyr Cys Gly
130
<210> 202
<211> 285
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 202
atgaaagtcg aaccagggct ctaccagcat tacaaggggc cgcagtaccg tgttttcagc 60
gtggcgcgcc actctgaaac cgaagaagaa gtggtgtttt accaagcgct gtatggcgaa 120
tacggctttt gggtgcgccc tttgagcatg ttcctggaga ccgtcgaagt tgacggcgag 180
caggtcccgc gctttgcttt ggtcacggcc gaacccagtc tttttacagg gcaaggtggg 240
ggtgggtcgg gtggtggtgg gtcgcatcat catcaccacc accga 285
<210> 203
<211> 792
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 203
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggcacgttgc ccgcactggt ccaatcatgg 180
atcgacaccg gcagcgtcga atcgacaccc accagctcca aggcgccgtt cctattgtcg 240
cccccggtgg cgcgcattga cccgaccaag ggccaaagct tgcgagtgct ctttaccggc 300
gcgcctttgg cgcaggacaa agagtcggtg ttctggctca acgttctcga aatcccgccc 360
aaacccgagg cgggtgcaga cctcaacacg ctgcaaatgg ctttccgttc gcgcatcaag 420
ctgttctatc gcccggtcgg cttgcctgga aatcccaatg aggcggttga gcaggtgcag 480
tggcaattgg ttacggcacg cgatggccaa ggcctggcgc tgaaggcgta cccgtcggcg 540
ttccacgtct cgctgatcga gttggacctg gtggcgggta accaacgcta tcgcagtgag 600
gacggcatgg tcggccctgg ggaaacccgg cagttcgcgc tgcccacgct caaggccagg 660
ccgtcgagcc aggcacaagt ggagttcagc gccatcaacg attacggcgc gttggtcccg 720
acccgcaaca cgctgcagcc cggtgggggt gggtcgggtg gtggtgggtc gcatcatcat 780
caccaccacc ga 792
<210> 204
<211> 351
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 204
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggcacgttgc ccgcactggt ccaatcatgg 180
atcgacaccg gcagcgtcga atcgacaccc accagctcca aggcgccgtt cctattgtcg 240
cccccggtgg cgcgcattga cccgaccaag ggccaaagct tgcgagtgct ctttaccggc 300
ggtgggggtg ggtcgggtgg tggtgggtcg catcatcatc accaccaccg a 351
<210> 205
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 205
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggtgggggtg ggtcgggtgg tggtgggtcg 180
catcatcatc accaccaccg a 201
<210> 206
<211> 666
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 206
atgtccgaag ttaatctgtc caccgacgaa acccgcgtca gctacggtat cggccgtcag 60
ttgggcgacc aactgcgtga caacccgcca ccgggcgtca gcctggacgc gatcctggcc 120
ggcctgaccg acgcgttcgc aggcaagcca agccgtgttg accaagagca aatggcggcc 180
agcttcaaag tgatccgcga aatcatgcaa gccgaagccg ctgccaaggc tgaagctgca 240
gcaggcgctg gcctggcttt cctggcggaa aacgccaagc gtgatggcat caccaccctg 300
gcttccggcc tgcaatttga agtgctgacg gctggtaccg gcgccaagcc gacccgtgaa 360
gaccaagtgc gtactcacta ccacggcacc ctgatcgacg gcactgtgtt cgacagctcc 420
tacgagcgcg gccagcctgc agaattcccg gttggcggcg tgatcgccgg ctggaccgaa 480
gccctgcaac tgatgaatgc cggcagcaaa tggcgcgtgt acgtgccgag cgaactggct 540
tacggcgctc aaggcgttgg cagcatcccg ccgcacagcg ttctggtatt cgacgtcgag 600
ctgctcgacg ttctgggtgg gggtgggtcg ggtggtggtg ggtcgcatca tcatcaccac 660
caccga 666
<210> 207
<211> 351
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 207
atgtccgaag ttaatctgtc caccgacgaa acccgcgtca gctacggtat cggccgtcag 60
ttgggcgacc aactgcgtga caacccgcca ccgggcgtca gcctggacgc gatcctggcc 120
ggcctgaccg acgcgttcgc aggcaagcca agccgtgttg accaagagca aatggcggcc 180
agcttcaaag tgatccgcga aatcatgcaa gccgaagccg ctgccaaggc tgaagctgca 240
gcaggcgctg gcctggcttt cctggcggaa aacgccaagc gtgatggcat caccaccctg 300
ggtgggggtg ggtcgggtgg tggtgggtcg catcatcatc accaccaccg a 351
<210> 208
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 208
atgtccgaag ttaatctgtc caccgacgaa acccgcgtca gctacggtat cggccgtcag 60
ttgggcgacc aactgcgtga caacccgcca ccgggcgtca gcctggacgc gatcctggcc 120
ggcctgaccg acgcgttcgc aggcaagcca ggtgggggtg ggtcgggtgg tggtgggtcg 180
catcatcatc accaccaccg a 201
<210> 209
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 209
atgagtactc ccctgaaaat cgatttcgtc agcgacgtat cctgcccctg gtgcatcatc 60
ggcctgcgcg gcttgaccga agccctcgac cagctcggca gcgaggtgca ggccgagatt 120
cattttcaac cgttcgaact gaacccgaac atgcccgccg aaggtcagaa catcgtcgag 180
cacattaccg aaaagtacgg ctccacggct gaagagtccc aggctaatcg tgcgcgtatc 240
cgtgacatgg gcgccgcgtt gggctttgct tttcgcaccg atggccagag ccgtatctac 300
aacaccttcg acgcgcaccg tctgttgcac tgggccgggt tggaaggctt gcagtacaac 360
ctcaaggaag cgctgttcaa ggcgtacttc agcgatggcc aggacccttc cgaccacgcg 420
accttggcga tcatcgccga aagcgtcggg ctggaccttg cgcgcgccgc cgagattctt 480
gccagcgatg aatacgccgc cgaggtccgc gagcaggagc agctgtgggt ttcccgtggg 540
gtgagttcgg tgccgaccat tgtcttcaat gaccaatatg cggtgagcgg tgggcaaccg 600
gctgaagcct tcgtgggtgc gattcgccag atcatcaacg aatccaaatc cggtgggggt 660
gggtcgggtg gtggtgggtc gcatcatcat caccaccacc ga 702
<210> 210
<211> 351
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 210
atgagtactc ccctgaaaat cgatttcgtc agcgacgtat cctgcccctg gtgcatcatc 60
ggcctgcgcg gcttgaccga agccctcgac cagctcggca gcgaggtgca ggccgagatt 120
cattttcaac cgttcgaact gaacccgaac atgcccgccg aaggtcagaa catcgtcgag 180
cacattaccg aaaagtacgg ctccacggct gaagagtccc aggctaatcg tgcgcgtatc 240
cgtgacatgg gcgccgcgtt gggctttgct tttcgcaccg atggccagag ccgtatctac 300
ggtgggggtg ggtcgggtgg tggtgggtcg catcatcatc accaccaccg a 351
<210> 211
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 211
atgagtactc ccctgaaaat cgatttcgtc agcgacgtat cctgcccctg gtgcatcatc 60
ggcctgcgcg gcttgaccga agccctcgac cagctcggca gcgaggtgca ggccgagatt 120
cattttcaac cgttcgaact gaacccgaac ggtgggggtg ggtcgggtgg tggtgggtcg 180
catcatcatc accaccaccg a 201
<210> 212
<211> 297
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 212
atgaaagtcg aaccagggct ctaccagcat tacaaggggc cgcagtaccg tgttttcagc 60
gtggcgcgcc actctgaaac cgaagaagaa gtggtgtttt accaagcgct gtatggcgaa 120
tacggctttt gggtgcgccc tttgagcatg ttcctggaga ccgtcgaagt tgacggcgag 180
caggtcccgc gctttgcttt ggtcacggcc gaacccagtc tttttacagg gcaaggtggg 240
ggtgggtcgg gtggtggtgg gtcgcatcat catcaccacc acgatgatga tgataag 297
<210> 213
<211> 807
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 213
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggcacgttgc ccgcactggt ccaatcatgg 180
atcgacaccg gcagcgtcga atcgacaccc accagctcca aggcgccgtt cctattgtcg 240
cccccggtgg cgcgcattga cccgaccaag ggccaaagct tgcgagtgct ctttaccggc 300
gcgcctttgg cgcaggacaa agagtcggtg ttctggctca acgttctcga aatcccgccc 360
aaacccgagg cgggtgcaga cctcaacacg ctgcaaatgg ctttccgttc gcgcatcaag 420
ctgttctatc gcccggtcgg cttgcctgga aatcccaatg aggcggttga gcaggtgcag 480
tggcaattgg ttacggcacg cgatggccaa ggcctggcgc tgaaggcgta caacccgtcg 540
gcgttccacg tctcgctgat cgagttggac ctggtggcgg gtaaccaacg ctatcgcagt 600
gaggacggca tggtcggccc tggggaaacc cggcagttcg cgctgcccac gctcaaggcc 660
aggccgtcga gccaggcaca agtggagttc agcgccatca acgattacgg cgcgttggtc 720
ccgacccgca acacgctgca gcccggtggg ggtgggtcgg gtggtggtgg gtcgcatcat 780
catcaccacc acgatgatga tgataag 807
<210> 214
<211> 363
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 214
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggcacgttgc ccgcactggt ccaatcatgg 180
atcgacaccg gcagcgtcga atcgacaccc accagctcca aggcgccgtt cctattgtcg 240
cccccggtgg cgcgcattga cccgaccaag ggccaaagct tgcgagtgct ctttaccggc 300
ggtgggggtg ggtcgggtgg tggtgggtcg catcatcatc accaccacga tgatgatgat 360
aag 363
<210> 215
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 215
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggtgggggtg ggtcgggtgg tggtgggtcg 180
catcatcatc accaccacga tgatgatgat aag 213
<210> 216
<211> 678
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 216
atgtccgaag ttaatctgtc caccgacgaa acccgcgtca gctacggtat cggccgtcag 60
ttgggcgacc aactgcgtga caacccgcca ccgggcgtca gcctggacgc gatcctggcc 120
ggcctgaccg acgcgttcgc aggcaagcca agccgtgttg accaagagca aatggcggcc 180
agcttcaaag tgatccgcga aatcatgcaa gccgaagccg ctgccaaggc tgaagctgca 240
gcaggcgctg gcctggcttt cctggcggaa aacgccaagc gtgatggcat caccaccctg 300
gcttccggcc tgcaatttga agtgctgacg gctggtaccg gcgccaagcc gacccgtgaa 360
gaccaagtgc gtactcacta ccacggcacc ctgatcgacg gcactgtgtt cgacagctcc 420
tacgagcgcg gccagcctgc agaattcccg gttggcggcg tgatcgccgg ctggaccgaa 480
gccctgcaac tgatgaatgc cggcagcaaa tggcgcgtgt acgtgccgag cgaactggct 540
tacggcgctc aaggcgttgg cagcatcccg ccgcacagcg ttctggtatt cgacgtcgag 600
ctgctcgacg ttctgggtgg gggtgggtcg ggtggtggtg ggtcgcatca tcatcaccac 660
cacgatgatg atgataag 678
<210> 217
<211> 363
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 217
atgtccgaag ttaatctgtc caccgacgaa acccgcgtca gctacggtat cggccgtcag 60
ttgggcgacc aactgcgtga caacccgcca ccgggcgtca gcctggacgc gatcctggcc 120
ggcctgaccg acgcgttcgc aggcaagcca agccgtgttg accaagagca aatggcggcc 180
agcttcaaag tgatccgcga aatcatgcaa gccgaagccg ctgccaaggc tgaagctgca 240
gcaggcgctg gcctggcttt cctggcggaa aacgccaagc gtgatggcat caccaccctg 300
ggtgggggtg ggtcgggtgg tggtgggtcg catcatcatc accaccacga tgatgatgat 360
aag 363
<210> 218
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 218
atgtccgaag ttaatctgtc caccgacgaa acccgcgtca gctacggtat cggccgtcag 60
ttgggcgacc aactgcgtga caacccgcca ccgggcgtca gcctggacgc gatcctggcc 120
ggcctgaccg acgcgttcgc aggcaagcca ggtgggggtg ggtcgggtgg tggtgggtcg 180
catcatcatc accaccacga tgatgatgat aag 213
<210> 219
<211> 714
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 219
atgagtactc ccctgaaaat cgatttcgtc agcgacgtat cctgcccctg gtgcatcatc 60
ggcctgcgcg gcttgaccga agccctcgac cagctcggca gcgaggtgca ggccgagatt 120
cattttcaac cgttcgaact gaacccgaac atgcccgccg aaggtcagaa catcgtcgag 180
cacattaccg aaaagtacgg ctccacggct gaagagtccc aggctaatcg tgcgcgtatc 240
cgtgacatgg gcgccgcgtt gggctttgct tttcgcaccg atggccagag ccgtatctac 300
aacaccttcg acgcgcaccg tctgttgcac tgggccgggt tggaaggctt gcagtacaac 360
ctcaaggaag cgctgttcaa ggcgtacttc agcgatggcc aggacccttc cgaccacgcg 420
accttggcga tcatcgccga aagcgtcggg ctggaccttg cgcgcgccgc cgagattctt 480
gccagcgatg aatacgccgc cgaggtccgc gagcaggagc agctgtgggt ttcccgtggg 540
gtgagttcgg tgccgaccat tgtcttcaat gaccaatatg cggtgagcgg tgggcaaccg 600
gctgaagcct tcgtgggtgc gattcgccag atcatcaacg aatccaaatc cggtgggggt 660
gggtcgggtg gtggtgggtc gcatcatcat caccaccacg atgatgatga taag 714
<210> 220
<211> 363
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 220
atgagtactc ccctgaaaat cgatttcgtc agcgacgtat cctgcccctg gtgcatcatc 60
ggcctgcgcg gcttgaccga agccctcgac cagctcggca gcgaggtgca ggccgagatt 120
cattttcaac cgttcgaact gaacccgaac atgcccgccg aaggtcagaa catcgtcgag 180
cacattaccg aaaagtacgg ctccacggct gaagagtccc aggctaatcg tgcgcgtatc 240
cgtgacatgg gcgccgcgtt gggctttgct tttcgcaccg atggccagag ccgtatctac 300
ggtgggggtg ggtcgggtgg tggtgggtcg catcatcatc accaccacga tgatgatgat 360
aag 363
<210> 221
<211> 213
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 221
atgagtactc ccctgaaaat cgatttcgtc agcgacgtat cctgcccctg gtgcatcatc 60
ggcctgcgcg gcttgaccga agccctcgac cagctcggca gcgaggtgca ggccgagatt 120
cattttcaac cgttcgaact gaacccgaac ggtgggggtg ggtcgggtgg tggtgggtcg 180
catcatcatc accaccacga tgatgatgat aag 213
<210> 222
<211> 30
<212> PRT
<213> Homo sapiens
<400> 222
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr
20 25 30
<210> 223
<211> 21
<212> PRT
<213> Homo sapiens
<400> 223
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Asn
20
<210> 224
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 224
Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr
1 5 10 15
Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg
20 25 30
<210> 225
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 225
Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
1 5 10 15
Glu Asn Tyr Cys Gly
20
<210> 226
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 226
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His His His His His His
1 5 10 15
Arg
<210> 227
<211> 549
<212> PRT
<213> Pseudomonas fluorescens
<400> 227
Met Thr Val Val Lys Val Phe Ser Met Trp Glu Leu Tyr Arg Ala Asp
1 5 10 15
Asn Gly Ala Val Gly Ile Gly Asn Ser His Ile Trp Thr Val Asn Phe
20 25 30
Pro Leu Phe Arg Val Ser Lys His Met His Ile Pro Val Arg Gln Ser
35 40 45
Ser Tyr Ser Arg Pro Ser Asp Lys Leu Gln Pro Asp Leu Ser Pro Asp
50 55 60
Glu His Gln Val Val Leu Trp Ala Asn Asn Lys Lys Ser Phe Thr Thr
65 70 75 80
Asp Gln Ala Ala Lys His Ile Thr Arg Gly Gly Phe Lys Phe His Asp
85 90 95
Arg Asn Asn Asp Gly Lys Ile Val Val Gly Tyr Asn Phe Ala Gly Gly
100 105 110
Phe Asn Ala Ala Gln Lys Glu Arg Ala Arg Gln Ala Leu Gln Tyr Trp
115 120 125
Ala Asp Val Ala Asn Ile Glu Phe Val Glu Asn Gly Pro Asn Thr Asp
130 135 140
Gly Thr Ile Ser Ile Lys Gly Val Pro Gly Ser Ala Gly Val Ala Gly
145 150 155 160
Leu Pro Asn Lys Tyr Asn Ser Asn Val Gln Ala Asn Ile Gly Thr Gln
165 170 175
Gly Gly Gln Asn Pro Ala Met Gly Ser His Phe Leu Gly Leu Leu Ile
180 185 190
His Glu Leu Gly His Thr Leu Gly Leu Ser His Pro Gly Lys Tyr Asp
195 200 205
Gly Gln Gly Phe Asn Tyr Asp Arg Ala Ala Glu Tyr Ala Gln Asp Thr
210 215 220
Lys Ala Arg Ser Val Met Ser Tyr Trp Thr Glu Thr His Gln Pro Gly
225 230 235 240
His Asn Phe Ala Gly Arg Ser Pro Gly Ala Pro Met Met Asp Asp Ile
245 250 255
Ala Ala Ala Gln Arg Leu Tyr Gly Ala Asn Thr Lys Thr Arg Asn Thr
260 265 270
Asp Thr Thr Tyr Gly Phe Asn Ser Asn Ser Gly Arg Glu Ala Tyr Ser
275 280 285
Leu Lys Gln Gly Ser Asp Lys Pro Ile Phe Thr Val Trp Asp Gly Gly
290 295 300
Gly Asn Asp Thr Leu Asp Phe Ser Gly Phe Thr Gln Asn Gln Thr Ile
305 310 315 320
Asn Leu Lys Ala Glu Ser Phe Ser Asp Val Gly Gly Leu Arg Gly Asn
325 330 335
Val Ser Ile Ala Lys Gly Val Ser Val Glu Asn Ala Ile Gly Gly Thr
340 345 350
Gly Asn Asp Thr Leu Thr Gly Asn Glu Gly Asn Asn Arg Leu Thr Gly
355 360 365
Gly Lys Gly Ala Asp Lys Leu His Gly Gly Ala Gly Ala Asp Thr Phe
370 375 380
Val Tyr Arg Arg Ala Ser Asp Ser Thr Pro Gln Ala Pro Asp Ile Ile
385 390 395 400
Gln Asp Phe Gln Ser Gly Ser Asp Lys Ile Asp Leu Thr Gly Val Val
405 410 415
Gln Glu Ala Gly Leu Lys Ser Leu Ser Phe Val Glu Lys Phe Ser Gly
420 425 430
Lys Ala Gly Glu Ala Val Leu Gly Gln Asp Ala Lys Thr Gly Arg Phe
435 440 445
Thr Leu Ala Val Asp Thr Thr Gly Asn Gly Thr Ala Asp Leu Leu Val
450 455 460
Ala Ser Gln Ser Gln Ile Lys Gln Ala Asp Val Ile Trp Asn Gly Gln
465 470 475 480
Ala Pro Thr Val Thr Pro Thr Pro Glu Pro Thr Val Val Pro Val Ser
485 490 495
Asp Pro Val Pro Thr Pro Thr Ser Glu Pro Thr Glu Pro Glu Pro Thr
500 505 510
Pro Glu Pro Ala Pro Leu Pro Val Pro Thr Pro Arg Pro Gly Gly Gly
515 520 525
Phe Ile Gly Lys Ile Phe Ser Ser Phe Lys Gly Phe Ile Lys Lys Val
530 535 540
Trp Ser Ile Phe Arg
545
<210> 228
<211> 795
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 228
atgtcgtgca cacgtgcatt caaaccactg ctgctgatcg gcctggccac actgatgtgt 60
tcccatgcat tcgctgcagt ggtgattacc ggtacgcgcc tggtctatcc ggcggaccag 120
aaagaaatca ccgtaaaact gaacaataac ggcacgttgc ccgcactggt ccaatcatgg 180
atcgacaccg gcagcgtcga atcgacaccc accagctcca aggcgccgtt cctattgtcg 240
cccccggtgg cgcgcattga cccgaccaag ggccaaagct tgcgagtgct ctttaccggc 300
gcgcctttgg cgcaggacaa agagtcggtg ttctggctca acgttctcga aatcccgccc 360
aaacccgagg cgggtgcaga cctcaacacg ctgcaaatgg ctttccgttc gcgcatcaag 420
ctgttctatc gcccggtcgg cttgcctgga aatcccaatg aggcggttga gcaggtgcag 480
tggcaattgg ttacggcacg cgatggccaa ggcctggcgc tgaaggcgta caacccgtcg 540
gcgttccacg tctcgctgat cgagttggac ctggtggcgg gtaaccaacg ctatcgcagt 600
gaggacggca tggtcggccc tggggaaacc cggcagttcg cgctgcccac gctcaaggcc 660
aggccgtcga gccaggcaca agtggagttc agcgccatca acgattacgg cgcgttggtc 720
ccgacccgca acacgctgca gcccggtggg ggtgggtcgg gtggtggtgg gtcgcatcat 780
catcaccacc accga 795
<210> 229
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 229
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 230
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 230
Lys Arg Arg Trp Lys Lys Asn Phe Ile Ala Val Ser Ala Ala Asn Arg
1 5 10 15
Phe Lys Lys Ile Ser Ser Ser Gly Ala Leu
20 25
<210> 231
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 231
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 232
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 232
Gly Ala Pro Val Pro Tyr Pro Asp Pro Leu Glu Pro Arg
1 5 10
<210> 233
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 233
Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
1 5 10 15
<210> 234
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 234
Met Asp Glu Lys Thr Thr Gly Trp Arg Gly Gly His Val Val Glu Gly
1 5 10 15
Leu Ala Gly Glu Leu Glu Gln Leu Arg Ala Arg Leu Glu His His Pro
20 25 30
Gln Gly Gln Arg Glu Pro
35
<210> 235
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 235
Thr Gln Asp Pro Ser Arg Val Gly
1 5
<210> 236
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 236
Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr
1 5 10
<210> 237
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 237
Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
1 5 10
<210> 238
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 238
Gly Gly Gly Gly Ser
1 5
<210> 239
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 239
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 240
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 240
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser
20
<210> 241
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 241
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25
<210> 242
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
6xHis tag
<400> 242
His His His His His His
1 5
Claims (23)
- 박테리아 샤프론 또는 폴딩(folding) 조절 인자인 N-말단 융합 파트너; 관심 폴리펩티드; 및 N-말단 융합 파트너와 관심 폴리펩티드 사이에 절단 부위를 포함하는 링커를 포함하는 재조합 융합 단백질.
- 제1항에 있어서, N-말단 융합 파트너가 DnaJ-유사 단백질; FklB 단백질 또는 이의 절두형; FrnE 단백질 또는 이의 절두형; FkpB2 단백질 또는 이의 절두형; EcpD 단백질 또는 이의 절두형; 또는 Skp 단백질 또는 이의 절두형으로부터 선택되는 것인 재조합 융합 단백질.
- 제1항에 있어서, N-말단 융합 파트너가 피. 플루오레센스(P. fluorescens) DnaJ-유사 단백질; 피. 플루오레센스 FklB 단백질 또는 이의 C-말단 절두형; 피. 플루오레센스 FrnE 단백질 또는 이의 절두형; 피. 플루오레센스 FkpB2 단백질 또는 이의 C-말단 절두형; 또는 피. 플루오레센스 EcpD 단백질 또는 이의 C-말단 절두형으로부터 선택되는 것인 재조합 융합 단백질.
- 제3항에 있어서, N-말단 융합 파트너가 C-말단으로부터 1 내지 200개 아미노산이 제거되도록 절두된 피. 플루오레센스 FklB 단백질, C-말단으로부터 1 내지 200개 아미노산이 제거되도록 절두된 피. 플루오레센스 EcpD 단백질, 또는 C-말단으로부터 1 내지 180개 아미노산이 제거되도록 절두된 피. 플루오레센스 FrnE 단백질인 재조합 융합 단백질.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 관심 폴리펩티드가 작거나 신속하게 분해되는 펩티드; 쉽게 분해되는 N-말단을 가진 단백질; 및 전형적으로 박테리아 발현 시스템에서 불용성 형태로 발현되는 단백질로부터 선택된 발현하기 어려운 단백질인 재조합 융합 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 관심 폴리펩티드가 작거나 신속하게 분해되는 펩티드이고, 관심 폴리펩티드가 hPTH1-34, Glp1, Glp2, IGF-1 엑세나타이드(서열 번호 37), 테두글루타이드(서열 번호 38), 프람린타이드(서열 번호 39), 지코노타이드(서열 번호 40), 베카플러민(서열 번호 42), 엔푸버타이드(서열 번호 43), 네시리타이드(서열 번호 44)로부터 선택되는 것인 재조합 융합 단백질
- 제1항 내지 제5항 중 어느 한 항에 있어서, 관심 폴리펩티드가 쉽게 분해되는 N-말단을 가진 단백질이고, 관심 폴리펩티드가 N-met-GCSF 또는 피. 팔시파룸(P. falciparum) 포자소체 단백질인 재조합 융합 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 관심 폴리펩티드가 전형적으로 박테리아 발현 시스템에서 불용성 단백질로서 발현되는 단백질이고, 관심 폴리펩티드가 인슐린 또는 인슐린 유사체로 프로세싱되는 프로인슐린, N-met-GCSF, GCSF, 또는 IFN-β인 재조합 융합 단백질.
- 제7항에 있어서, C-펩티드가 서열 번호 97; 서열 번호 98; 서열 번호 99; 또는 서열 번호 100으로부터 선택된 아미노산 서열을 갖는 것인 재조합 융합 단백질.
- 제7항에 있어서, 인슐린 유사체가 인슐린 글라진, 인슐린 아스파트, 라이스프로, 글루리신, 디터머, 또는 디글루덱인 재조합 융합 단백질.
- 제3항에 있어서, N-말단 융합 파트너가 서열 번호 2에 개시된 아미노산 서열을 갖는 피. 플루오레센스 DnaJ-유사 단백질인 재조합 융합 단백질.
- 제3항에 있어서, N-말단 융합 파트너가 서열 번호 4, 서열 번호 28, 서열 번호 61, 또는 서열 번호 62에 개시된 아미노산 서열을 갖는 피. 플루오레센스 FklB 단백질인 재조합 융합 단백질.
- 제3항에 있어서, N-말단 융합 파트너가 서열 번호 3, 서열 번호 63, 또는 서열 번호 64에 개시된 아미노산 서열을 갖는 피. 플루오레센스 FrnE 단백질인 재조합 융합 단백질.
- 제3항에 있어서, N-말단 융합 파트너가 서열 번호 7, 서열 번호 65, 서열 번호 66, 또는 서열 번호 67에 개시된 아미노산 서열을 갖는 피. 플루오레센스 EcpD 단백질인 재조합 융합 단백질.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 절단 부위가 엔테로키나아제; 트립신, 인자 Xa; 및 퓨린(furin)으로 이루어진 군의 절단 효소에 의해 인식되는 것인 재조합 융합 단백질.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 링커가 친화성 태그를 포함하는 것인 재조합 융합 단백질.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 링커가 서열 번호 9; 서열 번호 10; 서열 번호 11; 서열 번호 12; 및 서열 번호 226으로부터 선택된 아미노산 서열을 갖는 것인 재조합 융합 단백질.
- 제6항에 있어서, 관심 폴리펩티드가 hPTH1-34이고, 재조합 융합 단백질이 서열 번호 45; 서열 번호 46; 및 서열 번호 47로부터 선택된 아미노산 서열을 포함하는 것인 재조합 융합 단백질.
- 제1항 내지 제20항 중 어느 한 항의 재조합 융합 단백질의 발현을 위한 발현 벡터로서, 상기 재조합 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 것인 발현 벡터.
- (i) 발현 구조물을 포함하는 발현 벡터로 형질전환된 미생물 숙주 세포를 배양하는 단계로서, 상기 발현 구조물이 제1항 내지 제19항 중 어느 한 항의 재조합 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 것인 단계;
(ii) 재조합 융합 단백질을 발현하도록 단계 (i)의 숙주 세포를 유도하는 단계;
(iii) 단계 (ii)의 유도된 숙주 세포에서 발현된 재조합 융합 단백질을 정제하는 단계; 및
(iv) 단계 (iii)의 정제된 재조합 융합 단백질을, 링커 내 절단 부위를 인식하는 절단 효소와의 인큐베이션에 의해 절단하여 관심 폴리펩티드를 유리시킴으로써 관심 폴리펩티드를 얻는 단계
를 포함하는 관심 폴리펩티드의 생산 방법. - 제20항에 있어서, 단계 (ii)에서 발현된 융합 단백질의 발현 수준을 측정하는 단계, 단계 (iii)에서 정제된 재조합 융합 단백질의 양을 측정하는 단계, 또는 적합하게 유리된 단계 (iv)에서 얻어진 관심 폴리펩티드의 양을 측정하는 단계, 또는 상기 단계들의 조합을 더 포함하는 생산 방법.
- 제21항에 있어서, 단계 (iii) 또는 단계 (iv)에서 얻어진 관심 폴리펩티드의 양이 약 0.1 g/L 내지 약 25 g/L인 생산 방법.
- 제21항에 있어서, 얻어진 적합하게 유리된 관심 폴리펩티드가 가용성이거나, 완전(intact)하거나, 또는 둘 다인 생산 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462086119P | 2014-12-01 | 2014-12-01 | |
US62/086,119 | 2014-12-01 | ||
PCT/US2015/063027 WO2016089782A1 (en) | 2014-12-01 | 2015-11-30 | Fusion partners for peptide production |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170085129A true KR20170085129A (ko) | 2017-07-21 |
KR102353262B1 KR102353262B1 (ko) | 2022-01-18 |
Family
ID=56092296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177017007A KR102353262B1 (ko) | 2014-12-01 | 2015-11-30 | 펩티드 생산용 융합 파트너 |
Country Status (18)
Country | Link |
---|---|
US (2) | US10118956B2 (ko) |
EP (1) | EP3227455B1 (ko) |
JP (2) | JP6817939B2 (ko) |
KR (1) | KR102353262B1 (ko) |
CN (2) | CN107532190B (ko) |
AR (1) | AR102865A1 (ko) |
AU (1) | AU2015355242B2 (ko) |
BR (1) | BR112017011662A2 (ko) |
CA (1) | CA2966358C (ko) |
DK (1) | DK3227455T3 (ko) |
ES (1) | ES2952405T3 (ko) |
HK (1) | HK1245336A1 (ko) |
MX (1) | MX2017006866A (ko) |
NZ (1) | NZ732400A (ko) |
RU (1) | RU2017123283A (ko) |
SG (1) | SG11201704362VA (ko) |
TW (1) | TWI702289B (ko) |
WO (1) | WO2016089782A1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210063310A (ko) * | 2019-07-19 | 2021-06-01 | 주식회사 펩진 | GroES 융합을 이용한 글루카곤 유사 펩타이드-2 또는 이의 유사체의 생산방법 |
KR20210063309A (ko) * | 2019-07-19 | 2021-06-01 | 주식회사 펩진 | GroES 융합을 이용한 인간부갑상선호르몬 1-34의 생산방법 |
KR20210064144A (ko) * | 2019-07-19 | 2021-06-02 | 주식회사 펩진 | GroES 융합을 이용한 글루카곤 유사 펩타이드-1 또는 이의 유사체의 생산방법 |
US11267863B2 (en) | 2018-01-19 | 2022-03-08 | Pepgene Inc. | N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112017011662A2 (pt) | 2014-12-01 | 2018-02-27 | Pfenex Inc | parceiros de fusão para a produção de peptídeo |
US10474661B2 (en) | 2015-05-15 | 2019-11-12 | Foogal, Inc. | Dish recommendation from personal food inventory |
SG11202003614WA (en) | 2017-10-27 | 2020-05-28 | Pfenex Inc | Method for production of recombinant e. coli asparaginase |
CN111278852A (zh) * | 2017-10-27 | 2020-06-12 | 菲尼克斯公司 | 重组欧氏杆菌天冬酰胺酶的生产方法 |
CN108191981B (zh) * | 2018-02-06 | 2020-11-03 | 美药星(南京)制药有限公司 | 一种利拉鲁肽中间体多肽的制备方法 |
KR102017540B1 (ko) * | 2018-02-14 | 2019-09-03 | 주식회사 펩진 | 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-1 또는 이의 유사체를 생산하는 방법 |
KR102009709B1 (ko) * | 2018-02-14 | 2019-08-12 | 주식회사 펩진 | 융합 폴리펩타이드를 이용하여 인간 부갑상선 호르몬 1-84를 생산하는 방법 |
KR102017542B1 (ko) * | 2018-02-14 | 2019-09-03 | 주식회사 펩진 | 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-2 또는 이의 유사체를 생산하는 방법 |
CN108977423A (zh) * | 2018-08-17 | 2018-12-11 | 集美大学 | 一种从猪肺中分离提纯血管紧张素转化酶的方法 |
KR102011291B1 (ko) * | 2018-12-05 | 2019-10-21 | 주식회사 펩진 | 신규한 융합 폴리펩타이드 및 이를 이용하여 인간 부갑상선 호르몬 1-34를 생산하는 방법 |
US11364223B2 (en) | 2018-12-13 | 2022-06-21 | Huyabio International, Llc | Sulcardine administration for treatment of acute atrial fibrillation |
CN110305223B (zh) * | 2019-06-26 | 2022-05-13 | 重庆派金生物科技有限公司 | 重组串联融合蛋白制备目标多肽的方法 |
CN113773400B (zh) * | 2020-06-09 | 2023-08-18 | 宁波鲲鹏生物科技有限公司 | 一种门冬胰岛素衍生物及其应用 |
CN113151296B (zh) * | 2021-03-22 | 2022-09-13 | 云南中烟工业有限责任公司 | 一种烟草热激蛋白相关的基因及其应用 |
CN113025599B (zh) * | 2021-04-02 | 2023-09-12 | 重庆科润生物医药研发有限公司 | 一种重组溶组织梭菌i型胶原酶及其制备方法和应用 |
CN112941058B (zh) * | 2021-04-02 | 2023-12-05 | 重庆科润生物医药研发有限公司 | 一种重组溶组织梭菌ii型胶原酶及其制备方法和应用 |
EP4352219A1 (en) * | 2021-06-10 | 2024-04-17 | Pelican Technology Holdings, Inc. | Bacterial hosts for recombinant protein expression |
WO2023049631A2 (en) * | 2021-09-09 | 2023-03-30 | Northwestern University | Cell-free methods and compositions comprising tagless therapeutic hormones |
CN114350587B (zh) * | 2022-01-24 | 2023-10-31 | 修实生物医药(南通)有限公司 | 一种基因重组串联表达利那洛肽的工程菌 |
CN115109766A (zh) * | 2022-02-14 | 2022-09-27 | 上海理工大学 | 一种耐高温金属蛋白酶及其编码基因和应用 |
WO2024035782A1 (en) * | 2022-08-10 | 2024-02-15 | Aav Gene Therapeutics, Inc. | Aav-mediated intramuscular delivery of insulin |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1873251A1 (en) * | 2006-06-29 | 2008-01-02 | Chemotherapeutisches Forschungsinstitut Georg-Speyer-Haus | Expression vector(s) for enhanced expression of a protein of interest in eukaryotic or prokaryotic host cells |
KR20100023824A (ko) * | 2007-04-27 | 2010-03-04 | 다우 글로벌 테크놀로지스 인크. | 향상된 수율 및(또는) 품질로 이종 단백질을 발현하는 특정 균주를 동정하기 위해 미생물 숙주를 신속히 스크리닝하는 방법 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4769326A (en) | 1980-02-29 | 1988-09-06 | The Regents Of The University Of California | Expression linkers |
US4551433A (en) | 1981-05-18 | 1985-11-05 | Genentech, Inc. | Microbial hybrid promoters |
US4755465A (en) | 1983-04-25 | 1988-07-05 | Genentech, Inc. | Secretion of correctly processed human growth hormone in E. coli and Pseudomonas |
US5281532A (en) | 1983-07-27 | 1994-01-25 | Mycogen Corporation | Pseudomas hosts transformed with bacillus endotoxin genes |
US4695455A (en) | 1985-01-22 | 1987-09-22 | Mycogen Corporation | Cellular encapsulation of pesticides produced by expression of heterologous genes |
US4695462A (en) | 1985-06-28 | 1987-09-22 | Mycogen Corporation | Cellular encapsulation of biological pesticides |
GB8517071D0 (en) | 1985-07-05 | 1985-08-14 | Hoffmann La Roche | Gram-positive expression control sequence |
US5013653A (en) | 1987-03-20 | 1991-05-07 | Creative Biomolecules, Inc. | Product and process for introduction of a hinge region into a fusion protein to facilitate cleavage |
US5128130A (en) | 1988-01-22 | 1992-07-07 | Mycogen Corporation | Hybrid Bacillus thuringiensis gene, plasmid and transformed Pseudomonas fluorescens |
US5055294A (en) | 1988-03-03 | 1991-10-08 | Mycogen Corporation | Chimeric bacillus thuringiensis crystal protein gene comprising hd-73 and berliner 1715 toxin genes, transformed and expressed in pseudomonas fluorescens |
US5169760A (en) | 1989-07-27 | 1992-12-08 | Mycogen Corporation | Method, vectors, and host cells for the control of expression of heterologous genes from lac operated promoters |
US7150974B1 (en) | 1991-04-05 | 2006-12-19 | The General Hospital Corporation | Parathyroid hormone receptor binding method |
WO1993006217A1 (en) | 1991-09-19 | 1993-04-01 | Genentech, Inc. | EXPRESSION IN E. COLI OF ANTIBODY FRAGMENTS HAVING AT LEAST A CYSTEINE PRESENT AS A FREE THIOL, USE FOR THE PRODUCTION OF BIFUNCTIONAL F(ab')2 ANTIBODIES |
CA2125467C (en) | 1993-07-06 | 2001-02-06 | Heinz Dobeli | Process for producing hydrophobic polypeptides, proteins or peptides |
US5935824A (en) | 1996-01-31 | 1999-08-10 | Technologene, Inc. | Protein expression system |
CA2198966C (en) | 1996-03-04 | 2011-06-21 | Yuji Suzuki | Method for cleaving chimeric protein using processing enzyme |
JPH1175879A (ja) * | 1997-07-08 | 1999-03-23 | Toyota Central Res & Dev Lab Inc | プロテインジスルフィドイソメラーゼを含有する融合タンパク質をコードするdna |
US5989868A (en) | 1997-09-12 | 1999-11-23 | The Board Of Regents Of The University Of Oklahoma | Fusion protein systems designed to increase soluble cytoplasmic expression of heterologous proteins in esherichia coli |
CA2284847A1 (en) | 1998-01-30 | 1999-08-05 | Suntory Limited | Process for producing peptides using a helper peptide |
US6242219B1 (en) | 1999-03-18 | 2001-06-05 | Xoma (Us) Llc | Methods for recombinant peptide production |
CA2408630A1 (en) | 2000-06-19 | 2001-12-27 | Dyax Corp. | Novel enterokinase cleavage sequences |
JP2002262873A (ja) | 2001-03-06 | 2002-09-17 | Inst Of Physical & Chemical Res | タンパク質ドメインの製造方法及びその方法により得られたドメインを用いるタンパク質の立体構造解析方法 |
DK1402015T3 (da) * | 2001-06-22 | 2011-12-05 | Hoffmann La Roche | Opløseligt kompleks omfattende et retroviralt overfladeglycoprotein og FkpA eller SlyD |
EP1417237B1 (en) | 2001-07-26 | 2011-04-06 | Advanced Protein Technologies Corp. | Process for preparation of polypeptides of interest from fusion peolypeptides |
EP1539794B1 (en) | 2002-07-03 | 2008-12-31 | Dow Global Technologies Inc. | Benzoate- and anthranilate-inducible promoters |
CA2495145A1 (en) | 2002-08-09 | 2004-02-19 | National Research Council Of Canada | Staphylococcal nuclease fusion proteins for the production of recombinant peptides |
US7208585B2 (en) | 2002-09-18 | 2007-04-24 | Genencor International, Inc. | Protein purification |
US9453251B2 (en) | 2002-10-08 | 2016-09-27 | Pfenex Inc. | Expression of mammalian proteins in Pseudomonas fluorescens |
EP1621555A4 (en) | 2003-04-18 | 2006-08-02 | Sekisui Chemical Co Ltd | IMMUNOGENIC, COMPOSITION FOR IMMUNOLOGICAL USE AND METHOD FOR THE PRODUCTION OF ANTIBODIES WITH THEIR USE |
JP2005110591A (ja) | 2003-10-08 | 2005-04-28 | Sekisui Chem Co Ltd | 蛋白質の分離方法 |
AU2004293810B2 (en) | 2003-11-19 | 2010-07-01 | Pelican Technology Holdings, Inc. | Improved protein expression systems |
EP2336153B1 (en) | 2003-11-21 | 2016-03-30 | Pfenex Inc. | Improved expression systems with SEC-system secretion |
WO2005049847A1 (en) | 2003-11-24 | 2005-06-02 | Novo Nordisk A/S | Fusion proteins and methods of cleavage of such proteins |
JP5602336B2 (ja) | 2004-01-16 | 2014-10-08 | フェネックス インコーポレイテッド | シュードモナス・フルオレッセンスにおける哺乳動物タンパク質の発現 |
WO2006078273A2 (en) * | 2004-04-26 | 2006-07-27 | The United States Of America As Represented By Teh Secretary Of Health And Human Services, Nih | Methods and compositions for producing recombinant proteins |
EP1748071A4 (en) | 2004-05-21 | 2009-01-07 | Takara Bio Inc | PROCESS FOR PRODUCTION OF POLYPEPTIDE |
WO2006014899A2 (en) | 2004-07-26 | 2006-02-09 | Dow Global Technologies Inc. | Process for improved protein expression by strain engineering |
ATE540981T1 (de) | 2004-08-11 | 2012-01-15 | Univ Ramot | Lösliche fusionsproteine enthaltend heterologe polypeptide |
JP4897792B2 (ja) | 2005-04-20 | 2012-03-14 | ビロメッド カンパニー, リミテッド | 融合タンパク質の分離のための組成物および方法 |
EP1888763B1 (en) | 2005-06-06 | 2015-08-12 | Pfenex Inc. | Mannitol induced promoter systems in bacterial host cells |
EP2363495B1 (en) | 2006-05-30 | 2019-07-24 | Pfenex Inc. | Anthrax vaccine |
AU2007254993A1 (en) | 2006-05-30 | 2007-12-13 | Dow Global Technologies Llc | Codon optimization method |
PL2468869T3 (pl) | 2007-01-31 | 2015-08-31 | Pfenex Inc | Bakteryjna sekwencja wiodąca dla zwiększonej ekspresji |
US9580719B2 (en) | 2007-04-27 | 2017-02-28 | Pfenex, Inc. | Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins |
RU2441019C2 (ru) | 2007-08-09 | 2012-01-27 | Юсв Лимитед | Способ синтеза рекомбинантного паратиреоидного гормона человека |
US7943733B2 (en) | 2007-12-20 | 2011-05-17 | University Of Southern California | Spacers to increase the expression of recombinant fusion proteins |
EP2127678A1 (en) | 2008-05-26 | 2009-12-02 | Roche Diagnostics GmbH | SlpA as a tool for recombinant protein and enzyme technology |
JP2010006745A (ja) * | 2008-06-27 | 2010-01-14 | Sekisui Chem Co Ltd | 融合タンパク質、融合タンパク質固定化担体、化合物のスクリーニング方法、スクリーニング用組成物、並びに、スクリーニング用キット |
WO2010064748A1 (en) | 2008-12-04 | 2010-06-10 | Korea Research Institute Of Bioscience And Biotechnology | Screening of abundantly secreted proteins and their use as fusion partners for the production of recombinant proteins |
PL2552949T3 (pl) | 2010-04-01 | 2017-01-31 | Pfenex Inc. | Sposoby wytwarzania G-CSF w komórce gospodarza Pseudomonas |
WO2011151714A1 (en) | 2010-06-04 | 2011-12-08 | Lupin Limited | Modified sak gene for the production of recombinant proteins |
AR086250A1 (es) | 2011-05-05 | 2013-11-27 | Hoffmann La Roche | Polipeptido de fusion presentador de una secuencia de aminoacidos y utilizacion del mismo |
US9169304B2 (en) | 2012-05-01 | 2015-10-27 | Pfenex Inc. | Process for purifying recombinant Plasmodium falciparum circumsporozoite protein |
BR112017011662A2 (pt) | 2014-12-01 | 2018-02-27 | Pfenex Inc | parceiros de fusão para a produção de peptídeo |
US20180023098A1 (en) | 2015-02-13 | 2018-01-25 | Sekisui Chemical Co., Ltd. | Nucleic acid, fusion protein, recombined cell, and isoprene or cyclic terpene production method |
-
2015
- 2015-11-30 BR BR112017011662A patent/BR112017011662A2/pt active Search and Examination
- 2015-11-30 US US14/954,766 patent/US10118956B2/en active Active
- 2015-11-30 JP JP2017530121A patent/JP6817939B2/ja active Active
- 2015-11-30 RU RU2017123283A patent/RU2017123283A/ru not_active Application Discontinuation
- 2015-11-30 DK DK15866061.3T patent/DK3227455T3/da active
- 2015-11-30 MX MX2017006866A patent/MX2017006866A/es unknown
- 2015-11-30 WO PCT/US2015/063027 patent/WO2016089782A1/en active Application Filing
- 2015-11-30 AU AU2015355242A patent/AU2015355242B2/en active Active
- 2015-11-30 ES ES15866061T patent/ES2952405T3/es active Active
- 2015-11-30 NZ NZ732400A patent/NZ732400A/en unknown
- 2015-11-30 CN CN201580064973.4A patent/CN107532190B/zh active Active
- 2015-11-30 SG SG11201704362VA patent/SG11201704362VA/en unknown
- 2015-11-30 KR KR1020177017007A patent/KR102353262B1/ko active IP Right Grant
- 2015-11-30 EP EP15866061.3A patent/EP3227455B1/en active Active
- 2015-11-30 CN CN202110725675.2A patent/CN113444183A/zh active Pending
- 2015-11-30 CA CA2966358A patent/CA2966358C/en active Active
- 2015-12-01 AR ARP150103916A patent/AR102865A1/es unknown
- 2015-12-01 TW TW104140109A patent/TWI702289B/zh active
-
2018
- 2018-04-09 HK HK18104633.5A patent/HK1245336A1/zh unknown
- 2018-09-19 US US16/135,875 patent/US10981968B2/en active Active
-
2020
- 2020-09-03 JP JP2020148237A patent/JP7148579B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1873251A1 (en) * | 2006-06-29 | 2008-01-02 | Chemotherapeutisches Forschungsinstitut Georg-Speyer-Haus | Expression vector(s) for enhanced expression of a protein of interest in eukaryotic or prokaryotic host cells |
KR20100023824A (ko) * | 2007-04-27 | 2010-03-04 | 다우 글로벌 테크놀로지스 인크. | 향상된 수율 및(또는) 품질로 이종 단백질을 발현하는 특정 균주를 동정하기 위해 미생물 숙주를 신속히 스크리닝하는 방법 |
Non-Patent Citations (1)
Title |
---|
J.-H. Ahn et al, PLoS ONE, 6(11): e26875, p.1-9 (2011.11.02.)* * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11267863B2 (en) | 2018-01-19 | 2022-03-08 | Pepgene Inc. | N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same |
KR20210063310A (ko) * | 2019-07-19 | 2021-06-01 | 주식회사 펩진 | GroES 융합을 이용한 글루카곤 유사 펩타이드-2 또는 이의 유사체의 생산방법 |
KR20210063309A (ko) * | 2019-07-19 | 2021-06-01 | 주식회사 펩진 | GroES 융합을 이용한 인간부갑상선호르몬 1-34의 생산방법 |
KR20210064144A (ko) * | 2019-07-19 | 2021-06-02 | 주식회사 펩진 | GroES 융합을 이용한 글루카곤 유사 펩타이드-1 또는 이의 유사체의 생산방법 |
Also Published As
Publication number | Publication date |
---|---|
CN107532190A (zh) | 2018-01-02 |
BR112017011662A2 (pt) | 2018-02-27 |
US10118956B2 (en) | 2018-11-06 |
US10981968B2 (en) | 2021-04-20 |
JP2017536835A (ja) | 2017-12-14 |
SG11201704362VA (en) | 2017-06-29 |
ES2952405T3 (es) | 2023-10-31 |
EP3227455A1 (en) | 2017-10-11 |
AU2015355242B2 (en) | 2020-10-08 |
US20190135889A1 (en) | 2019-05-09 |
TWI702289B (zh) | 2020-08-21 |
KR102353262B1 (ko) | 2022-01-18 |
EP3227455A4 (en) | 2018-07-04 |
CA2966358A1 (en) | 2016-06-09 |
JP7148579B2 (ja) | 2022-10-05 |
JP6817939B2 (ja) | 2021-01-20 |
MX2017006866A (es) | 2017-11-15 |
JP2021003117A (ja) | 2021-01-14 |
EP3227455B1 (en) | 2023-07-12 |
HK1245336A1 (zh) | 2018-08-24 |
DK3227455T3 (da) | 2023-08-21 |
US20160159877A1 (en) | 2016-06-09 |
TW201629226A (zh) | 2016-08-16 |
AU2015355242A1 (en) | 2017-06-22 |
CA2966358C (en) | 2021-12-07 |
CN107532190B (zh) | 2021-07-09 |
CN113444183A (zh) | 2021-09-28 |
NZ732400A (en) | 2021-07-30 |
AR102865A1 (es) | 2017-03-29 |
WO2016089782A1 (en) | 2016-06-09 |
RU2017123283A (ru) | 2019-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102353262B1 (ko) | 펩티드 생산용 융합 파트너 | |
JP5028551B2 (ja) | Sec系分泌によって改良された発現系 | |
KR101183720B1 (ko) | 슈도모나스 플루오레센스에서의 포유류 단백질의 발현 | |
JP2023123512A (ja) | 組み換えerwiniaアスパラギナーゼの製造のための方法 | |
KR101739128B1 (ko) | 재조합 crm197의 고 수준 발현 | |
JP7358347B2 (ja) | 組み換えE.coliアスパラギナーゼの製造のための方法 | |
TW201726706A (zh) | 胜肽標記及含有其之附加標記的蛋白質 | |
US20090305351A1 (en) | Method for preparing soluble and active recombinant proteins using pdi as a fusion partner | |
EP3289088B1 (en) | Uncoupling growth and protein production | |
KR20200073280A (ko) | 주변세포질 단백질 발현을 위한 박테리아 리더 서열 | |
KR100890184B1 (ko) | SlyD를 융합파트너로 이용한 재조합 단백질의 제조방법 | |
CN111278979B (zh) | 重组大肠杆菌天冬酰胺酶的生产方法 | |
US20220119792A1 (en) | Gene expression cassette for expressing n-terminal methionine-truncated protein of interest and method for producing n-terminal methionine-truncated protein of interest by using same | |
KR100890189B1 (ko) | Rna 중합효소 알파 소단위를 융합파트너로 이용한재조합 단백질의 제조방법 | |
MXPA06008061A (en) | Expression of mammalian proteins in pseudomonas fluorescens |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |