KR20240021234A - 재조합 단백질 발현을 위한 박테리아 숙주 - Google Patents
재조합 단백질 발현을 위한 박테리아 숙주 Download PDFInfo
- Publication number
- KR20240021234A KR20240021234A KR1020247000858A KR20247000858A KR20240021234A KR 20240021234 A KR20240021234 A KR 20240021234A KR 1020247000858 A KR1020247000858 A KR 1020247000858A KR 20247000858 A KR20247000858 A KR 20247000858A KR 20240021234 A KR20240021234 A KR 20240021234A
- Authority
- KR
- South Korea
- Prior art keywords
- acid sequence
- seq
- amino acid
- set forth
- host cell
- Prior art date
Links
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title claims abstract description 69
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title claims abstract description 69
- 230000014509 gene expression Effects 0.000 title claims abstract description 39
- 230000001580 bacterial effect Effects 0.000 title claims description 172
- 108091005804 Peptidases Proteins 0.000 claims abstract description 684
- 239000004365 Protease Substances 0.000 claims abstract description 499
- 238000000034 method Methods 0.000 claims abstract description 92
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 62
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 59
- 229920001184 polypeptide Polymers 0.000 claims abstract description 58
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims abstract description 57
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims abstract description 57
- 108090000623 proteins and genes Proteins 0.000 claims description 674
- 230000000694 effects Effects 0.000 claims description 524
- 102000035195 Peptidases Human genes 0.000 claims description 508
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 500
- 235000019419 proteases Nutrition 0.000 claims description 470
- 102000004169 proteins and genes Human genes 0.000 claims description 422
- 210000004027 cell Anatomy 0.000 claims description 324
- 230000002358 autolytic effect Effects 0.000 claims description 166
- 108010013639 Peptidoglycan Proteins 0.000 claims description 163
- 108010062417 DD-endopeptidase Proteins 0.000 claims description 155
- 230000035772 mutation Effects 0.000 claims description 119
- 230000002950 deficient Effects 0.000 claims description 97
- 239000002243 precursor Substances 0.000 claims description 81
- 150000007523 nucleic acids Chemical group 0.000 claims description 65
- 102000037865 fusion proteins Human genes 0.000 claims description 54
- 108020001507 fusion proteins Proteins 0.000 claims description 54
- 108010078959 C-terminal processing peptidase Proteins 0.000 claims description 53
- 238000006467 substitution reaction Methods 0.000 claims description 53
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 51
- 241000589540 Pseudomonas fluorescens Species 0.000 claims description 39
- 230000007812 deficiency Effects 0.000 claims description 39
- 230000012010 growth Effects 0.000 claims description 34
- 241000588724 Escherichia coli Species 0.000 claims description 30
- 108010006464 Hemolysin Proteins Proteins 0.000 claims description 28
- 239000003228 hemolysin Substances 0.000 claims description 28
- 102000004190 Enzymes Human genes 0.000 claims description 27
- 108090000790 Enzymes Proteins 0.000 claims description 27
- 229940088598 enzyme Drugs 0.000 claims description 27
- 241000894006 Bacteria Species 0.000 claims description 24
- 230000028327 secretion Effects 0.000 claims description 24
- 230000006378 damage Effects 0.000 claims description 23
- 239000013604 expression vector Substances 0.000 claims description 21
- 150000001413 amino acids Chemical class 0.000 claims description 20
- 108010047041 Complementarity Determining Regions Proteins 0.000 claims description 18
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 18
- 241001529936 Murinae Species 0.000 claims description 17
- FBUKMFOXMZRGRB-UHFFFAOYSA-N Coronaric acid Natural products CCCCCC=CCC1OC1CCCCCCCC(O)=O FBUKMFOXMZRGRB-UHFFFAOYSA-N 0.000 claims description 16
- 101710170970 Leukotoxin Proteins 0.000 claims description 16
- 108090000279 Peptidyltransferases Proteins 0.000 claims description 14
- 239000000427 antigen Substances 0.000 claims description 14
- 108091007433 antigens Proteins 0.000 claims description 14
- 102000036639 antigens Human genes 0.000 claims description 14
- 102100033830 Amphiphysin Human genes 0.000 claims description 12
- 108091026890 Coding region Proteins 0.000 claims description 12
- 101710201881 D-alanyl-D-alanine-carboxypeptidase/endopeptidase AmpH Proteins 0.000 claims description 12
- 102100033342 Lysosomal acid glucosylceramidase Human genes 0.000 claims description 12
- 102000006010 Protein Disulfide-Isomerase Human genes 0.000 claims description 12
- 238000000855 fermentation Methods 0.000 claims description 12
- 230000004151 fermentation Effects 0.000 claims description 12
- 108020003519 protein disulfide isomerase Proteins 0.000 claims description 12
- 108010078791 Carrier Proteins Proteins 0.000 claims description 11
- 108010026389 Gramicidin Proteins 0.000 claims description 11
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 11
- 108010003723 Single-Domain Antibodies Proteins 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 11
- 235000019833 protease Nutrition 0.000 claims description 11
- 101710118538 Protease Proteins 0.000 claims description 10
- 230000006698 induction Effects 0.000 claims description 10
- 210000001322 periplasm Anatomy 0.000 claims description 10
- 230000001225 therapeutic effect Effects 0.000 claims description 10
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 claims description 9
- 241000607598 Vibrio Species 0.000 claims description 9
- 230000027455 binding Effects 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 9
- 230000003248 secreting effect Effects 0.000 claims description 9
- 241000271566 Aves Species 0.000 claims description 8
- 102000019034 Chemokines Human genes 0.000 claims description 8
- 108010012236 Chemokines Proteins 0.000 claims description 8
- 241000251730 Chondrichthyes Species 0.000 claims description 8
- 102000004127 Cytokines Human genes 0.000 claims description 8
- 108090000695 Cytokines Proteins 0.000 claims description 8
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 claims description 8
- 102000005593 Endopeptidases Human genes 0.000 claims description 8
- 108010059378 Endopeptidases Proteins 0.000 claims description 8
- 229930195725 Mannitol Natural products 0.000 claims description 8
- 230000003281 allosteric effect Effects 0.000 claims description 8
- 108010051210 beta-Fructofuranosidase Proteins 0.000 claims description 8
- 239000003102 growth factor Substances 0.000 claims description 8
- 230000001939 inductive effect Effects 0.000 claims description 8
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 8
- 239000000594 mannitol Substances 0.000 claims description 8
- 235000010355 mannitol Nutrition 0.000 claims description 8
- 239000013612 plasmid Substances 0.000 claims description 8
- 230000012743 protein tagging Effects 0.000 claims description 8
- 229960000532 sacrosidase Drugs 0.000 claims description 8
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 7
- 238000003780 insertion Methods 0.000 claims description 7
- 230000037431 insertion Effects 0.000 claims description 7
- 102000039446 nucleic acids Human genes 0.000 claims description 7
- 108020004707 nucleic acids Proteins 0.000 claims description 7
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 6
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 6
- 241000186216 Corynebacterium Species 0.000 claims description 6
- 108091006020 Fc-tagged proteins Proteins 0.000 claims description 6
- 241000192125 Firmicutes Species 0.000 claims description 6
- 101001041393 Homo sapiens Serine protease HTRA1 Proteins 0.000 claims description 6
- 108060003951 Immunoglobulin Proteins 0.000 claims description 6
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 claims description 6
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 claims description 6
- 102000004195 Isomerases Human genes 0.000 claims description 6
- 108090000769 Isomerases Proteins 0.000 claims description 6
- 102100037061 Protein disulfide-isomerase A6 Human genes 0.000 claims description 6
- 241000589516 Pseudomonas Species 0.000 claims description 6
- 102100021119 Serine protease HTRA1 Human genes 0.000 claims description 6
- 102000018358 immunoglobulin Human genes 0.000 claims description 6
- 230000002797 proteolythic effect Effects 0.000 claims description 6
- 229960005486 vaccine Drugs 0.000 claims description 6
- 108010092464 Urate Oxidase Proteins 0.000 claims description 5
- 238000003776 cleavage reaction Methods 0.000 claims description 5
- 210000001723 extracellular space Anatomy 0.000 claims description 5
- 230000001965 increasing effect Effects 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 239000012528 membrane Substances 0.000 claims description 5
- 230000007017 scission Effects 0.000 claims description 5
- NPOCDVAOUKODSQ-ZDUSSCGKSA-N (2s)-2-amino-6-[6-(2-methoxyethoxy)hexanoylamino]hexanoic acid Chemical compound COCCOCCCCCC(=O)NCCCC[C@H](N)C(O)=O NPOCDVAOUKODSQ-ZDUSSCGKSA-N 0.000 claims description 4
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 claims description 4
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 4
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 4
- 108010088751 Albumins Proteins 0.000 claims description 4
- 102000009027 Albumins Human genes 0.000 claims description 4
- 102000007698 Alcohol dehydrogenase Human genes 0.000 claims description 4
- 108010021809 Alcohol dehydrogenase Proteins 0.000 claims description 4
- 108010025188 Alcohol oxidase Proteins 0.000 claims description 4
- 239000004382 Amylase Substances 0.000 claims description 4
- 102000013142 Amylases Human genes 0.000 claims description 4
- 108010065511 Amylases Proteins 0.000 claims description 4
- 102000004452 Arginase Human genes 0.000 claims description 4
- 108700024123 Arginases Proteins 0.000 claims description 4
- 108010024976 Asparaginase Proteins 0.000 claims description 4
- 102000015790 Asparaginase Human genes 0.000 claims description 4
- 102100026189 Beta-galactosidase Human genes 0.000 claims description 4
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 claims description 4
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 claims description 4
- 241000283690 Bos taurus Species 0.000 claims description 4
- 102000003846 Carbonic anhydrases Human genes 0.000 claims description 4
- 108090000209 Carbonic anhydrases Proteins 0.000 claims description 4
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 claims description 4
- 102100025475 Carcinoembryonic antigen-related cell adhesion molecule 5 Human genes 0.000 claims description 4
- 108010022172 Chitinases Proteins 0.000 claims description 4
- 102000012286 Chitinases Human genes 0.000 claims description 4
- 108010023736 Chondroitinases and Chondroitin Lyases Proteins 0.000 claims description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 claims description 4
- 108010093031 Galactosidases Proteins 0.000 claims description 4
- 102000002464 Galactosidases Human genes 0.000 claims description 4
- 108010017544 Glucosylceramidase Proteins 0.000 claims description 4
- 108010060309 Glucuronidase Proteins 0.000 claims description 4
- 102000053187 Glucuronidase Human genes 0.000 claims description 4
- 108010073324 Glutaminase Proteins 0.000 claims description 4
- 102000009127 Glutaminase Human genes 0.000 claims description 4
- 108010070675 Glutathione transferase Proteins 0.000 claims description 4
- 101001098769 Homo sapiens Protein disulfide-isomerase A6 Proteins 0.000 claims description 4
- 108010003272 Hyaluronate lyase Proteins 0.000 claims description 4
- 102000009066 Hyaluronoglucosaminidase Human genes 0.000 claims description 4
- 108010059881 Lactase Proteins 0.000 claims description 4
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 claims description 4
- 102000018697 Membrane Proteins Human genes 0.000 claims description 4
- 108010052285 Membrane Proteins Proteins 0.000 claims description 4
- 108010014251 Muramidase Proteins 0.000 claims description 4
- 102000016943 Muramidase Human genes 0.000 claims description 4
- 102100031688 N-acetylgalactosamine-6-sulfatase Human genes 0.000 claims description 4
- 108020004485 Nonsense Codon Proteins 0.000 claims description 4
- 101710132082 Pyrimidine/purine nucleoside phosphorylase Proteins 0.000 claims description 4
- 102000006382 Ribonucleases Human genes 0.000 claims description 4
- 108010083644 Ribonucleases Proteins 0.000 claims description 4
- 101710145796 Staphylokinase Proteins 0.000 claims description 4
- 108010090804 Streptavidin Proteins 0.000 claims description 4
- 108010023197 Streptokinase Proteins 0.000 claims description 4
- 102000004385 Sulfurtransferases Human genes 0.000 claims description 4
- 108090000984 Sulfurtransferases Proteins 0.000 claims description 4
- 102000013537 Thymidine Phosphorylase Human genes 0.000 claims description 4
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 4
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 claims description 4
- 108090000848 Ubiquitin Proteins 0.000 claims description 4
- 102000044159 Ubiquitin Human genes 0.000 claims description 4
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 claims description 4
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 claims description 4
- 229960004470 agalsidase beta Drugs 0.000 claims description 4
- 108010056760 agalsidase beta Proteins 0.000 claims description 4
- 229960003122 alglucerase Drugs 0.000 claims description 4
- 108010060162 alglucerase Proteins 0.000 claims description 4
- 235000019418 amylase Nutrition 0.000 claims description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 4
- 229960003272 asparaginase Drugs 0.000 claims description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 claims description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 4
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 4
- 229960000182 blood factors Drugs 0.000 claims description 4
- 229940112869 bone morphogenetic protein Drugs 0.000 claims description 4
- 102000038379 digestive enzymes Human genes 0.000 claims description 4
- 108091007734 digestive enzymes Proteins 0.000 claims description 4
- 108010067396 dornase alfa Proteins 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- KUBARPMUNHKBIQ-VTHUDJRQSA-N eliglustat tartrate Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O.C([C@@H](NC(=O)CCCCCCC)[C@H](O)C=1C=C2OCCOC2=CC=1)N1CCCC1.C([C@@H](NC(=O)CCCCCCC)[C@H](O)C=1C=C2OCCOC2=CC=1)N1CCCC1 KUBARPMUNHKBIQ-VTHUDJRQSA-N 0.000 claims description 4
- 102000005396 glutamine synthetase Human genes 0.000 claims description 4
- 108020002326 glutamine synthetase Proteins 0.000 claims description 4
- 229960002773 hyaluronidase Drugs 0.000 claims description 4
- 229960002127 imiglucerase Drugs 0.000 claims description 4
- 108010039650 imiglucerase Proteins 0.000 claims description 4
- 229940116108 lactase Drugs 0.000 claims description 4
- 229960000274 lysozyme Drugs 0.000 claims description 4
- 239000004325 lysozyme Substances 0.000 claims description 4
- 235000010335 lysozyme Nutrition 0.000 claims description 4
- 229940086319 nattokinase Drugs 0.000 claims description 4
- 108010073682 nattokinase Proteins 0.000 claims description 4
- 230000037434 nonsense mutation Effects 0.000 claims description 4
- 244000052769 pathogen Species 0.000 claims description 4
- 230000001717 pathogenic effect Effects 0.000 claims description 4
- 229960001218 pegademase Drugs 0.000 claims description 4
- 108010027841 pegademase bovine Proteins 0.000 claims description 4
- 229960000424 rasburicase Drugs 0.000 claims description 4
- 108010084837 rasburicase Proteins 0.000 claims description 4
- 229960005202 streptokinase Drugs 0.000 claims description 4
- 108060008226 thioredoxin Proteins 0.000 claims description 4
- 229940094937 thioredoxin Drugs 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 229960005356 urokinase Drugs 0.000 claims description 4
- 101000981889 Brevibacillus parabrevis Linear gramicidin-PCP reductase Proteins 0.000 claims description 3
- 229920002101 Chitin Polymers 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- 108010013381 Porins Proteins 0.000 claims description 3
- 108010025955 Pyocins Proteins 0.000 claims description 3
- 231100000221 frame shift mutation induction Toxicity 0.000 claims description 3
- 230000037433 frameshift Effects 0.000 claims description 3
- 238000012224 gene deletion Methods 0.000 claims description 3
- 108020004999 messenger RNA Proteins 0.000 claims description 3
- 238000012259 partial gene deletion Methods 0.000 claims description 3
- 102000007739 porin activity proteins Human genes 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 102100038080 B-cell receptor CD22 Human genes 0.000 claims description 2
- 108010077805 Bacterial Proteins Proteins 0.000 claims description 2
- 102000004506 Blood Proteins Human genes 0.000 claims description 2
- 108010017384 Blood Proteins Proteins 0.000 claims description 2
- 102000014914 Carrier Proteins Human genes 0.000 claims description 2
- 241000700199 Cavia porcellus Species 0.000 claims description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 claims description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 claims description 2
- 108091028732 Concatemer Proteins 0.000 claims description 2
- 102000009123 Fibrin Human genes 0.000 claims description 2
- 108010073385 Fibrin Proteins 0.000 claims description 2
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 claims description 2
- 241000233866 Fungi Species 0.000 claims description 2
- 241000287828 Gallus gallus Species 0.000 claims description 2
- 102000009465 Growth Factor Receptors Human genes 0.000 claims description 2
- 108010009202 Growth Factor Receptors Proteins 0.000 claims description 2
- 241000282414 Homo sapiens Species 0.000 claims description 2
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 claims description 2
- 108091008036 Immune checkpoint proteins Proteins 0.000 claims description 2
- 102000037982 Immune checkpoint proteins Human genes 0.000 claims description 2
- 102000014150 Interferons Human genes 0.000 claims description 2
- 108010050904 Interferons Proteins 0.000 claims description 2
- 102000015696 Interleukins Human genes 0.000 claims description 2
- 108010063738 Interleukins Proteins 0.000 claims description 2
- 108090001030 Lipoproteins Proteins 0.000 claims description 2
- 102000004895 Lipoproteins Human genes 0.000 claims description 2
- 231100000757 Microbial toxin Toxicity 0.000 claims description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 2
- 108091000080 Phosphotransferase Proteins 0.000 claims description 2
- 101710106234 Protein disulfide-isomerase A5 Proteins 0.000 claims description 2
- 241000700159 Rattus Species 0.000 claims description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 2
- 108090000899 Serralysin Proteins 0.000 claims description 2
- 102000043168 TGF-beta family Human genes 0.000 claims description 2
- 108091085018 TGF-beta family Proteins 0.000 claims description 2
- 239000003146 anticoagulant agent Substances 0.000 claims description 2
- 229940127219 anticoagulant drug Drugs 0.000 claims description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 2
- 108091008324 binding proteins Proteins 0.000 claims description 2
- 230000002210 biocatalytic effect Effects 0.000 claims description 2
- 238000004113 cell culture Methods 0.000 claims description 2
- 229960003115 certolizumab pegol Drugs 0.000 claims description 2
- 239000003153 chemical reaction reagent Substances 0.000 claims description 2
- 229950003499 fibrin Drugs 0.000 claims description 2
- 239000003527 fibrinolytic agent Substances 0.000 claims description 2
- 210000003714 granulocyte Anatomy 0.000 claims description 2
- 239000001963 growth medium Substances 0.000 claims description 2
- 239000005556 hormone Substances 0.000 claims description 2
- 229940088597 hormone Drugs 0.000 claims description 2
- 229940126546 immune checkpoint molecule Drugs 0.000 claims description 2
- 229940079322 interferon Drugs 0.000 claims description 2
- 239000003446 ligand Substances 0.000 claims description 2
- 102000020233 phosphotransferase Human genes 0.000 claims description 2
- 102000005962 receptors Human genes 0.000 claims description 2
- 108020003175 receptors Proteins 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 229960000103 thrombolytic agent Drugs 0.000 claims description 2
- 102000005720 Glutathione transferase Human genes 0.000 claims 2
- 102000002933 Thioredoxin Human genes 0.000 claims 2
- DEFJQIDDEAULHB-QWWZWVQMSA-N D-alanyl-D-alanine Chemical compound C[C@@H]([NH3+])C(=O)N[C@H](C)C([O-])=O DEFJQIDDEAULHB-QWWZWVQMSA-N 0.000 claims 1
- DEFJQIDDEAULHB-UHFFFAOYSA-N N-D-alanyl-D-alanine Natural products CC(N)C(=O)NC(C)C(O)=O DEFJQIDDEAULHB-UHFFFAOYSA-N 0.000 claims 1
- 241000607365 Vibrio natriegens Species 0.000 claims 1
- 108010056243 alanylalanine Proteins 0.000 claims 1
- 101150039027 ampH gene Proteins 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 7
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 abstract description 2
- 230000000593 degrading effect Effects 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 347
- 208000035404 Autolysis Diseases 0.000 description 174
- 206010057248 Cell death Diseases 0.000 description 174
- 230000028043 self proteolysis Effects 0.000 description 174
- 235000001014 amino acid Nutrition 0.000 description 42
- 108010006519 Molecular Chaperones Proteins 0.000 description 21
- 229940024606 amino acid Drugs 0.000 description 18
- 101150036535 prc gene Proteins 0.000 description 17
- 230000037430 deletion Effects 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000004952 protein activity Effects 0.000 description 13
- 102000005431 Molecular Chaperones Human genes 0.000 description 10
- 230000010261 cell growth Effects 0.000 description 10
- 108090001081 Dipeptidases Proteins 0.000 description 9
- 102000004860 Dipeptidases Human genes 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 241000589776 Pseudomonas putida Species 0.000 description 8
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 7
- 102000004400 Aminopeptidases Human genes 0.000 description 6
- 108090000915 Aminopeptidases Proteins 0.000 description 6
- -1 D-lactoyl group Chemical group 0.000 description 6
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 239000010432 diamond Substances 0.000 description 5
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 4
- 108090000194 Dipeptidyl-peptidases and tripeptidyl-peptidases Proteins 0.000 description 4
- 102000003779 Dipeptidyl-peptidases and tripeptidyl-peptidases Human genes 0.000 description 4
- 102000005741 Metalloproteases Human genes 0.000 description 4
- 108010006035 Metalloproteases Proteins 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 230000017854 proteolysis Effects 0.000 description 4
- 108010087967 type I signal peptidase Proteins 0.000 description 4
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 3
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 3
- 102000001398 Granzyme Human genes 0.000 description 3
- 108060005986 Granzyme Proteins 0.000 description 3
- 241000589248 Legionella Species 0.000 description 3
- 208000007764 Legionnaires' Disease Diseases 0.000 description 3
- 241000239218 Limulus Species 0.000 description 3
- 239000006142 Luria-Bertani Agar Substances 0.000 description 3
- 108010067372 Pancreatic elastase Proteins 0.000 description 3
- 102000016387 Pancreatic elastase Human genes 0.000 description 3
- 208000008425 Protein deficiency Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000003114 blood coagulation factor Substances 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 102000034356 gene-regulatory proteins Human genes 0.000 description 3
- 108091006104 gene-regulatory proteins Proteins 0.000 description 3
- 150000004676 glycans Chemical class 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 230000002101 lytic effect Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- GMKMEZVLHJARHF-UHFFFAOYSA-N 2,6-diaminopimelic acid Chemical compound OC(=O)C(N)CCCC(N)C(O)=O GMKMEZVLHJARHF-UHFFFAOYSA-N 0.000 description 2
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 2
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 2
- 108010080937 Carboxypeptidases A Proteins 0.000 description 2
- 102000000496 Carboxypeptidases A Human genes 0.000 description 2
- 102000005600 Cathepsins Human genes 0.000 description 2
- 108010084457 Cathepsins Proteins 0.000 description 2
- 102000005927 Cysteine Proteases Human genes 0.000 description 2
- 108010005843 Cysteine Proteases Proteins 0.000 description 2
- 108700033346 EC 3.4.24.51 Proteins 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 108010080805 Factor XIa Proteins 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- 102000006166 Metallocarboxypeptidases Human genes 0.000 description 2
- 108030000089 Metallocarboxypeptidases Proteins 0.000 description 2
- 101710181812 Methionine aminopeptidase Proteins 0.000 description 2
- 108030003249 Muramoyltetrapeptide carboxypeptidases Proteins 0.000 description 2
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 2
- MNLRQHMNZILYPY-MKFCKLDKSA-N N-acetyl-D-muramic acid Chemical group OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)OC(O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MKFCKLDKSA-N 0.000 description 2
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 2
- 101000604750 Physarum polycephalum Physarolisin Proteins 0.000 description 2
- 102100037838 Prolyl endopeptidase Human genes 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 102000034328 Serine-type carboxypeptidases Human genes 0.000 description 2
- 108030000574 Serine-type carboxypeptidases Proteins 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 241000607626 Vibrio cholerae Species 0.000 description 2
- RASZIXQTZOARSV-BDPUVYQTSA-N astacin Chemical compound CC=1C(=O)C(=O)CC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)C(=O)CC1(C)C RASZIXQTZOARSV-BDPUVYQTSA-N 0.000 description 2
- 238000001818 capillary gel electrophoresis Methods 0.000 description 2
- 229940126051 coagulation factor XIa Drugs 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 108010069819 peptidoglycan endopeptidase Proteins 0.000 description 2
- 230000012846 protein folding Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- KDXKERNSBIXSRK-RGXOIRHWSA-N (2s)-6-amino-2-(deuterioamino)hexanoic acid Chemical compound [2H]N[C@H](C(O)=O)CCCCN KDXKERNSBIXSRK-RGXOIRHWSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 102100032488 Acylamino-acid-releasing enzyme Human genes 0.000 description 1
- 108010061216 Acylaminoacyl-peptidase Proteins 0.000 description 1
- 108030001653 Adamalysin Proteins 0.000 description 1
- 102000034473 Adamalysin Human genes 0.000 description 1
- 108010075409 Alanine carboxypeptidase Proteins 0.000 description 1
- 108030007066 Alternative-complement-pathway C3/C5 convertases Proteins 0.000 description 1
- 102000014161 Aminohydrolases Human genes 0.000 description 1
- 108010011527 Aminohydrolases Proteins 0.000 description 1
- 102100022749 Aminopeptidase N Human genes 0.000 description 1
- FQEQMASDZFXSJI-UHFFFAOYSA-N Anagyrin Natural products C12CCCCN2CC2C3=CC=CC(=O)N3CC1C2 FQEQMASDZFXSJI-UHFFFAOYSA-N 0.000 description 1
- 108090000886 Ananain Proteins 0.000 description 1
- 102100035765 Angiotensin-converting enzyme 2 Human genes 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 108090000101 Asclepain Proteins 0.000 description 1
- 102000030431 Asparaginyl endopeptidase Human genes 0.000 description 1
- 108090000432 Aspergillopepsin II Proteins 0.000 description 1
- 108090000658 Astacin Proteins 0.000 description 1
- 102000034498 Astacin Human genes 0.000 description 1
- 108090000618 Atrolysin B Proteins 0.000 description 1
- 108090000616 Atrolysin C Proteins 0.000 description 1
- 108090000664 Atrolysin E Proteins 0.000 description 1
- 108090000666 Atrolysin F Proteins 0.000 description 1
- 108090000254 Aureolysin Proteins 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 101710113841 Barrierpepsin Proteins 0.000 description 1
- 102100031006 Beta-Ala-His dipeptidase Human genes 0.000 description 1
- 108030004753 Beta-Ala-His dipeptidases Proteins 0.000 description 1
- 108010005785 Beta-aspartyl-peptidase Proteins 0.000 description 1
- 108090000654 Bone morphogenetic protein 1 Proteins 0.000 description 1
- 102000004152 Bone morphogenetic protein 1 Human genes 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- 102000007590 Calpain Human genes 0.000 description 1
- 108010032088 Calpain Proteins 0.000 description 1
- 101710124576 Candidapepsin Proteins 0.000 description 1
- 108090000087 Carboxypeptidase B Proteins 0.000 description 1
- 102000003670 Carboxypeptidase B Human genes 0.000 description 1
- 102100032378 Carboxypeptidase E Human genes 0.000 description 1
- 108010058255 Carboxypeptidase H Proteins 0.000 description 1
- 108090000007 Carboxypeptidase M Proteins 0.000 description 1
- 102100032936 Carboxypeptidase M Human genes 0.000 description 1
- 108090000012 Carboxypeptidase T Proteins 0.000 description 1
- 108090000391 Caricain Proteins 0.000 description 1
- 108090000426 Caspase-1 Proteins 0.000 description 1
- 108090000712 Cathepsin B Proteins 0.000 description 1
- 102000004225 Cathepsin B Human genes 0.000 description 1
- 108090000267 Cathepsin C Proteins 0.000 description 1
- 102000003902 Cathepsin C Human genes 0.000 description 1
- 102000003908 Cathepsin D Human genes 0.000 description 1
- 108090000258 Cathepsin D Proteins 0.000 description 1
- 108090000619 Cathepsin H Proteins 0.000 description 1
- 108090000613 Cathepsin S Proteins 0.000 description 1
- 102100035654 Cathepsin S Human genes 0.000 description 1
- 102100026657 Cathepsin Z Human genes 0.000 description 1
- 102100024539 Chymase Human genes 0.000 description 1
- 108090000227 Chymases Proteins 0.000 description 1
- 108090001069 Chymopapain Proteins 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 108090000205 Chymotrypsin C Proteins 0.000 description 1
- 102100039511 Chymotrypsin-C Human genes 0.000 description 1
- 102100023336 Chymotrypsin-like elastase family member 3B Human genes 0.000 description 1
- 108030007055 Classical-complement-pathway C3/C5 convertases Proteins 0.000 description 1
- 101800004419 Cleaved form Proteins 0.000 description 1
- 108010065152 Coagulase Proteins 0.000 description 1
- 108090000044 Complement Factor I Proteins 0.000 description 1
- 102000003706 Complement factor D Human genes 0.000 description 1
- 108090000059 Complement factor D Proteins 0.000 description 1
- 102100035431 Complement factor I Human genes 0.000 description 1
- 101000774636 Crotalus ruber ruber Snake venom metalloproteinase HT-2 Proteins 0.000 description 1
- 108030001451 Cysteine-type carboxypeptidases Proteins 0.000 description 1
- 108091000069 Cystinyl Aminopeptidase Proteins 0.000 description 1
- 102000030900 Cystinyl aminopeptidase Human genes 0.000 description 1
- 102100034560 Cytosol aminopeptidase Human genes 0.000 description 1
- 108010071840 Cytosol nonspecific dipeptidase Proteins 0.000 description 1
- 125000000030 D-alanine group Chemical group [H]N([H])[C@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 1
- 108030000936 D-stereospecific aminopeptidases Proteins 0.000 description 1
- 108030001574 Deuterolysin Proteins 0.000 description 1
- FMKGDHLSXFDSOU-BDPUVYQTSA-N Dienon-Astacin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)C(=O)C(=CC1(C)C)O)C=CC=C(/C)C=CC2=C(C)C(=O)C(=CC2(C)C)O FMKGDHLSXFDSOU-BDPUVYQTSA-N 0.000 description 1
- 102100020751 Dipeptidyl peptidase 2 Human genes 0.000 description 1
- 102100020750 Dipeptidyl peptidase 3 Human genes 0.000 description 1
- 102100025012 Dipeptidyl peptidase 4 Human genes 0.000 description 1
- 108030006877 Dipeptidyl-dipeptidases Proteins 0.000 description 1
- 208000013036 Dopa-responsive dystonia due to sepiapterin reductase deficiency Diseases 0.000 description 1
- 108700035154 EC 3.4.15.- Proteins 0.000 description 1
- 102000051496 EC 3.4.15.- Human genes 0.000 description 1
- 108700033355 EC 3.4.19.- Proteins 0.000 description 1
- 102000057898 EC 3.4.19.- Human genes 0.000 description 1
- 108700036006 EC 3.4.21.67 Proteins 0.000 description 1
- 108700036055 EC 3.4.21.90 Proteins 0.000 description 1
- 108700033921 EC 3.4.23.20 Proteins 0.000 description 1
- 108700033920 EC 3.4.23.26 Proteins 0.000 description 1
- 108700033912 EC 3.4.23.28 Proteins 0.000 description 1
- 108700033306 EC 3.4.23.30 Proteins 0.000 description 1
- 108700033307 EC 3.4.23.31 Proteins 0.000 description 1
- 108700033393 EC 3.4.24.47 Proteins 0.000 description 1
- 108700033395 EC 3.4.24.49 Proteins 0.000 description 1
- 108700033343 EC 3.4.24.50 Proteins 0.000 description 1
- 108700033344 EC 3.4.24.54 Proteins 0.000 description 1
- 108700033391 EC 3.4.24.60 Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 108010092208 Endothia aspartic proteinase Proteins 0.000 description 1
- 101001023854 Enterococcus faecalis (strain ATCC 700802 / V583) Gelatinase Proteins 0.000 description 1
- 108090000293 Envelysin Proteins 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 108010048049 Factor IXa Proteins 0.000 description 1
- 108010054265 Factor VIIa Proteins 0.000 description 1
- 108090000270 Ficain Proteins 0.000 description 1
- 108090001126 Furin Proteins 0.000 description 1
- 102000004961 Furin Human genes 0.000 description 1
- 102100021023 Gamma-glutamyl hydrolase Human genes 0.000 description 1
- 108090001072 Gastricsin Proteins 0.000 description 1
- 102000055441 Gastricsin Human genes 0.000 description 1
- 108010026132 Gelatinases Proteins 0.000 description 1
- 102000013382 Gelatinases Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- 108030005223 Glu-Glu dipeptidases Proteins 0.000 description 1
- 108010048963 Glutamate carboxypeptidase Proteins 0.000 description 1
- 108010058940 Glutamyl Aminopeptidase Proteins 0.000 description 1
- 102000006485 Glutamyl Aminopeptidase Human genes 0.000 description 1
- 102100030385 Granzyme B Human genes 0.000 description 1
- 108090000252 Histolysain Proteins 0.000 description 1
- 101000907951 Homo sapiens Chymotrypsin-like elastase family member 3B Proteins 0.000 description 1
- 101000931862 Homo sapiens Dipeptidyl peptidase 3 Proteins 0.000 description 1
- 101001009603 Homo sapiens Granzyme B Proteins 0.000 description 1
- 101000878213 Homo sapiens Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Proteins 0.000 description 1
- 101001095266 Homo sapiens Prolyl endopeptidase Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 108090000571 Hypodermin C Proteins 0.000 description 1
- 108010084019 IgA-specific metalloendopeptidase Proteins 0.000 description 1
- 108010002231 IgA-specific serine endopeptidase Proteins 0.000 description 1
- 102100036984 Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Human genes 0.000 description 1
- 102100021496 Insulin-degrading enzyme Human genes 0.000 description 1
- 108090000828 Insulysin Proteins 0.000 description 1
- 102100033903 Isoaspartyl peptidase/L-asparaginase Human genes 0.000 description 1
- 101710176219 Kallikrein-1 Proteins 0.000 description 1
- 101710172072 Kexin Proteins 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 1
- 101710180643 Leishmanolysin Proteins 0.000 description 1
- 108010004098 Leucyl aminopeptidase Proteins 0.000 description 1
- 102000002704 Leucyl aminopeptidase Human genes 0.000 description 1
- 108030007165 Leucyl endopeptidases Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100033320 Lysosomal Pro-X carboxypeptidase Human genes 0.000 description 1
- 108010053229 Lysyl endopeptidase Proteins 0.000 description 1
- 108090000855 Matrilysin Proteins 0.000 description 1
- 102000004318 Matrilysin Human genes 0.000 description 1
- 102000000380 Matrix Metalloproteinase 1 Human genes 0.000 description 1
- 108010016113 Matrix Metalloproteinase 1 Proteins 0.000 description 1
- 108010076497 Matrix Metalloproteinase 10 Proteins 0.000 description 1
- 108010016160 Matrix Metalloproteinase 3 Proteins 0.000 description 1
- 102100024131 Matrix metalloproteinase-25 Human genes 0.000 description 1
- 108010015302 Matrix metalloproteinase-9 Proteins 0.000 description 1
- 102000001776 Matrix metalloproteinase-9 Human genes 0.000 description 1
- 108030004769 Membrane dipeptidases Proteins 0.000 description 1
- 108090000265 Meprin A Proteins 0.000 description 1
- 102100030876 Meprin A subunit beta Human genes 0.000 description 1
- 108090000263 Meprin B Proteins 0.000 description 1
- 102000003843 Metalloendopeptidases Human genes 0.000 description 1
- 108090000131 Metalloendopeptidases Proteins 0.000 description 1
- 108090000192 Methionyl aminopeptidases Proteins 0.000 description 1
- 102000034452 Methionyl aminopeptidases Human genes 0.000 description 1
- 101000975489 Metridium senile U-metritoxin-Msn1a Proteins 0.000 description 1
- 108010013295 Microbial collagenase Proteins 0.000 description 1
- 108010042046 Mitochondrial processing peptidase Proteins 0.000 description 1
- 108010027383 Muramoylpentapeptide carboxypeptidase Proteins 0.000 description 1
- 101000715501 Mus musculus Cathepsin 7 Proteins 0.000 description 1
- 101710109431 Mycolysin Proteins 0.000 description 1
- 102100034681 Myeloblastin Human genes 0.000 description 1
- 108090000973 Myeloblastin Proteins 0.000 description 1
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 1
- MNLRQHMNZILYPY-MDMHTWEWSA-N N-acetyl-alpha-D-muramic acid Chemical compound OC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@H](O)[C@@H]1NC(C)=O MNLRQHMNZILYPY-MDMHTWEWSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- 108090000970 Nardilysin Proteins 0.000 description 1
- 102100021850 Nardilysin Human genes 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 102000003729 Neprilysin Human genes 0.000 description 1
- 108090000812 Neurolysin Proteins 0.000 description 1
- 102100023072 Neurolysin, mitochondrial Human genes 0.000 description 1
- 108030001564 Neutrophil collagenases Proteins 0.000 description 1
- 102000056189 Neutrophil collagenases Human genes 0.000 description 1
- 108010066503 Non-stereospecific dipeptidase Proteins 0.000 description 1
- 108010000240 O-sialoglycoprotein endopeptidase Proteins 0.000 description 1
- 235000010676 Ocimum basilicum Nutrition 0.000 description 1
- 240000007926 Ocimum gratissimum Species 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 101710167893 Penicillin-binding protein 3 Proteins 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000313 Pepsin B Proteins 0.000 description 1
- 101710146026 Peptidoglycan D,D-transpeptidase FtsI Proteins 0.000 description 1
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 1
- 108010030544 Peptidyl-Lys metalloendopeptidase Proteins 0.000 description 1
- 108030001199 Peptidyl-glycinamidases Proteins 0.000 description 1
- 241001674048 Phthiraptera Species 0.000 description 1
- 108090000316 Pitrilysin Proteins 0.000 description 1
- 108090000113 Plasma Kallikrein Proteins 0.000 description 1
- 102100034869 Plasma kallikrein Human genes 0.000 description 1
- 101710095622 Polyporopepsin Proteins 0.000 description 1
- 108010069820 Pro-Opiomelanocortin Proteins 0.000 description 1
- 239000000683 Pro-Opiomelanocortin Substances 0.000 description 1
- 102100025974 Pro-cathepsin H Human genes 0.000 description 1
- 102100027467 Pro-opiomelanocortin Human genes 0.000 description 1
- 102100037775 Probable tRNA N6-adenosine threonylcarbamoyltransferase Human genes 0.000 description 1
- 108010064622 Procollagen N-Endopeptidase Proteins 0.000 description 1
- 102000015339 Procollagen N-endopeptidase Human genes 0.000 description 1
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 1
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 1
- 102100038358 Prostate-specific antigen Human genes 0.000 description 1
- 101800001753 Protease Proteins 0.000 description 1
- 101800001494 Protease 2A Proteins 0.000 description 1
- 101800001491 Protease 3C Proteins 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 101000851169 Protobothrops flavoviridis Snake venom metalloproteinase trimerelysin-2 Proteins 0.000 description 1
- 101000851199 Protobothrops flavoviridis Zinc metalloproteinase-disintegrin-like HR1b Proteins 0.000 description 1
- 101000925883 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) Elastase Proteins 0.000 description 1
- 101000604548 Pseudomonas sp. (strain 101) Pseudomonalisin Proteins 0.000 description 1
- 108090000919 Pyroglutamyl-Peptidase I Proteins 0.000 description 1
- 102100031108 Pyroglutamyl-peptidase 1 Human genes 0.000 description 1
- 108090001002 Pyroglutamyl-peptidase II Proteins 0.000 description 1
- 102000004892 Pyroglutamyl-peptidase II Human genes 0.000 description 1
- 102100028255 Renin Human genes 0.000 description 1
- 108090000783 Renin Proteins 0.000 description 1
- 108090000040 Russellysin Proteins 0.000 description 1
- 102220604153 SH2 domain-containing protein 1A_Q99P_mutation Human genes 0.000 description 1
- 101710149263 Saccharolysin Proteins 0.000 description 1
- 101000715359 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Carboxypeptidase S Proteins 0.000 description 1
- 108090000077 Saccharopepsin Proteins 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 108010080085 Scytalidium lignicolum acid proteases Proteins 0.000 description 1
- 108010004832 Serine-Type D-Ala-D-Ala Carboxypeptidase Proteins 0.000 description 1
- 102000030899 Serine-Type D-Ala-D-Ala Carboxypeptidase Human genes 0.000 description 1
- 108090000794 Streptopain Proteins 0.000 description 1
- 102100030416 Stromelysin-1 Human genes 0.000 description 1
- 102100028848 Stromelysin-2 Human genes 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108090001109 Thermolysin Proteins 0.000 description 1
- 101710181297 Thermomycolin Proteins 0.000 description 1
- 108090000763 Thermopsin Proteins 0.000 description 1
- 102100031293 Thimet oligopeptidase Human genes 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- ISWQCIVKKSOKNN-UHFFFAOYSA-L Tiron Chemical compound [Na+].[Na+].OC1=CC(S([O-])(=O)=O)=CC(S([O-])(=O)=O)=C1O ISWQCIVKKSOKNN-UHFFFAOYSA-L 0.000 description 1
- 102000057032 Tissue Kallikreins Human genes 0.000 description 1
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 1
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 1
- 108010070926 Tripeptide aminopeptidase Proteins 0.000 description 1
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 1
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 1
- 102100040411 Tripeptidyl-peptidase 2 Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 102000001400 Tryptase Human genes 0.000 description 1
- 108060005989 Tryptase Proteins 0.000 description 1
- 108030000963 Tryptophanyl aminopeptidases Proteins 0.000 description 1
- 102000004342 Tubulinyl-Tyr carboxypeptidases Human genes 0.000 description 1
- 108090000906 Tubulinyl-Tyr carboxypeptidases Proteins 0.000 description 1
- 108010009135 Uca pugilator serine collagenase 1 Proteins 0.000 description 1
- 102220513284 Vasopressin V1b receptor_Y115F_mutation Human genes 0.000 description 1
- 108090000509 Venombin A Proteins 0.000 description 1
- 101001124322 Vibrio proteolyticus Neutral protease Proteins 0.000 description 1
- 229910052768 actinide Inorganic materials 0.000 description 1
- 150000001255 actinides Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 229940059720 apra Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010055066 asparaginylendopeptidase Proteins 0.000 description 1
- 108090000987 aspergillopepsin I Proteins 0.000 description 1
- 235000003676 astacin Nutrition 0.000 description 1
- 108010070189 atroxase Proteins 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- 238000012575 bio-layer interferometry Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 102220361446 c.398A>C Human genes 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000009134 cell regulation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001876 chaperonelike Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 102000021178 chitin binding proteins Human genes 0.000 description 1
- 108091011157 chitin binding proteins Proteins 0.000 description 1
- 229960002976 chymopapain Drugs 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 108090001092 clostripain Proteins 0.000 description 1
- 101150093586 clpA gene Proteins 0.000 description 1
- 101150017872 clpQ gene Proteins 0.000 description 1
- 101150096566 clpX gene Proteins 0.000 description 1
- 101150054715 clpY gene Proteins 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 239000000039 congener Substances 0.000 description 1
- 108010048032 cyclophilin B Proteins 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 108090000212 dipeptidyl peptidase II Proteins 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 229940066758 endopeptidases Drugs 0.000 description 1
- 108010003914 endoproteinase Asp-N Proteins 0.000 description 1
- 235000019836 ficin Nutrition 0.000 description 1
- POTUGHMKJGOKRI-UHFFFAOYSA-N ficin Chemical compound FI=CI=N POTUGHMKJGOKRI-UHFFFAOYSA-N 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 108090000285 fruit bromelain Proteins 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 108010062699 gamma-Glutamyl Hydrolase Proteins 0.000 description 1
- 108090000639 glutamyl endopeptidase II Proteins 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 230000009036 growth inhibition Effects 0.000 description 1
- 101150115543 hslU gene Proteins 0.000 description 1
- 101150055178 hslV gene Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 108010057284 lysosomal Pro-X carboxypeptidase Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 108090000440 matrix metalloproteinase 25 Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 108090000857 oligopeptidase B Proteins 0.000 description 1
- 108010003052 omptin outer membrane protease Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 108090000155 pancreatic elastase II Proteins 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 229940066716 pepsin a Drugs 0.000 description 1
- 108090000756 peptidyl dipeptidase B Proteins 0.000 description 1
- 108010020708 plasmepsin Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 108010035833 pro-ocytocin-neurophysin convertase Proteins 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010017378 prolyl aminopeptidase Proteins 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 101150116440 pyrF gene Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 108090000588 rhizopuspepsin Proteins 0.000 description 1
- 102220212835 rs1027195424 Human genes 0.000 description 1
- 102200098224 rs1127354 Human genes 0.000 description 1
- 102220277874 rs146221748 Human genes 0.000 description 1
- 102220316530 rs1553766242 Human genes 0.000 description 1
- 102200142777 rs1554112524 Human genes 0.000 description 1
- 102220297028 rs201008540 Human genes 0.000 description 1
- 102200149721 rs25403 Human genes 0.000 description 1
- 102200007894 rs2576090 Human genes 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 108090000710 scutelarin Proteins 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 201000001195 sepiapterin reductase deficiency Diseases 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108090000346 stem bromelain Proteins 0.000 description 1
- 108090000135 streptogrisin A Proteins 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108010031354 thermitase Proteins 0.000 description 1
- 108010073106 thimet oligopeptidase Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 108010039189 tripeptidyl-peptidase 2 Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 231100000611 venom Toxicity 0.000 description 1
- 229940118696 vibrio cholerae Drugs 0.000 description 1
- 108010021321 xanthomonapepsin Proteins 0.000 description 1
- 108010078692 yeast proteinase B Proteins 0.000 description 1
- 108010064359 zinc D-Ala-D-Ala carboxypeptidase Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/78—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/24—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
- C07K16/241—Tumor Necrosis Factors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/55—Fab or Fab'
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/56—Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
- C07K2317/569—Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/38—Pseudomonas
- C12R2001/39—Pseudomonas fluorescens
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 프로테아제 민감성 재조합 단백질을 분해하지 않으면서 높은 세포 밀도까지 생장하는 재조합 그람 음성 숙주 세포, 항체 및 항체 단편을 비롯한 고품질 재조합 단백질을 고수율로 생성하기 위해 이 숙주 세포를 사용하는 방법, 및 숙주 세포에서 관심 있는 재조합 단백질 또는 폴리펩티드의 주변세포질 발현에 관한 조성물 및 방법을 제공한다.
Description
상호참조
본원은 2021년 6월 10일에 출원된 미국 가출원 제63/209,239호의 이익을 주장하고, 이 출원의 내용은 그 전체가 본원에 참고로 포함된다.
발명의 배경
미생물 숙주 세포 발현 시스템은 다양한 정도의 성공으로 재조합 단백질의 제조에 사용된다. 재조합 단백질 분해 및 낮은 수율은 과제로 남아 있다. 고품질 단백질의 생성을 최적화하기 위한 숙주 세포 게놈의 변경은 종종 숙주 세포 생장 및 생성 수율을 실망스러울 정도로 낮춘다. 재조합 단백질의 고품질 및 고수율 둘 다를 달성하는 재조합 숙주 세포가 여전히 필요하다.
본 발명은 재조합 박테리아 숙주 세포, 및 고수율로 고품질 재조합 단백질을 생성하기 위해 이를 사용하는 방법을 제공한다. 구체적으로, 본 발명에 의해 제공된 조성물 및 방법은 항체 및 항체 단편을 포함하는, 단백질용해에 민감한 재조합 단백질을 생성하는 데 유용하다. 본 발명은 높은 세포 밀도까지 생장을 허용하면서 재조합 단백질의 분해를 감소시키는 유전적 변형의 조합을 포함하는 재조합 그람 음성 박테리아 숙주 세포를 포함한다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고 제2 프로테아제 활성은 뮤레인(murein) DD-엔도펩티다제 활성이다. 일부 실시양태에서, 본 발명은 꼬리 특이적 프로테아제 활성 및 뮤레인 DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포에 관한 것으로, 이때 상기 숙주 세포는 고품질의 분해되지 않은 재조합 단백질을 생성하고 높은 세포 밀도까지 생장한다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 활성은 MepM 활성이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 MepS 활성이 결핍되어 있지 않다. 일부 실시양태에서, 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포는 적어도 하나의 추가 프로테아제 활성, 적어도 하나의 자가용해 인자 활성, 또는 이들 둘 다가 추가로 결핍되어 있고, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고, 제2 프로테아제 활성은 MepM 뮤레인 DD-엔도펩티다제 활성이다. 일부 실시양태에서, 적어도 하나의 추가 프로테아제 활성은 세랄라이신(serralysin) 전구체 활성이다. 단백질 활성, 예를 들어, 제1 프로테아제, 제2 프로테아제, 추가 프로테아제 또는 자가용해 인자의 결핍은 하나 이상의 유전자의 돌연변이로부터 비롯될 수 있다. 본 발명은 본 발명의 재조합 그람 음성 박테리아 숙주 세포를 사용하여 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질을 고수율로 제조하는 방법도 제공한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 Fab'이다. 일부 실시양태에서, Fab'는 TNF-α에 결합한다.
본 발명은 재조합 단백질 발현을 위한 재조합 그람 음성 박테리아 숙주 세포를 포함하는 것으로, 이때 상기 숙주 세포는 (a) 제1 프로테아제 활성이 결핍되어 있고; (b) 제2 프로테아제 활성이 결핍되어 있으며, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고, 제1 프로테아제 활성의 결핍은 꼬리 특이적 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 제2 프로테아제 활성은 뮤레인 DD-엔도펩티다제 활성이고, 제2 프로테아제 활성의 결핍은 뮤레인 DD-엔도펩티다제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 추가로 (c) 적어도 하나의 추가 프로테아제 활성이 결핍되어 있거나; (d) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (e) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (f) 하나 이상의 폴딩 조절인자를 과발현하거나; (g) (c), (d), (e) 및 (f)의 임의의 조합을 나타내고, 이때 추가 프로테아제 활성의 결핍은 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 추가 프로테아제는 (a) 및 (b)의 프로테아제와 상이하고; 자가용해 인자 활성의 결핍은 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 활성의 결핍은 (i) 서열번호 33으로 제시된 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제, 서열번호 33의 상동체, 또는 서열번호 33과 적어도 30% 유사한 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제 관련 단백질; (ii) 서열번호 35로 제시된 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제, 서열번호 35의 상동체, 또는 서열번호 35와 적어도 30% 유사한 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제 관련 단백질; 또는 (iii) 서열번호 71로 제시된 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제, 서열번호 71의 상동체, 또는 서열번호 71과 적어도 30% 유사한 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 활성의 결핍은 (i) 서열번호 1로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 1의 상동체, 또는 서열번호 1과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; (ii) 서열번호 63으로 제시된 아미노산 서열을 가진 MepM 뮤레인 DD-엔도펩티다제, 서열번호 63의 상동체, 또는 서열번호 63과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; (iii) 서열번호 65로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 65의 상동체, 또는 서열번호 65와 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; 및 (iv) 서열번호 66으로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 66의 상동체, 또는 서열번호 66과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, (c)의 숙주 세포는 1개 내지 10개의 상이한 추가 프로테아제 활성이 결핍되어 있고; (d)의 숙주 세포는 1개 내지 5개의 상이한 자가용해 인자 활성이 결핍되어 있고; (e)의 숙주 세포는 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현하며, 이때 각각의 불활성화된 프로테아제는 상이하고; (f)의 숙주 세포는 1개 내지 10개의 상이한 폴딩 조절인자, 또는 이들의 임의의 조합을 과발현한다. 일부 실시양태에서, (c)의 하나 이상의 추가 프로테아제 활성의 결핍은 세랄라이신 전구체, 막 국소화 프로테아제, 뮤레인 L,D 트랜스펩티다제(transpeptidase), 헤모라이신(hemolysin) 전구체, D-알라닐-D-알라닌 카르복시펩티다제(carboxypeptidase)/엔도펩티다제 AmpH 전구체, 주변세포질(periplasmic) 세린 엔도프로테아제(endoprotease), AAA+ 패밀리 단백질용해 기구, 및 (a)와 상이한 뮤레인 DD-엔도펩티다제로부터 독립적으로 선택된 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (d)의 하나 이상의 자가용해 인자 활성의 결핍은 S형 피오신(pyocin), 선형 그라미시딘(gramicidin) 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신 및 포린(porin)으로부터 독립적으로 선택된 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (e)의 하나 이상의 불활성화된 프로테아제는 돌연변이체 주변세포질 세린 엔도프로테아제이고; (f)의 하나 이상의 폴딩 조절인자는 디설파이드 이소머라제이다. 일부 실시양태에서, 세랄라이신 전구체는 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질로부터 선택되고; 막 국소화 프로테아제는 서열번호 39로 제시된 아미노산 서열을 가진 HtpX, 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체, 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질이고; 뮤레인 L,D 트랜스펩티다제는 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제, 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체, 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질이고; 헤모라이신 전구체는 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체, 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체, 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질이고; D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체는 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체, 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질이고; 주변세포질 세린 엔도프로테아제는 서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP의 상동체; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP의 상동체; 및 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질로부터 선택되고; AAA+ 패밀리 단백질용해 기구는 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하고; 뮤레인 DD-엔도펩티다제는 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 또는 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 및 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질로부터 선택되고; S형 피오신은 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신, 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체, 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질이고; 선형 그라미시딘 합성효소는 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소, 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체, 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질이고; 류코톡신은 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신, 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체, 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질이고; ShlB 헤모라이신 수송체는 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체, 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체, 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질이고; 하나 이상의 과발현된 불활성화된 프로테아제 각각은 슈도모나스 플루오레센스(P. fluorescens) DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링 참조), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이(E. coli) Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 및 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택되고; 하나 이상의 폴딩 조절인자 각각은 서열번호 76 내지 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제; 서열번호 76 내지 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제의 상동체; 서열번호 76 내지 81 중 어느 한 서열번호로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 결합 이소머라제 관련 단백질; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제의 상동체; 및 서열번호 27 및 82 내지 98로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 단백질 디설파이드 이소머라제 관련 단백질로부터 독립적으로 선택된다.
일부 실시양태에서, 돌연변이는 상응하는 유전자의 코딩 서열 또는 비코딩 서열에 있고, 돌연변이는 (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택된다. 일부 실시양태에서, (iii)의 미스센스 돌연변이는 보존적 또는 비보존적 아미노산 치환을 야기한다. 일부 실시양태에서, 비코딩 서열은 조절 서열이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 기능성 프로테아제 활성을 추가로 포함하며, 이때 기능성 프로테아제 활성은 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질의 활성이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 기능성 프로테아제 활성을 추가로 포함하고, 이때 기능성 프로테아제 활성은 서열번호 7로 제시된 아미노산 서열을 가진 MepS2; 서열번호 7로 제시된 아미노산 서열을 가진 MepS2의 상동체; 또는 서열번호 7로 제시된 슈도모나스 플루오레센스 MepS2 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS2 관련 단백질이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 슈도모나드(Pseudomonad)이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 슈도모나드이고, 제1 프로테아제 활성의 결핍은 슈도모나스 플루오레센스 Prc1을 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이, 및/또는 슈도모나스 플루오레센스 Prc2를 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이로부터 비롯된다. 일부 실시양태에서, 제2 프로테아제 활성은 제2 프로테아제 활성을 가진 프로테아제의 활성 부위 아미노산 또는 알로스테릭 부위 아미노산의 보존적 또는 비보존적 치환을 야기하는 돌연변이로 인해 결핍된다. 일부 실시양태에서, 제2 프로테아제 활성의 결핍은 제2 프로테아제 유전자의 적어도 하나의 돌연변이로부터 비롯되고, 이때 돌연변이는 (i) 서열번호 1의 잔기 134 내지 411 중 어느 하나 이상의 잔기; (ii) 서열번호 1의 잔기 319 내지 411 중 어느 하나 이상의 잔기; (iii) 서열번호 1의 잔기 361 내지 378 중 어느 하나 이상의 잔기; (iv) 서열번호 1의 248, 319, 330, 332, 334, 337, 378, 410 및 411로부터 선택된 어느 하나 이상의 잔기; 또는 (i), (ii), (iii) 및 (iv)의 임의의 조합에 상응하는 위치에서 아미노산 서열의 파괴를 야기한다. 일부 실시양태에서, 박테리아 숙주 세포는 슈도모나스 플루오레센스이고, 제2 프로테아제 활성의 결핍은 Y248stop, G332S, D334N, A337T, H411Y, P410L, 및 R319, H330, D334, H378 및 H411 중 어느 한 잔기의 임의의 보존적 또는 비보존적 아미노산 치환으로부터 선택된 서열번호 1의 아미노산 치환을 야기하는 유전자 돌연변이로부터 비롯된다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 배양물에서 고밀도 세포 생장을 할 수 있다. 일부 실시양태에서, 배양물에서의 고밀도 세포 생장은 약 80 내지 약 300의 OD575까지의 생장을 포함한다. 일부 실시양태에서, 배양물에서의 고밀도 세포 생장은 대조군 세포에 비해 약 2배 내지 약 15배 증가된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포는 각각 (i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포; (ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 상기 2(c)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(c)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및 (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포로부터 선택된다. 일부 실시양태에서, 2(c)의 추가 프로테아제 활성은 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성이다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 적어도 하나의 발현 구축물을 추가로 포함하고, 이때 각각의 발현 구축물은 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 단백질 또는 이종 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 항체 기반 약물, 비-항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택된다. 일부 실시양태에서, 관심 있는 재조합 단백질은 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류(camelid), 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디(bibody); 트리바디(tribody); 인트라바디(intrabody); 나노바디(nanobody); 소형 모듈식 면역약제(SMIP); 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; 및 VHH로부터 선택된다. 일부 실시양태에서, VHH 함유 항체는 VHH 연쇄(concatenated) 항체이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자, 및 혈액 인자로부터 선택된 표적에 결합한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 Fab'이다. 일부 실시양태에서, Fab'는 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄는 전체 길이 또는 중쇄 단편이고, 경쇄는 전체 길이 또는 경쇄 단편이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄는 동일한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄는 상이한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된다. 일부 실시양태에서, 주변세포질 분비 신호는 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 발현 구축물은 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 항체 중쇄를 코딩하는 핵산 서열; 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 경쇄를 코딩하는 핵산 서열; 또는 이들 둘 다를 포함한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 인간화된다. 일부 실시양태에서, Fab'는 세르톨리주맙(certolizumab)이다. 일부 실시양태에서, Fab' 중쇄는 서열번호 21로 제시된 아미노산 서열을 갖고, Fab' 경쇄는 서열번호 23으로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 중쇄를 코딩하는 핵산 서열은 서열번호 11로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결되고, 경쇄를 코딩하는 핵산 서열은 서열번호 13으로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결된다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 (i) 제1 프로테아제 활성; (ii) 제2 프로테아제 활성; (iii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체, 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체, 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성; (iv) 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 (v) 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진HslV 관련 단백질이 결핍되어 있다. 일부 실시양태에서, 상기 숙주 세포는 외인성 불활성화된 DegP를 추가로 과발현하고, 이때 불활성화된 DegP는 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 및 잔기 116, 146, 219, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 하나 이상의 잔기의 보존적 또는 비보존적 아미노산 치환 또는 파괴를 포함하는 서열번호 31로 제시된 아미노산 서열을 가진 각각의 프로테아제로부터 선택된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 또는 73으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 이소머라제, 및 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 및 73으로 제시된 아미노산 서열을 가진 디설파이드 이소머라제의 상동체 중 어느 하나로부터 선택된 외인성 디설파이드 이소머라제를 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포; 이. 콜라이 숙주 세포; 및 비브리오(Vibrio) 숙주 세포로부터 선택된다. 일부 실시양태에서, 숙주 세포는 그람 양성 숙주 세포, 예를 들어, 바실러스(Bacillus) 숙주 세포이다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스(Pseudomonas) 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다(P. putida), 또는 슈도모나스 에루기노사(P. aeruginosa)이다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1-; (ii) Prc2-; (iii) HslU-; (iv) HslV-; (v) MepM1-; (vi) PyrF-; 및 (vii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체의 결핍을 나타내고; 이때 세랄라이신 전구체 결핍은 세랄라이신 전구체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 슈도모나스 플루오레센스이고, Prc1은 서열번호 33으로 제시된 아미노산 서열을 갖고, Prc2는 서열번호 35로 제시된 아미노산 서열을 갖고, HslU는 서열번호 37로 제시된 아미노산 서열을 갖고, HslV는 서열번호 38로 제시된 아미노산 서열을 갖고, MepM1은 서열번호 1로 제시된 아미노산 서열을 갖고, 세랄라이신 전구체는 서열번호 9로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 숙주 세포는 DegP2 S219A(서열번호 29)를 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 디설파이드 이소머라제 PDIA6(서열번호 27)을 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함한다. 일부 실시양태에서, 숙주 세포는 재조합 단백질을 코딩하는 발현 벡터를 추가로 포함한다. 일부 실시양태에서, 발현 벡터는 Fab'를 코딩한다. 일부 실시양태에서, DegP2 S219A 또는 디설파이드 이소머라제 PDIA6을 코딩하는 핵산 서열을 포함하는 발현 벡터는 Fab'를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Fab' 중쇄는 서열번호 21에 의해 코딩되고, Fab' 경쇄는 서열번호 23에 의해 코딩된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 균주 STR94975, STR94976 또는 STR94977의 유전형을 가진 슈도모나드이다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 재조합 항-TNF-알파 Fab'를 생성하는 데 사용하기 위한, STR94975, STR94976 또는 STR94977의 플라스미드에 포함된 발현 구축물 또는 구축물들을 추가로 포함한다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 이. 콜라이가 아니다.
본 발명은 (a) 적합한 발효 조건 하에서 배양된 본 발명의 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하는, 관심 있는 재조합 단백질을 제조하는 방법을 추가로 포함하고, 이때 상기 재조합 그람 음성 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 핵산을 포함하는 플라스미드에 의해 형질전환된다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열의 전사는 유도성 프로모터에 의해 조절된다. 일부 실시양태에서, 유도성 프로모터는 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터 및 아라비노스 프로모터로부터 선택된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 높은 세포 밀도까지 생장할 수 있다. 일부 실시양태에서, 높은 세포 밀도는 약 80 내지 약 300의 OD575를 포함한다. 일부 실시양태에서, 적합한 발효 조건은 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 33℃의 온도, 유가식, 및 약 0.2 내지 약 5 g/ℓ의 역가 범위에서 유도성 프로모터의 유도를 포함한다. 일부 실시양태에서, 유도성 프로모터는 IPTG에 의해 유도되고, 이때 IPTG는 약 0.08 내지 0.3 mM의 최종 농도로 첨가된다. 일부 실시양태에서, IPTG는 약 0.2 mM의 최종 농도로 첨가된다. 일부 실시양태에서, 유도는 약 6.0 내지 약 6.5의 배양 pH에서 수행된다. 일부 실시양태에서, 유도는 약 28℃ 내지 33℃의 온도에서 수행된다. 일부 실시양태에서, 유도는 약 32℃의 온도에서 수행된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 동일한 발효 조건 하에서 생장된 대조군 세포에 비해 증가된 세포 밀도까지 생장한다. 일부 실시양태에서, 세포 밀도의 증가는 약 2배 내지 약 15배이다. 일부 실시양태에서, 상기 방법은 (b) 재조합 그람 음성 박테리아 숙주 세포로부터 회수된 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질의 수율을 측정하는 단계를 추가로 포함한다. 일부 실시양태에서, 온전한, 가용성 및/또는 활성 재조합 단백질의 측정된 수율은 약 0.1 내지 약 10 g/ℓ이다. 일부 실시양태에서, 상기 방법은 (c) 대조군 세포로부터 회수된 온전한, 가용성, 활성 또는 이들의 조합 형태인 관심 있는 재조합 단백질의 수율을 측정하는 단계를 추가로 포함한다. 일부 실시양태에서, 상기 방법은 (d) 단계 (b)에서 측정된 수율을 단계 (c)에서 측정된 수율과 비교하는 단계를 추가로 포함한다. 일부 실시양태에서, 단계 (b)에서 측정된 수율은 단계 (c)에서 측정된 수율보다 약 2배 내지 약 100배 더 높다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포는 각각 (i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포; (ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(a)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(a)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및 (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포로부터 선택된다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 이. 콜라이가 아니다.
본 발명은 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드도 포함하고, 이때 상기 분비 신호 펩티드는 서열번호 11로 제시된 아미노산 서열을 가진다. 관심 있는 단백질 또는 폴리펩티드는 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원일 수 있다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머(concatemer); F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택된다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 인간화된다. 일부 실시양태에서, 효소는 치료 효소이다. 일부 실시양태에서, 치료 효소는 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제(uricase); 로다나제(rhodanase); 유로키나제(urokinase); 스트렙토키나제(streptokinase); 스타필로키나제(staphylokinase); 페닐라제(phenylase); 사크로시다제(sacrosidase); 라이소자임(lysozyme); 키티나제(chitinase); 리보뉴클레아제(ribonuclease); 글루타미나제(glutaminase); 아르기나제(arginase); 비브릴라제(vibrilase); 콘드로이티나제(chondroitinase); 히알루로니다제(hyaluronidase); 갈락토시다제(galactosidase); 글루쿠로니다제(glucuronidase); 글루코세레브로시다제(glucocerebrosidase); 티미딘 포스포릴라제(phosphorylase); 카보닉 안하이드라제(carbonic anhydrase); 유리카제(uricase) 티오설페이트-시아나이드; 설퍼트랜스퍼라제(sulfurtransferase); 포스포티오에스터라제(phosphothioesterase); 알코올 산화효소; 알코올 데하이드로게나제(dehydrogenase); 아스파라기나제(asparaginase); 글루타민 합성효소; 아데노신 데아미나제(deaminase); 소 페가데마제(pegademase); 알글루세라제(alglucerase); 도르나제(dornase) 알파; 이미글루세라제(imiglucerase); 사크로시다제(sacrosidase); 라스부리카제(rasburicase); 아갈시다제(agalsidase) 베타; 및 낫토키나제(nattokinase)로부터 선택된다. 일부 실시양태에서, 융합 단백질은 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 결합 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택된다. 일부 실시양태에서, 폴리펩티드는 링커를 추가로 포함한다. 일부 실시양태에서, 폴리펩티드는 절단 도메인을 추가로 포함한다. 일부 실시양태에서, 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도한다. 일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 주변세포질에서 발현되고 분비 신호 펩티드로부터 적절하게 절단된다. 일부 실시양태에서, 분비 신호 펩티드는 적절하게 절단된 형태, 가용성 형태, 활성 형태 또는 이들의 임의의 조합 형태의 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도한다. 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 온전한 또는 실질적으로 온전한 N-말단을 가질 수 있다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함한다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함하지 않는다. 일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 실질적인 활성을 위해 실질적으로 온전한 N-말단을 필요로 한다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 온전한 N-말단을 가진 동일한 관심 있는 단백질 또는 폴리펩티드와 비교될 때 그의 활성의 약 90% 내지 100%를 가진다. 원핵 숙주 세포는 그람 음성 박테리아일 수 있다. 원핵 숙주 세포는 그람 양성 박테리아일 수 있다. 그람 음성 박테리아는 슈도모나드, 비브리오 나트리겐스(V. natriegens), 또는 이. 콜라이일 수 있다. 그람 양성 박테리아는 코리네박테리움(Corynebacterium) 또는 바실러스일 수 있다. 본 발명은 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터를 포함한다. 본 발명은 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터를 포함하는 원핵 숙주 세포를 포함한다. 일부 실시양태에서, 재조합 폴리펩티드를 코딩하는 발현 벡터 및/또는 핵산 구축물은 관심 있는 이종 단백질 또는 폴리펩티드를 코딩하는 핵산 서열에 작동 가능하게 연결된, 서열번호 11의 분비 신호 펩티드를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 분비 신호 펩티드 아미노산 서열은 서열번호 12와 85% 내지 100% 서열 동일성을 가진 핵산 서열에 의해 코딩된다. 원핵 숙주 세포는 그람 음성 박테리아일 수 있다. 원핵 숙주는 그람 양성 박테리아일 수 있다. 그람 음성 박테리아는 슈도모나드, 비브리오 나트리겐스, 또는 이. 콜라이일 수 있다. 그람 양성 박테리아는 코리네박테리움 또는 바실러스일 수 있다. 일부 실시양태에서, 재조합 폴리펩티드를 코딩하는 핵산 서열은 원핵 숙주 세포에서 발현되도록 최적화된다. 본 발명은 또한 원핵 숙주 세포의 주변세포질 또는 세포외 공간에서 관심 있는 단백질 또는 폴리펩티드를 발현시키기 위한, 본원에 기재된 바와 같은 재조합 폴리펩티드, 발현 벡터 또는 원핵 숙주 세포의 용도를 포함한다.
본 발명은 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 단계를 포함하는, 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법을 추가로 포함하고, 이때 상기 원핵 숙주 세포는 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 이때 상기 분비 신호 펩티드는 서열번호 11로 제시된 아미노산 서열을 포함하고, 상기 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아니다. 이 방법은 생성된 관심 있는 단백질 또는 폴리펩티드를 단리하는 단계를 추가로 포함할 수 있다. 관심 있는 단백질 또는 폴리펩티드는 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택될 수 있다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택된다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 인간화된다. 일부 실시양태에서, 효소는 치료 효소이다. 일부 실시양태에서, 치료 효소는 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택된다. 일부 실시양태에서, 융합 단백질은 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택된다. 일부 실시양태에서, 핵산은 링커를 코딩한다. 일부 실시양태에서, 링커는 절단 도메인을 포함한다. 원핵 숙주 세포는 그람 음성 박테리아일 수 있다. 원핵 숙주 세포는 그람 양성 박테리아일 수 있다. 그람 음성 박테리아는 슈도모나드, 비브리오 나트리겐스, 또는 이. 콜라이일 수 있다. 그람 양성 박테리아는 코리네박테리움 또는 바실러스일 수 있다.
참고에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적 및 개별적으로 표시된 것과 동일한 정도로 본원에 참고로 포함된다.
본 발명의 신규 특징은 첨부된 청구범위에 구체적으로 기재되어 있다. 본 발명의 특징과 이점은 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 하기 상세한 설명 및 첨부된 도면을 참고함으로써 더 잘 이해될 것이다.
도 1. 0.5 ㎖ 규모에서 프로테아제 결핍 숙주 세포에서의 재조합 단백질 생성. DC1032 및 시험된 4가지 다른 프로테아제 결핍 슈도모나스 플루오레센스 균주에 의해 생성된 Fab' 단백질의 비환원 SDS-CGE 분석이 제시되어 있다. 각각의 균주에 대한 12개의 레인은 왼쪽에서 오른쪽으로 다음을 보여준다: 가장 왼쪽 레인 - MW가 16, 20, 29, 48 및 68 kD인 MW 래더; 1 내지 10으로 넘버링된 레인 - Fab' 중쇄 및 경쇄를 각각 코딩하는 구축물 1 내지 10을 사용함으로써 발현된 단백질. 구축물 1 내지 9 각각은 중쇄 유전자에 작동 가능하게 연결된 상이한 주변세포질 분비 신호를 코딩하는 핵산 서열을 갖고, 이들 각각은 경쇄 유전자에 작동 가능하게 연결된 Azu 분비 신호를 코딩하는 핵산 서열을 가졌다. 구축물 10은 구축물 3과 동일한 중쇄 분비 신호를 가졌다. 구축물 1 내지 9 각각은 슈도모나스 플루오레센스 유래 DsbC를 공-발현한 반면, 구축물 10은 공-발현하지 않았다. 레인 12(각각의 세트에서 가장 오른쪽 레인) - null 숙주 균주(null 발현 플라스미드를 가짐). 왼쪽에서 오른쪽으로, 처음 12개의 레인은 숙주 균주 DC1084에서의 Fab' 발현을 보여주고; 두 번째 12개의 레인은 DC977에서의 Fab' 단백질 발현을 보여주며; 세 번째 12개의 레인은 DC441에서의 Fab' 단백질 발현을 보여주고; 네 번째 12개의 레인은 DC1032에서의 Fab' 단백질 발현을 보여주고; 다섯 번째 12개의 레인은 DC509에서의 Fab' 단백질 발현을 보여준다. DC1032 레인 아래의 화살표는 Fab' 분해 생성물에 대한 이동 면적을 표시한다.
도 2. 준최적 조건 하에서 2 ℓ 규모에서 Prc null 숙주 균주의 생장. Y-축: OD575, X-축: 36℃에서 경과된 발효 시간(시). 격자선은 4시간 간격을 표시하며, 이때 마지막 시점은 62시간이다.
닫힌 원: STR36306(Fab' 발현 플라스미드; 약 27의 최대 OD575까지 생장)
다이아몬드: STR94998(DC1032 + null 플라스미드; 약 50의 최대 OD575까지 생장)
삼각형: STR94994(DC1032 MepS1 결실 + p688-048; 약 23의 최대 OD575까지 생장)
사각형: STR94995(DC1032 MepS2 결실 + p688-048; 약 33의 최대 OD575까지 생장)
열린 원: STR94996(DC1032 MepS1 결실 및 MepS2 결실 + p688-048; 약 22의 최대 OD575까지 생장).
도 3a 및 3b. 준최적 조건에서 Prc1 및 Prc2 결핍 숙주 균주 생장. 도 3a. 36℃에서 (pyrF 결실을 고려하여 생장을 허용하기 위해) NaCl의 부재 및 우라실의 존재 하에 1X LB 한천 배지에서 DC954 콜로니의 생장. 배경 생장이 있는 콜로니가 보인다. 도 3b. 왼쪽 플레이트는 36℃에서 NaCl의 부재 및 우라실의 존재 하에 0.5X LB 한천 배지에서 DC454(프로테아제 결실 없음)의 생장을 보여준다. 생장은 1X LB에서의 생장보다 더 느렸으나, 이 생장 조건은 치명적이지 않았다. 오른쪽 플레이트는 36℃에서 NaCl의 부재 및 우라실의 존재 하에 0.5X LB 한천 배지에서 DC954의 생장을 보여준다. 적응된(진화한) 세포는 생장할 수 있다.
도 4. 2 ℓ 규모에서 진화된 숙주 균주의 생장. Y-축: OD575, X-축: 발효 시간(시). 격자선은 4시간 간격을 표시하고, 이때 마지막 시점은 74시간이다(25.5시간에서의 유도). 각각의 균주 #에 대한 2개의 곡선에 상응하는, 각각의 균주의 두 배양물이 생장되었다.
삼각형: MepM1 결핍을 포함하도록 숙주 DC954로부터 진화된 PF1550, 생성된 유전형 Δprc1, Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1 + p688-48(Fab')
열린 원: STR36306, 유전형 Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1 + p688-48(Fab')을 가진 숙주 DC1032
사각형: 유전형 Δprc1, Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1 + pDOW1169(빈 발현 벡터)를 가진 진화된 PF1557
닫힌 원: DC432, 유전형 ΔpyrF + pDOW1169(빈 발현 벡터)를 가진 숙주 DC454.
도 5. 생장+ 조합적 MepM 및 MepS 돌연변이체. 선택된 조합적 돌연변이에 의한 생장의 예. 왼쪽에서 오른쪽으로, 하기 돌연변이체 균주(DC454 대조군을 제외한 모든 Δprc1, Δprc2; 유전형에 대해서는 표 6 참조) 각각을 NaCl의 부재 하에 0.5X LB + 250 ㎍/㎖ 우라실 한천 배지에 점적하고 36℃에서 48시간 동안 인큐베이션하였다. 도면에 표시된 방향으로 플레이트의 위에서 아래로 농도가 낮아지면서 5개의 10배 연속 희석액이 각각의 행에 점적되었다.
제1열: DC1032(Prc-)
제2열: PF1559
제3열: PF1588
제4열: PF1560
제5열: PF1590
제6열: PF1572
제7열: PF1577
제8열: PF1573
제9열: PF1575
제10열: DC454(Prc+)
도 6. 프로테아제 결핍 숙주 균주에서의 경쇄 단백질용해. STR87639, STR92557, STR92567, STR94974 및 STR94976을 생장시키고 y-축에 표시된 유도 후 시간(시)에서 수거하였고, 재조합 단백질을 Capto-L 농후화하고 NR-SDS-CGE로 분석하였다. x-축은 각각의 레인에서 단백질용해된 경쇄 종의 퍼센트를 보여준다.
도 7. 다양한 발효 조건 하에서 프로테아제 결핍 숙주 균주에 의해 생성된 재조합 Fab'의 역가. 2 ℓ 발효기 규모에서 다양한 pH 및 온도 조건 하에서 유도된 균주 STR94974, STR94975 및 STR4977로부터의 Fab' 역가(Y-축)를, Fab'와 TNF-알파의 결합을 측정하는 BLI로 평가하였다. 생장을 32℃ 및 pH 6.5에서 2 ℓ 생물반응기 규모로 수행하였고 다양한 pH 및 온도 값에서 OD575에서 0.2 mM IPTG +/- 5 g/ℓ 만니톨로 유도하였다. 발효 유닛 식별기호는 X-축을 따라 표시되어 있다. DG3_U1(STR94974, 28℃ 및 pH 6.5에서 유도됨), DG3_U2(STR94974, 25℃ 및 pH 6), DG3_U3(STR94974, 32℃ 및 pH 6), DG3_U4(STR94974, 25℃ 및 pH 7), DG3_U5(STR94975, 28℃, pH 6.5, 5 g/ℓ 만니톨), DG3_u6(STR94975, 25℃, pH 6.0, 5 g/ℓ 만니톨), DG3_u7(STR94975, 32℃, pH 6.0 및 5 g/ℓ 만니톨), DG3_u8(STR94975, 25℃, pH 7.0), DG5_u1(STR94977, 28℃, pH 6.5), DG5_u2(STR94977, 25℃, pH 6.0), DG5_u3(STR94977, 32℃ pH 6.0), DG5_u4(STR94977, 25℃, pH 7.0), DG5_u5(STR94974, 32℃, pH 6.0), DG5_u6(STR94975, 32℃, pH 6.0, 5 g/ℓ 만니톨), DG5_u7(STR94975, 25℃, pH 7, 5 g/ℓ 만니톨), DG3_u8(STR94977, 32℃, pH 6.0). 유도 후 시간인 24시간, 48시간 및 72시간에서 전체 세포 브로쓰의 샘플을 처리하고 분석하였다. 72시간에서, 세포를 배지로부터 분리하여 무세포 브로쓰(CFB)에서 Fab' 역가를 평가하였다.
도 8a 및 8b. 균주 STR87639와 STR92557, STR92567, STR94974 및 STR94976의 생장 비교. 32℃ 및 pH 6.5에서 생장된 Fab' 발현 균주의 생장을 비교하는 그래프. 배양물을 경과된 발효 시간(EFT) 19.5시간, 32℃ 및 pH 6.0에서 0.2 mM IPTG로 유도하였다. OD575는 Y-축에 표시되어 있고 EFT는 X-축에 표시되어 있다. 도 8a. 유도 후 24시간까지 균주의 대표적인 생장 곡선. 도 8b. 유도 후 48시간까지 균주의 생장 곡선. 도 8a 및 8b 둘 다에서:
닫힌 사각형, 실선: STR87639 I24
삼각형, 실선: STR94974 #1
삼각형, 점선: STR94974 #2
삼각형, 파선: STR94974 #3
원, 실선: STR94976 I24
원, 점선: STR94976 #2
원, 파선: STR94976 #3
열린 다이아몬드, 실선: STR92557 #1
열린 다이아몬드, 점선: STR92557 #2
열린 다이아몬드, 파선: STR92557 #3
열린 사각형, 실선: STR92567 I24.
도 9. 균주 STR87639와 STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장 비교.
그래프는 Prc 결핍 Fab' 발현 균주 STR87639, STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장을 비교한다. 생장기를 32℃ 및 pH 6.5에서 수행하였다.
닫힌 원, 실선: STR87639
삼각형, 실선: STR92473
다이아몬드, 실선: STR94995
원, 파선: STR94998
열린 원, 실선: STR94996
사각형, 실선: STR94994
도 10. 뮤레인 DD-엔도펩티다제 보존된 아미노산 잔기를 보여주는 정렬. 보존된 잔기는 어두운 배경에 흰색 글자로 표시되어 있다. 제1행(상단 행) = 슈도모나스 플루오레센스 MepM1(서열번호 1); 제2행(위에서 두 번째) = 이. 콜라이 MepM(서열번호 63, YebA로서도 알려짐); 제3행 = 슈도모나스 에루기노사 MepM1(서열번호 66); 제4행(하단 행): 슈도모나스 푸티다 MepM1(서열번호 65).
도 1. 0.5 ㎖ 규모에서 프로테아제 결핍 숙주 세포에서의 재조합 단백질 생성. DC1032 및 시험된 4가지 다른 프로테아제 결핍 슈도모나스 플루오레센스 균주에 의해 생성된 Fab' 단백질의 비환원 SDS-CGE 분석이 제시되어 있다. 각각의 균주에 대한 12개의 레인은 왼쪽에서 오른쪽으로 다음을 보여준다: 가장 왼쪽 레인 - MW가 16, 20, 29, 48 및 68 kD인 MW 래더; 1 내지 10으로 넘버링된 레인 - Fab' 중쇄 및 경쇄를 각각 코딩하는 구축물 1 내지 10을 사용함으로써 발현된 단백질. 구축물 1 내지 9 각각은 중쇄 유전자에 작동 가능하게 연결된 상이한 주변세포질 분비 신호를 코딩하는 핵산 서열을 갖고, 이들 각각은 경쇄 유전자에 작동 가능하게 연결된 Azu 분비 신호를 코딩하는 핵산 서열을 가졌다. 구축물 10은 구축물 3과 동일한 중쇄 분비 신호를 가졌다. 구축물 1 내지 9 각각은 슈도모나스 플루오레센스 유래 DsbC를 공-발현한 반면, 구축물 10은 공-발현하지 않았다. 레인 12(각각의 세트에서 가장 오른쪽 레인) - null 숙주 균주(null 발현 플라스미드를 가짐). 왼쪽에서 오른쪽으로, 처음 12개의 레인은 숙주 균주 DC1084에서의 Fab' 발현을 보여주고; 두 번째 12개의 레인은 DC977에서의 Fab' 단백질 발현을 보여주며; 세 번째 12개의 레인은 DC441에서의 Fab' 단백질 발현을 보여주고; 네 번째 12개의 레인은 DC1032에서의 Fab' 단백질 발현을 보여주고; 다섯 번째 12개의 레인은 DC509에서의 Fab' 단백질 발현을 보여준다. DC1032 레인 아래의 화살표는 Fab' 분해 생성물에 대한 이동 면적을 표시한다.
도 2. 준최적 조건 하에서 2 ℓ 규모에서 Prc null 숙주 균주의 생장. Y-축: OD575, X-축: 36℃에서 경과된 발효 시간(시). 격자선은 4시간 간격을 표시하며, 이때 마지막 시점은 62시간이다.
닫힌 원: STR36306(Fab' 발현 플라스미드; 약 27의 최대 OD575까지 생장)
다이아몬드: STR94998(DC1032 + null 플라스미드; 약 50의 최대 OD575까지 생장)
삼각형: STR94994(DC1032 MepS1 결실 + p688-048; 약 23의 최대 OD575까지 생장)
사각형: STR94995(DC1032 MepS2 결실 + p688-048; 약 33의 최대 OD575까지 생장)
열린 원: STR94996(DC1032 MepS1 결실 및 MepS2 결실 + p688-048; 약 22의 최대 OD575까지 생장).
도 3a 및 3b. 준최적 조건에서 Prc1 및 Prc2 결핍 숙주 균주 생장. 도 3a. 36℃에서 (pyrF 결실을 고려하여 생장을 허용하기 위해) NaCl의 부재 및 우라실의 존재 하에 1X LB 한천 배지에서 DC954 콜로니의 생장. 배경 생장이 있는 콜로니가 보인다. 도 3b. 왼쪽 플레이트는 36℃에서 NaCl의 부재 및 우라실의 존재 하에 0.5X LB 한천 배지에서 DC454(프로테아제 결실 없음)의 생장을 보여준다. 생장은 1X LB에서의 생장보다 더 느렸으나, 이 생장 조건은 치명적이지 않았다. 오른쪽 플레이트는 36℃에서 NaCl의 부재 및 우라실의 존재 하에 0.5X LB 한천 배지에서 DC954의 생장을 보여준다. 적응된(진화한) 세포는 생장할 수 있다.
도 4. 2 ℓ 규모에서 진화된 숙주 균주의 생장. Y-축: OD575, X-축: 발효 시간(시). 격자선은 4시간 간격을 표시하고, 이때 마지막 시점은 74시간이다(25.5시간에서의 유도). 각각의 균주 #에 대한 2개의 곡선에 상응하는, 각각의 균주의 두 배양물이 생장되었다.
삼각형: MepM1 결핍을 포함하도록 숙주 DC954로부터 진화된 PF1550, 생성된 유전형 Δprc1, Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1 + p688-48(Fab')
열린 원: STR36306, 유전형 Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1 + p688-48(Fab')을 가진 숙주 DC1032
사각형: 유전형 Δprc1, Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1 + pDOW1169(빈 발현 벡터)를 가진 진화된 PF1557
닫힌 원: DC432, 유전형 ΔpyrF + pDOW1169(빈 발현 벡터)를 가진 숙주 DC454.
도 5. 생장+ 조합적 MepM 및 MepS 돌연변이체. 선택된 조합적 돌연변이에 의한 생장의 예. 왼쪽에서 오른쪽으로, 하기 돌연변이체 균주(DC454 대조군을 제외한 모든 Δprc1, Δprc2; 유전형에 대해서는 표 6 참조) 각각을 NaCl의 부재 하에 0.5X LB + 250 ㎍/㎖ 우라실 한천 배지에 점적하고 36℃에서 48시간 동안 인큐베이션하였다. 도면에 표시된 방향으로 플레이트의 위에서 아래로 농도가 낮아지면서 5개의 10배 연속 희석액이 각각의 행에 점적되었다.
제1열: DC1032(Prc-)
제2열: PF1559
제3열: PF1588
제4열: PF1560
제5열: PF1590
제6열: PF1572
제7열: PF1577
제8열: PF1573
제9열: PF1575
제10열: DC454(Prc+)
도 6. 프로테아제 결핍 숙주 균주에서의 경쇄 단백질용해. STR87639, STR92557, STR92567, STR94974 및 STR94976을 생장시키고 y-축에 표시된 유도 후 시간(시)에서 수거하였고, 재조합 단백질을 Capto-L 농후화하고 NR-SDS-CGE로 분석하였다. x-축은 각각의 레인에서 단백질용해된 경쇄 종의 퍼센트를 보여준다.
도 7. 다양한 발효 조건 하에서 프로테아제 결핍 숙주 균주에 의해 생성된 재조합 Fab'의 역가. 2 ℓ 발효기 규모에서 다양한 pH 및 온도 조건 하에서 유도된 균주 STR94974, STR94975 및 STR4977로부터의 Fab' 역가(Y-축)를, Fab'와 TNF-알파의 결합을 측정하는 BLI로 평가하였다. 생장을 32℃ 및 pH 6.5에서 2 ℓ 생물반응기 규모로 수행하였고 다양한 pH 및 온도 값에서 OD575에서 0.2 mM IPTG +/- 5 g/ℓ 만니톨로 유도하였다. 발효 유닛 식별기호는 X-축을 따라 표시되어 있다. DG3_U1(STR94974, 28℃ 및 pH 6.5에서 유도됨), DG3_U2(STR94974, 25℃ 및 pH 6), DG3_U3(STR94974, 32℃ 및 pH 6), DG3_U4(STR94974, 25℃ 및 pH 7), DG3_U5(STR94975, 28℃, pH 6.5, 5 g/ℓ 만니톨), DG3_u6(STR94975, 25℃, pH 6.0, 5 g/ℓ 만니톨), DG3_u7(STR94975, 32℃, pH 6.0 및 5 g/ℓ 만니톨), DG3_u8(STR94975, 25℃, pH 7.0), DG5_u1(STR94977, 28℃, pH 6.5), DG5_u2(STR94977, 25℃, pH 6.0), DG5_u3(STR94977, 32℃ pH 6.0), DG5_u4(STR94977, 25℃, pH 7.0), DG5_u5(STR94974, 32℃, pH 6.0), DG5_u6(STR94975, 32℃, pH 6.0, 5 g/ℓ 만니톨), DG5_u7(STR94975, 25℃, pH 7, 5 g/ℓ 만니톨), DG3_u8(STR94977, 32℃, pH 6.0). 유도 후 시간인 24시간, 48시간 및 72시간에서 전체 세포 브로쓰의 샘플을 처리하고 분석하였다. 72시간에서, 세포를 배지로부터 분리하여 무세포 브로쓰(CFB)에서 Fab' 역가를 평가하였다.
도 8a 및 8b. 균주 STR87639와 STR92557, STR92567, STR94974 및 STR94976의 생장 비교. 32℃ 및 pH 6.5에서 생장된 Fab' 발현 균주의 생장을 비교하는 그래프. 배양물을 경과된 발효 시간(EFT) 19.5시간, 32℃ 및 pH 6.0에서 0.2 mM IPTG로 유도하였다. OD575는 Y-축에 표시되어 있고 EFT는 X-축에 표시되어 있다. 도 8a. 유도 후 24시간까지 균주의 대표적인 생장 곡선. 도 8b. 유도 후 48시간까지 균주의 생장 곡선. 도 8a 및 8b 둘 다에서:
닫힌 사각형, 실선: STR87639 I24
삼각형, 실선: STR94974 #1
삼각형, 점선: STR94974 #2
삼각형, 파선: STR94974 #3
원, 실선: STR94976 I24
원, 점선: STR94976 #2
원, 파선: STR94976 #3
열린 다이아몬드, 실선: STR92557 #1
열린 다이아몬드, 점선: STR92557 #2
열린 다이아몬드, 파선: STR92557 #3
열린 사각형, 실선: STR92567 I24.
도 9. 균주 STR87639와 STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장 비교.
그래프는 Prc 결핍 Fab' 발현 균주 STR87639, STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장을 비교한다. 생장기를 32℃ 및 pH 6.5에서 수행하였다.
닫힌 원, 실선: STR87639
삼각형, 실선: STR92473
다이아몬드, 실선: STR94995
원, 파선: STR94998
열린 원, 실선: STR94996
사각형, 실선: STR94994
도 10. 뮤레인 DD-엔도펩티다제 보존된 아미노산 잔기를 보여주는 정렬. 보존된 잔기는 어두운 배경에 흰색 글자로 표시되어 있다. 제1행(상단 행) = 슈도모나스 플루오레센스 MepM1(서열번호 1); 제2행(위에서 두 번째) = 이. 콜라이 MepM(서열번호 63, YebA로서도 알려짐); 제3행 = 슈도모나스 에루기노사 MepM1(서열번호 66); 제4행(하단 행): 슈도모나스 푸티다 MepM1(서열번호 65).
본원은 고수율로 고품질 재조합 단백질을 제조하는 조성물 및 방법을 제공한다.
본 명세서 및 청구범위(들)에서 사용된 바와 같이, 용어 "포함하는"(및 "포함하는"의 임의의 형태, 예컨대, "포함한다" 및 "포함하고"), "가진"(및 "가진"의 임의의 형태, 예컨대, "가진다" 및 "갖고"), "포괄하는"(및 "포괄하는"의 임의의 형태, 예컨대, "포괄한다" 및 "포괄하고") 또는 "함유하는"(및 "함유하는"의 임의의 형태, 예컨대, "함유한다" 및 "함유하고")은 포괄적이거나 제한되지 않으며, 언급되지 않은 추가 요소 또는 방법 단계를 배제하지 않는다. 본원에서 제공된 임의의 조성물 및 방법의 일부 실시양태에서, "포함하는"은 "본질적으로 ~로 구성되는" 또는 "~로 구성되는"으로 대체될 수 있다. 어구 "본질적으로 ~로 구성되는"은 특정된 특징(들)뿐만 아니라, 청구된 발명의 특성 또는 기능에 실질적으로 영향을 미치지 않는 특징도 요구하기 위해 본원에서 사용된다. 본원에서 사용된 바와 같이, 용어 "구성되는"은 언급된 특징만의 존재를 표시하기 위해 사용된다. 본 명세서에서 논의된 임의의 실시양태는 본 개시내용의 임의의 방법 또는 조성물과 관련하여 구현될 수 있고, 그 반대도 가능하다는 것이 예상된다. 나아가, 본 개시내용의 조성물은 본 개시내용의 방법을 달성하는 데 사용될 수 있다.
본 명세서에서 "실시양태", "특정 실시양태", "바람직한 실시양태", "구체적인 실시양태", "일부 실시양태", "실시양태", "한 실시양태" 또는 "다른 실시양태"의 언급은 해당 실시양태와 관련하여 설명된 특정 특징, 구조 또는 특성이 본 개시내용의 적어도 일부 실시양태에 포함되지만 반드시 모든 실시양태에 포함되는 것이 아님을 의미한다.
박테리아 숙주 세포에서의 재조합 단백질 발현
박테리아 숙주 세포에서 발현된 재조합 단백질은 수십 개의 숙주 세포 프로테아제들 중 임의의 숙주 세포 프로테아제에 의해 분해된다. 분해는 단백질 품질과 수율을 낮추어, 종종 단백질용해에 민감한 단백질을 유용한 양으로 생성할 수 없게 만든다. 숙주 세포 내로의 프로테아제 결핍의 도입은 재조합 단백질 분해를 감소시킬 수 있지만, 이러한 결핍은 숙주 세포가 높은 밀도까지 생장하는 것을 방해할 수 있다. 좋지 않은 세포 생장은 재조합 단백질 수율을 감소시켜, 프로테아제 유전자 돌연변이의 이점을 무효화한다. 예를 들어, 본원에 기재된 바와 같이, 재조합 단백질의 감소된 분해를 보임에도 불구하고, 꼬리 특이적 프로테아제 활성이 결핍된 박테리아는 잘 생장하지 않는다.
본 발명은 세포 생장을 손상시키지 않으면서 고품질 재조합 단백질을 생성하도록 유전적으로 조작된 재조합 그람 음성 박테리아 숙주 세포에 관한 것이다. 일부 실시양태에서, 본 발명은 높은 세포 밀도까지 생장을 회복시키도록 추가로 변형된, 꼬리 특이적 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포에 관한 것이다. 꼬리 특이적 프로테아제 활성의 결핍으로 인한 생장 억제는 프로테아제 활성의 결핍을 야기하는 하나 이상의 추가 유전적 변형을 도입함으로써 극복된다. 종종 하나 초과의 숙주 세포 프로테아제 활성이 원치 않는 재조합 단백질 분해를 야기한다. 이를 해결하기 위해, 본 발명은 재조합 단백질 품질을 더 향상시키는 것으로 발견된 추가 단백질 결핍을 가진 숙주 세포도 제공한다. 고수율로 관심 있는 고품질(예를 들어, 활성, 가용성 및/또는 온전한) 재조합 단백질을 생성하기 위해 본 발명의 숙주 세포를 사용하는 방법도 제공한다.
재조합 단백질 생성을 향상시키는 숙주 세포 단백질 결핍
본 발명은 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포를 제공한다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 추가로 (a) 하나 이상의 추가 프로테아제 활성이 결핍되어 있거나; (b) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (c) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (d) 하나 이상의 샤페론 또는 폴딩 조절인자 단백질을 과발현하거나; (e) (a), (b), (c) 및 (d)의 임의의 조합을 나타낸다. 일부 실시양태에서, 추가 프로테아제, 자가용해 인자, 불활성화된 프로테아제, 샤페론 또는 폴딩 조절인자, 제1 프로테아제 및 제2 프로테아제는 각각 상이하다. 일부 실시양태에서, 추가 프로테아제, 자가용해 인자, 불활성화된 프로테아제, 또는 샤페론 또는 폴딩 조절인자는 제1 프로테아제 및/또는 제2 프로테아제와 동일하다. 일부 실시양태에서, 불활성화된 프로테아제는 추가 프로테아제와 동일하다. (c)의 과발현된 불활성화된 프로테아제 및 (d)의 과발현된 샤페론 또는 폴딩 조절인자 단백질은 숙주 세포에서 과발현될 관심 있는 재조합 단백질과 상이한 것으로 이해된다. 따라서, (c)의 과발현된 불활성화된 프로테아제 및/또는 (d)의 과발현된 샤페론 또는 폴딩 조절인자 단백질은 관심 있는 재조합 단백질과 함께 공-과발현될 수 있다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현하고, 하나 이상의 샤페론을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현하고, 하나 이상의 샤페론을 과발현한다.
일부 실시양태에서, 추가 프로테아제 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 추가 프로테아제 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 추가 결핍 프로테아제 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 추가 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 과발현된 불활성화된 프로테아제의 정상 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 과발현된 샤페론의 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제1 프로테아제 활성과 동일하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제2 프로테아제 활성과 동일하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 추가 결핍 프로테아제 활성과 동일하다.
일부 실시양태에서, 과발현된 샤페론의 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 추가 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 과발현된 불활성화된 프로테아제 활성과 상이하다.
일부 실시양태에서, 숙주 세포 단백질 활성, 예를 들어, 프로테아제 활성 또는 자가용해 인자 활성의 결핍은 이러한 활성을 가진 단백질을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 단백질 활성의 결핍은 이러한 활성을 가진 단백질을 코딩하는 적어도 2개의 유전자의 돌연변이로부터 비롯되고, 이때 상기 적어도 2개의 유전자 각각은 본원에 기재된 바와 같은 관련 단백질을 코딩한다. 관련 단백질은 상동체일 수 있거나, 최소 서열 유사성 또는 동일성을 공유할 수 있거나, 이들 둘 다일 수도 있다. 일부 실시양태에서, 단백질 활성의 결핍은 임의의 관련 단백질 또는 임의의 단백질 상동체에 상응하는 임의의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 프로테아제 활성의 결핍은 임의의 관련 프로테아제 및/또는 프로테아제 상동체에 상응하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 자가용해 인자 활성의 결핍은 임의의 관련 자가용해 인자 및/또는 자가용해 인자 상동체에 상응하는 유전자의 돌연변이로부터 비롯된다.
박테리아 꼬리 특이적 프로테아제
본 발명은 제1 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포를 제공하는 것으로, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이다. 꼬리 특이적 프로테아제(Prc/Tsp)는 예를 들어, 본원에 참고로 포함되는 문헌[Expasy enzyme EC 3.4.21.102]에 기재되어 있다. Prc는 예를 들어, 본원에 참고로 포함되는 문헌[Kerr, C.H., et al., 2014, "Salinity-Dependent Impacts of ProQ, Prc, and Spr Deficiencies on Escherichia coli Cell Structure, J. Bact. 196(6):1286-1296]에 기재된 바와 같이 서열 의존적 방식으로 단백질 C-말단을 절단하기 때문에 꼬리 특이적 프로테아제(Tsp)로 명명된 ATP 의존적 주변세포질 프로테아제이다. 이. 콜라이에서 prc 유전자의 불활성화는 낮은 오스몰농도 하에 감열성 세포 생장을 부여한다(예를 들어, 본원에 참고로 포함되는 문헌[Hara H., et al., 1991, "Cloning, mapping, and characterization of the Escherichia coli prc gene, which is involved in C-terminal processing of penicillin-binding protein 3," J. Bact. 173(15):4799-813] 참조). 일부 그람 음성 박테리아는 2개 이상의 Prc 관련 단백질 또는 상동체, 예를 들어, 슈도모나스 플루오레센스 Prc1 및 Prc2를 코딩하는 유전자를 가진다. 꼬리 특이적 프로테아제는 에스케리키아(Escherichia), 비브리오(Vibrio), 에르위니아(Erwinia), 살모넬라(Salmonella), 클렙시엘라(Klebsiella), 레지오넬라(Legionella) 및 슈도모나드를 비롯한 많은 그람 음성 박테리아에서 발견된다.
꼬리 특이적 프로테아제는 박테리아 숙주 세포에서 발현된 재조합 단백질을 분해할 수 있다. 따라서, 꼬리 특이적 프로테아제 활성이 결핍된 재조합 숙주 세포는 기능성 꼬리 특이적 프로테아제를 가진 상응하는 숙주 세포보다 더 높은 품질의 관심 있는 재조합 단백질을 생성할 수 있다. 예를 들어, 꼬리 특이적 프로테아제 활성이 결핍된 박테리아에서 생성된 항체 단편은 덜 분해된다(예를 들어, 본원의 실시예, 및 전체가 본원에 참고로 포함되는 미국 특허 제9,493,559호("Bacterial host strain expressing recombinant DsbC and having reduced Tsp activity") 참조). 그러나, 마찬가지로 확인된 바와 같이, 꼬리 특이적 프로테아제 활성이 결핍된 재조합 박테리아 숙주 세포는 높은 세포 밀도까지 생장하지 못한다. 결과적으로, 좋지 않은 세포 생장은 재조합 단백질의 수율의 감소로 이어진다. 본 발명은 꼬리 특이적 프로테아제 활성이 결핍된 재조합 숙주 세포를 더 변형시켜 제2 프로테아제 결핍을 도입하여, 높은 세포 밀도까지 생장할 수 있게 함으로써 이 문제를 극복한다. 추가 전략적 변형으로 재조합 단백질 수율을 증가시키는 방법도 제공한다.
일부 실시양태에서, 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이다. 꼬리 특이적 프로테아제 활성이 결핍된 숙주 세포는 꼬리 특이적 프로테아제, 꼬리 특이적 프로테아제 관련 단백질 및/또는 꼬리 특이적 프로테아제 상동체를 코딩하는 유전자의 돌연변이에 의해 달성될 수 있다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 슈도모나드 Prc를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 Prc1, Prc1 관련 단백질 또는 Prc1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, Prc1은 서열번호 33의 아미노산 서열을 가진다. 일부 실시양태에서, Prc1 관련 단백질은 서열번호 33의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 Prc2, Prc2 관련 단백질 또는 Prc2 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, Prc2는 서열번호 35의 아미노산 서열을 가진다. 일부 실시양태에서, Prc2 관련 단백질은 서열번호 35의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 Prc1, Prc1 관련 단백질 또는 Prc1 상동체를 코딩하는 유전자의 돌연변이, 및 Prc2, Prc2 관련 단백질 또는 Prc2 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 이. 콜라이 Prc(Tsp)를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 이. 콜라이 Tsp, Tsp 관련 단백질 또는 Tsp 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, Tsp는 이. 콜라이 Tsp의 아미노산 서열(서열번호 71)을 가진다. 일부 실시양태에서, Tsp 관련 단백질은 서열번호 71의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, Tsp 관련 단백질은 서열번호 71의 상동체이다.
일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 서열번호 33의 아미노산 서열을 가진 Prc1, 서열번호 33의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 33의 아미노산 서열을 가진 Prc1의 상동체, 서열번호 35의 아미노산 서열을 가진 Prc2, 서열번호 35의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 35의 아미노산 서열을 가진 Prc2의 상동체, 서열번호 71의 아미노산 서열을 가진 Tsp, 서열번호 71의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Tsp 관련 단백질, 및 서열번호 71의 아미노산 서열을 가진 Tsp의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다.
박테리아 펩티도글리칸 가수분해효소
박테리아 펩티도글리칸 가수분해효소는 펩티도글리칸 소낭 및/또는 이의 단편에서 결합을 절단한다. 펩티도글리칸 가수분해효소 활성은 세포벽 생장의 조절, 생장 동안 펩티도글리칸의 전환, 및 세포 분열과 자가용해 동안 딸세포의 분리에 중요하다. 펩티도글리칸 가수분해효소는 박테리아 집단에서 발생하는 용해 현상에도 관여한다.
펩티도글리칸 소낭은 짧은 펩티드에 의해 가교결합된 글리칸 가닥으로 구성되고, 대다수의 박테리아의 세포질막을 둘러싸는 폐쇄된 주머니 모양의 구조를 형성한다. 상기 소낭의 글리칸 가닥은 β1-4 결합에 의해 연결된 교대하는 N-아세틸글루코사민(GlcNAc)과 N-아세틸뮤람산(MurNAc) 잔기로 구성된다. 각각의 MurNAc 잔기의 D-락토일 기는 신생 펩티도글리칸에서 전형적으로 조성 L-Ala-γ-D-Glu-meso-A2pm(또는 L-Lys)-D-Ala-D-Ala(A2pm, 2,6-디아미노피멜산)을 가진 펩티드 줄기로 치환되고, 마지막 D-Ala 잔기는 성숙 거대분자에 존재하지 않는다. 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Vollmer, W. et al., 2008, "Peptidoglycan structure and architecture," FEMS Micro. Rev. 32:149-167]을 참조한다.
뮤레인 DD-엔도펩티다제
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 이때 제2 프로테아제 활성은 뮤레인 DD-엔도펩티다제 활성이다. 뮤레인 DD-엔도펩티다제는 소낭 글리칸 가닥의 줄기 펩티드에서 DD-결합을 절단한다. 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Vollmer, W. et al., 2008, "Bacterial peptidoglycan (murein) hydrolases," FEMS Micro. Rev. 32:259-286]을 참조한다. 에스케리키아, 비브리오, 에르위니아, 살모넬라, 클렙시엘라, 레지오넬라 및 슈도모나드를 비롯한 많은 박테리아로부터의 뮤레인 DD-엔도펩티다제가 상기 문헌에 설명되어 있다.
뮤레인 DD-엔도펩티다제 활성이 결핍된 숙주 세포는 뮤레인 DD-엔도펩티다제, 뮤레인 DD-엔도펩티다제 관련 단백질 및/또는 뮤레인 DD-엔도펩티다제 상동체를 코딩하는 하나 이상의 유전자의 돌연변이에 의해 달성될 수 있다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 유전자는 슈도모나스 플루오레센스 MepM1(서열번호 1), 이. 콜라이 MepM(YebA로서도 지칭됨)(서열번호 63), 슈도모나스 에루기노사 MepM1(서열번호 66) 및 슈도모나스 푸티다 MepM1(서열번호 65) 중 어느 하나의 아미노산 서열을 가진 프로테아제를 코딩한다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 슈도모나스 플루오레센스 MepM1의 아미노산 서열(서열번호 1)을 가진 프로테아제, 슈도모나스 플루오레센스 MepM1 관련 단백질, 또는 슈도모나스 플루오레센스 MepM1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 1의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 이. 콜라이 MepM(YebA로서도 지칭됨)의 아미노산 서열(서열번호 63)을 가진 프로테아제, 이. 콜라이 MepM 관련 단백질, 또는 이. 콜라이 MepM 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제는 서열번호 63의 아미노산 서열을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 63의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 슈도모나스 에루기노사 MepM1의 아미노산 서열(서열번호 66)을 가진 프로테아제, 슈도모나스 에루기노사 MepM1 관련 단백질 또는 슈도모나스 에루기노사 MepM1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 66의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 슈도모나스 푸티다 MepM1의 아미노산 서열(서열번호 65)을 가진 프로테아제, 슈도모나스 푸티다 MepM1 관련 단백질, 또는 슈도모나스 푸티다 MepM1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 65의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다.
일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 1의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 63의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 65의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 66의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 및 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다.
뮤레인 DD-엔도펩티다제 결핍은 본원의 다른 곳에 기재된 바와 같이 뮤레인 DD-엔도펩티다제를 코딩하는 숙주 세포 유전자의 어느 하나 이상의 돌연변이, 예를 들어, (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 또는 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 비롯될 수 있다. 일부 실시양태에서, 프로테아제 결핍은 서열번호 1로 제시된 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 보존된 영역, 또는 서열번호 1로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제의 유사한 보존된 영역에서 아미노산을 변경시키는 돌연변이로부터 비롯된다. 도 10은 뮤레인 DD-엔도펩티다제 서열번호 1(슈도모나스 플루오레센스 MepM1), 서열번호 63(YebA로서도 지칭되는 이. 콜라이 MepM), 서열번호 66(슈도모나스 에루기노사 MepM1), 및/또는 서열번호 65(슈도모나스 푸티다 MepM1) 전체에 걸쳐 보존된 잔기를 표시하는 예시적인 아미노산 정렬을 보여준다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제의 결핍은 보존된 위치에서 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴하는 돌연변이로부터 비롯된다. 보존된 위치는 임의의 알려져 있는 방법에 의해 당업자에 의해 확인될 수 있다. 일부 실시양태에서, 보존된 위치는 뮤레인 DD-엔도펩티다제 아미노산 서열을 서열번호 1, 63, 66 및 65 중 어느 하나 이상의 서열과 비교함으로써 확인된다. 예를 들어, 아미노산 서열은 지니어스 프라임 소프트웨어(Genious Prime Software)를 사용함으로써 CLUSTAL Omega에 의해 도 10에 표시된 바와 같이 비교될 수 있다. 도 10은 어두운 음영과 함께 흰색 글자로 표시된 상응하는 보존된 아미노산 위치를 포함하는, 비교된 뮤레인 DD-엔도펩티다제 사이에서 정렬된 상응하는 아미노산 위치를 보여준다. 일부 실시양태에서, 돌연변이는 비보존적 아미노산 치환이다. 본원에 기재된 바와 같이, 아미노산 치환은 보존적 또는 비보존적 치환일 수 있다. 보존적 아미노산 치환 및 비보존적 아미노산 치환은 문헌에 기재되어 있으며, 당업자에게 잘 알려져 있고 본원에 기재되어 있는 방법에 의해 쉽게 확인될 수 있다(예를 들어, 보존적 아미노산 치환을 나열하는 표 2 참조). 일부 실시양태에서, 돌연변이, 예를 들어, 비보존적 아미노산 치환은 다음 위치들 중 임의의 위치에 상응하는 위치에서 뮤레인 DD-엔도펩티다제 아미노산 서열의 아미노산 잔기를 대체하거나 다른 방식으로 파괴한다: 표 1의 제2열에 나열된 서열번호 1 위치; 표 1의 제4열에 나열된 서열번호 63 위치; 표 1의 제8열에 나열된 서열번호 65 위치; 및 표 1의 제6열에 나열된 서열번호 66 위치. 일부 실시양태에서, 돌연변이, 예를 들어, 비보존적 아미노산 치환은 뮤레인 DD-엔도펩티다제 아미노산 서열의 아미노산 잔기를 대체하거나 다른 방식으로 파괴하고, 이때 대체되거나 파괴된 아미노산 잔기는 표 1의 제3열에 나열된 서열번호 1 잔기; 표 1의 제5열에 나열된 서열번호 63 잔기; 표 1의 제9열에 나열된 서열번호 65 잔기; 및 표 1의 제7열에 나열된 서열번호 66 잔기로부터 선택된 아미노산 잔기이다. 볼드체 텍스트는 서열번호 1, 63, 66 및 65 각각에서 활성 부위 보존된 위치를 표시한다.
비브리오 콜레라(Vibrio Cholera)에서, 주요 엔도펩티다제 ShyA(이. 콜라이 MepM의 상동체)의 활성은 촉매 부위의 접근성에 영향을 미치는 돌연변이에 의해 조절되는 것으로 보고되었다(특히 ShyA 활성 부위 및 알로스테릭 부위 아미노산 및 위치와 관련하여 본원에 참고로 포함되는 문헌[Shin, J-H et al., "Structural basis of peptidoglycan endopeptidase regulation," PNAS 117(21): 11692-11702, 2020]). 상기 문헌[Shin, et al.]은 ShyA가 잠재적으로 기질 결합을 위한 활성 부위의 노출을 허용하는 열린 입체구조, 및 닫힌 입체구조를 형성한다고 보고하였다. 구조적 예측을 기반으로, 상기 문헌[Shin, et al.]의 저자들은 ShyA 결합 도메인 1과 3(링커 도메인 2에 의해 분리됨) 사이의 소수성 상호작용 및 정전기적 상호작용이 이들을 근접하게 만들어 닫힌 입체구조를 형성한다고 추정하였다. 상기 문헌의 저자들은 불활성 입체구조를 안정화시키는, 도메인 2 돌연변이를 포함하는 알로스테릭 부위 돌연변이가 ShyA 활성을 낮춘다는 것을 발견하였다. 슈도모나스 플루오레센스 MepM1은 비브리오 콜레라 ShyA(서열번호 58)와 65% 유사성을 가진다.
일부 실시양태에서, 뮤레인 DD-엔도펩티다제, 이의 상동체, 또는 서열번호 1, 63, 66 또는 65로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤린 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 알로스테릭 부위 아미노산을 변경시키거나 다른 방식으로 파괴한다.
일부 실시양태에서, 서열번호 1, 63, 66 또는 65로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 활성 부위 위치에서 아미노산을 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 활성 부위 위치는 서열번호 1의 영역 319 내지 411 내의 임의의 위치에 상응한다.
일부 실시양태에서, 서열번호 1, 63, 66 또는 65로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 보존된 촉매(활성) 부위 위치에서 아미노산을 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 파괴된 보존된 활성 부위 위치는 영역 319 내지 411 내의 임의의 보존된 위치에 상응한다(표 1의 제54행 내지 제91행에 나열됨). 일부 실시양태에서, 활성 부위 아미노산 잔기는 서열번호 1의 촉매 아미노산 잔기 R319, H330, D334, H378 및 H411 중 어느 하나에 상응한다. 일부 실시양태에서, 돌연변이는 서열번호 1의 촉매 부위 아미노산 잔기 R319, H330, D334, H378 및 H411, 및 이들의 임의의 조합에 상응하는 아미노산 잔기의 결실을 야기한다. 일부 실시양태에서, 돌연변이는 서열번호 1의 Y248에 상응하는 위치에 있는 넌센스 돌연변이이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 332에 상응하는 위치에 있는 G에서 S로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 334에 상응하는 위치에 있는 D에서 N으로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 337에 상응하는 위치에 있는 A에서 T로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 411에 상응하는 위치에 있는 H에서 Y로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 410에 상응하는 위치에 있는 P에서 L로의 치환이다.
일부 실시양태에서, 서열번호 1, 63, 66, 65 및/또는 71로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 알로스테릭 부위 위치에서 아미노산을 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 알로스테릭 부위 위치는 서열번호 1의 영역 134 내지 145, 및 361 내지 378 내의 임의의 위치에 상응한다.
일부 실시양태에서, 서열번호 1, 63, 66, 65 및/또는 71로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 보존된 알로스테릭 부위 위치에서 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 파괴된 보존된 알로스테릭 부위 위치는 서열번호 1의 영역 134 내지 145(표 1의 제11행 및 제12행에 나열됨), 및 361 내지 378(표 1의 제71행 내지 제79행에 나열됨) 내의 임의의 보존된 위치에 상응한다.
일부 실시양태에서, 서열번호 1로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 서열번호 1의 영역 134 내지 145, 361 내지 378, 및 319 내지 411 내의 임의의 위치에 상응하는 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 상기 돌연변이는 서열번호 1의 영역 134 내지 145, 361 내지 378, 및 319 내지 411 내의 임의의 위치에 있는 아미노산에 상응하는 아미노산의 비보존적 치환을 야기한다.
일부 실시양태에서, 서열번호 1로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 서열번호 1의 K140, L145, Y248, R319, P322, H330, G332, V333, D334, A336, A337, P338, G340, T341, P342, G347, D348, G349, A354, R356, G358, G361, V364, I366, H368, G369, Y372, T374, Y376, H378, G389, V392, K393, G395, I398, G402, T404, G405, T408, G409, P410 및 H411 중 어느 하나 이상에 상응하는 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 상기 돌연변이는 서열번호 1의 K140, L145, Y248, R319, P322, H330, G332, V333, D334, A336, A337, P338, G340, T341, P342, G347, D348, G349, A354, R356, G358, G361, V364, I366, H368, G369, Y372, T374, Y376, H378, G389, V392, K393, G395, I398, G402, T404, G405, T408, G409, P410 및 H411 중 어느 하나 이상에 상응하는 아미노산의 비보존적 치환을 야기한다.
MepS/Spr
중요한 그람 음성 박테리아 뮤레인 DD-엔도펩티다제는 이. 콜라이에서 Spr로서도 알려진 MepS이다(예를 들어, 본원에 참고로 포함되는 문헌[Expasy enzyme EC 3.4.17.13] 및 문헌[Singh, S. K. et al., 2012, "Three redundant murein endopeptidases catalyse an essential cleavage step in peptidoglycan synthesis of Escherichia coli K12," Mol. Microbiol. 86(5): 1036-1051] 참조). 본원에 참고로 포함되는 문헌[Truong, T.T. et al., 2020, "Cell division is antagonized by the activity of peptidoglycan endopeptidases that promote cell elongation," Mol. Microbiol. 114: 966-978]은 (예를 들어, Prc/Tsp의 부재 하에) 꼬리 특이적 프로테아제 분해에 의한 확인되지 않은 MepS 단백질 전환이 세포 생장 억제, 및 세포 분열 동안 형태학적 결함의 발생을 초래한다고 보고하였다.
이. 콜라이와 관련하여, prc의 결실이 고밀도 발효에서 생장을 억제하고 아미노산 치환에 의한 MepS의 불활성화가 575 nm에서 광학 밀도(OD) >= 200까지 생장을 회복시키는 데 필요한 것으로 보고되었다(본원에 각각 참고로 포함되는 미국 특허 제9,493,559호(Hara, H. et al. 1996) 및 유럽 특허 제1341899B1호). 유사하게, 슈도모나드에서 두 Prc 유전자들의 완전한 불활성화는 생물반응기에서 높은 세포 밀도 생장을 방해하고, 배양물은 2 ℓ 생물반응기에서 최대 180의 OD575에 도달하는, 두 Prc 유전자들을 발현하는 균주와 비교될 때 20 내지 50의 OD575를 넘어 생장하지 못한다(본원의 실시예 참조). 그러나, 실시예에 나타낸 바와 같이, 슈도모나스 플루오레센스에서 MepS 상동체의 완전한 제거는 Prc 활성의 결핍으로부터 비롯된 생장 결함을 레스큐하지 못한다. 오히려, MepM1 활성의 결핍은 고밀도 세포 생장을 회복시키는 것으로 밝혀졌다. 더욱이, Prc 및 MepM1 활성이 결핍된 슈도모나드 숙주 세포에서 MepS1의 결핍은 세포 생장에 악영향을 미쳐, MepM1 활성 결핍의 도입 시 관찰된 생장의 회복을 무효화하였다.
일부 실시양태에서, 본 발명은 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 임의로 추가로 (a) 하나 이상의 추가 프로테아제 활성이 결핍되어 있거나; (b) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (c) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (d) 하나 이상의 샤페론 단백질을 과발현하거나; (e) (a), (b), (c) 및 (d)의 임의의 조합을 나타내는 재조합 그람 음성 박테리아 숙주 세포를 제공하는 것으로; 이때 상기 숙주 세포는 기능성 MepS 뮤레인 DD-엔도펩티다제를 생성한다. 일부 실시양태에서, 본 발명은 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 임의로 추가로 (a) 하나 이상의 추가 프로테아제 활성이 결핍되어 있거나; (b) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (c) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (d) 하나 이상의 샤페론 단백질을 과발현하거나; (e) (a), (b), (c) 및 (d)의 임의의 조합을 나타내는 재조합 그람 음성 박테리아 숙주 세포를 제공하는 것으로; 이때 상기 숙주 세포는 MepS 뮤레인 DD-엔도펩티다제가 결핍되어 있지 않다. 일부 실시양태에서, 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 기능성 MepS 뮤레인 DD-엔도펩티다제를 갖고/갖거나 MepS 뮤레인 DD-엔도펩티다제가 결핍되어 있지 않은 재조합 숙주 세포는 슈도모나드이다. 일부 실시양태에서, 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 기능성 MepS 뮤레인 DD-엔도펩티다제를 갖고/갖거나 MepS 뮤레인 DD-엔도펩티다제가 결핍되어 있지 않은 재조합 숙주 세포는 이. 콜라이가 아니다. 일부 실시양태에서, 기능성 및/또는 결핍되지 않은 MepS 뮤레인 DD-엔도펩티다제는 서열번호 5, 서열번호 7, 서열번호 72 또는 서열번호 73으로 제시된 아미노산 서열; 서열번호 5, 서열번호 7, 서열번호 72 또는 서열번호 73과 적어도 60% 유사하거나 적어도 60% 동일한 아미노산 서열; 또는 서열번호 5, 서열번호 7, 서열번호 72 또는 서열번호 73의 상동체를 가진다. 일부 실시양태에서, 숙주 세포는 슈도모나드, 예를 들어, 슈도모나스 플루오레센스이고, 기능성 및/또는 결핍되지 않은 MepS 뮤레인 DD-엔도펩티다제는 MepS1(서열번호 5)이다. 일부 실시양태에서, 숙주 세포는 슈도모나드, 예를 들어, 슈도모나스 플루오레센스이고, 기능성 및/또는 결핍되지 않은 MepS 뮤레인 DD-엔도펩티다제는 MepS2(서열번호 7)이다. 일부 실시양태에서, 재조합 숙주 세포는 기능성 및/또는 결핍되지 않은 MepS1(서열번호 5) 및 MepS2(서열번호 7)를 가진 슈도모나드, 예를 들어, 슈도모나스 플루오레센스이다.
추가 결핍 단백질 활성
본원에 제시된 바와 같이, 꼬리 특이적 프로테아제 활성 및 뮤레인-DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포는 추가로 적어도 하나의 추가 단백질 활성이 결핍될 수 있다. 하나 이상의 추가 단백질 활성의 결핍은 재조합 단백질의 더 높은 품질과 수율을 제공하는 것으로 밝혀졌다. 이 추가 단백질은 추가 프로테아제 및 자가용해 인자를 포함한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 하나 이상의 추가 단백질 활성이 결핍되어 있다. 일부 실시양태에서, 추가 단백질 활성은 프로테아제 활성 또는 자가용해 인자 활성이다.
일부 실시양태에서, 꼬리 특이적 프로테아제 활성 및 뮤레인-DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 추가 프로테아제 활성이 추가로 결핍되어 있다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 추가 프로테아제 활성을 가진 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 추가 프로테아제 활성을 가진 추가 프로테아제(들)를 코딩하는 적어도 2개의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 1개 내지 10개의 상이한 추가 프로테아제 활성은 상응하는 추가 프로테아제(들)를 코딩하는 1개 내지 30개의 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 추가 프로테아제는 세랄라이신 전구체(예를 들어, 세포외 알칼리 메탈로프로테아제, 예를 들어, RXF04495.2, 또는 자가용해 세랄라이신 전구체, 예를 들어, RXF4500), 막 국소화 프로테아제(예를 들어, HtpX, FtsH, OmpT), 뮤레인 L,D 트랜스펩티다제, 헤모라이신 전구체, D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 주변세포질 세린 엔도프로테아제(예를 들어, DegP 또는 DegP2), AAA+ 패밀리 단백질용해 기구(예를 들어, HslU/HslV) 또는 뮤레인 DD-엔도펩티다제(예를 들어, MepM, 예를 들어, 슈도모나드 MepM2)이다.
일부 실시양태에서, 추가 프로테아제는 다음으로부터 선택된다:
서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 39로 제시된 아미노산 서열을 가진 HtpX인 막 국소화 프로테아제; 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체; 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질;
서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제; 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체; 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질;
서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체; 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체; 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질;
서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체; 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체; 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질;
서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 또는 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질인 주변세포질 세린 엔도프로테아제;
서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP2의 상동체; 또는 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질인 주변세포질 세린 엔도프로테아제;
서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP2의 상동체; 또는 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질인 주변세포질 세린 엔도프로테아제;
서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제; 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체; 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질, 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제; 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체; 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하는 AAA+ 패밀리 단백질용해 기구;
서열번호 3으로 제시된 아미노산 서열을 가진 프로테아제(슈도모나스 플루오레센스 MepM2), 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제;
서열번호 64로 제시된 아미노산 서열을 가진 프로테아제(이. 콜라이 MepM2), 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제;
서열번호 67로 제시된 아미노산 서열을 가진 프로테아제(슈도모나스 푸티다 MepM2), 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제; 및
서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제(슈도모나스 에루기노사), 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제.
추가 프로테아제 활성의 결핍은 아미노펩티다제; 디펩티다제; 디펩티딜-펩티다제; 트리펩티딜 펩티다제; 펩티딜-디펩티다제; 세린형 카르복시펩티다제; 메탈로카르복시펩티다제; 시스테인형 카르복시펩티다제; 오메가펩티다제; 세린 프로테이나제; 시스테인 프로테이나제; 아스파르트산 프로테이나제; 메탈로프로테이나제; 또는 알려지지 않은 기작의 프로테이나제의 돌연변이로부터 비롯될 수 있다.
아미노펩티다제는 세포질 아미노펩티다제(류실 아미노펩티다제), 막 알라닐 아미노펩티다제, 시스티닐 아미노펩티다제, 트리펩티드 아미노펩티다제, 프롤릴 아미노펩티다제, 아르기닐 아미노펩티다제, 글루타밀 아미노펩티다제, x-pro 아미노펩티다제, 박테리아 류실 아미노펩티다제, 호열성 아미노펩티다제, 클로스트리디움 아미노펩티다제, 세포질 알라닐 아미노펩티다제, 라이실 아미노펩티다제, x-trp 아미노펩티다제, 트립토파닐 아미노펩티다제, 메티오닐 아미노펩티다제, d-입체특이적 아미노펩티다제, 아미노펩티다제 등을 포함한다. 디펩티다제는 x-his 디펩티다제, x-arg 디펩티다제, x-메틸-his 디펩티다제, cys-gly 디펩티다제, glu-glu 디펩티다제, pro-x 디펩티다제, x-pro 디펩티다제, met-x 디펩티다제, 비입체특이적 디펩티다제, 세포질 비특이적 디펩티다제, 막 디펩티다제, 베타-ala-his 디펩티다제를 포함한다. 디펩티딜-펩티다제 및 트리펩티딜 펩티다제는 디펩티딜-펩티다제 i, 디펩티딜-펩티다제 ii, 디펩티딜-펩티다제 iii, 디펩티딜-펩티다제 iv, 디펩티딜-디펩티다제, 트리펩티딜-펩티다제 I, 트리펩티딜-펩티다제 II를 포함한다. 펩티딜-디펩티다제는 펩티딜-디펩티다제 a 및 펩티딜-디펩티다제 b를 포함한다. 세린형 카르복시펩티다제는 라이소좀 pro-x 카르복시펩티다제, 세린형 D-ala-D-ala 카르복시펩티다제, 카르복시펩티다제 C, 카르복시펩티다제 D를 포함한다. 메탈로카르복시펩티다제는 카르복시펩티다제 a, 카르복시펩티다제 B, 라이신(아르기닌) 카르복시펩티다제, gly-X 카르복시펩티다제, 알라닌 카르복시펩티다제, 뮤라모일펜타펩티드 카르복시펩티다제, 카르복시펩티다제 h, 글루타메이트 카르복시펩티다제, 카르복시펩티다제 M, 뮤라모일테트라펩티드 카르복시펩티다제, 아연 d-ala-d-ala 카르복시펩티다제, 카르복시펩티다제 A2, 막 pro-x 카르복시펩티다제, 튜불리닐-tyr 카르복시펩티다제, 카르복시펩티다제 t를 포함한다. 오메가펩티다제는 아실아미노아실-펩티다제, 펩티딜-글리신아미다제, 피로글루타밀-펩티다제 I, 베타-아스파르틸-펩티다제, 피로글루타밀-펩티다제 II, n-포르밀메티오닐-펩티다제, 프테로일폴리-[감마]-글루타메이트 카르복시펩티다제, 감마-glu-X 카르복시펩티다제, 아실뮤라모일-ala 펩티다제를 포함한다. 세린 프로테이나제는 카이모트립신, 카이모트립신 c, 메트리딘, 트립신, 트롬빈, 응고 인자 Xa, 플라스민, 엔테로펩티다제, 아크로신, 알파 용해성 프로테아제, 글루타밀, 엔도펩티다제, 카텝신 G, 응고 인자 viia, 응고 인자 ixa, 쿠쿠미시(cucumisi), 프롤릴 올리고펩티다제, 응고 인자 xia, 브라큐린(brachyurin), 혈장 칼리크레인(kallikrein), 조직 칼리크레인, 췌장 엘라스타제, 백혈구 엘라스타제, 응고 인자 xia, 키마제(chymase), 보체 성분 c1r55, 보체 성분 c1s55, 고전적 보체 경로 c3/c5 전환효소, 보체 인자 I, 보체 인자 D, 대안적 보체 경로 c3/c5 전환효소, 세레비신(cerevisin), 하이포더민(hypodermin) C, 라이실 엔도펩티다제, 엔도펩티다제 1a, 감마-레니(reni), 베놈빈(venombin) ab, 류실 엔도펩티다제, 트립타제, 스쿠텔라린(scutelarin), 켁신(kexin), 서브틸리신(subtilisin), 오리진(oryzin), 엔도펩티다제 k, 써모마이콜린(thermomycolin), 테르미타제(thermitase), 엔도펩티다제 SO, T-플라스미노겐 활성화제, 단백질 C, 췌장 엔도펩티다제 E, 췌장 엘라스타제 ii, IGA 특이적 세린 엔도펩티다제, U-플라스미노겐, 활성화제, 베놈빈 A, 푸린(furin), 미엘로블라스틴(myeloblastin), 세메노겔라제(semenogelase), 그랜자임(granzyme) A 또는 세포독성 T 림프구 프로테이나제 1, 그랜자임 B 또는 세포독성 T 림프구 프로테이나제 2, 스트렙토그리신(streptogrisin) A, 트렙토그리신(treptogrisin) B, 글루타밀 엔도펩티다제 II, 올리고펩티다제 B, 리물루스(limulus) 응고 인자 c, 리물루스 응고 인자, 리물루스 응고 효소, 옴틴(omptin), 억제제 렉사(lexa), 박테리아 리더 펩티다제 I, 토가비린(togavirin), 플라비린(flavirin)을 포함한다. 시스테인 프로테이나제는 카텝신(cathepsin) B, 파파인(papain), 피신(ficin), 카이모파파인(chymopapain), 아스클레파인(asclepain), 클로스트리파인(clostripain), 스트렙토파인(streptopain), 악티나이드(actinide), 카텝신 1, 카텝신 H, 칼파인(calpain), 카텝신 t, 글리실, 엔도펩티다제, 암 응고촉진제, 카텝신 S, 피코르나인(picornain) 3C, 피코르나인 2A, 카리카인(caricain), 아나나인(ananain), 줄기 브로멜라인(bromelain), 과일 브로멜라인, 레구마인(legumain), 히스토라이세인(histolysain), 인터류킨 1-베타 전환 효소를 포함한다. 아스파르트 프로테이나제는 펩신 A, 펩신 B, 가스트리신(gastricsin), 카이모신, 카텝신 D, 네오펜테신, 레닌(renin), 레트로펩신, 프로-오피오멜라노코르틴(pro-opiomelanocortin) 전환 효소, 아스퍼길로펩신(aspergillopepsin) I, 아스퍼길로펩신 II, 페니실로펩신, 리조푸스펩신, 엔도티아펩신, 뮤코로펩신, 칸디다펩신, 사카로펩신, 로도토룰라펩신(rhodotorulapepsin), 파이사로펩신(physaropepsin), 아크로실린드로펩신(acrocylindropepsin), 폴리포로펩신(polyporopepsin), 피크노포로펩신(pycnoporopepsin), 스키탈리도펩신(scytalidopepsin) a, 스키탈리도펩신 b, 크산토모나펩신(xanthomonapepsin), 카텝신 e, 배리어펩신(barrierpepsin), 박테리아 리더 펩티다제 I, 슈도모나펩신, 플라스멥신(plasmepsin)을 포함한다. 메탈로프로테이나제는 아트로라이신(atrolysin) a, 미생물 콜라게나제, 류코라이신, 간질 콜라게나제, 네프릴라이신(neprilysin), 엔벨라이신(envelysin), iga 특이적 메탈로엔도펩티다제, 프로콜라겐 N-엔도펩티다제, 티메트(thimet) 올리고펩티다제, 뉴로라이신(neurolysin), 스트로멜라이신(stromelysin) 1, 메프린(meprin) A, 프로콜라겐 C-엔도펩티다제, 펩티딜-lys 메탈로엔도펩티다제, 아스타신(astacin), 스트로멜라이신 2, 매트릴라이신 젤라티나제, 에로모노라이신(aeromonolysin), 슈도라이신(pseudolysin), 써모라이신(thermolysin), 바실로라이신(bacillolysin), 아우레오라이신(aureolysin), 코코라이신(coccolysin), 마이코라이신(mycolysin), 베타-용해성 메탈로엔도펩티다제, 펩티딜-asp 메탈로엔도펩티다제, 호중구 콜라게나제, 젤라티나제 B, 레이슈마놀라이신(leishmanolysin), 사카로라이신(saccharolysin), 오토라이신(autolysin), 듀테로라이신(deuterolysin), 세랄라이신, 아트로라이신(atrolysin) B, 아트로라이신 C, 아트록사제(atroxase), 아트로라이신 E, 아트로라이신 F, 아다마라이신(adamalysin), 호릴라이신(horrilysin), 루버라이신(ruberlysin), 보쓰로파신(bothropasin), 보쓰로라이신, 오피오라이신(ophiolysin), 트리메레라이신(trimerelysin) I, 트리메레라이신 II, 뮤크로라이신(mucrolysin), 피트릴라이신(pitrilysin), 인슐라이신(insulysin), O-시알로당단백질 엔도펩티다제, 루셀라이신(russellysin), 미토콘드리아, 중간체, 펩티다제, 닥틸라이신(dactylysin), 나르딜라이신(nardilysin), 마그놀라이신(magnolysin), 메프린(meprin) B, 미토콘드리아 처리 펩티다제, 대식세포 엘라스타제, 코리오라이신(choriolysin), 톡실라이신(toxilysin)을 포함한다. 알려지지 않은 기작의 프로테이나제는 써몹신(thermopsin) 및 다중촉매성 엔도펩티다제 복합체를 포함한다.
특정 프로테아제들은 프로테아제 및 샤페론 유사 활성 둘 다를 가진다. 이 프로테아제들은 단백질 수율 및/또는 품질에 부정적인 영향을 미칠 때, 이들의 프로테아제 활성을 특이적으로 결실시키는 것이 종종 유용하며, 이들은 이들의 샤페론 활성이 단백질 수율 및/또는 품질에 긍정적인 영향을 미칠 수 있을 때 과발현된다. 이 프로테아제들은 Hsp100(Clp/Hsl) 계열 구성원 RXF04587.1(clpA), RXF08347.1, RXF04654.2(clpX), RXF04663.1, RXF01957.2(hslU), RXF01961.2(hslV); 펩티딜-프롤릴 시스-트랜스 이소머라제 계열 구성원 RXF05345.2(ppiB); 메탈로펩티다제 M20 계열 구성원 RXF04892.1(아미노가수분해효소); 메탈로펩티다제 M24 계열 구성원 RXF04693.1(메티오닌 아미노펩티다제) 및 RXF03364.1(메티오닌 아미노펩티다제); 및 세린 펩티다제 S26 신호 펩티다제 I 계열 구성원 RXF01181.1(신호 펩티다제)을 포함하나 이들로 제한되지 않는다.
이들 및 다른 프로테아제와 폴딩 조절인자는 당분야에 알려져 있으며, 전체가 참고로 포함되는 문헌, 예를 들어, 미국 특허 제8,603,824호("Process for improved protein expression by strain engineering")에 기재되어 있다. 예를 들어, '824 특허의 표 D는 Tig(tig, 유발제 인자, FKBP형 피아제(ppiase)(ec 5.2.1.8) RXF04655, UniProtKB - P0A850(TIG_ECOLI))를 설명한다. 미국 특허 제9,394,571호 및 제9,580,719호(둘 다 발명의 명칭이 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins"임)는 Tig(RXF04655.2, 이 특허들에서 서열번호 34), LepB(RXF01181.1, 이 특허들에서 서열번호 56), DegP1(RXF01250, 이 특허들에서 서열번호 57), AprA(RXF04304.1, 이 특허들에서 서열번호 86), Prc1(RXF06586.1, 이 특허들에서 서열번호 120), DegP2(RXF07210.1, 이 특허들에서 서열번호 124), Lon(RXF04653, 이 특허들에서 서열번호 92); DsbA(RXF01002.1, 이 특허들에서 서열번호 25) 및 DsbC(RXF03307.1, 이 특허들에서 서열번호 26)를 설명한다. 이 서열들, 및 다른 프로테아제와 폴딩 조절인자에 대한 서열도 전체가 본원에 참고로 포함되는 미국 특허 제9,580,719호(이 특허의 컬럼 93 내지 98의 서열번호 표)에 제시되어 있다. 예를 들어, 미국 특허 제9,580,719호는 HslU(RXF01957.2) 및 HslV(RXF01961.2)를 코딩하는 서열을 각각 서열번호 18 및 19로서 제공한다.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성 내지 2개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 3개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 4개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 3의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 4개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 4개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 또는 9개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성, 9개의 추가 프로테아제 활성, 또는 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성, 또는 9개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성, 9개의 추가 프로테아제 활성 또는 10개의 추가 프로테아제 활성이 결핍되어 있다.
일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 추가 프로테아제 유전자 내지 2개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 3개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 4개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 3개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 4개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 4개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 또는 25개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자, 25개의 추가 프로테아제 유전자 또는 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 적어도 1개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자, 또는 25개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 최대 2개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자, 25개의 추가 프로테아제 유전자 또는 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 예를 들어, 이. 콜라이에서, 추가 프로테아제 활성은 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 (슈도모나드 MepS1), 서열번호 5의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS2), 서열번호 7의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 72의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 73의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(이. 콜라이 MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 또는 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 하나 이상을 코딩하는 뮤레인 DD-엔도펩티다제 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 꼬리 특이적 프로테아제 활성 및 뮤레인-DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 자가용해 인자 활성이 추가로 결핍되어 있다. 일부 실시양태에서, 자가용해 인자 활성의 결핍은 상응하는 자가용해 인자 활성을 가진 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 자가용해 인자 활성의 결핍은 자가용해 인자 활성을 가진 자가용해 인자(들)를 코딩하는 적어도 2개의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 1개 내지 10개의 상이한 자가용해 인자 활성은 상응하는 자가용해 인자(들)를 코딩하는 1개 내지 30개의 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 자가용해 인자는 S형 피오신(pyocin), 선형 그라미시딘 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신 또는 포린이다.
일부 실시양태에서, 자가용해 인자는 다음으로부터 선택된다:
서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신; 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체; 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질;
서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소; 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체; 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질;
서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신; 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체; 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질; 및
서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체; 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체; 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 자가용해 인자 활성 내지 2개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 3개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 4개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 3개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 4개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 4개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 7개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 7개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 7개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 8개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 8개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 또는 9개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 자가용해 인자 활성, 2개의 자가용해 인자 활성, 3개의 자가용해 인자 활성, 4개의 자가용해 인자 활성, 5개의 자가용해 인자 활성, 6개의 자가용해 인자 활성, 7개의 자가용해 인자 활성, 8개의 자가용해 인자 활성, 9개의 자가용해 인자 활성, 또는 10개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 자가용해 인자 활성, 2개의 자가용해 인자 활성, 3개의 자가용해 인자 활성, 4개의 자가용해 인자 활성, 5개의 자가용해 인자 활성, 6개의 자가용해 인자 활성, 7개의 자가용해 인자 활성, 8개의 자가용해 인자 활성, 또는 9개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 자가용해 인자 활성, 3개의 자가용해 인자 활성, 4개의 자가용해 인자 활성, 5개의 자가용해 인자 활성, 6개의 자가용해 인자 활성, 7개의 자가용해 인자 활성, 8개의 자가용해 인자 활성, 9개의 자가용해 인자 활성, 또는 10개의 자가용해 인자 활성이 결핍되어 있다.
일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 자가용해 인자 유전자 내지 2개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 3개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 4개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 3개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 4개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 4개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 또는 25개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자, 25개의 자가용해 인자 유전자 또는 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 적어도 1개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자, 또는 25개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 최대 2개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자, 25개의 자가용해 인자 유전자 또는 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 추가 단백질 활성의 결핍은 제1 프로테아제 및/또는 제2 프로테아제와 상이한 추가 단백질을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 상기 돌연변이는 꼬리 특이적 프로테아제를 코딩하는 유전자에 존재하지 않는다. 일부 실시양태에서, 추가 단백질 결핍은 서열번호 33의 아미노산 서열을 가진 Prc1, 서열번호 33의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 33의 아미노산 서열을 가진 Prc1의 상동체, 서열번호 35의 아미노산 서열을 가진 Prc2, 서열번호 35의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 35의 아미노산 서열을 가진 Prc2의 상동체, 서열번호 71의 아미노산 서열을 가진 Tsp, 서열번호 71의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Tsp 관련 단백질, 및 서열번호 71의 아미노산 서열을 가진 Tsp의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯되지 않는다. 일부 실시양태에서, 돌연변이는 서열번호 33, 35 및 71 중 어느 한 서열번호의 아미노산 서열과 60% 미만의 유사성 또는 동일성, 50% 미만의 유사성 또는 동일성, 40% 미만의 유사성 또는 동일성, 또는 30% 미만의 유사성 또는 동일성을 가진 아미노산 서열을 가진 단백질을 코딩하는 유전자에 존재한다.
일부 실시양태에서, 추가 단백질(예를 들어, 프로테아제 또는 자가용해 인자) 활성의 결핍은 제1 프로테아제 및/또는 제2 프로테아제를 코딩하는 유전자와 상이한 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 단백질 활성의 결핍은 MepM1 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이로부터 비롯되지 않는다. 일부 실시양태에서, 어느 하나 이상의 그람 음성 박테리아 숙주 세포에서, 돌연변이는 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 1의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 63의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 65의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 66의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS1), 서열번호 5의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS2), 서열번호 7의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 72의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 73의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(이. 콜라이 MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 또는 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 어느 하나 이상을 코딩하는 유전자에 존재하지 않는다. 이 실시양태들에서, 돌연변이는 서열번호 1, 63, 65, 66, 5, 7, 72, 73 및 32 중 어느 한 서열번호의 아미노산 서열과 60% 미만의 유사성 또는 동일성, 50% 미만의 유사성 또는 동일성, 40% 미만의 유사성 또는 동일성, 또는 30% 미만의 유사성 또는 동일성을 가진 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자에 있을 수 있다.
일부 실시양태에서, 어느 하나 이상의 그람 음성 박테리아 숙주 세포, 예를 들어, 이. 콜라이 또는 슈도모나드에서, 추가 단백질 활성(예를 들어, 프로테아제)의 결핍은 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS1), 서열번호 5의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS2), 서열번호 7의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 72의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 73의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(이. 콜라이 MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 및 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 이. 콜라이이고, 추가 단백질 활성의 결핍은 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 및 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체를 코딩하는 유전자의 돌연변이로부터 비롯되고, 이때 돌연변이는 D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택된 아미노산이거나 이 아미노산에 상응하는 아미노산에 존재하지 않는다. 관련 실시양태에서, 돌연변이는 N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D, V135G, L136P, G140C, R144C, H145A, G147C 또는 H157A를 발생시키는 돌연변이이거나 이 돌연변이에 상응하는 돌연변이가 아니다.
과발현된 단백질
본 발명의 재조합 그람 음성 박테리아 숙주 세포는 하나 이상의 단백질, 예를 들어, 불활성화된 프로테아제 또는 폴딩 조절인자, 예를 들어, 샤페론을 과발현할 수 있다. 숙주 세포에서 관심 있는 재조합 단백질과 함께 공-과발현될 때, 과발현된 단백질은 생성된 관심 있는 재조합 단백질의 품질 및/또는 수율을 개선할 수 있다. 일부 실시양태에서, 공-과발현된 단백질은 외인성 발현 구축물로부터 발현된다. 일부 실시양태에서, 발현 구축물은 플라스미드 또는 발현 벡터에 있다. 일부 실시양태에서, 관심 있는 재조합 단백질도 과발현하는 숙주 세포에서 과발현될 때, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 상이한 플라스미드로부터 발현된다. 일부 실시양태에서, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 동일한 플라스미드로부터 발현된다. 일부 실시양태에서, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 동일한 플라스미드 상의 상이한 프로모터로부터의 전사에 의해 발현된다. 일부 실시양태에서, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 공-전사된다, 즉 이들은 동일한 플라스미드 상의 동일한 프로모터로부터의 전사에 의해 발현된다. 일부 실시양태에서, 공-과발현된 단백질은 박테리아 염색체로부터 발현되지 않는다. 일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 불활성화된 프로테아제이다. 일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 샤페론 또는 단백질 폴딩 조절인자이다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 공-과발현된 단백질 내지 2개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 3개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 4개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 3개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 4개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 4개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 3개 상이한 공-과발현된 단백질 내지 20개 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질내지 20개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 또는 15개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질, 15개의 상이한 공-과발현된 단백질, 또는 20개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질, 또는 15개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질, 15개의 상이한 공-과발현된 단백질, 또는 20개의 상이한 공-과발현된 단백질을 과발현한다.
불활성화된 프로테아제
일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 불활성화된 프로테아제이다. 숙주 세포에 존재하는 기능성 프로테아제로부터 유래한 불활성화된 프로테아제는 숙주 세포에서 기능성 프로테아제 활성을 감소시키도록 숙주 세포에 의해 과발현될 수 있다. 불활성화된 프로테아제 돌연변이체는 우성 음성 프로테아제로서 작용할 수 있다. 과발현된 불활성화된 프로테아제는 예를 들어, 플라스미드 상의 발현 구축물로부터 외인적으로 생성될 수 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 상응하는 기능성 프로테아제를 코딩하는 유전자의 돌연변이에 의해 불활성화된다.
일부 실시양태에서, 불활성화된 프로테아제는 EC 3.4.21.107 효소 계열로부터의 그람 음성 박테리아 세린 프로테아제 유전자의 불활성 형태이다. 일부 실시양태에서, 불활성화된 프로테아제는 DegP 프로테아제(HtrA로서도 알려짐)이다. DegP 프로테아제는 예를 들어, DegP2 프로테아제 또는 DegP 유사 프로테아제일 수 있다. DegP 프로테아제는 주변세포질 세린 엔도프로테아제이다. 이들의 구조는 예를 들어, 본원에 참고로 포함되는 문헌[Pallen, M.J. and Wren, B.W., 1997, "The HtrA family of serine proteases," Molecular Microbiology 26(2): 209-221]에 기재되어 있다. 일부 실시양태에서, DegP 프로테아제는 슈도모나스 플루오레센스 DegP2(서열번호 31); 슈도모나스 플루오레센스 DegP(서열번호 69); 이. 콜라이 DegP/HtrA(서열번호 62); 또는 슈도모나스 푸티다 DegP(예를 들어, UniProtKB - A5W8F5 균주, 슈도모나스 푸티다 F1 또는 B0KV30, 균주 슈도모나스 푸티다 GB1)로부터 선택된 DegP 프로테아제를 코딩하는 유전자의 돌연변이에 의해 불활성화된다.
일부 실시양태에서, 과발현된 불활성화된 프로테아제는 DegP, DegP 관련 단백질 또는 DegP 상동체를 코딩하는 유전자의 돌연변이에 의해 불활성화된다. 일부 실시양태에서, 하나 이상의 불활성화된 프로테아제 각각은 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 서열번호 62의 위치 131, 134 및 236 위치(또는 26개 아미노산 리더를 제외할 때, 위치 105, 108 및 210) 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 서열번호 31의 108 내지 122, 146 내지 152, 및 217 내지 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택된다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 116(His), 120(Asp), 122(Asp) 및 219(Ser) 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진다.
일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 상응하는 DegP, DegP 관련 단백질 또는 DegP 상동체의 촉매 부위에서 아미노산 치환 또는 파괴를 포함한다. 본원에 참고로 포함되는 문헌[Pallen and Wren, 1997, and Skorko-Glonek, J. et al., 1995, "Site-directed mutagenesis of the HtrA(DegP) serine protease, whose proteolytic activity is indispensable for Escherichia coli survival at elevated temperatures," Gene 163:47-52]은 DegP/HtrA 및 관련 단백질의 촉매 부위를 설명한다. 구체적으로, 아미노산 잔기 S210과 H105는 프로테아제 활성에 중요하다. 아미노산 치환 S210A 및 H105R은 단백질용해 활성을 제거한다. 상기 문헌[Pallen and Wren]은 "촉매 트리아드(catalytic triad)"인 아미노산 His, Asp 및 Ser을 포함하는 촉매 도메인을 설명한다. 이. 콜라이 Htr에서 이 중요한 잔기들은 위치 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링 참조), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210에 존재한다. 슈도모나스 플루오레센스 DegP2(서열번호 31)에서, 촉매 트리아드 잔기는 리더 서열 1-27을 포함하는 넘버링을 이용할 때 위치 116(His), 120(Asp) 및 219(Ser)에 존재하고; 리더 서열을 제외할 때, 촉매 트리아드 잔기는 위치 89(His), 93(Asp) 및 192(Ser)에 존재한다. 당업자는 임의의 DegP, DegP 관련 단백질 또는 DegP 상동체에서 상응하는 활성 부위 및 촉매 트리아드를 확인할 수 있다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 서열번호 31의 위치 116(His), 120(Asp) 및 219(Ser) 중 어느 한 위치에 상응하는 어느 하나 이상의 촉매 트리아드 아미노산의 아미노산 치환 또는 파괴를 포함한다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 위치 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링 참조), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 어느 하나 이상의 촉매 트리아드 아미노산의 아미노산 치환 또는 파괴를 포함한다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 어느 하나 이상의 아미노산의 아미노산 치환 또는 파괴를 포함한다.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 불활성화된 프로테아제 내지 2개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 3개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 4개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 3개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 4개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 4개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 또는 9개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제, 9개의 불활성화된 프로테아제 또는 10개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제, 또는 9개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제, 9개의 불활성화된 프로테아제 또는 10개의 불활성화된 프로테아제를 과발현한다.
단백질 폴딩 조절인자
일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 관심 있는 재조합 단백질의 품질 및/또는 수율을 개선하는 단백질 폴딩 조절인자이다. 샤페론, 디설파이드 결합 이소머라제, 펩티딜-프롤릴 시스-트랜스 이소머라제(PPIase)를 포함하는 단백질 폴딩 조절인자는 신생 폴리펩티드의 폴딩, 언폴딩 및 분해를 돕는, 모든 세포에 존재하는 한 부류의 단백질이다. 과발현된 단백질 폴딩 조절인자는 예를 들어, 플라스미드 상의 발현 구축물로부터 외인적으로 생성될 수 있다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포는 어느 하나 이상의 상이한 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 단백질 폴딩 조절인자를 과발현한다.
일부 실시양태에서, 단백질 폴딩 조절인자는 미생물이다. 일부 실시양태에서, 미생물 단백질 폴딩 조절인자는 박테리아, 포유동물, 진균(예를 들어, 효모 또는 사상 진균), 절지동물(예를 들어, 거미류 또는 곤충), 또는 플라스모듐(Plasmodium)으로부터 유래한다. 일부 실시양태에서, 박테리아 단백질 폴딩 조절인자는 그람 음성 박테리아로부터 유래한다. 일부 실시양태에서, 포유동물 단백질 폴딩 조절인자는 설치류, 예를 들어, 마우스, 래트 또는 햄스터, 예를 들어, 골든 햄스터로부터 유래한다. 일부 실시양태에서, 포유동물 단백질 폴딩 조절인자는 유인원, 예를 들어, 오랑우탄, 인간, 말, 돼지, 새, 예를 들어, 딱새로부터 유래한다. 일부 실시양태에서, 그람 음성 박테리아 단백질 폴딩 조절인자는 이. 콜라이 또는 슈도모나드 폴딩 조절인자 단백질이다. 일부 실시양태에서, 단백질 폴딩 조절인자 또는 샤페론은 슈도모나스 플루오레센스 단백질 폴딩 조절인자이다. 과발현된 단백질 폴딩 조절인자는 예를 들어, 미국 특허 제10,118,956호("Fusion Partners for Peptide Production")(예를 들어, 표 1), 미국 특허 제9,580,719호(예를 들어, 미국 특허 제10,118,956호의 표 1에 나열된 RXF로 각각의 폴딩 조절인자에 대한 서열을 제공함) 및 미국 특허 제8,603,824호(예를 들어, 이 특허의 표 A 내지 F)에 기재된 임의의 단백질 폴딩 조절인자일 수 있다. 본원에서 사용된 바와 같이, RXF 번호는 오픈 리딩 프레임 번호이고, PROKKA 번호는 예를 들어, 본원에 참고로 포함되는 문헌[Seemann, T., 2014, "Prokka: rapid prokaryotic genome annotation," Bioinformatics 30 (14): 2068-2069]에 기재된 바와 같이 Prokka 도구를 사용함으로써 확인된 표기이다.
일부 실시양태에서, 단백질 폴딩 조절인자는 당업자에게 알려져 있거나 문헌, 예를 들어, 본원에 참고로 포함되는 문헌["Guidebook to Molecular Chaperones and Protein-Folding Catalysts," 1997, ed. M. Gething, Melbourne University, Australia]에 기재되어 있는 임의의 단백질 폴딩 조절인자이다. 일부 실시양태에서, 하나 이상의 단백질 폴딩 조절인자 각각은 GroES/EL, DnaKJ, Clp, Hsp90, SecB, HSP70, HSP110/SSE, HSP40(DnaJ 관련), GRPE 유사, HSP90, CPN60, CPN10, 세포질 샤페론, HSP100, 작은 HSP, 칼넥신(calnexin), 칼레티쿨린(calreticulin), 단백질 디설파이드 이소머라제(PDI), 티오레독신 관련 단백질, 디설파이드 결합 이소머라제, 단백질 디설파이드 이소머라제, 펩티딜-프롤릴 이소머라제, 사이클로필린(cyclophilin) PPIase, FK-506 결합 단백질, 파르불린(parvulin) PPIase, 개별 샤페론, 단백질 특이적 샤페론 또는 분자내 샤페론으로부터 독립적으로 선택된다.
일부 실시양태에서, 과발현된 폴딩 조절인자 단백질은 디설파이드 결합 이소머라제이다. 일부 실시양태에서, 디설파이드 결합 이소머라제는 그람 음성 박테리아 DsbA, DsbB, DsbC, DsbD 또는 DsbG이다. 일부 실시양태에서, 디설파이드 결합 이소머라제는 서열번호 60(DsbC), 76(추정 세포질 디설파이드 이소머라제 DsbA), 77(DsbA), 78(DsbB), 80(DsbD) 또는 81(DsbG)로부터 선택된다. 일부 실시양태에서, 과발현된 폴딩 조절인자 단백질은 단백질 디설파이드 이소머라제이다. 일부 실시양태에서, 단백질 디설파이드 이소머라제는 PDIA6이다. 일부 실시양태에서, PDIA6은 서열번호 27 및 82 내지 98로부터 선택된 아미노산 서열을 가진다. 일부 실시양태에서, 과발현된 단백질 폴딩 조절인자는 서열번호 27, 57, 60, 76 내지 78, 및 80 내지 98로부터 선택된 아미노산 서열을 가진다.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 단백질 폴딩 조절인자 내지 2개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 3개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 4개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 3개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 4개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 4개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 또는 9개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자, 9개의 단백질 폴딩 조절인자 또는 10개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자 또는 9개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자, 9개의 단백질 폴딩 조절인자 또는 10개의 단백질 폴딩 조절인자를 과발현한다.
관련 단백질
본 발명에 따라 변형되기 전에, 예를 들어, 돌연변이를 유전자에 도입하여 단백질 활성을 결핍시키기 위해, 박테리아 숙주 세포는 동일한 단백질을 코딩하거나, 동일하거나 유사한 활성, 예를 들어, 프로테아제 활성 또는 자가용해 인자 활성을 가진 다수의 단백질들을 코딩하는 다수의 유전자들을 가질 수 있다. 이러한 상황에서, 재조합 박테리아 숙주 세포의 단백질 결핍은 하나 초과의 유전자의 돌연변이로부터 비롯될 수 있다.
2개의 상이한 그람 음성 박테리아 숙주 세포, 예를 들어, 상이한 속 또는 종의 숙주 세포는 다수의 관련 단백질들을 가질 수 있다. 이 관련 단백질들은 유사한 서열, 구조, 기능 및/또는 활성을 가질 수 있다. 이 상황 하에서, 제1 숙주 세포의 단백질 활성 결핍 및 제2 숙주 세포의 단백질 활성 결핍은 높은 수준의 아미노산 서열 유사성 또는 동일성을 가진 유전자의 돌연변이로부터 비롯될 수 있다. (예를 들어, 상이한 종들의) 상이한 숙주 세포들 사이에서, 그리고 동일한 숙주 세포 내에서, 이러한 특정 단백질은 조상 연관성의 지식 또는 가정을 기반으로 상동체로서 문헌에 기재되어 있다.
본 발명과 관련하여, 조상 연관성과 관계없이, 당업자는 당분야에 알려져 있고 본원에 기재된 방법을 이용하여 (동일한 숙주 세포, 예를 들어, 동일한 숙주 세포 종 내에서, 또는 2개의 상이한 숙주 세포들 사이에서) 2개의 단백질들을 관련 단백질로서 식별할 수 있다.
일부 실시양태에서, 본원에 언급된 바와 같이, 관련 단백질, 예를 들어, 관련 프로테아제 또는 관련 자가용해 인자는 정의된 아미노산 서열 유사성 또는 동일성을 가진다. 본원의 다른 곳에서 제공된 임의의 아미노산 서열 유사성 또는 동일성 범위는 그 범위 내에 속하는 더 좁은 범위로 대체될 수 있으며, 본원에서 제공된 임의의 최소 아미노산 서열 유사성 또는 동일성은 더 높은 최소값으로 대체될 수 있는 것으로 이해된다. 일부 실시양태에서, 본원에서 사용된 "관련 단백질"은 약 30% 내지 약 100%의 아미노산 서열 유사성 또는 동일성, 활성/촉매 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가질 수 있다. 본원에 기재된 핵산 또는 아미노산 서열의 서열 유사성 또는 동일성은 당업자에게 알려진 방법에 의해 측정될 수 있다. 일부 실시양태에서, 아미노산은 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성이 유사하다. 예를 들어, 음으로 하전된 아미노산은 아스파르트산 및 글루탐산을 포함하고; 양으로 하전된 아미노산안 라이신 및 아르기닌을 포함하고; 유사한 친수성 값을 가진 비하전 극성 헤드 기 또는 비극성 헤드 기를 가진 아미노산은 류신, 이소류신, 발린; 글리신, 알라닌; 아스파라긴, 글루타민; 세린, 트레오닌; 페닐알라닌, 티로신을 포함한다. 따라서, 유사한 아미노산은 예를 들어, 문헌에 기재되어 있는 보존적 아미노산 치환에 적합한 것으로서 확인된 아미노산일 수 있고, 예를 들어, 보존적 아미노산 치환을 나열하는 표 2에 나타낸 바와 같이 당업자에게 알려진 방법에 의해 용이하게 확인될 수 있다. 일부 실시양태에서, 유사한 아미노산은 표 2에서 원래 아미노산에 상응하는 행의 제2열("I. 보존적 치환"이라는 제목)에 나열된 아미노산이다. 일부 실시양태에서, 유사한 아미노산은 표 2에서 원래 아미노산에 상응하는 행의 제3열("II. 대안적 치환"이라는 제목)에 나열된 아미노산이다.
일부 실시양태에서, 관련 단백질은 약 30% 내지 약 35%, 약 30% 내지 약 40%, 약 30% 내지 약 45%, 약 30% 내지 약 50%, 약 30% 내지 약 55%, 약 30% 내지 약 60%, 약 30% 내지 약 65%, 약 30% 내지 약 70%, 약 30% 내지 약 80%, 약 30% 내지 약 90%, 약 30% 내지 약 100%, 약 35% 내지 약 40%, 약 35% 내지 약 45%, 약 35% 내지 약 50%, 약 35% 내지 약 55%, 약 35% 내지 약 60%, 약 35% 내지 약 65%, 약 35% 내지 약 70%, 약 35% 내지 약 80%, 약 35% 내지 약 90%, 약 35% 내지 약 100%, 약 40% 내지 약 45%, 약 40% 내지 약 50%, 약 40% 내지 약 55%, 약 40% 내지 약 60%, 약 40% 내지 약 65%, 약 40% 내지 약 70%, 약 40% 내지 약 80%, 약 40% 내지 약 90%, 약 40% 내지 약 100%, 약 45% 내지 약 50%, 약 45% 내지 약 55%, 약 45% 내지 약 60%, 약 45% 내지 약 65%, 약 45% 내지 약 70%, 약 45% 내지 약 80%, 약 45% 내지 약 90%, 약 45% 내지 약 100%, 약 50% 내지 약 55%, 약 50% 내지 약 60%, 약 50% 내지 약 65%, 약 50% 내지 약 70%, 약 50% 내지 약 80%, 약 50% 내지 약 90%, 약 50% 내지 약 100%, 약 55% 내지 약 60%, 약 55% 내지 약 65%, 약 55% 내지 약 70%, 약 55% 내지 약 80%, 약 55% 내지 약 90%, 약 55% 내지 약 100%, 약 60% 내지 약 65%, 약 60% 내지 약 70%, 약 60% 내지 약 80%, 약 60% 내지 약 90%, 약 60% 내지 약 100%, 약 65% 내지 약 70%, 약 65% 내지 약 80%, 약 65% 내지 약 90%, 약 65% 내지 약 100%, 약 70% 내지 약 80%, 약 70% 내지 약 90%, 약 70% 내지 약 100%, 약 80% 내지 약 90%, 약 80% 내지 약 100%, 또는 약 90% 내지 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 80%, 약 90% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 적어도 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 80% 또는 약 90%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 최대 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 80%, 약 90% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 약 45% 내지 약 50%, 약 45% 내지 약 55%, 약 45% 내지 약 60%, 약 45% 내지 약 65%, 약 45% 내지 약 70%, 약 45% 내지 약 75%, 약 45% 내지 약 80%, 약 45% 내지 약 85%, 약 45% 내지 약 90%, 약 45% 내지 약 95%, 약 45% 내지 약 100%, 약 50% 내지 약 55%, 약 50% 내지 약 60%, 약 50% 내지 약 65%, 약 50% 내지 약 70%, 약 50% 내지 약 75%, 약 50% 내지 약 80%, 약 50% 내지 약 85%, 약 50% 내지 약 90%, 약 50% 내지 약 95%, 약 50% 내지 약 100%, 약 55% 내지 약 60%, 약 55% 내지 약 65%, 약 55% 내지 약 70%, 약 55% 내지 약 75%, 약 55% 내지 약 80%, 약 55% 내지 약 85%, 약 55% 내지 약 90%, 약 55% 내지 약 95%, 약 55% 내지 약 100%, 약 60% 내지 약 65%, 약 60% 내지 약 70%, 약 60% 내지 약 75%, 약 60% 내지 약 80%, 약 60% 내지 약 85%, 약 60% 내지 약 90%, 약 60% 내지 약 95%, 약 60% 내지 약 100%, 약 65% 내지 약 70%, 약 65% 내지 약 75%, 약 65% 내지 약 80%, 약 65% 내지 약 85%, 약 65% 내지 약 90%, 약 65% 내지 약 95%, 약 65% 내지 약 100%, 약 70% 내지 약 75%, 약 70% 내지 약 80%, 약 70% 내지 약 85%, 약 70% 내지 약 90%, 약 70% 내지 약 95%, 약 70% 내지 약 100%, 약 75% 내지 약 80%, 약 75% 내지 약 85%, 약 75% 내지 약 90%, 약 75% 내지 약 95%, 약 75% 내지 약 100%, 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 95%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 95%, 약 85% 내지 약 100%, 약 90% 내지 약 95%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 적어도 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90% 또는 약 95%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 최대 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다.
관련 단백질은 상동체일 수 있거나 상동체가 아닐 수 있다. 일부 실시양태에서, 주어진 단백질의 상동체인 관련 단백질은 디폴트 설정에서 NCBI 데이터베이스에 기탁된 숙주 세포(예를 들어, 이. 콜라이) 프로테옴 서열로부터의 모든 비중복(nr) 단백질 서열들의 PSI-BLAST(위치 특이적 반복적 기본 국소 정렬 검색 도구) 검색에서 조회(query) 서열로서 단백질 서열을 사용함으로써 확인된다. PSI-BLAST 검색 방법은 당업자에게 알려져 있으며, 예를 들어, 본원에 참고로 포함되는 문헌[Bhagwat, M., and Aravind, L., 2007, "PSI-BLAST Tutorial," Ch. 10 in Comparative Genomics: Volumes 1 and 2, Bergman NH, ed., Totowa (NJ): Humana Press]에 기재되어 있다. 상동체를 확인하는 접근법은 문헌, 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Pearson, W.R., 2014, "BLAST and FASTA similarity searching for multiple sequence alignment," Methods Mol. Biol. 1079:75-101]에 기재되어 있다.
핵산 및 아미노산 서열 유사성 동일성은 본원에 기재된 방법들을 포함하나 이들로 제한되지 않는, 당분야에 알려진 임의의 적합한 방법에 따라 측정될 수 있다. 예를 들어, 유사한 서열에 대한 정렬 및 검색은 미국 국립 생명공학 정보 센터(NCBI, 메릴랜드주 베데스다) 프로그램인 MegaBLAST를 사용함으로써 수행될 수 있다. 아미노산 서열의 경우 예를 들어, 70%로 설정되거나 뉴클레오타이드 서열의 경우 예를 들어, 90%로 설정된 퍼센트 동일성에 대한 옵션을 가진 이 프로그램의 사용은 조회 서열과 70% 또는 90% 이상의 서열 동일성을 가진 서열을 확인할 수 있다. 유사한 서열, 예를 들어, 본원의 분비 신호 서열을 함유하는 정보 스트링과 적어도 70% 또는 90% 동일한 서열을 정렬하고/하거나 검색하기 위해 당분야에 알려진 다른 소프트웨어도 이용 가능하다. 예를 들어, 조회 서열과 적어도 70% 또는 90% 동일한 서열을 확인하는 비교를 위한 서열 정렬은 예를 들어, GCG 서열 분석 소프트웨어 팩키지(위스콘신주 53705 매디슨 유니버시티 애비뉴 1710 위스콘신 대학 생명공학 센터에 소재하는 제네틱스 컴퓨터 그룹(Genetics Computer Group)으로부터 입수 가능함)에서 이용 가능한 GAP, BESTFIT, BLAST, FASTA 및 TFASTA 프로그램을, 이들에 특정된 디폴트 파라미터 및 원하는 퍼센트로 설정된 서열 동일성의 정도에 대한 파라미터와 함께 사용함으로써 종종 수행된다. 또한, 예를 들어, CLUSTAL 프로그램(캘리포니아주 마운틴뷰에 소재하는 인텔리제네틱스(Intelligenetics)의 PC/유전자 소프트웨어 팩키지에서 이용 가능함)이 사용될 수 있다.
이들 및 다른 서열 정렬 방법은 당분야에 잘 알려져 있으며, 수동 정렬, 육안 검사, 또는 서열 정렬 알고리즘의 수동 또는 자동 적용, 예컨대, 전술된 프로그램에 의해 구현된 정렬들 중 임의의 정렬에 의해 수행될 수 있다. 다양한 유용한 알고리즘들은 예를 들어, 문헌[W. R. Pearson & D. J. Lipman, Proc. Natl. Acad. Sci. USA 85:2444-48 (April 1988)]에 기재된 유사성 검색 방법; 문헌[T. F. Smith & M. S. Waterman, Adv. Appl. Math. 2:482-89 (1981) and J. Molec. Biol. 147:195-97 (1981)]에 기재된 국소 상동성 방법; 문헌[S. B. Needleman & C. D. Wunsch, J. Molec. Biol. 48(3):443-53 (March 1970)]에 기재된 상동성 정렬 방법; 및, 예를 들어, 문헌[W. R. Pearson, Genomics 11(3):635-50 (November 1991)], 문헌[W. R. Pearson, Methods Molec. Biol. 24:307-31 and 25:365-89 (1994)], 및 문헌[D. G. Higgins & P. M. Sharp, Comp. Appl'ns in Biosci. 5:151-53 (1989) and Gene 73(1):237-44 (15 Dec. 1988)]에 기재된 다양한 방법들을 포함한다.
상기 니들만(Needleman)과 분슈(Wunsch)(1970)의 알고리즘을 사용하는 GAP 버전 10은 하기 파라미터를 사용하여 서열 동일성 또는 유사성을 측정하는 데 사용될 수 있다: GAP 가중치 50과 길이 가중치 3, 및 nwsgapdna.cmp 점수화 매트릭스를 사용하여 뉴클레오타이드 서열에 대한 % 동일성 및 % 유사성; GAP 가중치 8과 길이 가중치 2, 및 BLOSUM62 점수화 프로그램을 사용하여 아미노산 서열에 대한 % 동일성 또는 % 유사성. 당업자가 이해할 바와 같이, 동등하거나 유사한 프로그램도 사용될 수 있다. 예를 들어, 해당 임의의 두 서열에 대해 GAP 버전 10에 의해 생성된 상응하는 정렬과 비교될 때 동일한 뉴클레오타이드 잔기 일치 및 동일한 퍼센트 서열 동일성을 가진 정렬을 생성하는 서열 비교 프로그램이 사용될 수 있다. 실시양태에서, 조회 또는 대상체 서열의 전체, 또는 이들 둘 다에 걸쳐 서열 비교를 수행한다.
재조합 숙주 세포 단백질의 결핍 또는 불활성화된 프로테아제 과발현을 야기하는 돌연변이
단백질 활성이 결핍된 본 발명의 재조합 박테리아 숙주 세포는 임의의 알려진 방법으로 단백질 활성을 가진 단백질을 코딩하는 하나 이상의 유전자를 변경시킴으로써 생성될 수 있다. 본 설명 전체에 걸쳐 사용된 "결핍된" 단백질 활성 또는 단백질 활성의 "결핍"은 부분적 결핍, 실질적인 결핍 또는 완전한 결핍을 포함할 수 있다. 본 설명 전체에 걸쳐 사용된 "결핍된" 단백질 활성 또는 단백질 활성의 "결핍"은 단백질 활성의 감소 또는 제거를 포함할 수 있다. 따라서, 일부 실시양태에서, 재조합 숙주 세포 단백질 활성은 숙주 세포에서 대조군 세포에 비해 결핍되어 있다. 일부 실시양태에서, 대조군 세포는 단백질의 야생형 활성을 가진 상응하는 숙주 세포이다. 일부 실시양태에서, 대조군 세포는 상응하는 야생형 세포이다. 일부 실시양태에서, 대조군 세포는 단백질의 야생형 활성을 갖지만 야생형 세포에 비해 다른 차이점을 가진다. 본 발명의 재조합 숙주 세포는 단백질의 활성을 감소시키거나 제거하기 위해, 예를 들어, 본원에 기재된 바와 같이 임의의 적합한 수단에 의해 변형될 수 있다. 본 발명의 재조합 박테리아 숙주 세포는 본원에 기재된 바와 같이 불활성화된 프로테아제를 과발현할 수도 있다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 프로테아제 활성이 부분적으로 불활성화되거나, 실질적으로 불활성화되거나, 완전히 불활성화된다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 프로테아제 활성이 부분적으로 불활성화되거나, 실질적으로 불활성화되거나, 완전히 불활성화되고, 또 다른 성질, 예를 들어, 샤페론 활성이 활성을 띤다. 일부 실시양태에서, 불활성화된 프로테아제는 돌연변이, 예를 들어, (프로테아제 활성을 가진) 활성 프로테아제를 코딩하는 유전자의 돌연변이에 의해 불활성화된다.
일부 실시양태에서, 재조합 숙주 세포의 단백질 활성의 결핍 또는 감소는 예를 들어, 아미노산 치환, 하나 이상의 아미노산의 결실, 하나 이상의 아미노산의 삽입 또는 단백질 절단에 의해 아미노산 변화 또는 다른 파괴를 야기하는 돌연변이로부터 비롯된다. 일부 실시양태에서, 돌연변이는 불활성화 돌연변이이다. 일부 실시양태에서, 돌연변이는 부분적 불활성화 돌연변이이다. 일부 실시양태에서, 단백질, 예를 들어, 프로테아제 또는 자가용해 인자의 활성 결핍은 (i) 완전한 유전자 결실(유전자 녹아웃), (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택된 하나 이상의 돌연변이로부터 비롯된다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택된 하나 이상의 돌연변이에 의해 불활성화된다. 일부 실시양태에서, 단백질 활성의 결핍 또는 프로테아제의 불활성화를 야기하는 돌연변이는 단백질 또는 불활성화된 프로테아제를 코딩하는 유전자의 코딩 영역에 있다. 일부 실시양태에서, 단백질 활성의 결핍을 야기하는 돌연변이는 단백질을 코딩하는 유전자의 비코딩 영역에 있다. 일부 실시양태에서, 유전자의 비코딩 영역은 조절 영역이다. 일부 실시양태에서, 유전자의 조절 영역에서의 돌연변이는 단백질의 생성에 필요한 조절 요소, 예를 들어, 상응하는 RNA의 전사 또는 단백질로의 mRNA의 번역에 필요한 요소를 파괴한다. 예를 들어, 비코딩 영역 조절 요소는 프로모터, 인핸서, 조절 단백질 결합 부위, 리보좀 결합 부위, 또는 당업자에게 알려진 임의의 다른 조절 요소일 수 있다.
일부 실시양태에서, 돌연변이는 예를 들어, 프로테아제 활성 부위에서 하나 이상의 아미노산을 변경시키거나 결실시킴으로써 단백질의 중요 부위를 파괴하여, 재조합 숙주 세포에서 단백질의 결핍을 야기하거나 과발현된 프로테아제의 불활성화를 야기한다. 일부 실시양태에서, 돌연변이는 예를 들어, 알로스테릭 영역에서 하나 이상의 아미노산을 변경시킴으로써 단백질의 알로스테릭 영역을 파괴한다. 알로스테릭 영역은 또 다른 영역과 상호작용하여 활성 단백질 입체구조를 형성하는 영역일 수 있다. 일부 실시양태에서, 돌연변이는 아미노산을 임의의 다른 아미노산으로 치환시킨다. 일부 실시양태에서, 치환은 비보존적 아미노산 치환이다. 비보존적 아미노산 치환은 당업자에 의해 용이하게 선택될 수 있다. 표 2는 보존적 아미노산 치환(제I열) 및 대안적 보존적 아미노산 치환(II)의 예를 제공한다. 일부 실시양태에서, 원래 아미노산(예를 들어, 야생형 단백질의 아미노산)의 비보존적 치환은 원래 아미노산을 (I)에 나열되지 않은 임의의 아미노산으로 치환하는 것이다. 일부 실시양태에서, 원래 아미노산의 비보존적 치환은 원래 아미노산을 (II)에 나열되지 않은 임의의 아미노산으로 치환하는 것이다. 일부 실시양태에서, 비보존적 아미노산 치환은 원래 아미노산을 (I) 또는 (II)에 나열되지 않은 임의의 아미노산으로 치환하는 것이다.
관심 있는 재조합 단백질
본 발명은 고품질 및 고수율로 관심 있는 재조합 단백질을 생성하는 그람 음성 박테리아 숙주 세포 및 이를 사용하는 방법을 제공한다. 일부 실시양태에서, 기재된 숙주 세포 및 방법을 이용하여 생성한 관심 있는 재조합 단백질은 그람 음성 박테리아 숙주 세포에서 재조합적으로 발현될 때 분해되기 쉬운 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 야생형 또는 기능성 꼬리 특이적 프로테아제를 생성하는 숙주 세포에서 분해되고, 꼬리 특이적 프로테아제 활성이 결핍된 숙주 세포에서는 덜 분해되는 것으로 관찰된다. 본원에 기재된 바와 같이, 관심 있는 재조합 단백질은 관심 있는 재조합 단백질을 코딩하고 재조합 단백질을 발현할 수 있는 핵산 발현 구축물을 포함하는 하나 이상의 발현 플라스미드 또는 벡터로부터 재조합 그람 음성 박테리아 숙주 세포에 의해 생성될 수 있다.
분자유전학 및 유전공학 기법에 필요한 광범위한 서열 정보는 널리 공개적으로 입수될 수 있다. 포유동물 및 인간의 완전한 뉴클레오타이드 서열, 유전자, cDNA 서열, 아미노산 서열 및 게놈에의 접근은 웹사이트 www.ncbi.nlm.nih.gov/Entrez에서 진뱅크(GenBank)로부터 종종 수득된다. 추가 정보는 와이즈만 과학 게놈 및 생물정보학 연구소(Weizmann Institute of Science Genome and Bioinformatics)로부터 유전자와 이의 생성물 및 생물의학적 적용에 관한 정보를 통합한 전자 백과사전인 진카드(GeneCards)로부터 수득될 수 있다. 뉴클레오타이드 서열 정보는 EMBL 뉴클레오타이드 서열 데이터베이스 또는 DNA 데이터뱅크 또는 일본(DDBJ)으로부터 수득될 수 있다. 아미노산 서열에 대한 추가 정보 출처는 조지타운의 단백질 정보 자원 웹사이트 및 Swiss-Prot를 포함한다.
일부 실시양태에서, 관심 있는 단백질은 포유동물 단백질 또는 폴리펩티드이거나 포유동물 단백질 또는 폴리펩티드로부터 유래한다. 문맥이 달리 표시하지 않는 한, 용어 "단백질" 및 "폴리펩티드"는 본원에서 교환 가능하게 사용된다. 실시양태에서, 관심 있는 단백질은 인간 단백질이거나 인간 단백질로부터 유래한다. 실시양태에서, 관심 있는 단백질은 원핵생물 단백질이거나 원핵생물 단백질로부터 유래한다. 실시양태에서, 관심 있는 단백질은 미생물 단백질이거나 미생물 단백질로부터 유래한다. 실시양태에서, 관심 있는 단백질은 박테리아 단백질이거나 박테리아 단백질로부터 유래한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아이거나, 이들로부터 유래한다.
일부 실시양태에서, 본 발명의 조성물 및 방법을 이용함으로써 생성되는 관심 있는 재조합 단백질은 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체(항체, 항체 단편 또는 이의 유도체); 항체 기반 약물, 비-항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택된다.
일부 실시양태에서, 본 발명의 조성물 및 방법을 이용함으로써 생성되는 관심 있는 재조합 단백질은 포유동물, 설치류, 조류, 연골어류, 진균 또는 박테리아 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 닭, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 재조합 그람 음성 박테리아 숙주 세포에 대한 이종 단백질이다, 즉 관심 있는 단백질은 발현 숙주 세포 이외의 유기체로부터 유래한다. 일부 실시양태에서, 생성되는 관심 있는 재조합 단백질은 발현시키기 어려운 재조합 단백질, 예를 들어, 분해에 취약한 N-말단을 가진 단백질 및 전형적으로 미생물 또는 박테리아 발현 시스템에서 불용성 형태로 생성되는 단백질을 포함하는, 세포내 박테리아 프로테아제에 의해 빠른 단백질용해적 분해를 겪는 단백질이다.
일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체(항체, 항체 단편 또는 이의 유도체)는 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 트리바디; 인트라바디; 나노바디; 소형 모듈식 면역약제(SMIP), 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; VHH; 또는 당분야, 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 제5,648,237호("Expression of Functional Antibody Fragments")에 기재된 임의의 다른 항체 단편으로부터 선택된다. 일부 실시양태에서, VHH 함유 항체는 VHH 연쇄 항체이다. 일부 실시양태에서, 비인간 동물 종으로부터 유래한 항체 또는 항체 단편은 인간화된다.
일부 실시양태에서, 본 발명의 조성물 및 방법을 이용함으로써 생성되는 항체, 항체 단편 또는 이의 유도체는 치료 항체, 항체 단편 또는 이의 유도체이다. 일부 실시양태에서, 치료 항체, 항체 단편 또는 이의 유도체는 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자; 및 혈액 인자로부터 선택된 표적에 결합한다. 일부 실시양태에서, 사이토카인은 TNF-알파이다. 일부 실시양태에서, 약물은 혈소판 응집 억제제이다. 일부 실시양태에서, 혈소판 응집 억제제는 티카그렐로르(ticagrelor)이다.
일부 실시양태에서, 관심 있는 재조합 단백질은 Fab, Fab' 또는 F(ab')2로부터 선택된 항체 단편이다. Fab는 중쇄 및 경쇄 각각의 1개의 불변 영역 도메인 및 1개의 가변 영역 도메인을 포함하고, 항체 힌지 영역을 결여한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 Fab'이다. Fab'도 중쇄 및 경쇄 각각의 1개의 불변 영역 도메인 및 1개의 가변 영역 도메인을 포함하고, 중쇄의 항체 힌지 영역도 포함함으로써, 유리 설프하이드릴을 가진다. F(ab')2는 중쇄 및 경쇄 각각의 1개의 불변 영역 도메인 및 1개의 가변 영역 도메인을 각각 가진 2개의 항원 결합 영역, 및 힌지 영역을 가진 두 중쇄를 포함한다. 이것은 디설파이드 결합이 2개의 결합 영역을 연결할 수 있게 한다.
일부 실시양태에서, 관심 있는 재조합 단백질은 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합하는 Fab'이다. 일부 실시양태에서, Fab'는 아르시투모맙(Arcitumomab); 벡투모맙(Bectumomab); 비시로맙(Biciromab); 세르톨리주맙 페골(Certolizumab pegol)의 Fab' 모이어티; 및 술레소맙(Sulesomab)으로부터 선택된다. 일부 실시양태에서, 관심 있는 재조합 단백질은 EpCAM, 보체 인자 D(CFD), C242 항원, 5T4, 인간 산란 인자 수용체 키나제, VEGF-A 및 인테그린 αIIbβ3으로부터 선택된 표적에 결합하는 Fab이다. 일부 실시양태에서, Fab는 압식시맙(Abciximab); 아브레제키맙(Abrezekimab); 아나투모맙 마페나톡스(Anatumomab mafenatox); 시타투주맙 보가톡스(Citatuzumab bogatox); 람팔리주맙(Lampalizumab); 나콜로맙 타페나톡스(Nacolomab tafenatox); 나프투모맙 에스타페나톡스(Naptumomab estafenatox); 노페투모맙 메르펜탄(Nofetumomab merpentan); 오나르투주맙(Onartuzumab); 라니비주맙(Ranibizumab); 타도시주맙(Tadocizumab); 및 텔리모맙 아리톡스(Telimomab aritox)로부터 선택된다. 일부 실시양태에서, 관심 있는 재조합 단백질은 TNF-알파; VEGFR2; ITGB2(CD18); 및 CA-125로부터 선택된 표적에 결합하는 F(ab')2이다. 일부 실시양태에서, F(ab')2는 아펠리모맙(Afelimomab); 알라시주맙 페골(Alacizumab pegol); 도를리모맙 아리톡스(Dorlimomab aritox); 에를리주맙(Erlizumab); 및 이고보맙(Igovomab)으로부터 선택된다.
일부 실시양태에서, 인간 종양 괴사 인자 알파(인간 TNF-알파)에 결합하는 Fab'는 세르톨리주맙의 Fab' 모이어티이다. 세르톨리주맙은 약 40 kDa 폴리에틸렌 글리콜(PEG2MAL40K)에 접합된, 인간 TNF-알파에 대한 특이성을 가진 재조합 인간화 항체 Fab' 단편이다. 세르톨리주맙은 Cimzia 처방 정보(전체가 참고로 포함되는, 2019년 9월에 개정된 Cimzia 처방 정보)에 상세히 기재된 바와 같이 크론병, 류마티스 관절염, 건선 관절염, 강직 척추염, 비방사선학적 축성 척추관절염, 및 중등도 내지 중증 플라크 건선을 비롯한 자가면역 질환의 치료용으로 미국에서 Cimzia®라는 명칭으로 승인되었다. 일부 실시양태에서, 본원에 기재된 재조합 그람 음성 박테리아 숙주 세포 및 관련 방법은 크론병, 류마티스 관절염, 건선 관절염, 강직성 척추염, 비방사선학적 축성 척추관절염, 및 중등도 내지 중증 플라크 건선의 치료에 사용하기 위해 인간 TNF-알파에 결합하는 재조합 Fab'를 생성하는 데 사용된다.
일부 실시양태에서, 관심 있는 재조합 단백질은 하나 이상의 발현 구축물을 각각 포함하는 하나 이상의 발현 벡터로부터 재조합 그람 음성 박테리아 숙주 세포에서 발현되고, 상기 발현 구축물 각각은 관심 있는 재조합 단백질을 발현하고 코딩하는 핵산 서열을 포함한다. 당업자가 이해하는 바와 같이, 관심 있는 재조합 단백질에 포함된 각각의 폴리펩티드 쇄를 코딩하는 데 필요한 경우, 하나 이상의 발현 구축물이 단일 발현 벡터에 포함될 수 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 관심 있는 재조합 단백질에 따라 필요한 경우 하나 이상의 발현 구축물을 각각 포함하는 적어도 2개의 발현 벡터를 포함한다. 당업자가 이해하는 바와 같이, 항체, 항체 단편 또는 이의 유도체는 하나 이상의 발현 구축물로부터 생성된 하나 이상의 폴리펩티드로 구성될 수 있다. 예를 들어, 항체는 4개의 폴리펩티드, 즉 적어도 2개의 유전자에 의해 코딩된 2개의 동일한 중쇄와 2개의 동일한 경쇄로 구성될 수 있다. 항체는 적어도 4개의 상이한 유전자에 의해 코딩된 2개의 동일하지 않은 중쇄와 2개의 동일하지 않은 경쇄로 구성될 수 있다. 항체 단편은 예를 들어, 1개의 중쇄와 1개의 경쇄(예를 들어, Fab 또는 Fab'), 2개의 중쇄와 2개의 경쇄(예를 들어, F(ab')2), 1개의 중쇄(예를 들어, VHH, VH 또는 VL), 또는 VH 및 VL 둘 다를 포함하는 단일 폴리펩티드(scFv)로 구성될 수 있다. 일부 실시양태에서, 재조합 숙주 세포 내의 하나 이상의 발현 벡터는 동일한 발현 구축물의 다수의 카피를 포함할 수 있다.
일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄는 전체 길이 또는 중쇄 단편이고, 경쇄는 전체 길이 또는 경쇄 단편이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄 및 경쇄는 동일한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄 및 경쇄는 상이한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된다.
추가로, 본원에 기재된 바와 같이, 본 발명의 재조합 그람 음성 숙주 세포는 공-과발현된 단백질, 예를 들어, 불활성화된 프로테아제, 폴딩 조절인자, 샤페론 또는 이들의 임의의 조합의 생성을 위해 하나 이상의 발현 구축물을 함유하는 하나 이상의 발현 벡터를 포함할 수 있다. 관심 있는 재조합 단백질 및 공-과발현된 단백질 발현은 동일한 발현 벡터로부터 발현될 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질 및 공-과발현된 단백질은 동일한 프로모터로부터 공-전사된다. 일부 실시양태에서, 관심 있는 재조합 단백질 및 공-과발현된 단백질은 상이한 프로모터로부터 전사된다. 관심 있는 재조합 단백질 및 공-과발현된 단백질은 재조합 숙주 세포에서 상이한 발현 벡터로부터 발현될 수 있다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 1개 내지 5개의 발현 벡터를 포함한다. 일부 실시양태에서, 발현 벡터 각각은 1개 내지 5개의 발현 구축물을 포함한다. 일부 실시양태에서, 발현 구축물 각각은 상이한 단백질을 코딩한다. 일부 실시양태에서, 발현 벡터(들)에 존재하는 하나 초과의 발현 구축물은 동일한 단백질을 코딩한다.
재조합 단백질을 제조하는 방법
본 발명은 본원에 기재된 재조합 그람 음성 박테리아 숙주 세포를 사용하여 관심 있는 재조합 단백질을 제조하는 방법을 포함한다. 본 발명의 조성물 및 방법은 고품질, 고수율 또는 이들 둘 다의 관심 있는 재조합 단백질을 제조하는 데 사용될 수 있다. 관심 있는 고품질 재조합 단백질은 가용성 재조합 단백질, 활성 재조합 단백질, 온전한 재조합 단백질 또는 이들의 임의의 조합일 수 있다. 일부 실시양태에서, 본 발명의 조성물 및 방법은 가용성, 활성 또는 온전한 재조합 단백질, 고수율로 존재하는 재조합 단백질, 또는 이들의 임의의 조합을 제조하는 데 사용된다.
일부 실시양태에서, 관심 있는 재조합 단백질을 제조하는 방법은 본원에 제시된 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하고, 이때 재조합 그람 음성 숙주 세포는 적합한 발효 조건 하에서 배양되었고, 재조합 그람 음성 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 벡터로 형질전환되었다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계는 적어도 하나의 정제 단계를 포함한다. 일부 실시양태에서, 회수된 관심 있는 재조합 단백질의 수율 및/또는 품질이 측정된다. 일부 실시양태에서, 회수된 관심 있는 재조합 단백질의 수율 및/또는 품질은 대조군 세포로부터 회수된 관심 있는 재조합 단백질의 수율 및/또는 품질과 비교된다.
본원에 기재된 본 발명의 그람 음성 박테리아 숙주 세포를 사용하여 관심 있는 재조합 단백질을 제조하고 평가하는 것은 박테리아 숙주 세포에서 재조합 단백질을 제조하는 알려진 수단 및 방법과 함께, 본원에 기재된 바와 같이 수행될 수 있다.
그람 음성 박테리아 숙주 세포
본 발명의 그람 음성 박테리아 숙주 세포는 슈도모나드(즉, 슈도모나달레스(Pseudomonadales) 목의 숙주 세포) 및 당분야에 알려진 관련 박테리아 유기체, 예를 들어, 에스케리키아(Escherichia), 에르위니아(Erwinia), 살모넬라(Salmonella), 시겔라(Shigella), 모락셀라(Moraxella), 헬리코박터(Helicobacter), 레지오넬라(Legionella), 네이세리아(Neisseria), 헤모필루스(Haemophilus), 아시네토박터(Acinetobacter), 자일렐라(Xylella), 박테로이데스(Bacteroides), 시트로박터(Citrobacter), 엔테로박터(Enterobacter), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 세라티아(Serratia), 시겔라(Shigella), 예르시니아(Yersinia) 및 비브리오(Vibrio)를 포함하고, 슈도모나스 플루오레센스, 슈도모나스 에루기노사, 슈도모나스 푸티다, 에스케리키아 콜라이, 에르위니아 크라이산테미(E. chrysanthemi), 살모넬라 타이피무륨(S. typhimurium), 헬리코박터 파일로리(Helicobacter pylori), 레지오넬라 뉴모필라(L. pneumophila), 네이세리아 메닝기티디스(N. meningitidis), 네이세리아 고노로에아(N. gonorrhoeae), 헤모필루스 인플루엔자(Haemophilus influenzae), 비브리오 콜레라(V. cholerae), 자일렐라 파스티디오사(X. fastidiosa) 및 아시네토박터 베이일리(A. baylyi)를 포함하나 이들로 제한되지 않는 임의의 종 또는 아종을 포함한다.
일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 플루오레센스이다.
실시양태에서, 숙주 세포는 슈도모나달레스 목(본원에서 "슈도모나드"로서 지칭됨)의 세포이다. 숙주 세포가 슈도모나달레스 목의 세포인 경우, 숙주 세포는 슈도모나스 속을 포함하는 슈도모나다세아(Pseudomonadaceae) 과의 구성원일 수 있다.
감마 프로테오박테리아 숙주는 에스케리키아 콜라이 종의 구성원 및 슈도모나스 플루오레센스 종의 구성원을 포함한다. 다른 슈도모나스 유기체도 유용할 수 있다. 슈도모나드 및 밀접하게 관련된 종은 전체가 본원에 참고로 포함되는 문헌[R. E. Buchanan and N. E. Gibbons (eds.), Bergey's Manual of Determinative Bacteriology, pp. 217-289 (8th ed., 1974) (The Williams & Wilkins Co., Baltimore, Md., USA)]에 "그람 음성 호기성 간균 및 구균"으로서 기재된 과 및/또는 속에 속하는 프로테오박테리아 군을 포함하는 그람 음성 프로테오박테리아 하위군 1을 포함한다. 표 3은 유기체의 이러한 과 및 속을 제시한다.
슈도모나스 및 밀접하게 관련된 박테리아는 일반적으로 "그람(-) 프로테오박테리아 하위군 1" 또는 "그람 음성 호기성 간균 및 구균"으로서 정의된 군의 일부이다(Buchanan and Gibbons (eds.) (1974) Bergey's Manual of Determinative Bacteriology, pp. 217-289). 슈도모나스 숙주 균주는 문헌, 예를 들어, 본원에 각각 참고로 포함되는 미국 특허 제9,458,487호 및 미국 특허 제9,453,251호(둘 다 발명의 명칭이 "Expression of mammalian proteins in Pseudomonas fluorescens"임)에 기재되어 있다.
"그람 음성 프로테오박테리아 하위군 1"은 분류에 사용된 기준에 따라 이 제목에 분류될 프로테오박테리아도 포함한다. 이 제목은 이전에 이 단락에서 분류되었으나 더 이상 분류되지 않은 군, 예컨대, 악시도보락스(Acidovorax), 브레분디모나스(Brevundimonas), 부르크홀데리아(Burkholderia), 하이드로제노파가(Hydrogenophaga), 오세아니모나스(Oceanimonas), 랄스토니아(Ralstonia) 및 스테노트로포모나스(Stenotrophomonas) 속; 잔토모나스(Xanthomonas) 속에 속하는(그리고 이전에 이의 종으로서 지칭된) 유기체의 재분류에 의해 생성된 스핑고모나스(Sphingomonas) 속(및 이로부터 유래한 블라스토모나스(Blastomonas) 속); 상기 문헌[Bergey (1974)]에서 정의된 아세토박터(Acetobacter) 속에 속하는 유기체의 재분류에 의해 생성된 악시도모나스(Acidomonas) 속도 포함한다. 또한, 숙주는 각각 알테로모나스 할로플란크티스(Alteromonas haloplanktis), 알테로모나스 니그리파시엔스(Alteromonas nigrifaciens) 및 알테로모나스 푸트레파시엔스(Alteromonas putrefaciens)로서 재분류된 슈도모나스 속의 슈도모나스 에날리아(Pseudomonas enalia)(ATCC 14393), 슈도모나스 니그리파시엔시(Pseudomonas nigrifaciensi)(ATCC 19375) 및 슈도모나스 푸트레파시엔스(Pseudomonas putrefaciens)(ATCC 8071)로부터의 세포를 포함할 수 있다. 유사하게, 예를 들어, 슈도모나스 악시도보란스(Pseudomonas acidovorans)(ATCC 15668) 및 슈도모나스 테스토스테로니(Pseudomonas testosteroni)(ATCC 11996)는 나중에 각각 코마모나스 악시도보란스(Comamonas acidovorans) 및 코마모나스 테스토스테로니(Comamonas testosteroni)로서 재분류되었고, 슈도모나스 니그리파시엔스(Pseudomonas nigrifaciens)(ATCC 19375) 및 슈도모나스 피시시다(Pseudomonas piscicida)(ATCC 15057)는 각각 슈도알테로모나스 니그리파시엔스(Pseudoalteromonas nigrifaciens) 및 슈도알테로모나스 피시시다(Pseudoalteromonas piscicida)로서 재분류되었다. "그람 음성 프로테오박테리아 하위군 1"은 슈도모나다세아, 아조토박테라세아(Azotobacteraceae)(현재는 동의어인 슈도모나다세아의 "아조토박터 군"으로 종종 지칭됨), 리조비아세아(Rhizobiaceae) 및 메틸로모나다세아(Methylomonadaceae)(현재는 동의어인 "메틸로코카세아(Methylococcaceae)"로 종종 지칭됨) 과들 중 임의의 과에 속하는 것으로서 분류된 프로테오박테리아도 포함한다. 결과적으로, 본원에 달리 기재된 속들 이외에, "그람 음성 프로테오박테리아 하위군 1"에 속하는 추가 프로테오박테리아 속은 1) 아조리조필루스(Azorhizophilus) 속의 아조토박터 군 박테리아; 2) 셀비브리오(Cellvibrio), 올리겔라(Oligella) 및 테레디니박터(Teredinibacter) 속의 슈도모나다세아 과 박테리아; 3) 켈라토박터(Chelatobacter), 엔시퍼(Ensifer), 리베리박터(Liberibacter)("칸디다투스 리베리박터(Candidatus Liberibacter)"로서도 지칭됨) 및 시노리조비움(Sinorhizobium) 속의 리조비아세아 과 박테리아; 및 4) 메틸로박터(Methylobacter), 메틸로칼둠(Methylocaldum), 메틸로마이크로비움(Methylomicrobium), 메틸로사르시나(Methylosarcina) 및 메틸로스패라(Methylosphaera) 속의 메틸로코카세아 과 박테리아를 포함한다.
숙주 세포는 "그람 음성 프로테오박테리아 하위군 16"으로부터 선택될 수 있다. "그람 음성 프로테오박테리아 하위군 16"은 하기 슈도모나스 종의 프로테오박테리아 군으로서 정의된다(예시적인 균주(들)의 ATCC 또는 다른 수탁번호는 가로 안에 표시됨): 슈도모나스 아비에타니필라(Pseudomonas abietaniphila)(ATCC 700689); 슈도모나스 에루기노사(ATCC 10145); 슈도모나스 알칼리제네스(Pseudomonas alcaligenes)(ATCC 14909); 슈도모나스 안귈리셉티카(Pseudomonas anguilliseptica)(ATCC 33660); 슈도모나스 시트로넬로리스(Pseudomonas citronellolis)(ATCC 13674); 슈도모나스 플라베센스(Pseudomonas flavescens)(ATCC 51555); 슈도모나스 멘도시나(Pseudomonas mendocina)(ATCC 25411); 슈도모나스 니트로리덕센스(Pseudomonas nitroreducens)(ATCC 33634); 슈도모나스 올레오보란스(Pseudomonas oleovorans)(ATCC 8062); 슈도모나스 슈도알칼리제네스(Pseudomonas pseudoalcaligenes)(ATCC 17440); 슈도모나스 레시노보란스(Pseudomonas resinovorans)(ATCC 14235); 슈도모나스 스트라미네아(Pseudomonas straminea)(ATCC 33636); 슈도모나스 아가리시(Pseudomonas agarici)(ATCC 25941); 슈도모나스 알칼리필라(Pseudomonas alcaliphila); 슈도모나스 알기노보라(Pseudomonas alginovora); 슈도모나스 안데르소니(Pseudomonas andersonii); 슈도모나스 아스플레니(Pseudomonas asplenii)(ATCC 23835); 슈도모나스 아젤라이카(Pseudomonas azelaica)(ATCC 27162); 슈도모나스 베예린키(Pseudomonas beyerinckii)(ATCC 19372); 슈도모나스 보레알리스(Pseudomonas borealis); 슈도모나스 보레오폴리스(Pseudomonas boreopolis)(ATCC 33662); 슈도모나스 브라시카세아룸(Pseudomonas brassicacearum); 슈도모나스 부타노보라(Pseudomonas butanovora)(ATCC 43655); 슈도모나스 셀룰로사(Pseudomonas cellulosa)(ATCC 55703); 슈도모나스 아우란티아카(Pseudomonas aurantiaca)(ATCC 33663); 슈도모나스 클로로라피스(Pseudomonas chlororaphis)(ATCC 9446, ATCC 13985, ATCC 17418, ATCC 17461); 슈도모나스 프라기(Pseudomonas fragi)(ATCC 4973); 슈도모나스 룬덴시스(Pseudomonas lundensis)(ATCC 49968); 슈도모나스 테트롤렌스(Pseudomonas taetrolens)(ATCC 4683); 슈도모나스 시시콜라(Pseudomonas cissicola)(ATCC 33616); 슈도모나스 코로나파시엔스(Pseudomonas coronafaciens); 슈도모나스 디테르페니필라(Pseudomonas diterpeniphila); 슈도모나스 엘롱가타(Pseudomonas elongata)(ATCC 10144); 슈도모나스 플렉텐스(Pseudomonas flectens)(ATCC 12775); 슈도모나스 아조토포르만스(Pseudomonas azotoformans); 슈도모나스 브레네리(Pseudomonas brenneri); 슈도모나스 세드렐라(Pseudomonas cedrella); 슈도모나스 코루가타(Pseudomonas corrugata)(ATCC 29736); 슈도모나스 엑스트레모리엔탈리스(Pseudomonas extremorientalis); 슈도모나스 플루오레센스(ATCC 35858); 슈도모나스 게사르디(Pseudomonas gessardii); 슈도모나스 리바넨시스(Pseudomonas libanensis); 슈도모나스 만델리(Pseudomonas mandelii)(ATCC 700871); 슈도모나스 마르기날리스(Pseudomonas marginalis)(ATCC 10844); 슈도모나스 미굴라(Pseudomonas migulae); 슈도모나스 뮤시돌렌스(Pseudomonas mucidolens)(ATCC 4685); 슈도모나스 오리엔탈리스(Pseudomonas orientalis); 슈도모나스 로데시아(Pseudomonas rhodesiae); 슈도모나스 신잔타(Pseudomonas synxantha)(ATCC 9890); 슈도모나스 톨라시(Pseudomonas tolaasii)(ATCC 33618); 슈도모나스 베로니(Pseudomonas veronii)(ATCC 700474); 슈도모나스 프레데릭스베르겐시스(Pseudomonas frederiksbergensis); 슈도모나스 제니쿨라타(Pseudomonas geniculata)(ATCC 19374); 슈도모나스 진저리(Pseudomonas gingeri); 슈도모나스 그라미니스(Pseudomonas graminis); 슈도모나스 그리몬티(Pseudomonas grimontii); 슈도모나스 할로데니트리피칸스(Pseudomonas halodenitrificans); 슈도모나스 할로필라(Pseudomonas halophila); 슈도모나스 히비스시콜라(Pseudomonas hibiscicola)(ATCC 19867); 슈도모나스 후티엔시스(Pseudomonas huttiensis)(ATCC 14670); 슈도모나스 하이드로게노보라(Pseudomonas hydrogenovora); 슈도모나스 제세니(Pseudomonas jessenii)(ATCC 700870); 슈도모나스 킬로넨시스(Pseudomonas kilonensis); 슈도모나스 란세올라타(Pseudomonas lanceolata)(ATCC 14669); 슈도모나스 리니(Pseudomonas lini); 슈도모나스 마르기네이트(Pseudomonas marginate)(ATCC 25417); 슈도모나스 메피티카(Pseudomonas mephitica)(ATCC 33665); 슈도모나스 데니트리피칸스(Pseudomonas denitrificans)(ATCC 19244); 슈도모나스 퍼투시노제나(Pseudomonas pertucinogena)(ATCC 190); 슈도모나스 픽토룸(Pseudomonas pictorum)(ATCC 23328); 슈도모나스 사이크로필라(Pseudomonas psychrophila); 슈도모나스 필바(Pseudomonas filva)(ATCC 31418); 슈도모나스 몬테일리(Pseudomonas monteilii)(ATCC 700476); 슈도모나스 모셀리(Pseudomonas mosselii); 슈도모나스 오리지하비탄스(Pseudomonas oryzihabitans)(ATCC 43272); 슈도모나스 플레코글로시시다(Pseudomonas plecoglossicida)(ATCC 700383); 슈도모나스 푸티다(ATCC 12633); 슈도모나스 리액탄스(Pseudomonas reactans); 슈도모나스 스피노사(Pseudomonas spinosa)(ATCC 14606); 슈도모나스 발레아리카(Pseudomonas balearica); 슈도모나스 루테올라(Pseudomonas luteola)(ATCC 43273); 슈도모나스 스투제리(Pseudomonas stutzeri)(ATCC 17588); 슈도모나스 아미그달리(Pseudomonas amygdali)(ATCC 33614); 슈도모나스 아벨라나(Pseudomonas avellanae)(ATCC 700331); 슈도모나스 카리카파파예(Pseudomonas caricapapayae)(ATCC 33615); 슈도모나스 시코리(Pseudomonas cichorii)(ATCC 10857); 슈도모나스 피쿠세렉타(Pseudomonas ficuserectae)(ATCC 35104); 슈도모나스 푸스코바기나(Pseudomonas fuscovaginae); 슈도모나스 멜리아(Pseudomonas meliae)(ATCC 33050); 슈도모나스 시링가(Pseudomonas syringae)(ATCC 19310); 슈도모나스 비리디플라바(Pseudomonas viridiflava)(ATCC 13223); 슈도모나스 써모카르복시도보란스(Pseudomonas thermocarboxydovorans)(ATCC 35961); 슈도모나스 써모톨레란스(Pseudomonas thermotolerans); 슈도모나스 티버발렌시스(Pseudomonas thivervalensis); 슈도모나스 반쿠버렌시스(Pseudomonas vancouverensis)(ATCC 700688); 슈도모나스 위스콘시넨시스(Pseudomonas wisconsinensis); 및 슈도모나스 샤메넨시스(Pseudomonas xiamenensis). 한 실시양태에서, 숙주 세포는 슈도모나스 플루오레센스이다.
숙주 세포는 "그람 음성 프로테오박테리아 하위군 17"로부터 선택될 수도 있다. "그람 음성 프로테오박테리아 하위군 17"은 예를 들어, 하기 슈도모나스 종에 속하는 프로테오박테리아를 포함하는 "형광 슈도모나드"로서 당분야에 알려진 프로테오박테리아 군으로서 정의된다: 슈도모나스 아조토포르만스; 슈도모나스 브레네리; 슈도모나스 세드렐라; 슈도모나스 코루가타; 슈도모나스 엑스트레모리엔탈리스; 슈도모나스 플루오레센스; 슈도모나스 게사르디; 슈도모나스 리바넨시스; 슈도모나스 만델리; 슈도모나스 마르기날리스; 슈도모나스 미굴라; 슈도모나스 뮤시돌렌스; 슈도모나스 오리엔탈리스; 슈도모나스 로데시아; 슈도모나스 신잔타; 슈도모나스 톨라시; 및 슈도모나스 베로니.
숙주 균주 배경
본 발명의 방법을 실시하는 데 유용한 숙주 세포, 균주 및 발현 구축물은 당업자에게 알려져 있고 문헌에 기재되어 있는 시약 및 방법을 사용함으로써 확인될 수 있거나 제조될 수 있다. 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 제8,288,127호("Protein Expression Systems")는 염색체 lacI 유전자 삽입물(예를 들어, lsc::lacIQ1)을 포함하는 영양요구성 슈도모나스 플루오레센스 숙주 세포 내로 핵산 구축물을 도입함으로써 재조합 폴리펩티드를 제조하는 것을 설명한다. 상기 핵산 구축물은 숙주 세포에서 핵산의 발현을 유도할 수 있는 프로모터에 작동 가능하게 연결된 재조합 폴리펩티드를 코딩하는 뉴클레오타이드 서열을 포함하고, 영양요구성 선택 마커를 코딩하는 뉴클레오타이드 서열도 포함한다. 영양요구성 선택 마커는 영양요구성 숙주 세포에 대한 원영양성(prototrophy)을 회복시키는 폴리펩티드이다. 실시양태에서, 세포는 프롤린, 우라실, 또는 이들의 조합에 대해 영양요구성을 나타낸다. 실시양태에서, 숙주 세포는 MB101(ATCC 수탁번호 PTA-7841)로부터 유래한다. 전체가 본원에 참고로 포함되는 미국 특허 제8,288,127호("Protein Expression Systems") 및 문헌[Schneider, et al., 2005, "Auxotrophic markers pyrF and proC can replace antibiotic markers on protein production plasmids in high-cell-density Pseudomonas fluorescens fermentation," Biotechnol. Progress 21(2): 343-8]은 균주 MB101에서 pyrF 유전자를 결실시킴으로써 구축된, 우라실에 대한 영양요구성을 가진 생산 숙주 균주를 설명한다. pyrF 유전자를 균주 MB214(ATCC 수탁번호 PTA-7840)로부터 클로닝하여, pyrF 결실을 보완하여 원영양성을 회복시키는 플라스미드를 생성하였다. 특정 실시양태에서, 슈도모나스 플루오레센스 숙주 세포에서 이중 pyrF-proC 이중 영양요구성 선택 마커 시스템이 사용된다. 공개된 문헌을 고려하면, 기재된 pyrF 결실 생산 숙주 균주는 알려진 방법을 이용함으로써 당업자에 의해 제조될 수 있고, 본 발명의 방법을 실시하는 데 유용한 것으로서 본원에 기재된 게놈 변화를 비롯한 다른 원하는 게놈 변화를 도입하기 위한 배경으로서 사용될 수 있다. 당업자는 당분야에 알려져 있고 문헌에 기재되어 있는 많은 적합한 방법들 중 임의의 방법을 이용하여, 예를 들어, PyrF, Prc1, Prc2, MepM1을 코딩하는 유전자, 및 임의로 추가 프로테아제 또는 자가용해 인자를 코딩하는 유전자를 불활성화시킴으로써, 공개적으로 입수 가능한 숙주 세포, 예를 들어, 슈도모나스 플루오레센스 MB101을 사용하여 본 발명의 방법에 유용한 생산 숙주 균주를 생성할 수 있음을 이해할 것이다. 또한, 당분야에 알려져 있고 문헌에 기재되어 있는 임의의 적합한 방법을 이용하여 원영양성 회복 플라스미드, 예를 들어, 균주 MB214의 pyrF 유전자를 운반하는 플라스미드를 균주 내로 형질전환시킬 수 있다는 것도 이해된다. 추가로, 당분야에 잘 알려져 있는 방법을 이용하여 불활성화된 프로테아제 및 폴딩 조절인자 과발현 구축물을 이러한 균주에 도입할 수 있다.
실시양태에서, 본 발명의 방법에 사용되는 슈도모나스 플루오레센스 숙주 균주는 유전자 pyrF가 결실되어 있고 이. 콜라이 lacI 전사 억제제가 삽입되고 레반수크라제(levansucrase) 유전자(lsc)와 융합되어 있는 기탁된 균주 MB101의 유도체인 DC1032(Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1)이다. 이 유전자들의 서열 및 이들을 사용하는 방법은 당분야에 알려져 있으며 문헌, 예를 들어, 본원에 각각 참고로 포함되는 미국 특허 제8,288,127호, 제8,017,355호("Mannitol induced promoter systems in bacterial host cells") 및 제7,794,972호("Benzoate-and anthranilate-inducible promoters")에 기재되어 있다.
표 4에 나열된 숙주 세포, 예를 들어, DC1032, DC954 또는 DC454와 동등한 슈도모나스 숙주 세포, 또는 본원에 기재된 임의의 숙주 세포 또는 발현 균주는 본원 및 공개된 문헌에 기재된 방법을 이용함으로써 MB101로부터 구축될 수 있다. 실시양태에서, DC1032 또는 DC954와 동등한 숙주 세포가 사용된다. 숙주 세포 DC454는 전체가 본원에 참고로 포함되는 문헌[Schneider, et al., 2005](여기서, 이 세포는 DC206으로서 지칭됨) 및 미국 특허 제8,569,015호("rPA Optimization")에 기재되어 있다. DC206은 DC454와 동일한 균주이고; 동물 성분 무함유 배지에서 3회 계대배양된 후 DC454로서 재명명되었다. DC454는 DC1032 및 DC954의 모 균주이다.
당분야에서 통상의 기술을 가진 자는 실시양태에서, 숙주 세포 게놈 결실 또는 돌연변이(예를 들어, 불활성화 또는 쇠약화 돌연변이)가 예를 들어, 슈도모나스 플루오레센스에서 복제되지 않는, 결실될 유전자를 플랭킹하는 영역을 운반하는 결실 플라스미드를 사용한 대립유전자 교환에 의해 달성될 수 있음을 이해할 것이다. 결실 플라스미드는 결실될 유전자의 업스트림 및 다운스트림 영역을 포함하는, 결실될 유전자를 PCR 증폭함으로써 구축될 수 있다. 결실은 아가로스 슬래브 겔에서 전기영동으로 분리한 후에 관찰된, 분석용 프라이머를 사용하여 게놈 DNA로부터 증폭시킨 PCR 생성물을 시퀀싱한 다음, 단편을 DNA 시퀀싱함으로써 확인될 수 있다. 실시양태에서, 유전자는 완전한 결실, 부분적 결실 또는 돌연변이, 예를 들어, 프레임시프트, 점 또는 삽입 돌연변이에 의해 불활성화된다.
실시양태에서, 본 발명과 관련하여 사용된 균주를 당분야에 알려진 방법에 따라 FMO 플라스미드로 형질전환시켰다. 본 발명의 방법에 따라 재조합 단백질을 발현시키는 데 유용한 재조합 단백질 발현 균주 및 상응하는 숙주 세포의 특정 예에 대한 유전형은 표 10에 제시되어 있다. 실시양태에서, 본 발명의 방법을 이용하여 관심 있는 재조합 단백질을 발현시키기 위해 표 4에 기재된 임의의 숙주 세포와 동등한 숙주 세포를 본원에 기재된 발현 벡터로 형질전환시켜, 본원에 기재된 발현 균주와 동등한 발현 균주를 수득하였다. 기재된 바와 같이, 적절한 발현 균주는 본원 및 문헌에 제시된 방법에 따라 유사하게 유도될 수 있다.
발현 시스템
당업자는 본원의 교시를 기반으로 본 방법에 따라 관심 있는 재조합 단백질을 제조하는 데 유용한 적절한 박테리아 발현 시스템을 확인할 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 뉴클레오타이드 서열을 포함하는 발현 구축물은 유도성 발현 벡터의 일부로서 제공된다. 실시양태에서, 발현 벡터로 형질전환시킨 숙주 세포를 배양하고, 발현 벡터로부터 관심 있는 재조합 단백질의 발현을 유도한다. 발현 벡터는 예를 들어, 플라스미드일 수 있다. 실시양태에서, 발현 벡터는 선택 마커를 추가로 포함하는 재조합 단백질 코딩 서열을 코딩하는 플라스미드이고, 숙주 세포는 플라스미드의 유지를 허용하는 선택 조건 하에서 생장된다. 실시양태에서, 발현 구축물은 숙주 세포 게놈에 통합된다. 실시양태에서, 발현 구축물은 관심 있는 재조합 단백질을 주변세포질로 유도할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다.
본 발명의 방법에 유용한 숙주 세포에서 유용한 조절 서열(예를 들어, 프로모터, 분비 신호 및 리보좀 결합 부위)을 포함하는 이종 단백질을 발현시키는 방법은 문헌, 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression"), 미국 특허 제7,985,564호("Expression systems with Sec-system secretion"), 미국 특허 제9,394,571호, 미국 특허 제9,580,719호, 미국 특허 제9,458,487호, 미국 특허 제9,453,251호, 미국 특허 제8,603,824호, 미국 특허 제8,530,171호("High level expression of recombinant toxin proteins"), 미국 특허 제10,118,956호, 미국 특허 제5,888,808호("Bacterial polypeptide expression employing tryptophan promoter-operator"), 미국 특허 제9,534,217호("Method of creating a library of bacterial clones with varying levels of gene expression") 및 문헌[Vellanoweth, R.L., and Rabinowitz, J. C., May 1992, "The influence of ribosome-binding-site elements on translational efficiency in Bacillus subtilis and Escherichia coli in vivo," Molecular Microbiology 6(9):1105-1114]에 기재되어 있다. 실시양태에서, 본 발명과 관련하여 사용된 분비 리더는 미국 특허 제7,618,799호, 미국 특허 제7,985,564호, 미국 특허 제9,394,571호, 미국 특허 제9,580,719호, 미국 특허 제9,453,251호, 미국 특허 제8,603,824호, 미국 특허 제8,530,171호 및 미국 특허 제10,118,956호 중 임의의 특허에 개시된 분비 리더이다. 이 특허들은 이종 단백질 발현을 증가시키기 위해 폴딩 조절인자를 과발현하도록 조작되었거나 프로테아제 돌연변이가 도입되어 있는, 본원의 방법을 실시하는 데 유용한 박테리아 숙주 균주도 설명한다.
본 발명에 따라 사용되는 프로모터는 항시성 프로모터 또는 조절 프로모터일 수 있다. 유도성 프로모터의 예는 lac 프로모터(즉, lacZ 프로모터)로부터 유래한 계열의 프로모터, 예를 들어, 본원에 참고로 포함되는 미국 특허 제4,551,433호("Microbial Hybrid Promoters")에 기재된 tac 및 trc 프로모터뿐만 아니라, Ptac16, Ptac17, PtacII, PlacUV5 및 T7lac 프로모터도 포함한다. 실시양태에서, 프로모터는 숙주 세포 유기체로부터 유래하지 않는다. 실시양태에서, 프로모터는 이. 콜라이 유기체로부터 유래한다. 실시양태에서, lac 프로모터는 플라스미드로부터 관심 있는 재조합 단백질의 발현을 조절하는 데 사용된다. lac 프로모터 유도체 또는 계열 구성원, 예를 들어, tac 프로모터의 경우, 유도제는 IPTG(이소프로필-β-D-1-티오갈락토피라노사이드, "이소프로필티오갈락토사이드")이다. 실시양태에서, IPTG는 당분야에 알려져 있고 문헌, 예를 들어, 미국 특허 제9,458,487호 및 미국 특허 제9,453,251호에 기재되어 있는 방법에 따라 슈도모나스 숙주 세포에서 lac 프로모터로부터 관심 있는 재조합 단백질의 발현을 유도하기 위해 숙주 세포 배양물에 첨가된다.
본 발명에 따른 발현 시스템에 유용한 비-lac 프로모터의 예는 예를 들어, 문헌[J. Sanchez-Romero & V. De Lorenzo (1999) Manual of Industrial Microbiology and Biotechnology (A. Demain & J. Davies, eds.) pp. 460-74 (ASM Press, Washington, D.C.)]; 문헌[H. Schweizer (2001) Current Opinion in Biotechnology, 12:439-445]; 및 문헌[R. Slater & R. Williams (2000 Molecular Biology and Biotechnology (J. Walker & R. Rapley, eds.) pp. 125-54 (The Royal Society of Chemistry, Cambridge, UK)]에 기재된 PR(고온에 의해 유도됨), PL(고온에 의해 유도됨), Pm(알킬벤조에이트 또는 할로벤조에이트에 의해 유도됨), Pu(알킬톨루엔 또는 할로톨루엔에 의해 유도됨), 또는 Psal(살리실레이트에 의해 유도됨)을 포함한다. 선택된 박테리아 숙주 세포에 대한 천연 프로모터의 뉴클레오타이드 서열을 가진 프로모터, 예를 들어, 슈도모나스 안트라닐레이트 또는 벤조에이트 오페론 프로모터(Pant, Pben)를 사용하여 관심 있는 폴리펩티드를 코딩하는 발현 구축물의 발현을 조절할 수도 있다. 서열이 동일하든 아니면 상이하든 관계없이, 하나 초과의 프로모터가 또 다른 프로모터에 공유부착되어 있는 탠덤 프로모터, 예를 들어, 동일하거나 상이한 유기체로부터 유래한 Pant-Pben 탠덤 프로모터(프로모터간 하이브리드) 또는 Plac-Plac 탠덤 프로모터도 사용될 수 있다. 일부 실시양태에서, 프로모터는 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 제7,476,532호 및 제8,017,355호(둘 다 발명의 명칭이 "Mannitol induced promoter systems in bacterial host cells"임)에 기재된 바와 같은 Pmtl이다.
조절(유도성) 프로모터는 프로모터가 유전자의 일부인 유전자의 전사를 조절하기 위해 프로모터 조절 단백질을 사용한다. 조절 프로모터가 본원에서 사용되는 경우, 상응하는 프로모터 조절 단백질도 본 발명에 따른 발현 시스템의 일부일 것이다. 프로모터 조절 단백질의 예는 활성화제 단백질, 예를 들어, 이. 콜라이 이화물질 활성화제 단백질, MalT 단백질; AraC 계열 전사 활성화제; 억제제 단백질, 예를 들어, 이. 콜라이 Lad 단백질; 및 이중 기능 조절 단백질, 예를 들어, 이. 콜라이 NagC 단백질을 포함한다. 많은 조절 프로모터/프로모터 조절 단백질 쌍이 당분야에 알려져 있다. 일부 실시양태에서, 본 조성물 및 방법을 이용함으로써 생성된 관심 있는 재조합 단백질을 코딩하는 유전자를 전사하는 데 사용되는 프로모터는 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터, Trp 프로모터 및 아라비노스 프로모터로부터 선택된다. 관심 있는 재조합 단백질을 생성하기 위해 하나 초과의 발현 구축물이 사용되는 경우, 하나 초과의 상이한 프로모터가 사용될 수 있다.
프로모터 조절 단백질은 이펙터 화합물, 즉 조절 단백질과 가역적으로 또는 비가역적으로 결합하여, 상기 단백질이 프로모터의 조절 하에 있는 유전자의 적어도 하나의 DNA 전사 조절 영역으로부터 방출될 수 있게 하거나 이 영역에 결합할 수 있게 함으로써, 유전자의 전사를 시작하는 데 있어서 전사효소의 작용을 허용하거나 차단하는 화합물과 상호작용한다. 이펙터 화합물은 유도제 또는 공-억제제로서 분류되며, 이러한 화합물은 천연 이펙터 화합물 및 무료 유도제 화합물을 포함한다. 많은 조절 프로모터/프로모터 조절 단백질/이펙터 화합물 트리오가 당분야에 알려져 있다. 이펙터 화합물은 세포 배양 또는 발효 전반에 걸쳐 사용될 수 있지만, 조절 프로모터가 사용되는 바람직한 실시양태에서, 원하는 양 또는 밀도의 숙주 세포 바이오매스의 성장 후에, 적절한 이펙터 화합물을 배양물에 첨가하여, 관심 있는 재조합 단백질을 코딩하는 원하는 유전자(들)의 발현을 직접적으로 또는 간접적으로 야기한다.
lac 계열 프로모터가 사용되는 실시양태에서, lacI 유전자도 시스템에 존재할 수 있다. 일반적으로 항시적으로 발현되는 유전자인 lacI 유전자는 lac 계열 프로모터의 lac 오퍼레이터에 결합하는 Lac 억제제 단백질인 LacI 단백질을 코딩한다. 따라서, lac 계열 프로모터가 사용되는 경우, lac 유전자도 발현 시스템에 포함되어 발현될 수 있다.
발현 벡터
관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 적합한 발현 벡터(들)에 도입하여, 본원에 기재된 바와 같이 관심 있는 재조합 단백질, 과발현된 단백질, 예를 들어, 샤페론, 폴딩 조절인자 또는 불활성화된 프로테아제를 생성할 수 있거나, 동일한 발현 벡터를 사용하여 관심 있는 재조합 단백질 및 과발현된 단백질 둘 다를 생성할 수 있다. 발현 벡터는 플라스미드일 수 있다. 요구되고 적절한 경우, 당업자는 본 발명과 관련하여 사용할 발현 벡터를 시판되는 발현 벡터로부터 선택할 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 플라스미드는 선택 마커를 포함할 수 있고, 플라스미드를 유지하는 숙주 세포는 선택 조건 하에서 생장될 수 있다. 일부 실시양태에서, 플라스미드는 선택 마커를 포함하지 않는다. 일부 실시양태에서, 발현 벡터는 숙주 세포 게놈에 통합된다. 일부 실시양태에서, 발현 벡터는 발현된 관심 있는 재조합 단백질을 주변세포질로 유도할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다. 일부 실시양태에서, 발현 벡터는 발현된 관심 있는 재조합 단백질을 세포질로 유도할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다. 일부 실시양태에서, 발현 벡터는 발현된 Fab'를 주변세포질로 유도할 수 있는 주변세포질 분비 신호에 융합된 Fab', 예를 들어, 항-TNF-알파 Fab'를 코딩한다.
본 조성물 및 방법을 이용하여 생성할 수 있는 관심 있는 재조합 단백질은 본원에 기재되어 있다. 당업자는 관심 있는 재조합 단백질의 아미노산 서열 및 잠재적인 코딩 서열을 용이하게 수득할 수 있다. 항-TNF-알파 Fab'의 중쇄 및 경쇄의 아미노산 서열, 및 Fab'를 코딩하는 뉴클레오타이드 서열의 예는 본원의 서열 표인 표 14에 제공되어 있다.
다른 조절 요소
일부 실시양태에서, 다른 조절 요소가 관심 있는 재조합 단백질을 코딩하는 발현 구축물에 존재한다. 실시양태에서, 관심 있는 가용성 재조합 단백질은 생성 동안 세포의 세포질 또는 주변세포질에 존재한다. 관심 있는 재조합 단백질을 어느 한 구획으로 표적화하는 데 유용한 분비 리더는 본원에 기재되어 있다. 실시양태에서, 본 발명의 발현 구축물은 관심 있는 재조합 단백질을 슈도모나드 세포의 세포질로 수송할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다. 실시양태에서, 발현 구축물은 관심 있는 재조합 단백질을 슈도모나드 세포의 주변세포질로 수송할 수 있는 분비 리더에 융합된 관심 있는 재조합 단백질을 코딩한다. 실시양태에서, 분비 리더는 관심 있는 재조합 단백질로부터 절단된다.
다른 요소는 전사 인핸서 서열, 번역 인핸서 서열, 다른 프로모터, 활성화제, 번역 시작 및 정지 신호, 전사 종결요소, 시스트론 조절인자, 폴리시스트론 조절인자, 태그 서열, 예컨대, 전술된 바와 같이 발현된 폴리펩티드의 식별, 분리, 정제 및/또는 단리를 용이하게 하는 뉴클레오타이드 서열 태그 및 태그 폴리펩티드 코딩 서열을 포함하나 이들로 제한되지 않는다. 일부 실시양태에서, 발현 구축물은 단백질 코딩 서열 이외에, 이에 작동 가능하게 연결된 하기 조절 요소들 중 임의의 조절 요소를 포함한다: 프로모터, 리보좀 결합 부위(RBS), 전사 종결요소, 및 번역 시작 및 정지 신호. 유용한 RBS는 예를 들어, 앞서 인용된 미국 특허 제10,118,956호 및 제9,580,719호에 따른 발현 시스템에서 숙주 세포로서 유용한 종들 중 임의의 종으로부터 수득될 수 있다. 많은 RBS가 알려져 있으며, 예를 들어, 본원에 참고로 포함되는 문헌[D. Frishman et al., Gene 234(2):257-65 (8 Jul. 1999)]; 및 문헌[B. E. Suzek et al., Bioinformatics 17(12):1123-30 (December 2001)]에 설명되어 있고 언급되어 있다. 추가로, 천연 또는 합성 RBS, 예를 들어, 유럽 특허 제0207459호(합성 RBS); 및 문헌[O. Ikehata et al., Eur. J. Biochem. 181(3):563-70 (1989)]에 기재된 RBS가 사용될 수 있다. 일부 실시양태에서, "Hi" 리보좀 결합 부위인 aggagg(서열번호 59)가 구축물에 사용된다. RBS와 번역 개시 코돈 사이의 간격의 최적화를 포함하는 리보좀 결합 부위는 문헌, 예를 들어, 본원에 참고로 포함되는 문헌[Chen, et al., 1994, "Determination of the optimal aligned spacing between the Shine-Dalgarno sequence and the translation initiation codon of Escherichia coli mRNAs," Nucleic Acids Research 22(23):4953-4957] 및 문헌[Ma, et al., 2002, "Correlations between Shine-Dalgarno Sequences and Gene Features Such as Predicted Expression Levels and Operon Structures," J. Bact. 184(20): 5733-45]에 기재되어 있다.
본 발명에 유용한 방법, 벡터, 번역과 전사 요소, 및 다른 요소의 추가 예는 당분야에 잘 알려져 있으며, 예를 들어, 본원에 참고로 포함되는 미국 특허 제5,055,294호(Gilroy) 및 미국 특허 제5,128,130호(Gilroy et al.); 미국 특허 제5,281,532호(Rammler et al.); 미국 특허 제4,695,455호 및 미국 특허 제4,861,595호(Barnes et al.); 미국 특허 제4,755,465호(Gray et al.); 및 미국 특허 제5,169,760호(Wilcox)뿐만 아니라, 본원에 참고로 포함되는 다른 문헌에도 기재되어 있다.
분비 리더 서열
실시양태에서, 분비 신호 또는 리더 코딩 서열은 관심 있는 재조합 단백질을 코딩하는 서열의 N-말단에 융합된다. 분비 신호 서열의 사용은 박테리아에서 재조합 단백질의 생성을 증가시킬 수 있다. 추가로, 많은 유형의 단백질은 알려진 방법을 이용함으로써 비효율적으로 달성되는 2차 변형을 요구한다. 분비 리더 사용은 세포내 환경으로부터 단백질을 분비함으로써 적절하게 폴딩된 단백질의 수거를 증가시킬 수 있다. 그람 음성 박테리아에서, 세포질로부터 분비된 단백질은 외막에 부착된 주변세포질 공간 또는 세포외 브로쓰로 들어갈 수 있다. 이 방법은 봉입체의 형성을 피할 수 있다. 주변세포질 공간 내로의 단백질의 분비는 적절한 디설파이드 결합 형성을 용이하게 하는 효과도 가진다(Bardwell et al., 1994, Phosphate Microorg, Chapter 45, 270-5, and Manoil, 2000, Methods in Enzymol. 326:35-47). 재조합 단백질 분비의 다른 이점은 단백질의 보다 효율적인 단리; 예를 들어, 활성 형태의 단백질의 퍼센트로 표시되는 수율의 증가로 이어지는 단백질의 적절한 폴딩과 디설파이드 결합 형성; 봉입체 형성의 감소와 숙주 세포에 대한 독성의 감소; 및 가용성 형태의 재조합 단백질의 퍼센트 증가를 포함한다. 관심 있는 단백질이 배양 배지 내로 배출될 가능성은 또한 잠재적으로 단백질 생성을 위해 회분식 배양보다는 연속식 배양을 촉진할 수 있다. 분비 신호는 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제7,618,799호, 미국 특허 제7,985,564호 및 미국 특허 출원 공개 제2019/0127744호("Bacterial leader sequences for periplasmic protein expression")뿐만 아니라 미국 특허 제10,118,956호에도 기재되어 있다.
일부 실시양태에서, 관심 있는 재조합 단백질은 숙주 세포의 주변세포질 또는 세포외 공간으로 표적화된다. 일부 실시양태에서, 발현 벡터는 관심 있는 재조합 단백질을 코딩하는 뉴클레오타이드 서열에 작동 가능하게 연결된 분비 신호 폴리펩티드를 코딩하는 뉴클레오타이드 서열을 추가로 포함한다.
코돈 최적화
본 발명은 사용되는 숙주 세포에서 발현되도록 최적화된 임의의 서열을 포함하는, 관심 있는 재조합 단백질에 대한 임의의 적절한 코딩 서열의 사용을 예상한다. 당업자가 이해하는 바와 같이, 관심 있는 재조합 단백질을 코딩하는 핵산 서열은 재조합 그람 음성 박테리아 숙주 세포에서의 발현을 개선하도록 코돈 최적화될 수 있다. 예를 들어, 슈도모나스 숙주 균주에서의 발현을 위한 코돈의 최적화는 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 출원 공개 제2007/0292918호("Codon Optimization Method")에 기재되어 있다. 이. 콜라이에서의 발현을 위한 코돈 최적화는 예를 들어, 본원에 참고로 포함되는 문헌[Welch, et al., 2009, PLoS One, "Design Parameters to Control Synthetic Gene Expression in Escherichia coli, 4(9): e7002]에 기재되어 있다. 관심 있는 재조합 단백질을 코딩하는 임의의 적합한 서열은 당업자에 의해 널리 알려진 방법에 따라 요구된 바와 같이 생성될 수 있는 것으로 이해된다.
발현 구축물
당업자는 본 개시내용을 고려하여 본 발명의 방법에 따라 관심 있는 재조합 단백질을 생성하는 데 적절한 발현 구축물을 선택할 수 있다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에서 생성되는 관심 있는 재조합 단백질은 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터에 의해 코딩되고, 이때 상기 발현 구축물은 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열은 동일한 프로모터로부터 전사된다(공-전사된다). 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열은 상이한 프로모터로부터 전사된다(공-전사되지 않는다). 공-전사되지 않는 경우, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열을 코딩하는 적어도 2개의 핵산 서열 각각은 동일한 발현 벡터 또는 별도의 발현 벡터로부터 생성될 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열은 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열 각각은 동일하거나 상이한 분비 신호를 코딩하는 핵산 서열에 개별적으로 작동 가능하게 연결된다. 일부 실시양태에서, 숙주 세포에서 관심 있는 재조합 단백질을 코딩하는 핵산 서열 각각은 서열번호 11, 13, 25, 또는 26으로 제시된 아미노산 서열을 가진 주변세포질 분비 신호로부터 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 꼬리 특이적 프로테아제 활성 및 Mep1 엔도펩티다제 활성이 결핍되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 추가로, 임의로 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 임의로 적어도 하나의 자가용해 인자 활성이 결핍되어 있고, 임의로 하나 이상의 불활성화된 프로테아제를 과발현하고, 임의로 하나 이상의 샤페론 또는 폴딩 조절인자를 과발현하고, 임의로 기능성 MepS1 프로테아제를 갖고, 임의로 기능성 MepS2 프로테아제를 갖고, 이들 각각은 본원의 다른 곳에 상세하게 기재되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포, 이. 콜라이 숙주 세포, 에르위니아 숙주 세포, 살모넬라 숙주 세포, 시겔라 숙주 세포, 모락셀라 숙주 세포, 헬리코박터 숙주 세포, 레지오넬라 숙주 세포, 네이세리아 숙주 세포, 헤모필루스 숙주 세포, 아시네토박터 숙주 세포, 박테로이데스 숙주 세포, 자일렐라 숙주 세포, 시트로박터 숙주 세포, 엔테로박터 숙주 세포, 클렙시엘라 숙주 세포, 예르시니아 숙주 세포, 세라티아 숙주 세포, 프로테우스 숙주 세포 및 비브리오 숙주 세포로부터 선택된다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사이다.
일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1 결핍; (ii) Prc2 결핍; (iii) HslU 결핍; (iv) HslV 결핍; (v) MepM1 결핍; 및 (vi) PyrF 결핍이고; 이때 숙주 세포는 임의로 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체가 결핍되어 있고; 임의로 DsbC를 과발현하고; 임의로 불활성화된 DegP2를 과발현하고; 임의로 PDIA6을 과발현한다.
일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주인 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주의 유전형(게놈 변형)을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 STR94975, STR94976 또는 STR94977의 유전형을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에서 생성될 항체는 이 항체를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터에 의해 코딩되며, 이때 상기 발현 구축물은 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 경쇄를 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 실시양태에서, 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 경쇄를 코딩하는 적어도 2개의 핵산 서열 중 2개 이상은 동일한 프로모터로부터 전사된다(공-전사된다). 일부 실시양태에서, 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 경쇄를 코딩하는 적어도 2개의 핵산 서열은 상이한 프로모터로부터 전사된다(공-전사되지 않는다). 공-전사되지 않는 경우, 항체 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 항체 경쇄를 코딩하는 적어도 2개의 핵산 서열 각각은 동일한 발현 벡터 또는 다수의 발현 벡터로부터 생성될 수 있다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 핵산 서열에 개별적으로 작동 가능하게 연결되어, 분비 신호-중쇄 융합체 및 분비 신호-경쇄 융합체를 생성한다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각은 서열번호 11로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, 경쇄 코딩 핵산 서열 각각은 서열번호 13으로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 항체를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 꼬리 특이적 프로테아제 활성 및 Mep1 엔도펩티다제 활성이 결핍되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 추가로, 임의로 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 임의로 적어도 하나의 자가용해 인자 활성이 결핍되어 있고, 임의로 하나 이상의 불활성화된 프로테아제를 과발현하고, 임의로 하나 이상의 샤페론 또는 폴딩 조절인자를 과발현하고, 임의로 기능성 MepS1 프로테아제를 갖고, 임의로 기능성 MepS2 프로테아제를 갖고, 이들 각각은 본원의 다른 곳에 상세하게 기재되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포, 이. 콜라이 숙주 세포, 에르위니아 숙주 세포, 살모넬라 숙주 세포, 시겔라 숙주 세포, 모락셀라 숙주 세포, 헬리코박터 숙주 세포, 레지오넬라 숙주 세포, 네이세리아 숙주 세포, 헤모필루스 숙주 세포, 아시네토박터 숙주 세포, 박테로이데스 숙주 세포, 자일렐라 숙주 세포, 시트로박터 숙주 세포, 엔테로박터 숙주 세포, 클렙시엘라 숙주 세포, 예르시니아 숙주 세포, 세라티아 숙주 세포, 프로테우스 숙주 세포 및 비브리오 숙주 세포로부터 선택된다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사이다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 이. 콜라이 숙주 세포가 아니다.
일부 실시양태에서, 항체를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1 결핍; (ii) Prc2 결핍; (iii) HslU 결핍; (iv) HslV 결핍; (v) MepM1 결핍; (vi) PyrF 결핍이고; 이때 상기 숙주 세포는 임의로 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체가 결핍되어 있고; 임의로 DsbC를 과발현하고; 임의로 불활성화된 DegP2를 과발현하고; 임의로 PDIA6을 과발현한다.
일부 실시양태에서, 항체는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주인 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 항체는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주의 유전형을 갖고/갖거나, 이 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 항체는 STR94975, STR94976 및 STR94977의 유전형을 갖고/갖거나, 이 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에서 생성될 Fab 또는 Fab', 예를 들어, 인간 TNF-알파 Fab'는 Fab 또는 Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터에 의해 코딩되고, 이때 상기 발현 구축물은 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 경쇄를 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 중쇄는 서열번호 21로 제시된 아미노산 서열을 갖고, 경쇄는 서열번호 23으로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 경쇄를 코딩하는 적어도 하나의 핵산 서열은 동일한 프로모터로부터 전사된다(공-전사된다). 일부 실시양태에서, 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 경쇄를 코딩하는 적어도 하나의 핵산 서열은 상이한 프로모터로부터 전사된다(공-전사되지 않는다). 공-전사되지 않는 경우, Fab 또는 Fab' 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 Fab 또는 Fab' 경쇄를 코딩하는 적어도 하나의 핵산 서열은 동일한 발현 벡터 또는 별도의 발현 벡터로부터 생성될 수 있다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 핵산 서열에 개별적으로 작동 가능하게 연결되어, 분비 신호-중쇄 융합체 및 분비 신호-경쇄 융합체를 생성한다. 일부 실시양태에서, Fab 또는 Fab' 중쇄 코딩 핵산 서열 각각은 서열번호 11로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, Fab 또는 Fb' 경쇄 코딩 핵산 서열 각각은 서열번호 13으로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, 인간 TNF-알파 Fab' 분비 신호-중쇄 융합체는 서열번호 25로 제시된 아미노산 서열을 갖고, 인간 TNF-알파 Fab' 분비 신호-경쇄 융합체는 서열번호 26으로 제시된 아미노산 서열을 가진다.
일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 하기 유전형을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다: Δprc1, Δprc2, ΔhslU, ΔhslV, ΔmepM1, ΔRXF04495.2, ΔpyrF, 및 lsc::lacIQ1 . 일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 항-TNF-알파 Fab'이고, 숙주 세포는 하기 a) 내지 d)로부터 선택된 발현 구축물을 포함하는 플라스미드를 추가로 포함한다:
a) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' 중쇄(HC)를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' 경쇄(LC)를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC와 항-TNF-알파 Fab' LC는 공-전사됨;
b) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' HC를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' LC를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC와 항-TNF-알파 Fab' LC는 공-전사됨;
c) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' HC를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' LC를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC, 항-TNF-알파 Fab' LC 및 DegP2 S219A는 공-전사됨; 및
d) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' HC를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' LC를 코딩하는 핵산 서열, 서열번호 27로 제시된 아미노산 서열을 가진 PDIA6을 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC, 항-TNF-알파 Fab' LC 및 PDIA6은 공-전사됨.
일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 항-TNF-알파 Fab'이고, 숙주 세포는 하기 a) 내지 d)로부터 선택된 발현 구축물을 포함하는 플라스미드를 추가로 포함한다:
a) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' 중쇄(HC) 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' 경쇄(LC) 융합체를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체와 분비 리더-항-TNF-알파 Fab' LC 융합체는 공-전사됨;
b) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' HC 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' LC 융합체를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체와 분비 리더-항-TNF-알파 Fab' LC 융합체는 공-전사됨;
c) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' HC 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' LC 융합체를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체, 분비 리더-항-TNF-알파 Fab' LC 융합체 및 DegP2 S219A는 공-전사됨; 및
d) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' HC 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' LC 융합체를 코딩하는 핵산 서열, 서열번호 27로 제시된 아미노산 서열을 가진 PDIA6을 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체, 분비 리더-항-TNF-알파 Fab' LC 융합체 및 PDIA6은 공-전사됨.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 Fab 또는 Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 꼬리 특이적 프로테아제 활성 및 Mep1 엔도펩티다제 활성이 결핍되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 추가로, 임의로 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 임의로 적어도 하나의 자가용해 인자 활성이 결핍되어 있고, 임의로 하나 이상의 불활성화된 프로테아제를 과발현하고, 임의로 하나 이상의 샤페론 또는 폴딩 조절인자를 과발현하고, 임의로 기능성 MepS1 프로테아제를 갖고, 임의로 기능성 MepS2 프로테아제를 갖고, 이들 각각은 본원의 다른 곳에 상세하게 기재되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포, 이. 콜라이 숙주 세포, 에르위니아 숙주 세포, 살모넬라 숙주 세포, 시겔라 숙주 세포, 모락셀라 숙주 세포, 헬리코박터 숙주 세포, 레지오넬라 숙주 세포, 네이세리아 숙주 세포, 헤모필루스 숙주 세포, 아시네토박터 숙주 세포, 박테로이데스 숙주 세포, 자일렐라 숙주 세포, 시트로박터 숙주 세포, 엔테로박터 숙주 세포, 클렙시엘라 숙주 세포, 예르시니아 숙주 세포, 세라티아 숙주 세포, 프로테우스 숙주 세포 및 비브리오 숙주 세포로부터 선택된다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사이다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 이. 콜라이 숙주 세포가 아니다.
일부 실시양태에서, Fab 또는 Fab', 예를 들어, 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1 결핍; (ii) Prc2 결핍; (iii) HslU 결핍; (iv) HslV 결핍; (v) MepM1 결핍; (vi) PyrF 결핍이고; 이때 상기 숙주 세포는 임의로 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체가 결핍되어 있고; 임의로 DsbC를 과발현하고; 임의로 불활성화된 DegP2를 과발현하고; 임의로 PDIA6을 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주이다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주의 유전형을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 STR94975, STR94976 또는 STR94977의 유전형을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 발현 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 또는 STR94977의 유전형을 갖고, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 갖고, 이러한 균주의 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 발현 균주 STR94975, STR94976 또는 STR94977의 유전형을 갖고, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 갖고, 이러한 균주의 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함한다.
일부 실시양태에서, 관심 있는 재조합 단백질, 항체, Fab 또는 Fab', 또는 항-TNF Fab'는 발현 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 또는 STR94977의 유전형을 갖고/갖거나 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 본원에 기재된 방법에 따라 생성된다. 일부 실시양태에서, 항-TNF Fab'는 발현 균주 STR94975, STR94976 또는 STR94977의 유전형을 갖고 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 갖고 항-TNF Fab', 예를 들어, 서열번호 25로 제시된 중쇄 서열 및 서열번호 26으로 제시된 경쇄 서열을 가진 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 재조합 그람 음성 박테리아 숙주 세포에서 본원에 기재된 방법에 따라 생성된다. 일부 실시양태에서, Fab' 발현 구축물은 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977로부터 선택된 발현 균주의 발현 구축물이다. 일부 실시양태에서, 본 발명의 숙주 균주로부터 생성된 항-TNF Fab'는 약 0.2 내지 약 5 g/ℓ의 역가로 가용성, 활성 및/또는 온전한 형태로 생성된다.
발효 형식
적합한 발효 조건 하에서 관심 있는 재조합 단백질을 코딩하는 플라스미드에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포(발현 균주)를 배양함으로써 본원에 기재된 방법을 이용하여 관심 있는 재조합 단백질을 생성할 수 있다. 임의의 발효 형식, 예를 들어, 회분식, 유가식, 반연속식 또는 연속식 발효 방식이 이용될 수 있다.
발효 배지는 풍부 배지, 최소 배지 및 무기염 배지로부터 선택될 수 있다. 일부 실시양태에서, 최소 배지 또는 무기염 배지가 선택된다. 일부 실시양태에서, 무기염 배지가 선택된다.
무기염 배지는 무기염 및 탄소원, 예를 들어, 글루코스, 수크로스 또는 글리세롤로 구성된다. 무기염 배지의 예는 예를 들어, M9 배지, 슈도모나스 배지(ATCC 179), 및 (Davis)와 밍기올리(Mingioli) 배지를 포함한다(문헌[Davis, B.D., and Mingioli, E.S., 1950, J. Bact. 60:17-28] 참조). 무기염 배지를 제조하는 데 사용되는 무기염은 예를 들어, 인산칼륨, 황산암모늄 또는 염화암모늄, 황산마그네슘 또는 염화마그네슘, 및 미량 무기물, 예컨대, 염화칼슘, 붕산염, 및 철, 구리, 망간 및 아연의 황산염으로부터 선택된 무기염을 포함한다. 전형적으로, 무기염 배지에는 유기 질소원, 예컨대, 펩톤, 트립톤, 아미노산 또는 효모 추출물이 포함되지 않는다. 그 대신, 무기 질소원이 사용되며, 이것은 예를 들어, 암모늄염, 수성 암모니아 및 기체 암모니아로부터 선택될 수 있다. 무기염 배지는 전형적으로 탄소원으로서 글루코스 또는 글리세롤을 함유할 것이다. 무기염 배지에 비해, 최소 배지는 무기염 및 탄소원을 함유할 수도 있으나, 예를 들어, 낮은 수준의 아미노산, 비타민, 펩톤 또는 다른 성분으로 보충될 수 있지만, 이들은 매우 최소한의 수준으로 첨가된다. 본 발명의 방법에 사용하기에 적합한 배지는 문헌, 예를 들어, 미국 특허 제9,458,487호 및 미국 특허 제9,453,251호에 기재된 방법을 이용함으로써 제조될 수 있다. 본 발명의 방법에 유용한 배양 절차 및 무기염 배지의 세부사항은 본원에 참고로 포함되는 문헌[Riesenberg, D et al., 1991, "High cell density cultivation of Escherichia coli at controlled specific growth rate," J. Biotechnol. 20 (1):17-27]에 기재되어 있다.
실시양태에서, 제조는 생물반응기 배양물에서 달성될 수 있다. 배양물은 예를 들어, 무기염 배지를 함유하는 최대 2 ℓ 생물반응기에서 생장될 수 있으며, 암모니아의 첨가를 통해 32℃ 및 pH 6.5에서 유지될 수 있다. 용존 산소는 교반의 증가 및 발효기 내로의 분사된 공기와 산소의 유동을 통해 과량으로 유지될 수 있다. 글리세롤은 과량의 수준을 유지하기 위해 발효 전반에 걸쳐 배양물에 전달될 수 있다. 실시양태에서, 이러한 조건은 유도를 위한 목표 배양 세포 밀도, 예를 들어, 575 nm의 광학 밀도(A575)에 도달될 때까지 유지되고, IPTG는 표적 단백질 생성을 시작하기 위해 첨가된다. 유도 시 세포 밀도, IPTG의 농도, pH, 온도, CaCl2 농도, 용존 산소 유속 각각을 변경시켜 발현을 위한 최적 조건을 확인할 수 있음이 이해된다. 실시양태에서, 유도 시 세포 밀도는 40 내지 200 흡광도 단위(AU)의 A575 범위 내에서 변경될 수 있다. IPTG 농도는 0.02 내지 1.0 mM의 범위 내에서 변경될 수 있고, pH는 5 내지 7.5의 범위 내에서 변경될 수 있고, 온도는 20℃ 내지 35℃의 범위 내에서 변경될 수 있고, CaCl2 농도는 0 내지 0.5 g/ℓ의 범위 내에서 변경될 수 있고, 용존 산소 유속은 1 LPM(분당 리터) 내지 10 LPM의 범위 내에서 변경될 수 있다. 6시간 내지 96시간 후, 각각의 생물반응기로부터의 배양물은 원심분리에 의해 수거될 수 있고, 세포 펠릿은 -80℃에서 냉동될 수 있다. 그 다음, 샘플은 예를 들어, SDS-CGE에 의해 생성물 형성에 대해 분석될 수 있다.
발효는 임의의 규모로 수행될 수 있다. 본 발명에 따른 발현 시스템은 임의의 규모로 재조합 단백질을 발현시키는 데 유용하다. 따라서, 예를 들어, 마이크로리터 규모, 밀리리터 규모, 센티리터 규모 및 데시리터 규모 발효 부피가 사용될 수 있으며, 1 리터 규모 및 더 큰 발효 부피도 사용될 수 있다.
실시양태에서, 발효 부피는 약 1 리터 이상이다. 실시양태에서, 발효 부피는 약 1 리터 내지 약 100 리터이다. 실시양태에서, 발효 부피는 약 1 리터, 약 2 리터, 약 3 리터, 약 4 리터, 약 5 리터, 약 6 리터, 약 7 리터, 약 8 리터, 약 9 리터 또는 약 10 리터이다. 실시양태에서, 발효 부피는 약 1 리터 내지 약 5 리터, 약 1 리터 내지 약 10 리터, 약 1 리터 내지 약 25 리터, 약 1 리터 내지 약 50 리터, 약 1 리터 내지 약 75 리터, 약 10 리터 내지 약 25 리터, 약 25 리터 내지 약 50 리터, 또는 약 50 리터 내지 약 100 리터이다. 다른 실시양태에서, 발효 부피는 5 리터, 10 리터, 15 리터, 20 리터, 25 리터, 50 리터, 75 리터, 100 리터, 200 리터, 250 리터, 300 리터, 500 리터, 1,000 리터, 2,000 리터, 5,000 리터, 10,000 리터 또는 50,000 리터 이상이다.
일반적으로, 더 큰 배양 부피, 예를 들어, 50 ㎖ 진탕 플라스크 배양, 1 리터 배양 또는 더 큰 부피의 배양에 의해 생성된 재조합 단백질의 양은 더 작은 배양 부피, 예를 들어, 0.5 ㎖ 고처리량 스크리닝 배양에서 관찰된 양에 비해 증가된다. 이것은 배양 크기의 증가에 기인할 수 있을뿐만 아니라, 예를 들어, 대규모 발효에서 세포를 더 높은 밀도까지 생장시키는 능력(예를 들어, 배양 흡광도에 의해 반영됨)에도 기인할 수 있다. 예를 들어, 동일한 균주로부터의 부피 수율은 HTP 규모부터 대규모 발효까지 최대 10배 증가할 수 있다. 실시양태에서, 동일한 발현 균주에 대해 관찰된 부피 수율은 HTP 규모 생장보다 대규모 발효 후 2배 내지 10배 더 크다. 실시양태에서, 동일한 발현 균주에 대해 관찰된 수율은 HTP 규모 생장 후보다 대규모 발효 후에 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 2배 내지 10배, 2배 내지 9배, 2배 내지 8배, 2배 내지 7배, 2배 내지 6배, 2배 내지 5배, 2배 내지 4배, 2배 내지 3배, 3배 내지 10배, 3배 내지 9배, 3배 내지 8배, 3배 내지 7배, 3배 내지 6배, 3배 내지 5배, 3배 내지 4배, 4배 내지 10배, 4배 내지 9배, 4배 내지 8배, 4배 내지 7배, 4배 내지 6배, 4배 내지 5배, 5배 내지 10배, 5배 내지 9배, 5배 내지 8배, 5배 내지 7배, 5배 내지 6배, 6배 내지 10배, 6배 내지 9배, 6배 내지 8배, 6배 내지 7배, 7배 내지 10배, 7배 내지 9배, 7배 내지 8배, 8배 내지 10배, 8배 내지 9배, 9배 내지 10배 더 크다. 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Retallack, et al., 2012, "Reliable protein production in a Pseudomonas fluorescens expression system," Prot. Exp. and Purif. 81:157-165]을 참조한다.
박테리아 생장 조건
제공된 발명의 방법에 유용한 적합한 발효 조건은 약 4℃ 내지 약 42℃의 온도 및 약 5.7 내지 약 8.8의 pH에서의 생장을 포함할 수 있다. lacZ 프로모터를 가진 발현 구축물이 사용될 때, 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 IPTG를 배양물에 첨가함으로써 발현을 유도할 수 있다. 일부 실시양태에서, 발효 조건은 약 40 내지 약 200의 OD575, 약 5.5 내지 약 7.2의 배양 pH, 및 약 20℃ 내지 약 34℃의 온도에서 유가식으로 유도성 프로모터를 유도하는 것을 포함한다. 일부 실시양태에서, 발효 조건은 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 약 33℃의 온도에서 유가식으로 유도성 프로모터를 유도하는 것을 포함한다. 일부 실시양태에서, 생성된 재조합 단백질 역가는 세포 배양액의 약 0.2 내지 약 5 g/ℓ이다.
배양물의 pH는 당업자에게 알려진 pH 완충제 및 방법을 이용함으로써 유지될 수 있다. 배양 동안 pH의 조절은 수성 암모니아를 사용함으로써 달성될 수도 있다. 실시양태에서, 생장기, 유도기 및/또는 생성기 동안 배양물의 pH는 약 5 내지 약 8.8이다. 실시양태에서, 배양물 pH는 약 5.0, 5.1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7, 5.8, 5.9, 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.0, 8.1, 8.2, 8.3, 8.4, 8.5, 8.6, 8.7, 8.8, 또는 이들 사이의 임의의 범위이다. 실시양태에서, 배양물 pH는 약 5 내지 약 8.8이다. 실시양태에서, 배양물 pH는 약 5 내지 약 5.5, 약 5 내지 약 6, 약 5 내지 약 6.5, 약 5 내지 약 7, 약 5 내지 약 7.5, 약 5 내지 약 8, 약 5 내지 약 8.5, 약 5 내지 약 8.8, 약 5.5 내지 약 6, 약 5.5 내지 약 6.5, 약 5.5 내지 약 7, 약 5.5 내지 약 7.5, 약 5.5 내지 약 8, 약 5.5 내지 약 8.5, 약 5.5 내지 약 8.8, 약 6 내지 약 6.5, 약 6 내지 약 7, 약 6 내지 약 7.5, 약 6 내지 약 8, 약 6 내지 약 8.5, 약 6 내지 약 8.8, 약 6.5 내지 약 7, 약 6.5 내지 약 7.5, 약 6.5 내지 약 8, 약 6.5 내지 약 8.5, 약 6.5 내지 약 8.8, 약 7 내지 약 7.5, 약 7 내지 약 8, 약 7 내지 약 8.5, 약 7 내지 약 8.8, 약 7.5 내지 약 8, 약 7.5 내지 약 8.5, 약 7.5 내지 약 8.8, 약 8 내지 약 8.5, 약 8 내지 약 8.8, 또는 약 8.5 내지 약 8.8이다. 실시양태에서, 배양물 pH는 약 5, 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8, 약 8.5 또는 약 8.8이다. 실시양태에서, 배양물 pH는 적어도 약 5, 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8 또는 약 8.5이다. 실시양태에서, 배양물 pH는 최대 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8, 약 8.5 또는 약 8.8이다. 실시양태에서, 배양물 pH는 약 5.8 내지 약 7이다. 실시양태에서, 배양물 pH는 약 5.8 내지 약 5.9, 약 5.8 내지 약 6, 약 5.8 내지 약 6.1, 약 5.8 내지 약 6.2, 약 5.8 내지 약 6.2, 약 5.8 내지 약 6.4, 약 5.8 내지 약 6.5, 약 5.8 내지 약 6.6, 약 5.8 내지 약 6.7, 약 5.8 내지 약 6.8, 약 5.8 내지 약 7, 약 5.9 내지 약 6, 약 5.9 내지 약 6.1, 약 5.9 내지 약 6.2, 약 5.9 내지 약 6.2, 약 5.9 내지 약 6.4, 약 5.9 내지 약 6.5, 약 5.9 내지 약 6.6, 약 5.9 내지 약 6.7, 약 5.9 내지 약 6.8, 약 5.9 내지 약 7, 약 6 내지 약 6.1, 약 6 내지 약 6.2, 약 6 내지 약 6.2, 약 6 내지 약 6.4, 약 6 내지 약 6.5, 약 6 내지 약 6.6, 약 6 내지 약 6.7, 약 6 내지 약 6.8, 약 6 내지 약 7, 약 6.1 내지 약 6.2, 약 6.1 내지 약 6.2, 약 6.1 내지 약 6.4, 약 6.1 내지 약 6.5, 약 6.1 내지 약 6.6, 약 6.1 내지 약 6.7, 약 6.1 내지 약 6.8, 약 6.1 내지 약 7, 약 6.2 약 6.2, 약 6.2 내지 약 6.4, 약 6.2 내지 약 6.5, 약 6.2 내지 약 6.6, 약 6.2 내지 약 6.7, 약 6.2 내지 약 6.8, 약 6.2 내지 약 7, 약 6.2 내지 약 6.4, 약 6.2 내지 약 6.5, 약 6.2 내지 약 6.6, 약 6.2 내지 약 6.7, 약 6.2 내지 약 6.8, 약 6.2 내지 약 7, 약 6.4 내지 약 6.5, 약 6.4 내지 약 6.6, 약 6.4 내지 약 6.7, 약 6.4 내지 약 6.8, 약 6.4 내지 약 7, 약 6.5 내지 약 6.6, 약 6.5 내지 약 6.7, 약 6.5 내지 약 6.8, 약 6.5 내지 약 7, 약 6.6 내지 약 6.7, 약 6.6 내지 약 6.8, 약 6.6 내지 약 7, 약 6.7 내지 약 6.8, 약 6.7 내지 약 7, 또는 약 6.8 내지 약 7이다. 실시양태에서, 배양물 pH는 약 5.8, 약 5.9, 약 6, 약 6.1, 약 6.2, 약 6.2, 약 6.4, 약 6.5, 약 6.6, 약 6.7, 약 6.8 또는 약 7이다. 실시양태에서, 배양물 pH는 적어도 약 5.8, 약 5.9, 약 6, 약 6.1, 약 6.2, 약 6.2, 약 6.4, 약 6.5, 약 6.6, 약 6.7 또는 약 6.8이다. 실시양태에서, 배양물 pH는 최대 약 5.9, 약 6, 약 6.1, 약 6.2, 약 6.2, 약 6.4, 약 6.5, 약 6.6, 약 6.7, 약 6.8 또는 약 7이다. 일부 실시양태에서, pH는 약 6 내지 6.5이다. 일부 실시양태에서, 배양물 pH는 약 6 내지 약 6.1, 약 6 내지 약 6.2, 약 6 내지 약 6.3, 약 6 내지 약 6.4, 약 6 내지 약 6.5, 약 6.1 내지 약 6.2, 약 6.1 내지 약 6.3, 약 6.1 내지 약 6.4, 약 6.1 내지 약 6.5, 약 6.2 내지 약 6.3, 약 6.2 내지 약 6.4, 약 6.2 내지 약 6.5, 약 6.3 내지 약 6.4, 약 6.3 내지 약 6.5, 또는 약 6.4 내지 약 6.5이다. 일부 실시양태에서, 배양물 pH는 약 6, 약 6.1, 약 6.2, 약 6.3, 약 6.4 또는 약 6.5이다. 일부 실시양태에서, 배양물 pH는 적어도 약 6, 약 6.1, 약 6.2, 약 6.3 또는 약 6.4이다. 일부 실시양태에서, 배양물 pH는 최대 약 6.1, 약 6.2, 약 6.3, 약 6.4 또는 약 6.5이다.
실시양태에서, 생장기, 유도기 및/또는 생성기 동안 배양물의 생장 온도는 약 4℃ 내지 약 42℃로 유지된다. 실시양태에서, 생장 온도는 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 약 42℃, 또는 이들 사이의 임의의 범위이다. 실시양태에서, 생장 온도는 약 25℃ 내지 약 35℃이다. 실시양태에서, 생장 온도는 약 25℃ 내지 약 35℃이다. 실시양태에서, 생장 온도는 약 25℃ 내지 약 26℃, 약 25℃ 내지 약 27℃, 약 25℃ 내지 약 28℃, 약 25℃ 내지 약 29℃, 약 25℃ 내지 약 30℃, 약 25℃ 내지 약 31℃, 약 25℃ 내지 약 32℃, 약 25℃ 내지 약 33℃, 약 25℃ 내지 약 34℃, 약 25℃ 내지 약 35℃, 약 26℃ 내지 약 27℃, 약 26℃ 내지 약 28℃, 약 26℃ 내지 약 29℃, 약 26℃ 내지 약 30℃, 약 26℃ 내지 약 31℃, 약 26℃ 내지 약 32℃, 약 26℃ 내지 약 33℃, 약 26℃ 내지 약 34℃, 약 26℃ 내지 약 35℃, 약 27℃ 내지 약 28℃, 약 27℃ 내지 약 29℃, 약 27℃ 내지 약 30℃, 약 27℃ 내지 약 31℃, 약 27℃ 내지 약 32℃, 약 27℃ 내지 약 33℃, 약 27℃ 내지 약 34℃, 약 27℃ 내지 약 35℃, 약 28℃ 내지 약 29℃, 약 28℃ 내지 약 30℃, 약 28℃ 내지 약 31℃, 약 28℃ 내지 약 32℃, 약 28℃ 내지 약 33℃, 약 28℃ 내지 약 34℃, 약 28℃ 내지 약 35℃, 약 29℃ 내지 약 30℃, 약 29℃ 내지 약 31℃, 약 29℃ 내지 약 32℃, 약 29℃ 내지 약 33℃, 약 29℃ 내지 약 34℃, 약 29℃ 내지 약 35℃, 약 30℃ 내지 약 31℃, 약 30℃ 내지 약 32℃, 약 30℃ 내지 약 33℃, 약 30℃ 내지 약 34℃, 약 30℃ 내지 약 35℃, 약 31℃ 내지 약 32℃, 약 31℃ 내지 약 33℃, 약 31℃ 내지 약 34℃, 약 31℃ 내지 약 35℃, 약 32℃ 내지 약 33℃, 약 32℃ 내지 약 34℃, 약 32℃ 내지 약 35℃, 약 33℃ 내지 약 34℃, 약 33℃ 내지 약 35℃, 또는 약 34℃ 내지 약 35℃이다. 실시양태에서, 생장 온도는 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃ 또는 약 35℃이다. 실시양태에서, 생장 온도는 적어도 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃ 또는 약 34℃이다. 실시양태에서, 생장 온도는 최대 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃ 또는 약 35℃이다.
실시양태에서, 온도는 배양 동안 변경된다. 실시양태에서, 작용제, 예를 들어, IPTG를 배양물에 첨가하여 구축물로부터 발현을 유도하기 전에는 온도를 약 30℃ 내지 약 32℃로 유지하고, 유도제를 첨가한 후에는 온도를 약 25℃ 내지 약 28℃로 감소시킨다. 실시양태에서, 작용제, 예를 들어, IPTG를 배양물에 첨가하여 구축물로부터 발현을 유도하기 전에는 온도를 약 30℃로 유지하고, 유도제를 첨가한 후에는 온도를 약 25℃로 감소시킨다.
본원의 다른 곳에 기재된 바와 같이, 유도성 프로모터, 예를 들어, lac 프로모터는 관심 있는 재조합 단백질의 발현을 조절하기 위해 발현 구축물에 사용될 수 있다. lac 프로모터 유도체 또는 계열 구성원, 예를 들어, tac 프로모터의 경우, 이펙터 화합물은 유도제, 예컨대, IPTG와 같은 무상 유도제이다. 실시양태에서, lac 프로모터 유도체가 사용되고, 세포 밀도가 약 80 내지 약 300의 OD575에 의해 확인된 수준에 도달하였을 때, IPTG를 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 첨가하여 재조합 단백질 발현을 유도한다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 300이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 100, 약 80 내지 약 120, 약 80 내지 약 140, 약 80 내지 약 160, 약 80 내지 약 180, 약 80 내지 약 200, 약 80 내지 약 220, 약 80 내지 약 240, 약 80 내지 약 260, 약 80 내지 약 280, 약 80 내지 약 300, 약 100 내지 약 120, 약 100 내지 약 140, 약 100 내지 약 160, 약 100 내지 약 180, 약 100 내지 약 200, 약 100 내지 약 220, 약 100 내지 약 240, 약 100 내지 약 260, 약 100 내지 약 280, 약 100 내지 약 300, 약 120 내지 약 140, 약 120 내지 약 160, 약 120 내지 약 180, 약 120 내지 약 200, 약 120 내지 약 220, 약 120 내지 약 240, 약 120 내지 약 260, 약 120 내지 약 280, 약 120 내지 약 300, 약 140 내지 약 160, 약 140 내지 약 180, 약 140 내지 약 200, 약 140 내지 약 220, 약 140 내지 약 240, 약 140 내지 약 260, 약 140 내지 약 280, 약 140 내지 약 300, 약 160 내지 약 180, 약 160 내지 약 200, 약 160 내지 약 220, 약 160 내지 약 240, 약 160 내지 약 260, 약 160 내지 약 280, 약 160 내지 약 300, 약 180 내지 약 200, 약 180 내지 약 220, 약 180 내지 약 240, 약 180 내지 약 260, 약 180 내지 약 280, 약 180 내지 약 300, 약 200 내지 약 220, 약 200 내지 약 240, 약 200 내지 약 260, 약 200 내지 약 280, 약 200 내지 약 300, 약 220 내지 약 240, 약 220 내지 약 260, 약 220 내지 약 280, 약 220 내지 약 300, 약 240 내지 약 260, 약 240 내지 약 280, 약 240 내지 약 300, 약 260 내지 약 280, 약 260 내지 약 300, 또는 약 280 내지 약 300이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80, 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 약 240, 약 260, 약 280 또는 약 300이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 적어도 약 80, 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 약 240, 약 260 또는 약 280이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 최대 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 약 240, 약 260, 약 280 또는 약 300이다. 일부 실시양태에서, 유도 OD575는 약 80 내지 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 90, 약 80 내지 약 100, 약 80 내지 약 110, 약 80 내지 약 120, 약 80 내지 약 130, 약 80 내지 약 140, 약 80 내지 약 150, 약 80 내지 약 160, 약 90 내지 약 100, 약 90 내지 약 110, 약 90 내지 약 120, 약 90 내지 약 130, 약 90 내지 약 140, 약 90 내지 약 150, 약 90 내지 약 160, 약 100 내지 약 110, 약 100 내지 약 120, 약 100 내지 약 130, 약 100 약 140, 약 100 내지 약 150, 약 100 내지 약 160, 약 110 내지 약 120, 약 110 내지 약 130, 약 110 내지 약 140, 약 110 내지 약 150, 약 110 내지 약 160, 약 120 내지 약 130, 약 120 내지 약 140, 약 120 내지 약 150, 약 120 내지 약 160, 약 130 내지 약 140, 약 130 내지 약 150, 약 130 내지 약 160, 약 140 내지 약 150, 약 140 내지 약 160, 또는 약 150 내지 약 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80, 약 90, 약 100, 약 110, 약 120, 약 130, 약 140, 약 150 또는 약 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 적어도 약 80, 약 90, 약 100, 약 110, 약 120, 약 130, 약 140 또는 약 150이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 최대 약 90, 약 100, 약 110, 약 120, 약 130, 약 140, 약 150 또는 약 160이다.
세포 밀도는 다른 방법에 의해 측정될 수 있으며, 다른 단위, 예를 들어, 단위 부피당 세포로 표현될 수 있다. 예를 들어, 슈도모나스 플루오레센스 배양물의 약 40 내지 약 160의 OD575는 ㎖당 약 4 x 1010 내지 약 1.6 x 1011 콜로니 형성 유닛 또는 ℓ당 17.5 내지 70 g 건조 세포 중량에 해당한다. 실시양태에서, 배양 유도 시 세포 밀도는 세포 밀도 측정에 이용된 방법 또는 측정 단위와 관계없이 OD575에서의 흡광도로 본원에 특정된 세포 밀도에 해당한다. 당업자는 임의의 세포 배양물에 대해 적절한 전환을 수행하는 방법을 알 것이다.
일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM 내지 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM 내지 약 0.02 mM, 약 0.01 mM 내지 약 0.03 mM, 약 0.01 mM 내지 약 0.05 mM, 약 0.01 mM 내지 약 0.06 mM, 약 0.01 mM 내지 약 0.07 mM, 약 0.01 mM 내지 약 0.08 mM, 약 0.01 mM 내지 약 0.09 mM, 약 0.01 mM 내지 약 0.1 mM, 약 0.01 mM 내지 약 0.2 mM, 약 0.01 mM 내지 약 0.5 mM, 약 0.01 mM 내지 약 1 mM, 약 0.02 mM 내지 약 0.03 mM, 약 0.02 mM 내지 약 0.05 mM, 약 0.02 mM 내지 약 0.06 mM, 약 0.02 mM 내지 약 0.07 mM, 약 0.02 mM 내지 약 0.08 mM, 약 0.02 mM 내지 약 0.09 mM, 약 0.02 mM 내지 약 0.1 mM, 약 0.02 mM 내지 약 0.2 mM, 약 0.02 mM 내지 약 0.5 mM, 약 0.02 mM 내지 약 1 mM, 약 0.03 mM 내지 약 0.05 mM, 약 0.03 mM 내지 약 0.06 mM, 약 0.03 mM 내지 약 0.07 mM, 약 0.03 mM 내지 약 0.08 mM, 약 0.03 mM 내지 약 0.09 mM, 약 0.03 mM 내지 약 0.1 mM, 약 0.03 mM 내지 약 0.2 mM, 약 0.03 mM 내지 약 0.5 mM, 약 0.03 mM 내지 약 1 mM, 약 0.05 mM 내지 약 0.06 mM, 약 0.05 mM 내지 약 0.07 mM, 약 0.05 mM 내지 약 0.08 mM, 약 0.05 mM 내지 약 0.09 mM, 약 0.05 mM 내지 약 0.1 mM, 약 0.05 mM 내지 약 0.2 mM, 약 0.05 mM 내지 약 0.5 mM, 약 0.05 mM 내지 약 1 mM, 약 0.06 mM 내지 약 0.07 mM, 약 0.06 mM 내지 약 0.08 mM, 약 0.06 mM 내지 약 0.09 mM, 약 0.06 mM 내지 약 0.1 mM, 약 0.06 mM 내지 약 0.2 mM, 약 0.06 mM 내지 약 0.5 mM, 약 0.06 mM 내지 약 1 mM, 약 0.07 mM 내지 약 0.08 mM, 약 0.07 mM 내지 약 0.09 mM, 약 0.07 mM 내지 약 0.1 mM, 약 0.07 mM 내지 약 0.2 mM, 약 0.07 mM 내지 약 0.5 mM, 약 0.07 mM 내지 약 1 mM, 약 0.08 mM 내지 약 0.09 mM, 약 0.08 mM 내지 약 0.1 mM, 약 0.08 mM 내지 약 0.2 mM, 약 0.08 mM 내지 약 0.5 mM, 약 0.08 mM 내지 약 1 mM, 약 0.09 mM 내지 약 0.1 mM, 약 0.09 mM 내지 약 0.2 mM, 약 0.09 mM 내지 약 0.5 mM, 약 0.09 mM 내지 약 1 mM, 약 0.1 mM 내지 약 0.2 mM, 약 0.1 mM 내지 약 0.5 mM, 약 0.1 mM 내지 약 1 mM, 약 0.2 mM 내지 약 0.5 mM, 약 0.2 mM 내지 약 1 mM, 또는 약 0.5 mM 내지 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM, 약 0.02 mM, 약 0.03 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM, 약 0.5 mM 또는 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 적어도 약 0.01 mM, 약 0.02 mM, 약 0.03 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM 또는 약 0.5 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 최대 약 0.02 mM, 약 0.03 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM, 약 0.5 mM, 또는 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM 내지 약 0.3 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM 내지 약 0.09 mM, 약 0.08 mM 내지 약 0.1 mM, 약 0.08 mM 내지 약 0.125 mM, 약 0.08 mM 내지 약 0.15 mM, 약 0.08 mM 내지 약 0.175 mM, 약 0.08 mM 내지 약 0.2 mM, 약 0.08 mM 내지 약 0.225 mM, 약 0.08 mM 내지 약 0.25 mM, 약 0.08 mM 내지 약 0.275 mM, 약 0.08 mM 내지 약 0.3 mM, 약 0.09 mM 내지 약 0.1 mM, 약 0.09 mM 내지 약 0.125 mM, 약 0.09 mM 내지 약 0.15 mM, 약 0.09 mM 내지 약 0.175 mM, 약 0.09 mM 내지 약 0.2 mM, 약 0.09 mM 내지 약 0.225 mM, 약 0.09 mM 내지 약 0.25 mM, 약 0.09 mM 내지 약 0.275 mM, 약 0.09 mM 내지 약 0.3 mM, 약 0.1 mM 내지 약 0.125 mM, 약 0.1 mM 내지 약 0.15 mM, 약 0.1 mM 내지 약 0.175 mM, 약 0.1 mM 내지 약 0.2 mM, 약 0.1 mM 내지 약 0.225 mM, 약 0.1 mM 내지 약 0.25 mM, 약 0.1 mM 내지 약 0.275 mM, 약 0.1 mM 내지 약 0.3 mM, 약 0.125 mM 내지 약 0.15 mM, 약 0.125 mM 내지 약 0.175 mM, 약 0.125 mM 내지 약 0.2 mM, 약 0.125 mM 내지 약 0.225 mM, 약 0.125 mM 내지 약 0.25 mM, 약 0.125 mM 내지 약 0.275 mM, 약 0.125 mM 내지 약 0.3 mM, 약 0.15 mM 내지 약 0.175 mM, 약 0.15 mM 내지 약 0.2 mM, 약 0.15 mM 내지 약 0.225 mM, 약 0.15 mM 내지 약 0.25 mM, 약 0.15 mM 내지 약 0.275 mM, 약 0.15 mM 내지 약 0.3 mM, 약 0.175 mM 내지 약 0.2 mM, 약 0.175 mM 내지 약 0.225 mM, 약 0.175 mM 내지 약 0.25 mM, 약 0.175 mM 내지 약 0.275 mM, 약 0.175 mM 내지 약 0.3 mM, 약 0.2 mM 내지 약 0.225 mM, 약 0.2 mM 내지 약 0.25 mM, 약 0.2 mM 내지 약 0.275 mM, 약 0.2 mM 내지 약 0.3 mM, 약 0.225 mM 내지 약 0.25 mM, 약 0.225 mM 내지 약 0.275 mM, 약 0.225 mM 내지 약 0.3 mM, 약 0.25 mM 내지 약 0.275 mM, 약 0.25 mM 내지 약 0.3 mM, 또는 약 0.275 mM 내지 약 0.3 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.125 mM, 약 0.15 mM, 약 0.175 mM, 약 0.2 mM, 약 0.225 mM, 약 0.25 mM, 약 0.275 mM 또는 약 0.3 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 적어도 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.125 mM, 약 0.15 mM, 약 0.175 mM, 약 0.2 mM, 약 0.225 mM, 약 0.25 mM 또는 약 0.275 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 최대 약 0.09 mM, 약 0.1 mM, 약 0.125 mM, 약 0.15 mM, 약 0.175 mM, 약 0.2 mM, 약 0.225 mM, 약 0.25 mM, 약 0.275 mM 또는 약 0.3 mM이다.
본원 및 문헌에 기재된 바와 같이 비-lac 유형 프로모터가 사용되는 실시양태에서, 다른 유도제 또는 이펙터가 사용될 수 있다. 한 실시양태에서, 프로모터는 항시성 프로모터이다.
유도제를 첨가한 후, 배양물은 일정 시간, 예를 들어, 약 24시간 동안 생장될 수 있으며, 이 시간 동안 재조합 단백질이 발현된다(생성기). 유도제를 첨가한 후, 배양물은 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 5시간, 약 6시간, 약 7시간, 약 8시간, 약 9시간, 약 10시간, 약 11시간, 약 12시간, 약 13시간, 약 14시간, 약 15시간, 약 16시간, 약 17시간, 약 18시간, 약 19시간, 약 20시간, 약 21시간, 약 22시간, 약 23시간, 약 24시간, 약 36시간 또는 약 48시간 동안 생장될 수 있다. 유도제를 배양물에 첨가한 후, 배양물은 약 1시간 내지 48시간, 약 1시간 내지 24시간, 약 1시간 내지 8시간, 약 10시간 내지 24시간, 약 15시간 내지 24시간, 또는 약 20시간 내지 24시간 동안 생장될 수 있다. 세포 배양물은 원심분리에 의해 농축될 수 있으며, 배양 펠릿은 후속 용해 절차에 적합한 완충제 또는 용액에 재현탁될 수 있다.
일부 실시양태에서, 일정한 공급물이 사용된다. 일부 실시양태에서, 유가식 형식이 이용된다. 일부 실시양태에서, 공급물은 글리세롤 또는 글루코스이다. 일부 실시양태에서, 공급물 볼루스는 약 10 g/ℓ 내지 약 50 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 약 10 g/ℓ 내지 약 15 g/ℓ, 약 10 g/ℓ 내지 약 20 g/ℓ, 약 10 g/ℓ 내지 약 25 g/ℓ, 약 10 g/ℓ 내지 약 30 g/ℓ, 약 10 g/ℓ 내지 약 35 g/ℓ, 약 10 g/ℓ 내지 약 40 g/ℓ, 약 10 g/ℓ 내지 약 45 g/ℓ, 약 10 g/ℓ 내지 약 50 g/ℓ, 약 15 g/ℓ 내지 약 20 g/ℓ, 약 15 g/ℓ 내지 약 25 g/ℓ, 약 15 g/ℓ 내지 약 30 g/ℓ, 약 15 g/ℓ 내지 약 35 g/ℓ, 약 15 g/ℓ 내지 약 40 g/ℓ, 약 15 g/ℓ 내지 약 45 g/ℓ, 약 15 g/ℓ 내지 약 50 g/ℓ, 약 20 g/ℓ 내지 약 25 g/ℓ, 약 20 g/ℓ 내지 약 30 g/ℓ, 약 20 g/ℓ 내지 약 35 g/ℓ, 약 20 g/ℓ 내지 약 40 g/ℓ, 약 20 g/ℓ 내지 약 45 g/ℓ, 약 20 g/ℓ 내지 약 50 g/ℓ, 약 25 g/ℓ 내지 약 30 g/ℓ, 약 25 g/ℓ 내지 약 35 g/ℓ, 약 25 g/ℓ 내지 약 40 g/ℓ, 약 25 g/ℓ 내지 약 45 g/ℓ, 약 25 g/ℓ 내지 약 50 g/ℓ, 약 30 g/ℓ 내지 약 35 g/ℓ, 약 30 g/ℓ 내지 약 40 g/ℓ, 약 30 g/ℓ내지 약 45 g/ℓ, 약 30 g/ℓ 내지 약 50 g/ℓ, 약 35 g/ℓ 내지 약 40 g/ℓ, 약 35 g/ℓ 내지 약 45 g/ℓ, 약 35 g/ℓ 내지 약 50 g/ℓ, 약 40 g/ℓ 내지 약 45 g/ℓ, 약 40 g/ℓ 내지 약 50 g/ℓ, 또는 약 45 g/ℓ 내지 약 50 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 적어도 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ 또는 약 45 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 최대 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ이다.
실시양태에서, 고압 기계적 세포 파괴를 위한 장치(예를 들어, 시판되는 장치, 예를 들어, 마이크로플루이딕스 미세유동화기(Microfluidics Microfluidizer), 불변 세포 파괴기(Constant Cell Disruptor), 니로-소아비(Niro-Soavi) 균질화기 또는 APV-가울린(Gaulin) 균질화기)를 이용하여 세포를 파괴한다. 예를 들어, 초음파처리를 이용하여 재조합 단백질을 발현하는 세포를 파괴할 수 있다. 당분야에 알려진 임의의 적절한 세포 용해 방법을 이용하여 가용성 분획을 방출할 수 있다. 예를 들어, 실시양태에서, 세포벽 용해 효소 및 EDTA와 같은 화학적 및/또는 효소적 세포 용해 시약을 사용할 수 있다. 냉동되거나 미리 저장된 배양물의 사용도 본 발명의 방법에서 예상된다. 용해 전에 배양물을 OD 정규화할 수 있다. 예를 들어, 세포를 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19 또는 약 20의 OD600으로 정규화할 수 있다.
임의의 적절한 장치 및 방법을 이용하여 원심분리를 수행할 수 있다. 불용성 분획으로부터 가용성 분획을 분리할 목적의 세포 배양물 또는 용해물의 원심분리는 당분야에 잘 알려져 있다. 예를 들어, 용해된 세포를 20,800xg에서 20분 동안 (4℃에서) 원심분리할 수 있고 수동 또는 자동 액체 처리를 이용하여 상청액을 제거할 수 있다. 세포 배양물의 원심분리에 의해 수득된 세포 펠렛, 또는 세포 용해물의 원심분리에 의해 수득된 불용성 분획을 완충 용액에 재현탁할 수 있다. 예를 들어, 오버헤드 혼합기에 연결된 임펠러, 자기 교반 막대, 락킹 진탕기 등과 같은 장치를 이용하여 세포 펠릿 또는 불용성 분획의 재현탁을 수행할 수 있다.
"가용성 분획", 즉 용해물의 원심분리 후 수득된 가용성 상청액, 및 "불용성 분획", 즉 용해물의 원심분리 후 수득된 펠릿은 배양물을 용해하고 원심분리한 결과이다.
고처리량 스크린
실시양태에서, 관심 있는 재조합 단백질을 발현시키기 위한 최적 조건을 확인하기 위해 고처리량 스크린을 수행한다. 스크린에서 변경될 수 있는 조건은 예를 들어, 숙주 세포, 숙주 세포의 유전적 배경(예를 들어, 본원에 상세히 설명된 바와 같음), 발현 구축물의 프로모터의 유형, 코딩된 관심 있는 폴리펩티드 또는 단백질에 융합된 분비 리더의 유형, 생장 온도, 유도성 프로모터가 사용될 때 유도의 OD, 첨가된 유도제의 양(예를 들어, lacZ 프로모터 또는 이의 유도체가 사용될 때 유도에 사용된 IPTG의 양), 단백질 유도의 지속시간, 유도제를 배양물에 첨가한 후 생장 온도, 배양물의 교반 속도, 플라스미드 유지를 위한 선택 방법, 용기 내의 배양물의 부피 및 세포 용해 방법을 포함한다.
일부 실시양태에서, 숙주 균주의 라이브러리(또는 "어레이")를 제공하고, 이때 상기 라이브러리 내의 각각의 균주(또는 "숙주 세포의 집단")는 숙주 세포에서 하나 이상의 표적 유전자의 발현을 조절하도록 유전적으로 변형되었다. 어레이에서 표현형적으로 구별되는 숙주 세포의 다른 집단에 비해 관심 있는 발현된 단백질의 양, 품질 및/또는 위치를 기반으로 "최적 숙주 균주" 또는 "최적 발현 시스템"을 확인할 수 있거나 선택할 수 있다. 따라서, 최적 숙주 균주는 원하는 세부요건에 따라 관심 있는 재조합 단백질을 생성하는 균주이다. 원하는 세부요건은 생성되는 폴리펩티드에 따라 달라질 것이지만, 세부요건은 단백질의 품질 및/또는 양, 단백질이 격리되는지 아니면 분비되는지 여부, 단백질 폴딩 등을 포함한다. 예를 들어, 최적 숙주 균주 또는 최적 발현 시스템은 특정 절대적인 수준, 또는 대조군 또는 지표 균주, 즉 비교에 사용된 균주에 의해 생성된 수준에 상대적인 특정 수준의 수율을 생성하고, 이 수율은 가용성 재조합 단백질의 양, 회수 가능한 재조합 단백질의 양, 적절히 처리된 재조합 단백질의 양, 적절하게 폴딩된 재조합 단백질의 양, 활성 재조합 단백질의 양, 및/또는 관심 있는 재조합 단백질의 총량으로 특징져진다. 재조합 단백질의 발현에 있어서 개선된 수율 및/또는 품질을 가진 균주를 확인하기 위해 미생물 숙주를 스크리닝하는 방법은 예를 들어, 미국 특허 제9,394,571호 및 제9,580,719호에 기재되어 있다.
단백질 분석
본 발명의 방법에 따라 생성된 관심 있는 재조합 단백질은 고품질의 재조합 단백질, 예를 들어, 활성, 가용성 및/또는 온전한 재조합 단백질; 높은 수율 또는 역가로 생성되는 재조합 단백질; 또는 이들의 조합일 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질은 대조군 숙주 세포의 사용 시 관찰된 품질 및/또는 수율과 비교될 때 더 높은 품질 및/또는 더 높은 수율로 본 발명의 방법에 따른 재조합 그람 음성 박테리아 숙주 세포에 의해 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 대조군 숙주 세포보다 더 높은 세포 밀도까지 생장한다.
실시양태에서, 본원에서 제공된 방법에 의해 생성된 관심 있는 재조합 단백질은 (예를 들어, 온전한 단백질을 측정함으로써) 수율, 용해도, 활성 및 분해와 관련하여 분석된다. 관심 있는 재조합 단백질은 당업자에게 알려진 임의의 적절한 방법에 의해 분석될 수 있다. 단백질의 "용해도" 및 "활성"은 관련된 품질이지만 일반적으로 상이한 수단에 의해 측정된다. 단백질, 특히 소수성 단백질의 용해도는 소수성 아미노산 잔기가 폴딩된 단백질의 내부에 적절하게 위치한다는 것을 표시한다. 예를 들어, 아래에 설명된 바와 같이, 다양한 방법을 이용하여 종종 평가하는 단백질 활성은 적절한 단백질 입체구조의 또 다른 지표이다.
일부 실시양태에서, 관심 있는 재조합 단백질은 생물층 간섭측정, SDS-PAGE, 웨스턴 블롯, 파 웨스턴 블롯, ELISA, 흡광도 또는 질량 분광측정(예를 들어, 탠덤 질량 분광측정)에 의해 분석된다. 일부 실시양태에서, 생성된 관심 있는 폴리펩티드 또는 단백질의 농도 및/또는 양은 예를 들어, 브래드포드 어세이, 흡광도, 쿠마시 염색, 질량 분광측정 등에 의해 측정된다. 불용성 분획 및 가용성 분획에서의 단백질 수율 및 단편화는 당업자에게 알려진 방법, 예를 들어, 모세관 겔 전기영동(CGE), SDS-PAGE 및 웨스턴 블롯 분석에 의해 분석될 수 있다. 예를 들어, 생물층 간섭측정을 이용하여 가용성 분획을 평가할 수도 있다. 단백질 활성은 관심 있는 재조합 단백질에 적합한 임의의 알려진 방법에 의해 측정될 수 있다. 결합 단백질인 관심 있는 재조합 단백질의 경우, 이것은 임의의 알려진 방법으로 이 단백질과 표적 리간드, 예를 들어, TNF-알파, 또는 임의의 다른 표적의 결합을 측정하는 단계를 포함할 수 있다.
단백질 수율의 유용한 측정치는 예를 들어, 배양물 부피당 재조합 단백질의 양(예를 들어, 배양물 리터당 단백질의 그램 또는 밀리그램으로 표현될 수 있는 농도), 용해 후 수득된 불용성 펠릿에서 측정된 재조합 단백질의 퍼센트 또는 분율(예를 들어, 추출물 상청액 중의 재조합 단백질의 양/불용성 분획 중의 단백질의 양), 활성 단백질의 퍼센트 또는 분율(예를 들어, 활성 단백질의 양/어세이에 사용된 단백질의 양), 총 세포 단백질(tcp)의 퍼센트 또는 분율, 단백질/세포의 양, 및 퍼센트 건조 바이오매스를 포함한다. 본원에서 사용된 측정치는 대규모 발효 배양물에 대해 측정된 측정치를 의미할 수 있다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 실질적으로 동일한 생장 조건 하에서 대조군 세포보다 배양물에서 증가된 세포 밀도까지 생장한다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 약 2배 내지 약 15배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 약 2배 내지 약 3배, 약 2배 내지 약 4배, 약 2배 내지 약 5배, 약 2배 내지 약 6배, 약 2배 내지 약 7배, 약 2배 내지 약 8배, 약 2배 내지 약 9배, 약 2배 내지 약 10배, 약 2배 내지 약 11배, 약 2배 내지 약 12배, 약 2배 내지 약 15배, 약 3배 내지 약 4배, 약 3배 내지 약 5배, 약 3배 내지 약 6배, 약 3배 내지 약 7배, 약 3배 내지 약 8배, 약 3배 내지 약 9배, 약 3배 내지 약 10배, 약 3배 내지 약 11배, 약 3배 내지 약 12배, 약 3배 내지 약 15배, 약 4배 내지 약 5배, 약 4배 내지 약 6배, 약 4배 내지 약 7배, 약 4배 내지 약 8배, 약 4배 내지 약 9배, 약 4배 내지 약 10배, 약 4배 내지 약 11배, 약 4배 내지 약 12배, 약 4배 내지 약 15배, 약 5배 내지 약 6배, 약 5배 내지 약 7배, 약 5배 내지 약 8배, 약 5배 내지 약 9배, 약 5배 내지 약 10배, 약 5배 내지 약 11배, 약 5배 내지 약 12배, 약 5배 내지 약 15배, 약 6배 내지 약 7배, 약 6배 내지 약 8배, 약 6배 내지 약 9배, 약 6배 내지 약 10배, 약 6배 내지 약 11배, 약 6배 내지 약 12배, 약 6배 내지 약 15배, 약 7배 내지 약 8배, 약 7배 내지 약 9배, 약 7배 내지 약 10배, 약 7배 내지 약 11배, 약 7배 내지 약 12배, 약 7배 내지 약 15배, 약 8배 내지 약 9배, 약 8배 내지 약 10배, 약 8배 내지 약 11배, 약 8배 내지 약 12배, 약 8배 내지 약 15배, 약 9배 내지 약 10배, 약 9배 내지 약 11배, 약 9배 내지 약 12배, 약 9배 내지 약 15배, 약 10배 내지 약 11배, 약 10배 내지 약 12배, 약 10배 내지 약 15배, 약 11배 내지 약 12배, 약 11배 내지 약 15배, 또는 약 12배 내지 약 15배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배 또는 약 15배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 적어도 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배 또는 약 12배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 최대 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배 또는 약 15배이다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 대조군 세포에 비해 증가된 수율의 고품질 재조합 단백질을 생성한다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 약 2배 내지 약 100배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 약 2배 내지 약 5배, 약 2배 내지 약 10배, 약 2배 내지 약 20배, 약 2배 내지 약 30배, 약 2배 내지 약 40배, 약 2배 내지 약 50배, 약 2배 내지 약 60배, 약 2배 내지 약 70배, 약 2배 내지 약 80배, 약 2배 내지 약 90배, 약 2배 내지 약 100배, 약 5배 내지 약 10배, 약 5배 내지 약 20배, 약 5배 내지 약 30배, 약 5배 내지 약 40배, 약 5배 내지 약 50배, 약 5배 내지 약 60배, 약 5배 내지 약 70배, 약 5배 내지 약 80배, 약 5배 내지 약 90배, 약 5배 내지 약 100배, 약 10배 내지 약 20배, 약 10배 내지 약 30배, 약 10배 내지 약 40배, 약 10배 내지 약 50배, 약 10배 내지 약 60배, 약 10배 내지 약 70배, 약 10배 내지 약 80배, 약 10배 내지 약 90배, 약 10배 내지 약 100배, 약 20배 내지 약 30배, 약 20배 내지 약 40배, 약 20배 내지 약 50배, 약 20배 내지 약 60배, 약 20배 내지 약 70배, 약 20배 내지 약 80배, 약 20배 내지 약 90배, 약 20배 내지 약 100배, 약 30배 내지 약 40배, 약 30배 내지 약 50배, 약 30배 내지 약 60배, 약 30배 내지 약 70배, 약 30배 내지 약 80배, 약 30배 내지 약 90배, 약 30배 내지 약 100배, 약 40배 내지 약 50배, 약 40배 내지 약 60배, 약 40배 내지 약 70배, 약 40배 내지 약 80배, 약 40배 내지 약 90배, 약 40배 내지 약 100배, 약 50배 내지 약 60배, 약 50배 내지 약 70배, 약 50배 내지 약 80배, 약 50배 내지 약 90배, 약 50배 내지 약 100배, 약 60배 내지 약 70배, 약 60배 내지 약 80배, 약 60배 내지 약 90배, 약 60배 내지 약 100배, 약 70배 내지 약 80배, 약 70배 내지 약 90배, 약 70배 내지 약 100배, 약 80배 내지 약 90배, 약 80배 내지 약 100배, 또는 약 90배 내지 약 100배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 약 2배, 약 5배, 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배 또는 약 100배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 적어도 약 2배, 약 5배, 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배 또는 약 90배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 최대 약 5배, 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배 또는 약 100배이다.
재조합 그람 음성 박테리아 숙주 세포와 비교하기 위한 임의의 적합한 대조군 세포는 당업자에 의해 선택될 수 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포는 각각 (i) 본원에 기재된 바와 같이 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포; (ii) 본원에 기재된 바와 같이 제1 프로테아제 활성, 제2 프로테아제 활성 및 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및 (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포로부터 선택된다.
실시양태에서, 본원의 방법을 이용하여 총 세포 단백질의 약 20% 내지 약 90%의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 특정 실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 폴리펩티드 또는 단백질의 수율은 총 세포 단백질의 약 20%, 총 세포 단백질의 약 25%, 총 세포 단백질의 약 30%, 총 세포 단백질의 약 31%, 총 세포 단백질의 약 32%, 총 세포 단백질의 약 33%, 총 세포 단백질의 약 34%, 총 세포 단백질의 약 35%, 총 세포 단백질의 약 36%, 총 세포 단백질의 약 37%, 총 세포 단백질의 약 38%, 총 세포 단백질의 약 39%, 총 세포 단백질의 약 40%, 총 세포 단백질의 약 41%, 총 세포 단백질의 약 42%, 총 세포 단백질의 약 43%, 총 세포 단백질의 약 44%, 총 세포 단백질의 약 45%, 총 세포 단백질의 약 46%, 총 세포 단백질의 약 47%, 총 세포 단백질의 약 48%, 총 세포 단백질의 약 49%, 총 세포 단백질의 약 50%, 총 세포 단백질의 약 51%, 총 세포 단백질의 약 52%, 총 세포 단백질의 약 53%, 총 세포 단백질의 약 54%, 총 세포 단백질의 약 55%, 총 세포 단백질의 약 56%, 총 세포 단백질의 약 57%, 총 세포 단백질의 약 58%, 총 세포 단백질의 약 59%, 총 세포 단백질의 약 60%, 총 세포 단백질의 약 65%, 총 세포 단백질의 약 70%, 총 세포 단백질의 약 75%, 총 세포 단백질의 약 80%, 총 세포 단백질의 약 85% 또는 총 세포 단백질의 약 90%이다. 일부 실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 수율은 총 세포 단백질의 약 20% 내지 약 25%, 총 세포 단백질의 약 20% 내지 약 30%, 총 세포 단백질의 약 20% 내지 약 35%, 총 세포 단백질의 약 20% 내지 약 40%, 총 세포 단백질의 약 20% 내지 약 45%, 총 세포 단백질의 약 20% 내지 약 50%, 총 세포 단백질의 약 20% 내지 약 55%, 총 세포 단백질의 약 20% 내지 약 60%, 총 세포 단백질의 약 20% 내지 약 65%, 총 세포 단백질의 약 20% 내지 약 70%, 총 세포 단백질의 약 20% 내지 약 75%, 총 세포 단백질의 약 20% 내지 약 80%, 총 세포 단백질의 약 20% 내지 약 85%, 총 세포 단백질의 약 20% 내지 약 90%, 총 세포 단백질의 약 25% 내지 약 90%, 총 세포 단백질의 약 30% 내지 약 90%, 총 세포 단백질의 약 35% 내지 약 90%, 총 세포 단백질의 약 40% 내지 약 90%, 총 세포 단백질의 약 45% 내지 약 90%, 총 세포 단백질의 약 50% 내지 약 90%, 총 세포 단백질의 약 55% 내지 약 90%, 총 세포 단백질의 약 60% 내지 약 90%, 총 세포 단백질의 약 65% 내지 약 90%, 총 세포 단백질의 약 70% 내지 약 90%, 총 세포 단백질의 약 75% 내지 약 90%, 총 세포 단백질의 약 80% 내지 약 90%, 총 세포 단백질의 약 85% 내지 약 90%, 총 세포 단백질의 약 31% 내지 약 60%, 총 세포 단백질의 약 35% 내지 약 60%, 총 세포 단백질의 약 40% 내지 약 60%, 총 세포 단백질의 약 45% 내지 약 60%, 총 세포 단백질의 약 50% 내지 약 60%, 총 세포 단백질의 약 55% 내지 약 60%, 총 세포 단백질의 약 31% 내지 약 55%, 총 세포 단백질의 약 31% 내지 약 50%, 총 세포 단백질의 약 31% 내지 약 45%, 총 세포 단백질의 약 31% 내지 약 40%, 총 세포 단백질의 약 31% 내지 약 35%, 총 세포 단백질의 약 35% 내지 약 55%, 또는 총 세포 단백질의 약 40% 내지 약 50%이다.
실시양태에서, 본원의 방법을 이용하여 리터당 약 1 그램 내지 리터당 약 50 그램의 수율(농도로서 표현되는 경우 역가로서 지칭될 수 있음)로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ 내지 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 5 g/ℓ, 약 0.1 g/ℓ 내지 약 10 g/ℓ, 약 0.1 g/ℓ 내지 약 15 g/ℓ, 약 0.1 g/ℓ 내지 약 20 g/ℓ, 약 0.1 g/ℓ 내지 약 25 g/ℓ, 약 0.1 g/ℓ 내지 약 30 g/ℓ, 약 0.1 g/ℓ 내지 약 35 g/ℓ, 약 0.1 g/ℓ 내지 약 40 g/ℓ, 약 0.1 g/ℓ 내지 약 45 g/ℓ, 약 0.1 g/ℓ 내지 약 50 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 10 g/ℓ, 약 1 g/ℓ 내지 약 15 g/ℓ, 약 1 g/ℓ 내지 약 20 g/ℓ, 약 1 g/ℓ 내지 약 25 g/ℓ, 약 1 g/ℓ 내지 약 30 g/ℓ, 약 1 g/ℓ 내지 약 35 g/ℓ, 약 1 g/ℓ 내지 약 40 g/ℓ, 약 1 g/ℓ 내지 약 45 g/ℓ, 약 1 g/ℓ 내지 약 50 g/ℓ, 약 5 g/ℓ 내지 약 10 g/ℓ, 약 5 g/ℓ 내지 약 15 g/ℓ, 약 5 g/ℓ 내지 약 20 g/ℓ, 약 5 g/ℓ 내지 약 25 g/ℓ, 약 5 g/ℓ 내지 약 30 g/ℓ, 약 5 g/ℓ 내지 약 35 g/ℓ, 약 5 g/ℓ 내지 약 40 g/ℓ, 약 5 g/ℓ 내지 약 45 g/ℓ, 약 5 g/ℓ 내지 약 50 g/ℓ, 약 10 g/ℓ 내지 약 15 g/ℓ, 약 10 g/ℓ 내지 약 20 g/ℓ, 약 10 g/ℓ 내지 약 25 g/ℓ, 약 10 g/ℓ 내지 약 30 g/ℓ, 약 10 g/ℓ 내지 약 35 g/ℓ, 약 10 g/ℓ 내지 약 40 g/ℓ, 약 10 g/ℓ 내지 약 45 g/ℓ, 약 10 g/ℓ 내지 약 50 g/ℓ, 약 15 g/ℓ 내지 약 20 g/ℓ, 약 15 g/ℓ 내지 약 25 g/ℓ, 약 15 g/ℓ 내지 약 30 g/ℓ, 약 15 g/ℓ 내지 약 35 g/ℓ, 약 15 g/ℓ 내지 약 40 g/ℓ, 약 15 g/ℓ 내지 약 45 g/ℓ, 약 15 g/ℓ 내지 약 50 g/ℓ, 약 20 g/ℓ 내지 약 25 g/ℓ, 약 20 g/ℓ 내지 약 30 g/ℓ, 약 20 g/ℓ 내지 약 35 g/ℓ, 약 20 g/ℓ 내지 약 40 g/ℓ, 약 20 g/ℓ 내지 약 45 g/ℓ, 약 20 g/ℓ 내지 약 50 g/ℓ, 약 25 g/ℓ 내지 약 30 g/ℓ, 약 25 g/ℓ 내지 약 35 g/ℓ, 약 25 g/ℓ 내지 약 40 g/ℓ, 약 25 g/ℓ 내지 약 45 g/ℓ, 약 25 g/ℓ 내지 약 50 g/ℓ, 약 30 g/ℓ 내지 약 35 g/ℓ, 약 30 g/ℓ 내지 약 40 g/ℓ, 약 30 g/ℓ 내지 약 45 g/ℓ, 약 30 g/ℓ 내지 약 50 g/ℓ, 약 35 g/ℓ 내지 약 40 g/ℓ, 약 35 g/ℓ 내지 약 45 g/ℓ, 약 35 g/ℓ 내지 약 50 g/ℓ, 약 40 g/ℓ 내지 약 45 g/ℓ, 약 40 g/ℓ 내지 약 50 g/ℓ, 또는 약 45 g/ℓ 내지 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ, 약 1 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 적어도 약 0.1 g/ℓ, 약 1 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ 또는 약 45 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 최대 약 1 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ 내지 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여, 약 0.1 g/ℓ 내지 약 0.5 g/ℓ, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 2 g/ℓ, 약 0.1 g/ℓ 내지 약 3 g/ℓ, 약 0.1 g/ℓ 내지 약 4 g/ℓ, 약 0.1 g/ℓ 내지 약 5 g/ℓ, 약 0.1 g/ℓ 내지 약 6 g/ℓ, 약 0.1 g/ℓ 내지 약 7 g/ℓ, 약 0.1 g/ℓ 내지 약 8 g/ℓ, 약 0.1 g/ℓ 내지 약 9 g/ℓ, 약 0.1 g/ℓ 내지 약 10 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 3 g/ℓ, 약 0.5 g/ℓ 내지 약 4 g/ℓ, 약 0.5 g/ℓ 내지 약 5 g/ℓ, 약 0.5 g/ℓ 내지 약 6 g/ℓ, 약 0.5 g/ℓ 내지 약 7 g/ℓ, 약 0.5 g/ℓ 내지 약 8 g/ℓ, 약 0.5 g/ℓ 내지 약 9 g/ℓ, 약 0.5 g/ℓ 내지 약 10 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 3 g/ℓ, 약 1 g/ℓ 내지 약 4 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 6 g/ℓ, 약 1 g/ℓ 내지 약 7 g/ℓ, 약 1 g/ℓ 내지 약 8 g/ℓ, 약 1 g/ℓ 내지 약 9 g/ℓ, 약 1 g/ℓ 내지 약 10 g/ℓ, 약 2 g/ℓ 내지 약 3 g/ℓ, 약 2 g/ℓ 내지 약 4 g/ℓ, 약 2 g/ℓ 내지 약 5 g/ℓ, 약 2 g/ℓ 내지 약 6 g/ℓ, 약 2 g/ℓ 내지 약 7 g/ℓ, 약 2 g/ℓ 내지 약 8 g/ℓ, 약 2 g/ℓ 내지 약 9 g/ℓ, 약 2 g/ℓ 내지 약 10 g/ℓ, 약 3 g/ℓ 내지 약 4 g/ℓ, 약 3 g/ℓ 내지 약 5 g/ℓ, 약 3 g/ℓ 내지 약 6 g/ℓ, 약 3 g/ℓ 내지 약 7 g/ℓ, 약 3 g/ℓ 내지 약 8 g/ℓ, 약 3 g/ℓ 내지 약 9 g/ℓ, 약 3 g/ℓ 내지 약 10 g/ℓ, 약 4 g/ℓ 내지 약 5 g/ℓ, 약 4 g/ℓ 내지 약 6 g/ℓ, 약 4 g/ℓ 내지 약 7 g/ℓ, 약 4 g/ℓ 내지 약 8 g/ℓ, 약 4 g/ℓ 내지 약 9 g/ℓ, 약 4 g/ℓ 내지 약 10 g/ℓ, 약 5 g/ℓ 내지 약 6 g/ℓ, 약 5 g/ℓ 내지 약 7 g/ℓ, 약 5 g/ℓ 내지 약 8 g/ℓ, 약 5 g/ℓ 내지 약 9 g/ℓ, 약 5 g/ℓ 내지 약 10 g/ℓ, 약 6 g/ℓ 내지 약 7 g/ℓ, 약 6 g/ℓ 내지 약 8 g/ℓ, 약 6 g/ℓ 내지 약 9 g/ℓ, 약 6 g/ℓ 내지 약 10 g/ℓ, 약 7 g/ℓ 내지 약 8 g/ℓ, 약 7 g/ℓ 내지 약 9 g/ℓ, 약 7 g/ℓ 내지 약 10 g/ℓ, 약 8 g/ℓ 내지 약 9 g/ℓ, 약 8 g/ℓ 내지 약 10 g/ℓ, 또는 약 9 g/ℓ 내지 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/L, 약 3 g/ℓ, 약 4 g/ℓ, 약 5 g/ℓ, 약 6 g/ℓ, 약 7 g/ℓ, 약 8 g/ℓ, 약 9 g/ℓ 또는 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 적어도 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ, 약 5 g/ℓ, 약 6 g/ℓ, 약 7 g/ℓ, 약 8 g/ℓ 또는 약 9 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 최대 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ, 약 5 g/ℓ, 약 6 g/ℓ, 약 7 g/ℓ, 약 8 g/ℓ, 약 9 g/ℓ 또는 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.2 g/ℓ 내지 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.2 g/ℓ 내지 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여, 약 0.2 g/ℓ 내지 약 0.3 g/ℓ, 약 0.2 g/ℓ 내지 약 0.4 g/ℓ, 약 0.2 g/ℓ 내지 약 0.5 g/ℓ, 약 0.2 g/ℓ 내지 약 0.75 g/ℓ, 약 0.2 g/ℓ 내지 약 1 g/ℓ, 약 0.2 g/ℓ 내지 약 1.25 g/ℓ, 약 0.2 g/ℓ 내지 약 1.5 g/ℓ, 약 0.2 g/ℓ 내지 약 2 g/ℓ, 약 0.2 g/ℓ 내지 약 3 g/ℓ, 약 0.2 g/ℓ 내지 약 4 g/ℓ, 약 0.2 g/ℓ 내지 약 5 g/ℓ, 약 0.3 g/ℓ 내지 약 0.4 g/ℓ, 약 0.3 g/ℓ 내지 약 0.5 g/ℓ, 약 0.3 g/ℓ 내지 약 0.75 g/ℓ, 약 0.3 g/ℓ 내지 약 1 g/ℓ, 약 0.3 g/ℓ 내지 약 1.25 g/ℓ, 약 0.3 g/ℓ 내지 약 1.5 g/ℓ, 약 0.3 g/ℓ 내지 약 2 g/ℓ, 약 0.3 g/ℓ 내지 약 3 g/ℓ, 약 0.3 g/ℓ 내지 약 4 g/ℓ, 약 0.3 g/ℓ 내지 약 5 g/ℓ, 약 0.4 g/ℓ 내지 약 0.5 g/ℓ, 약 0.4 g/ℓ 내지 약 0.75 g/ℓ, 약 0.4 g/ℓ 내지 약 1 g/ℓ, 약 0.4 g/ℓ 내지 약 1.25 g/ℓ, 약 0.4 g/ℓ 내지 약 1.5 g/ℓ, 약 0.4 g/ℓ 내지 약 2 g/ℓ, 약 0.4 g/ℓ 내지 약 3 g/ℓ, 약 0.4 g/ℓ 내지 약 4 g/ℓ, 약 0.4 g/ℓ 내지 약 5 g/ℓ, 약 0.5 g/ℓ 내지 약 0.75 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 1.25 g/ℓ, 약 0.5 g/ℓ 내지 약 1.5 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 3 g/ℓ, 약 0.5 g/ℓ 내지 약 4 g/ℓ, 약 0.5 g/ℓ 내지 약 5 g/ℓ, 약 0.75 g/ℓ 내지 약 1 g/ℓ, 약 0.75 g/ℓ 내지 약 1.25 g/ℓ, 약 0.75 g/ℓ 내지 약 1.5 g/ℓ, 약 0.75 g/ℓ 내지 약 2 g/ℓ, 약 0.75 g/ℓ 내지 약 3 g/ℓ, 약 0.75 g/ℓ 내지 약 4 g/ℓ, 약 0.75 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 1.25 g/ℓ, 약 1 g/ℓ 내지 약 1.5 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 3 g/ℓ, 약 1 g/ℓ 내지 약 4 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1.25 g/ℓ 내지 약 1.5 g/ℓ, 약 1.25 g/ℓ 내지 약 2 g/ℓ, 약 1.25 g/ℓ 내지 약 3 g/ℓ, 약 1.25 g/ℓ 내지 약 4 g/ℓ, 약 1.25 g/ℓ 내지 약 5 g/ℓ, 약 1.5 g/ℓ 내지 약 2 g/ℓ, 약 1.5 g/ℓ 내지 약 3 g/ℓ, 약 1.5 g/ℓ 내지 약 4 g/ℓ, 약 1.5 g/ℓ 내지 약 5 g/ℓ, 약 2 g/ℓ 내지 약 3 g/ℓ, 약 2 g/ℓ 내지 약 4 g/ℓ, 약 2 g/ℓ 내지 약 5 g/ℓ, 약 3 g/ℓ 내지 약 4 g/ℓ, 약 3 g/ℓ 내지 약 5 g/ℓ, 또는 약 4 g/ℓ 내지 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.75 g/ℓ, 약 1 g/ℓ, 약 1.25 g/ℓ, 약 1.5 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ 또는 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 적어도 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.75 g/ℓ, 약 1 g/ℓ, 약 1.25 g/ℓ, 약 1.5 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ 또는 약 4 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 최대 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.75 g/ℓ, 약 1 g/ℓ, 약 1.25 g/ℓ, 약 1.5 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ 또는 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다.
실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 생성된 관심 있는 총 활성, 가용성 및/또는 온전한 재조합 단백질의 양의 약 10% 내지 약 100%이다. 실시양태에서, 이 양은 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양의 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 99%, 또는 약 100%이다. 실시양태에서, 이 양은 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양의 약 10% 내지 약 20%, 20% 내지 약 50%, 약 25% 내지 약 50%, 약 25% 내지 약 50%, 약 25% 내지 약 95%, 약 30% 내지 약 50%, 약 30% 내지 약 40%, 약 30% 내지 약 60%, 약 30% 내지 약 70%, 약 35% 내지 약 50%, 약 35% 내지 약 70%, 약 35% 내지 약 75%, 약 35% 내지 약 95%, 약 40% 내지 약 50%, 약 40% 내지 약 95%, 약 50% 내지 약 75%, 약 50% 내지 약 95%, 약 70% 내지 약 95%, 또는 약 80% 내지 약 100%이다.
일부 실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 퍼센트로서 표현된다. 주어진 세포 밀도에서 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질 중량/세포 배양물 부피의 관점에서 표현된 데이터는 총 세포 단백질 중 재조합 단백질의 퍼센트로서 표현된 데이터로 전환될 수 있다. 예를 들어, 주어진 세포 밀도에서 세포 배양물의 부피당 총 세포 단백질의 양을 파악하여, 부피 단백질 수율을 % 총 세포 단백질로 전환하는 것은 숙련된 당업자의 능력 내에 있다. 이 숫자는 1) 주어진 세포 밀도에서 세포 중량/배양물 부피, 및 2) 총 단백질을 구성하는 세포 중량의 퍼센트를 파악하는 경우 결정될 수 있다. 예를 들어, 1.0의 OD550에서, 이. 콜라이의 건조 세포 중량은 0.5 그램/리터인 것으로 보고되어 있다("Production of Heterologous Proteins from Recombinant DNA Escherichia coli in Bench Fermentors," Lin, N.S., and Swartz, J.R., 1992, METHODS: A Companion to Methods in Enzymology 4: 159-168). 박테리아 세포는 단백질뿐만 아니라 다당류, 지질 및 핵산으로도 구성된다. 이. 콜라이 세포는 단백질이 이. 콜라이 세포의 52.4 중량%를 차지한다고 추정하는 문헌[Da Silva, N.A., et al., 1986, "Theoretical Growth Yield Estimates for Recombinant Cells," Biotechnology and Bioengineering, Vol. XXVIII: 741-746], 및 이. 콜라이의 단백질 함량을 55% 건조 세포 중량으로서 보고하는 문헌["Escherichia coli and Salmonella typhimurium Cellular and Molecular Biology," 1987, Ed. in Chief Frederick C. Neidhardt, Vol. 1, pp. 3-6]을 포함하나 이들로 제한되지 않는 참고문헌에 의해 약 52.4% 내지 55% 단백질인 것으로 보고되어 있다. 상기 측정치(즉, 0.5 그램/리터의 건조 세포 중량, 및 55% 세포 중량로서 단백질)을 사용하여, 이. 콜라이의 경우 1.0의 A550에서 세포 배양물의 부피당 총 세포 단백질의 양을 275 ㎍ 총 세포 단백질/㎖/A550으로서 계산한다. 습윤 세포 중량을 기준으로 세포 배양물의 부피당 총 세포 단백질의 계산은 예를 들어, 이. 콜라이의 경우 1.0의 A600이 1.7 그램/리터의 습윤 세포 중량 및 0.39 그램/리터의 건조 세포 중량을 야기한다는 글라지리나 연구진(Glazyrina, et al.)(본원에 참고로 포함되는 문헌[Microbial Cell Factories 2010, 9:42])에 의한 확인을 이용할 수 있다. 예를 들어, 이 습윤 세포 중량과 건조 세포 중량의 비교를 이용하고 전술된 바와 같이 단백질을 55% 건조 세포 중량으로서 사용하여, 이. 콜라이의 경우 1.0의 A600에서 세포 배양물의 부피당 총 세포 단백질의 양을 215 ㎍ 총 세포 단백질/㎖/A600으로서 계산할 수 있다. 슈도모나스 플루오레센스의 경우, 주어진 세포 밀도에서 세포 배양물의 부피당 총 세포 단백질의 양은 이. 콜라이에 대해 발견된 양과 유사하다. 슈도모나스 플루오레센스는 이. 콜라이처럼 그람 음성 막대 모양 박테리아이다. 문헌[Edwards, et al., 1972, "Continuous Culture of Pseudomonas fluorescens with Sodium Maleate as a Carbon Source," Biotechnology and Bioengineering, Vol. XIV, pages 123-147]에 의해 보고된 슈도모나스 플루오레센스 ATCC 11150의 건조 세포 중량은 0.5 그램/리터/A500이다. 이것은 1.0의 A550에서 이. 콜라이에 대해 상기 문헌[Lin, et al.]에 의해 보고된 중량과 동일한 중량이다. 500 nm 및 550 nm에서 얻은 광산란 측정치는 매우 유사할 것으로 예상된다. 슈도모나스 플루오레센스 HK44에 대한 총 세포 단백질을 구성하는 세포 중량의 퍼센트는 예를 들어, 문헌[Yarwood, et al., July 2002, "Noninvasive Quantitative Measurement of Bacterial Growth in Porous Media under Unsaturated-Flow Conditions," Applied and Environmental Microbiology 68(7):3597-3605]에 의해 55%로서 기재되어 있다. 이 퍼센트는 전술된 참고문헌들에 의해 이. 콜라이의 경우 주어진 퍼센트와 유사하거나 동일하다.
실시양태에서, 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 0.1% 내지 약 95%이다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%를 초과한다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%이다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 5% 내지 약 95%, 약 10% 내지 약 85%, 약 20% 내지 약 75%, 약 30% 내지 약 65%, 약 40% 내지 약 55%, 약 1% 내지 약 95%, 약 5% 내지 약 30%, 약 1% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 또는 약 80% 내지 약 90%이다.
실시양태에서, 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 건조 세포 중량(DCW)의 약 0.1% 내지 약 50%이다. 실시양태에서, 이 양은 DCW의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45% 또는 50%를 초과한다. 실시양태에서, 이 양은 DCW의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45% 또는 50%이다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 5% 내지 약 50%, 약 10% 내지 약 40%, 약 20% 내지 약 30%, 약 1% 내지 약 20%, 약 5% 내지 약 25%, 약 1% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 또는 약 40% 내지 약 50%이다.
실시양태에서, 본 발명의 방법을 이용함으로써 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 실질적으로 유사한 조건, 예를 들어, 동일한 생장 조건 하에서 대조군 숙주 세포에 의해 생성된 단백질의 양보다 더 크다. 대조군 숙주 세포는 재조합 그람 음성 숙주 세포와 모든 면에서 동일하지만, (a) 재조합 그람 음성 숙주 세포에 결핍된 하나 이상의 활성이 결핍되어 있지 않거나, (b) 재조합 그람 음성 숙주 세포에서 과발현되는 하나 이상의 샤페론, 폴딩 조절인자 또는 불활성화된 프로테아제를 과발현하지 않거나, (c) (a)와 (b)의 임의의 조합을 나타내는 숙주 세포일 수 있다. 대조군 숙주 세포는 재조합 그람 음성 숙주 세포의 야생형 배경을 갖지만, (a) 재조합 그람 음성 숙주 세포에 결핍된 하나 이상의 활성이 결핍되어 있지 않거나, (b) 재조합 그람 음성 숙주 세포에서 과발현되는 하나 이상의 샤페론, 폴딩 조절인자 또는 불활성화된 프로테아제를 과발현하지 않거나, (c) (a)와 (b)의 임의의 조합을 나타내는 숙주 세포일 수 있다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포를 사용하는 본 방법에 따라 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 더 큰 양으로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 약 1.5배 내지 약 10배인 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 약 1.5배 내지 약 2배, 약 1.5배 내지 약 2.5배, 약 1.5배 내지 약 3배, 약 1.5배 내지 약 3.5배, 약 1.5배 내지 약 4배, 약 1.5배 내지 약 5배, 약 1.5배 내지 약 6배, 약 1.5배 내지 약 7배, 약 1.5배 내지 약 8배, 약 1.5배 내지 약 9배, 약 1.5배 내지 약 10배, 약 2배 내지 약 2.5배, 약 2배 내지 약 3배, 약 2배 내지 약 3.5배, 약 2배 내지 약 4배, 약 2배 내지 약 5배, 약 2배 내지 약 6배, 약 2배 내지 약 7배, 약 2배 내지 약 8배, 약 2배 내지 약 9배, 약 2배 내지 약 10배, 약 2.5배 내지 약 3배, 약 2.5배 내지 약 3.5배, 약 2.5배 내지 약 4배, 약 2.5배 내지 약 5배, 약 2.5배 내지 약 6배, 약 2.5배 내지 약 7배, 약 2.5배 내지 약 8배, 약 2.5배 내지 약 9배, 약 2.5배 내지 약 10배, 약 3배 내지 약 3.5배, 약 3배 내지 약 4배, 약 3배 내지 약 5배, 약 3배 내지 약 6배, 약 3배 내지 약 7배, 약 3배 내지 약 8배, 약 3배 내지 약 9배, 약 3배 내지 약 10배, 약 3.5배 내지 약 4배, 약 3.5배 내지 약 5배, 약 3.5배 내지 약 6배, 약 3.5배 내지 약 7배, 약 3.5배 내지 약 8배, 약 3.5배 내지 약 9배, 약 3.5배 내지 약 10배, 약 4배 내지 약 5배, 약 4배 내지 약 6배, 약 4배 내지 약 7배, 약 4배 내지 약 8배, 약 4배 내지 약 9배, 약 4배 내지 약 10배, 약 5배 내지 약 6배, 약 5배 내지 약 7배, 약 5배 내지 약 8배, 약 5배 내지 약 9배, 약 5배 내지 약 10배, 약 6배 내지 약 7배, 약 6배 내지 약 8배, 약 6배 내지 약 9배, 약 6배 내지 약 10배, 약 7배 내지 약 8배, 약 7배 내지 약 9배, 약 7배 내지 약 10배, 약 8배 내지 약 9배, 약 8배 내지 약 10배, 또는 약 9배 내지 약 10배 더 큰 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배 또는 약 10배 더 큰 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 적어도 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배 또는 약 9배 더 큰 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 최대 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배 또는 약 10배 더 큰 수율로 생성된다.
활성 어세이
관심 있는 재조합 단백질의 활성을 평가하는 어세이는 당분야에 알려져 있으며, 형광측정, 비색측정, 화학발광, 분광광도측정, 및 당업자에 의해 이용될 수 있는 다른 효소 어세이를 포함하나 이들로 제한되지 않는다. 항체, 항체 단편 또는 이의 유도체와 같은 결합 단백질은 당분야에 알려져 있는 임의의 적절한 표적 결합 어세이에 의해 평가될 수 있다. 이 어세이를 이용하여 관심 있는 재조합 단백질 제제의 활성을 시판되는 또는 다른 재조합 단백질 제제와 비교할 수 있다.
실시양태에서, 활성은 어세이된 총량과 비교된 추출물 상청액 중의 퍼센트 활성 단백질로 표시된다. 이것은 어세이에 사용된 단백질의 총량에 비해 어세이에 의해 활성을 띠는 것으로 확인된 단백질의 양을 기반으로 한다. 다른 실시양태에서, 활성은 표준물, 예를 들어, 천연 단백질과 비교된 단백질의 % 활성 수준으로 표시된다. 이것은 표준 샘플 중의 활성 단백질의 양에 비해 상청액 추출물 샘플 중의 활성 단백질의 양을 기반으로 한다(이때 각각의 샘플로부터 동일한 양의 단백질이 어세이에 사용됨).
실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 40% 내지 약 100%가 활성을 띠는 것으로 확인된다. 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100%가 활성을 띠는 것으로 확인된다. 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 약 90% 내지 약 100%, 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 40% 내지 약 90%, 약 40% 내지 약 95%, 약 50% 내지 약 90%, 약 50% 내지 약 95%, 약 50% 내지 약 100%, 약 60% 내지 약 90%, 약 60% 내지 약 95%, 약 60% 내지 약 100%, 약 70% 내지 약 90%, 약 70% 내지 약 95%, 약 70% 내지 약 100%, 또는 약 70% 내지 약 100%가 활성을 띠는 것으로 확인된다.
다른 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 75% 내지 약 100%가 활성을 띠는 것으로 확인된다. 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 75% 내지 약 80%, 약 75% 내지 약 85%, 약 75% 내지 약 90%, 약 75% 내지 약 95%, 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 95%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 95%, 약 85% 내지 약 100%, 약 90% 내지 약 95%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100%가 활성을 띠는 것으로 확인된다.
SlmT 분비 신호 펩티드
숙주 세포에서 높은 수준의 적절하게 처리된 재조합 단백질 또는 폴리펩티드를 생성하는 조성물 및 방법을 제공한다. 일부 측면에서, 그람 음성 박테리아의 주변세포질 또는 세포외 환경 내로의 관심 있는 재조합 단백질 또는 폴리펩티드의 표적화를 촉진하는 신규 분비 신호인 Slmt를 제공한다. 본원에 개시된 Slmt 주변세포질 분비 신호 펩티드는 그람 음성 박테리아에서 내부 막을 가로질러 단백질을 주변세포질 공간으로 수송할 수 있게 한다. 일부 측면에서, 본원에서 제공된 Slmt 주변세포질 분비 신호 펩티드는 그람 양성 박테리아에서 관심 있는 단백질 또는 폴리펩티드를 세포외 공간으로 표적화하는 것을 촉진한다. 주변세포질 단백질 발현은 주변세포질에서 디설파이드 결합의 적절한 형성을 허용하고 높은 수준의 재조합 단백질 발현을 야기할 수 있다. 주변세포질 공간으로의 발현은 재조합 단백질의 보다 더 효율적인 회수/정제를 가능하게 할 수 있다. 본 개시내용의 목적을 위해, "분비 신호", "분비 리더", "분비 신호 폴리펩티드", "신호 펩티드", "리더 펩티드" 또는 "리더 서열"은 관심 있는 단백질 또는 폴리펩티드를 세포 구획, 예를 들어, 그람 음성 박테리아의 주변세포질 또는 세포외 공간으로 표적화하는 데 유용한 펩티드 서열(또는 이 펩티드 서열을 코딩하는 폴리뉴클레오타이드)을 지칭하기 위한 것이다. 분비 신호 서열은 Slmt 분비 신호(서열번호 11로 제시된 아미노산 서열), 및 이의 단편 및 변이체를 포함한다. 서열번호 11을 코딩하고 본 방법에 유용한 뉴클레오타이드 서열의 한 예는 서열번호 12로 제공된다. 당업자에게 알려져 있는 바와 같이, 아미노산 서열은 유전자 코드의 중복성으로 인해 상이한 뉴클레오타이드 서열에 의해 코딩될 수 있다. 따라서, 본 발명의 조성물 및 방법은 상이한 뉴클레오타이드 서열에 의해 코딩될 수 있지만 동일한 분비 신호 아미노산 서열을 포함할 수 있다. 본원은 작동 가능하게 연결된 관심 있는 재조합 단백질 또는 폴리펩티드의 주변세포질 발현을 유도할 수 있는 분비 신호 펩티드 서열의 단편 및 변이체도 제공한다.
서열번호 11로 제시된 아미노산 서열을 코딩하는 분비 신호 코딩 서열은 발현되어 숙주 세포 주변세포질 또는 세포외 공간으로 표적화될 관심 있는 이종 재조합 단백질 또는 폴리펩티드를 코딩하는 서열의 N-말단에 융합될 수 있다. 이종 분비 신호 및 관심 있는 단백질 또는 폴리펩티드와 관련하여 본원에서 사용된 바와 같이, "이종" 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호가 아니다. 반대로, 분비 신호 펩티드와 관련하여, 관심 있는 "이종" 단백질 또는 폴리펩티드는 분비 신호에 대한 천연 단백질 또는 폴리펩티드가 아니다. 서열번호 11과 관련하여, 관심 있는 이종 단백질 또는 폴리펩티드는 슈도모나스 플루오레센스 가용성 용해성 뮤레인 트랜스글리코실라제(SlmT)가 아닌 이종 단백질 또는 폴리펩티드이다. 서열번호 11로 제시된 아미노산 서열을 코딩하는 분비 신호 코딩 서열을 포함하는 구축물과 관련하여, 관심 있는 이종 단백질 또는 폴리펩티드를 코딩하는 서열은 슈도모나스 플루오레센스 가용성 용해성 뮤레인 트랜스글리코실라제(SlmT)를 코딩하지 않는 서열이다. 숙주 세포와 관련하여, 용어 이종은 특정 숙주 세포에 대한 천연 단백질 또는 폴리펩티드가 아닌 관심 있는 단백질 또는 폴리펩티드를 의미할 수 있다.
본 발명은 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 단계를 포함하는, 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법을 포함하고, 이때 원핵 숙주 세포는 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 이때 상기 분비 신호 펩티드는 서열번호 11의 아미노산 서열을 포함하고, 상기 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아니다.
일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 주변세포질에서 발현되고 분비 신호 펩티드, 예를 들어, 서열번호 11로부터 적절하게 절단된다. 일부 실시양태에서, 분비 신호 펩티드는 적절하게 절단된 형태, 가용성 형태, 활성 형태 또는 이들의 임의의 조합으로 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도한다. 정확하게 또는 적절히 절단되거나 처리된 관심 있는 단백질 또는 폴리펩티드는 온전한 또는 실질적으로 온전한 N-말단을 가질 수 있다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함한다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함하지 않는다. 관심 있는 단백질 또는 폴리펩티드는 활성, 용해도 또는 이들 둘 다를 위해 실질적으로 온전한 N-말단을 요구할 수 있다. 일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 대조군과 비교될 때 약 80% 내지 100% 활성을 가진다. 일부 실시양태에서, 대조군은 N-말단 메티오닌을 포함하는 동일한 관심 있는 단백질 또는 폴리펩티드이다. 일부 실시양태에서, 대조군은 N-말단 메티오닌을 포함하지 않는 동일한 관심 있는 단백질 또는 폴리펩티드이다. 일부 실시양태에서, 대조군은 실질적으로 온전한 N-말단을 가진 동일한 관심 있는 단백질 또는 폴리펩티드이다. 일부 실시양태에서, 발현되거나 생성된 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 약 80% 내지 약 100%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 92%, 약 80% 내지 약 94%, 약 80% 내지 약 95%, 약 80% 내지 약 96%, 약 80% 내지 약 97%, 약 80% 내지 약 98%, 약 80% 내지 약 99%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 92%, 약 85% 내지 약 94%, 약 85% 내지 약 95%, 약 85% 내지 약 96%, 약 85% 내지 약 97%, 약 85% 내지 약 98%, 약 85% 내지 약 99%, 약 85% 내지 약 100%, 약 90% 내지 약 92%, 약 90% 내지 약 94%, 약 90% 내지 약 95%, 약 90% 내지 약 96%, 약 90% 내지 약 97%, 약 90% 내지 약 98%, 약 90% 내지 약 99%, 약 90% 내지 약 100%, 약 92% 내지 약 94%, 약 92% 내지 약 95%, 약 92% 내지 약 96%, 약 92% 내지 약 97%, 약 92% 내지 약 98%, 약 92% 내지 약 99%, 약 92% 내지 약 100%, 약 94% 내지 약 95%, 약 94% 내지 약 96%, 약 94% 내지 약 97%, 약 94% 내지 약 98%, 약 94% 내지 약 99%, 약 94% 내지 약 100%, 약 95% 내지 약 96%, 약 95% 내지 약 97%, 약 95% 내지 약 98%, 약 95% 내지 약 99%, 약 95% 내지 약 100%, 약 96% 내지 약 97%, 약 96% 내지 약 98%, 약 96% 내지 약 99%, 약 96% 내지 약 100%, 약 97% 내지 약 98%, 약 97% 내지 약 99%, 약 97% 내지 약 100%, 약 98% 내지 약 99%, 약 98% 내지 약 100%, 또는 약 99% 내지 약 100%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 약 80%, 약 85%, 약 90%, 약 92%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 약 100%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 적어도 약 80%, 약 85%, 약 90%, 약 92%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 최대 약 85%, 약 90%, 약 92%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 약 100%의 활성을 가진다.
일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 5 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 0.2 g/ℓ, 약 0.1 g/ℓ 내지 약 0.3 g/ℓ, 약 0.1 g/ℓ 내지 약 0.4 g/ℓ, 약 0.1 g/ℓ 내지 약 0.5 g/ℓ, 약 0.1 g/ℓ 내지 약 0.6 g/ℓ, 약 0.1 g/ℓ 내지 약 0.7 g/ℓ, 약 0.1 g/ℓ 내지 약 0.8 g/ℓ, 약 0.1 g/ℓ 내지 약 0.9 g/ℓ, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 2 g/ℓ, 약 0.1 g/ℓ 내지 약 3 g/ℓ, 약 0.2 g/ℓ 내지 약 0.3 g/ℓ, 약 0.2 g/ℓ 내지 약 0.4 g/ℓ, 약 0.2 g/ℓ 내지 약 0.5 g/ℓ, 약 0.2 g/ℓ 내지 약 0.6 g/ℓ, 약 0.2 g/ℓ 내지 약 0.7 g/ℓ, 약 0.2 g/ℓ 내지 약 0.8 g/ℓ, 약 0.2 g/ℓ 내지 약 0.9 g/ℓ, 약 0.2 g/ℓ 내지 약 1 g/ℓ, 약 0.2 g/ℓ 내지 약 2 g/ℓ, 약 0.2 g/ℓ 내지 약 3 g/ℓ, 약 0.3 g/ℓ 내지 약 0.4 g/ℓ, 약 0.3 g/ℓ 내지 약 0.5 g/ℓ, 약 0.3 g/ℓ 내지 약 0.6 g/ℓ, 약 0.3 g/ℓ 내지 약 0.7 g/ℓ, 약 0.3 g/ℓ 내지 약 0.8 g/ℓ, 약 0.3 g/ℓ 내지 약 0.9 g/ℓ, 약 0.3 g/ℓ 내지 약 1 g/ℓ, 약 0.3 g/ℓ 내지 약 2 g/ℓ, 약 0.3 g/ℓ 내지 약 3 g/ℓ, 약 0.4 g/ℓ 내지 약 0.5 g/ℓ, 약 0.4 g/ℓ 내지 약 0.6 g/ℓ, 약 0.4 g/ℓ 내지 약 0.7 g/ℓ, 약 0.4 g/ℓ 내지 약 0.8 g/ℓ, 약 0.4 g/ℓ 내지 약 0.9 g/ℓ, 약 0.4 g/ℓ 내지 약 1 g/ℓ, 약 0.4 g/ℓ 내지 약 2 g/ℓ, 약 0.4 g/ℓ 내지 약 3 g/ℓ, 약 0.5 g/ℓ 내지 약 0.6 g/ℓ, 약 0.5 g/ℓ 내지 약 0.7 g/ℓ, 약 0.5 g/ℓ 내지 약 0.8 g/ℓ, 약 0.5 g/ℓ 내지 약 0.9 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 3 g/ℓ, 약 0.6 g/ℓ 내지 약 0.7 g/ℓ, 약 0.6 g/ℓ 내지 약 0.8 g/ℓ, 약 0.6 g/ℓ 내지 약 0.9 g/ℓ, 약 0.6 g/ℓ 내지 약 1 g/ℓ, 약 0.6 g/ℓ 내지 약 2 g/ℓ, 약 0.6 g/ℓ 내지 약 3 g/ℓ, 약 0.7 g/ℓ 내지 약 0.8 g/ℓ, 약 0.7 g/ℓ 내지 약 0.9 g/ℓ, 약 0.7 g/ℓ 내지 약 1 g/ℓ, 약 0.7 g/ℓ 내지 약 2 g/ℓ, 약 0.7 g/ℓ 내지 약 3 g/ℓ, 약 0.8 g/ℓ 내지 약 0.9 g/ℓ, 약 0.8 g/ℓ 내지 약 1 g/ℓ, 약 0.8 g/ℓ 내지 약 2 g/ℓ, 약 0.8 g/ℓ 내지 약 3 g/ℓ, 약 0.9 g/ℓ 내지 약 1 g/ℓ, 약 0.9 g/ℓ 내지 약 2 g/ℓ, 약 0.9 g/ℓ 내지 약 3 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 3 g/ℓ, 또는 약 2 g/ℓ 내지 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ, 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.6 g/ℓ, 약 0.7 g/ℓ, 약 0.8 g/ℓ, 약 0.9 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ 또는 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 적어도 약 0.1 g/ℓ, 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.6 g/ℓ, 약 0.7 g/ℓ, 약 0.8 g/ℓ, 약 0.9 g/ℓ, 약 1 g/ℓ 또는 약 2 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 최대 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.6 g/ℓ, 약 0.7 g/ℓ, 약 0.8 g/ℓ, 약 0.9 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ 또는 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 0.5 g/ℓ, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 2 g/ℓ, 약 0.1 g/ℓ 내지 약 5 g/ℓ, 약 0.1 g/ℓ 내지 약 10 g/ℓ, 약 0.1 g/ℓ 내지 약 15 g/ℓ, 약 0.1 g/ℓ 내지 약 20 g/ℓ, 약 0.1 g/ℓ 내지 약 25 g/ℓ, 약 0.1 g/ℓ 내지 약 30 g/ℓ, 약 0.1 g/ℓ 내지 약 40 g/ℓ, 약 0.1 g/ℓ 내지 약 50 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 5 g/ℓ, 약 0.5 g/ℓ 내지 약 10 g/ℓ, 약 0.5 g/ℓ 내지 약 15 g/ℓ, 약 0.5 g/ℓ 내지 약 20 g/ℓ, 약 0.5 g/ℓ 내지 약 25 g/ℓ, 약 0.5 g/ℓ 내지 약 30 g/ℓ, 약 0.5 g/ℓ 내지 약 40 g/ℓ, 약 0.5 g/ℓ 내지 약 50 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 10 g/ℓ, 약 1 g/ℓ 내지 약 15 g/ℓ, 약 1 g/ℓ 내지 약 20 g/ℓ, 약 1 g/ℓ 내지 약 25 g/ℓ, 약 1 g/ℓ 내지 약 30 g/ℓ, 약 1 g/ℓ 내지 약 40 g/ℓ, 약 1 g/ℓ 내지 약 50 g/ℓ, 약 2 g/ℓ 내지 약 5 g/ℓ, 약 2 g/ℓ 내지 약 10 g/ℓ, 약 2 g/ℓ 내지 약 15 g/ℓ, 약 2 g/ℓ 내지 약 20 g/ℓ, 약 2 g/ℓ 내지 약 25 g/ℓ, 약 2 g/ℓ 내지 약 30 g/ℓ, 약 2 g/ℓ 내지 약 40 g/ℓ, 약 2 g/ℓ 내지 약 50 g/ℓ, 약 5 g/ℓ 내지 약 10 g/ℓ, 약 5 g/ℓ 내지 약 15 g/ℓ, 약 5 g/ℓ 내지 약 20 g/ℓ, 약 5 g/ℓ 내지 약 25 g/ℓ, 약 5 g/ℓ 내지 약 30 g/ℓ, 약 5 g/ℓ 내지 약 40 g/ℓ, 약 5 g/ℓ 내지 약 50 g/ℓ, 약 10 g/ℓ 내지 약 15 g/ℓ, 약 10 g/ℓ 내지 약 20 g/ℓ, 약 10 g/ℓ 내지 약 25 g/ℓ, 약 10 g/ℓ 내지 약 30 g/ℓ, 약 10 g/ℓ 내지 약 40 g/ℓ, 약 10 g/ℓ 내지 약 50 g/ℓ, 약 15 g/ℓ 내지 약 20 g/ℓ, 약 15 g/ℓ 내지 약 25 g/ℓ, 약 15 g/ℓ 내지 약 30 g/ℓ, 약 15 g/ℓ 내지 약 40 g/ℓ, 약 15 g/ℓ 내지 약 50 g/ℓ, 약 20 g/ℓ 내지 약 25 g/ℓ, 약 20 g/ℓ 내지 약 30 g/ℓ, 약 20 g/ℓ 내지 약 40 g/ℓ, 약 20 g/ℓ 내지 약 50 g/ℓ, 약 25 g/ℓ 내지 약 30 g/ℓ, 약 25 g/ℓ 내지 약 40 g/ℓ, 약 25 g/ℓ 내지 약 50 g/ℓ, 약 30 g/ℓ 내지 약 40 g/ℓ, 약 30 g/ℓ 내지 약 50 g/ℓ, 또는 약 40 g/ℓ 내지 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 40 g/ℓ 또는 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 상기 공정은 적어도 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ 또는 약 40 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 상기 공정은 최대 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 40 g/ℓ 또는 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다.
일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 약 5 내지 약 100이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 약 5 내지 약 10, 약 5 내지 약 20, 약 5 내지 약 30, 약 5 내지 약 40, 약 5 내지 약 50, 약 5 내지 약 60, 약 5 내지 약 70, 약 5 내지 약 80, 약 5 내지 약 90, 약 5 내지 약 95, 약 5 내지 약 100, 약 10 내지 약 20, 약 10 내지 약 30, 약 10 내지 약 40, 약 10 내지 약 50, 약 10 내지 약 60, 약 10 내지 약 70, 약 10 내지 약 80, 약 10 내지 약 90, 약 10 내지 약 95, 약 10 내지 약 100, 약 20 내지 약 30, 약 20 내지 약 40, 약 20 내지 약 50, 약 20 내지 약 60, 약 20 내지 약 70, 약 20 내지 약 80, 약 20 내지 약 90, 약 20 내지 약 95, 약 20 내지 약 100, 약 30 내지 약 40, 약 30 내지 약 50, 약 30 내지 약 60, 약 30 내지 약 70, 약 30 내지 약 80, 약 30 내지 약 90, 약 30 내지 약 95, 약 30 내지 약 100, 약 40 내지 약 50, 약 40 내지 약 60, 약 40 내지 약 70, 약 40 내지 약 80, 약 40 내지 약 90, 약 40 내지 약 95, 약 40 내지 약 100, 약 50 내지 약 60, 약 50 내지 약 70, 약 50 내지 약 80, 약 50 내지 약 90, 약 50 내지 약 95, 약 50 내지 약 100, 약 60 내지 약 70, 약 60 내지 약 80, 약 60 내지 약 90, 약 60 내지 약 95, 약 60 내지 약 100, 약 70 내지 약 80, 약 70 내지 약 90, 약 70 내지 약 95, 약 70 내지 약 100, 약 80 내지 약 90, 약 80 내지 약 95, 약 80 내지 약 100, 약 90 내지 약 95, 약 90 내지 약 100, 또는 약 95 내지 약 100이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 약 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 95 또는 약 100이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 적어도 약 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90 또는 약 95이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 최대 약 10, 약 20, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 95 또는 약 100이다.
분비 신호 펩티드에 융합된 재조합 단백질 및 폴리펩티드의 처리/절단 및 주변세포질 발현에 관한 참고문헌을 포함하는, 하기 특허 및 특허 출원은 그 전체가 본원에 참고로 포함된다: 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression"), 미국 특허 제7,985,564호("Expression systems with Sec-system secretion"), 미국 특허 제9,394,571호 및 제9,580,719호(둘 다 발명의 명칭이 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins"임), 미국 특허 제9,453,251호("Expression of Mammalian Proteins in Pseudomonas fluorescens"), 미국 특허 제8,603,824호("Process for Improved Protein Expression by Strain Engineering"), 미국 특허 제8,530,171호("High Level Expression of Recombinant Toxin Proteins"), 및 미국 특허 출원 공개 제2019/0127744호("Bacterial Leader Sequences for Periplasmic Protein Expression").
실시양태에서, 분비 신호 서열은 서열번호 11로 제시된 분비 신호 펩티드와 동일하거나 실질적으로 동일하고/하거나, 서열번호 12로 제시된 폴리뉴클레오타이드 서열에 의해 코딩된다. 또 다른 실시양태에서, 분비 신호 서열은 서열번호 11의 적어도 아미노산 2-29를 포함한다. 또 다른 실시양태에서, 분비 신호 서열은 아미노 말단으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 아미노산이 절단되어 있으나 생물학적 활성, 즉 분비 신호 활성을 보유하는, 서열번호 11의 단편을 포함한다.
한 실시양태에서, 펩티드의 아미노산 서열은 주어진 원래 펩티드의 변이체이고, 이때 변이체의 서열은, 변이체가 원래 펩티드의 원하는 기능을 보유하는 한, 최대 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29% 또는 30% 포함하는, 원래 펩티드의 아미노산 잔기의 최대 또는 약 30%를 다른 아미노산 잔기(들)로 대체함으로써 수득될 수 있다. 실질적인 상동성을 가진 변이체 아미노산은 원래 펩티드와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 적어도 약 99% 상동할 것이다. 변이체 아미노산 서열은 서열번호 11의 하나 이상의 아미노산의 아미노산 치환, 결실, 절단 및 삽입을 포함하는 다양한 방식으로 수득될 수 있다. 일부 실시양태에서, 변이체 아미노산 서열은 1개 내지 9개의 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합을 포함한다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 1 내지 10이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 6 내지 10, 7 내지 8, 7 내지 9, 7 내지 10, 8 내지 9, 8 내지 10, 또는 9 내지 10이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 적어도 1, 2, 3, 4, 5, 6, 7, 8 또는 9이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 최대 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다.
"실질적으로 상동한", "실질적으로 동일한" 또는 "실질적으로 유사한"은 표준 파라미터를 사용하는, 본원에 기재되어 있거나 당분야에 알려져 있는 적합한 정렬 프로그램을 사용하여 기준 서열과 비교하였을 때 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 약 또는 적어도 약 99%, 또는 더 큰 퍼센트의 서열 동일성을 가진 아미노산 또는 뉴클레오타이드 서열을 의미한다. 당업자는 코돈 축퇴성, 아미노산 유사성, 리딩 프레임 위치선정 등을 고려하여 2개의 뉴클레오타이드 서열에 의해 코딩된 단백질의 상응하는 동일성을 측정하기 위해 이들 값을 적절하게 조절할 수 있음을 인식할 것이다.
실시양태에서, 본 발명에 사용되는 분비 신호 펩티드는 "비필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "비필수" 아미노산 잔기는 원래 분비 신호 펩티드("유사체" 또는 "기준" 펩티드로서도 지칭됨)의 활성(예를 들어, 아고니스트 활성)을 제거하거나 실질적으로 감소시키지 않으면서 신규 아미노산 서열에서 변경, 예를 들어, 결실, 치환 또는 유도체화될 수 있는 잔기이다. 일부 실시양태에서, 분비 신호 펩티드는 "필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "필수" 아미노산 잔기는 신규 아미노산 서열에서 변경, 예를 들어, 결실, 치환 또는 유도체화될 때 기준 펩티드의 활성을 실질적으로 감소시키거나 제거하는 잔기이다. 필수 아미노산 잔기가 변경되는 이러한 실시양태에서, 변형된 분비 신호 펩티드는 원래 분비 신호의 활성을 가질 수 있다. 치환, 삽입 및 결실은 N-말단 또는 C-말단에 있을 수 있거나, 분비 신호의 내부 부분에 있을 수 있다. 예를 들어, 분비 신호 펩티드는 분비 신호 펩티드 전체에 걸쳐 연속적인 방식으로 또는 간격을 두고 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 치환을 포함할 수 있다. 분비 신호 펩티드는 단독으로 또는 치환과 함께, 마찬가지로 분비 신호 펩티드 전체에 걸쳐 연속적인 방식으로 또는 간격을 두고 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 삽입을 포함할 수 있다. 분비 신호 펩티드는 단독으로 또는 치환 및/또는 삽입과 함께, 펩티드 전체에 걸쳐 연속적인 방식으로 또는 간격을 두고 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 결실도 포함할 수 있다. 분비 신호 펩티드는 단독으로 또는 치환, 삽입 및/또는 결실과 함께, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 아미노산 추가도 포함할 수 있다.
치환은 보존적 아미노산 치환을 포함한다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄 또는 물리화학적 특성(예를 들어, 정전기적, 수소 결합, 등배체, 소수성 특징)을 가진 아미노산 잔기로 대체되는 치환이다. 아미노산은 천연 생성 아미노산 또는 비천연 아미노산일 수 있다. 유사한 측쇄를 가진 아미노산 잔기의 계열이 당분야에 알려져 있다. 이 계열은 염기성 측쇄를 가진 아미노산(예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄를 가진 아미노산(예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄를 가진 아미노산(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 메티오닌, 시스테인), 비극성 측쇄를 가진 아미노산(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 트립토판), β-분지된 측쇄를 가진 아미노산(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄를 가진 아미노산(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다. 치환은 비보존적 변경도 포함할 수 있다.
본원에 포함된 관심 있는 변이체 단백질 또는 폴리펩티드는 생물학적 활성을 가진다. 즉, 이들은 관심 있는 원래 단백질 또는 폴리펩티드의 원하는 생물학적 활성을 계속 보유하며; 예를 들어, 변이체 분비 리더 펩티드는 분비 신호 활성을 보유한다. "활성을 보유한다"는 변이체가 원래 펩티드, 단백질 또는 폴리펩티드의 약 또는 적어도 약 30%, 약 또는 적어도 약 35%, 약 또는 적어도 약 40%, 약 또는 적어도 약 45%, 약 또는 적어도 약 50%, 약 또는 적어도 약 55%, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 약 또는 적어도 약 99%, 약 또는 적어도 약 100%, 약 또는 적어도 약 110%, 약 또는 적어도 약 125%, 약 또는 적어도 약 150%, 약 또는 적어도 약 200%, 또는 더 큰 퍼센트의 활성, 예를 들어, 분비 신호 활성을 가질 것임을 의미한다.
폴리뉴클레오타이드
본 개시내용은 관심 있는 단백질 또는 폴리펩티드를 그람 음성 박테리아의 주변세포질 또는 세포외 공간으로 표적화하는 데 유용한 신규 분비 신호를 코딩하는 서열을 가진 핵산도 포함한다. 한 실시양태에서, 단리된 폴리뉴클레오타이드는 Slmt 분비 신호 펩티드와 실질적으로 상동한 펩티드 서열을 코딩한다. 또 다른 실시양태에서, 본 개시내용은 서열번호 11의 적어도 아미노산 2-29와 실질적인 서열 동일성을 가진 펩티드 서열을 코딩하는 핵산을 제공하거나, 서열번호 12로 제시된 뉴클레오타이드 서열과 실질적인 서열 동일성을 가진 핵산을 제공하고, 이들의 생물학적 활성 변이체 및 단편을 포함한다. 또 다른 실시양태에서, 핵산 서열은 서열번호 12로 제시된 핵산 서열과 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 또는 약 또는 적어도 약 99%, 또는 더 큰 퍼센트의 동일성을 가진다.
실시양태에서, 본원의 분비 신호 펩티드는 서열번호 12로 제시된 뉴클레오타이드 서열과 실질적으로 동일한 뉴클레오타이드 서열에 의해 코딩된다. 본 발명의 분비 신호 서열과 실질적인 동일성을 가진 상응하는 분비 신호 펩티드 서열은 당분야에 알려져 있거나 문헌에 기재되어 있는 임의의 적절한 방법, 예를 들어, PCR, 하이브리드화 방법을 이용함으로써 확인될 수 있다. 예를 들어, 문헌[Sambrook J., and Russell, D.W., 2001, Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; and Innis, et al., 1990, PCR Protocols: A Guide to Methods and Applications; Academic Press, NY]을 참조한다. 변이체 뉴클레오타이드 서열은 예를 들어, 부위 지정 돌연변이유발을 이용함으로써 생성된 합성 유래 뉴클레오타이드 서열을 포함할 수 있다. 실시양태에서, 돌연변이된 서열은 본원에 개시된 분비 신호 펩티드를 여전히 코딩한다. 변이체 분비 신호 펩티드는 생물학적 활성을 갖고 있다. 즉, 이 펩티드는 천연 단백질의 원하는 생물학적 활성을 계속 보유한다. 즉, 이 펩티드는 분비 신호전달 활성을 보유한다. "활성을 보유한다"는 변이체가 원래 분비 신호 펩티드의 약 30%, 약 또는 적어도 약 35%, 약 또는 적어도 약 40%, 약 또는 적어도 약 45%, 약 또는 적어도 약 50%, 약 또는 적어도 약 55%, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 약 또는 적어도 약 99%, 약 또는 적어도 약 100%, 약 또는 적어도 약 110%, 약 또는 적어도 약 125%, 약 또는 적어도 약 150%, 약 또는 적어도 약 200%, 또는 더 큰 퍼센트의 활성을 가질 것임을 의미한다. 임의의 적절한 방법을 이용하여 펩티드, 단백질 또는 폴리펩티드 활성, 예를 들어, 분비 신호 활성을 측정할 수 있다. 이러한 방법은 당분야에 잘 알려져 있고, 이의 예는 본원에 논의되어 있다.
숙련된 당업자는 일부 경우 변화가 돌연변이에 의해 본원에서 제공된 뉴클레오타이드 서열에 도입됨으로써, 분비 신호 펩티드의 생물학적 활성을 변경시키지 않으면서, 코딩된 분비 신호 펩티드의 아미노산 서열의 변화로 이어진다는 것도 인식할 것이다. 따라서, 변이체 단리된 핵산 분자는 하나 이상의 아미노산 치환, 추가 또는 결실이 코딩된 단백질에 도입되도록 하나 이상의 뉴클레오타이드 치환, 추가 또는 결실을 본원에 개시된 상응하는 뉴클레오타이드 서열에 도입함으로써 종종 생성된다. 돌연변이는 당업자에게 알려져 있는 임의의 표준 기법, 예를 들어, 부위 지정 돌연변이유발 및 PCR 매개 돌연변이유발에 의해 도입될 수 있다.
핵산 및 아미노산 서열 동일성 또는 상동성은 본원에 기재된 방법들을 포함하나 이들로 제한되지 않는, 당분야에 알려져 있는 임의의 적합한 방법에 따라 측정될 수 있다.
일부 경우, 본원의 방법은 Slmt 분비 신호 서열, 또는 서열번호 11로서 본원에 개시된 분비 신호 펩티드 서열과 실질적으로 상동하거나 유사한 서열로 구성된 군으로부터 선택된 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 폴리펩티드를 발현시키는 단계를 포함한다. 실시양태에서, 분비 신호 펩티드 서열은 서열번호 12로 제시된 뉴클레오타이드 서열에 의해 코딩된다. 일부 실시양태에서, 발현 구축물은 슈도모나드 숙주 세포에 존재한다. 일부 경우, 발현 구축물은 플라스미드이다. 일부 실시양태에서, 관심 있는 폴리펩티드 또는 단백질을 코딩하는 플라스미드는 선택 마커를 포함하고, 플라스미드를 유지하는 숙주 세포는 선택 조건 하에서 생장한다. 일부 실시양태에서, 플라스미드는 선택 마커를 포함하지 않는다. 일부 실시양태에서, 발현 구축물은 숙주 세포 게놈에 통합된다.
본 발명은 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드를 생성하기 위한 발현 구축물을 포함한다. 발현 구축물은 관심 있는 단백질 또는 폴리펩티드를 코딩하는 핵산 서열에 작동 가능하게 연결된, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 실시양태에서, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열은 서열번호 12로 제시된 핵산 서열과 동일하거나 실질적으로 동일한 서열을 가진다. 일부 실시양태에서, 핵산 서열은 서열번호 12로 제시된 핵산 서열과 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 가진다.
발현 벡터는 관심 있는 단백질 또는 폴리펩티드를 코딩하는 핵산 서열에 작동 가능하게 연결된, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열을 포함하는 발현 구축물을 포함할 수 있다. 일부 실시양태에서, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열은 서열번호 12로 제시된 핵산 서열과 동일하거나 실질적으로 동일한 서열을 가진다. 일부 실시양태에서, 핵산 서열은 서열번호 12로 제시된 핵산 서열과 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 가진다.
슈도모나스 숙주 균주를 비롯한 숙주 균주에서 본 발명의 방법에 유용한 조절 서열(예를 들어, 프로모터, 분비 리더 및 리보좀 결합 부위)을 포함하는 이종 단백질을 발현시키는 방법은 본원 전체에 개시된 바와 같이 이용될 수 있다. 이러한 방법은 당분야에 알려져 있으며, 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression"), 미국 특허 제7,985,564호("Expression systems with Sec-system secretion"), 미국 특허 제9,394,571호 및 제9,580,719호(이들 둘 다의 발명의 명칭은 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins"임), 미국 특허 제9,458,487호 및 제9,453,251호(이들 둘 다의 발명의 명칭은 "Expression of mammalian proteins in Pseudomonas fluorescens"임), 미국 특허 제8,603,824호("Process for Improved Protein Expression by Strain Engineering"), 및 미국 특허 제8,530,171호("High Level Expression of Recombinant Toxin Proteins")에 기재되어 있다. 실시양태에서, 본 발명과 관련하여 사용된 분비 리더는 미국 특허 제7,618,799호, 미국 특허 제7,985,564호, 미국 특허 제9,394,571호, 미국 특허 제9,580,719호, 미국 특허 제9,453,251호, 미국 특허 제8,603,824호 및 미국 특허 제8,530,171호 중 임의의 특허에 개시된 바와 같은 분비 리더이다. 이 특허들은 또한 이종 단백질 발현을 증가시키기 위해 폴딩 조절인자를 과발현하도록 조작되었거나 프로테아제 돌연변이가 도입되어 있는, 본원의 방법을 실시하는 데 유용한 박테리아 숙주 균주도 설명한다. 실시양태에서, 본 발명의 방법에 사용되는 발현 숙주 세포는 본원에 기재된 임의의 발현 숙주 세포이다.
예시적인 실시양태
1. 재조합 단백질 발현을 위한 재조합 그람 음성 박테리아 숙주 세포로서,
(a) 제1 프로테아제 활성이 결핍되어 있고, 이때 제1 프로테아제 활성이 꼬리 특이적 프로테아제 활성이고, 제1 프로테아제 활성의 결핍이 꼬리 특이적 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
(b) 제2 프로테아제 활성이 결핍되어 있고, 이때 제2 프로테아제 활성이 뮤레인 DD-엔도펩티다제 활성이고, 제2 프로테아제 활성의 결핍이 뮤레인 DD-엔도펩티다제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되는 것인 재조합 그람 음성 박테리아 숙주 세포.
2. 실시양태 1에 있어서, 추가로
(c) 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 이때 추가 프로테아제 활성의 결핍이 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 상기 추가 프로테아제가 (a) 및 (b)의 프로테아제와 상이하거나;
(d) 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 이때 자가용해 인자 활성의 결핍이 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되거나;
(e) 하나 이상의 불활성화된 프로테아제를 과발현하거나;
(f) 하나 이상의 폴딩 조절인자를 과발현하거나;
(g) (c), (d), (e) 및 (f)의 임의의 조합을 나타내는 재조합 그람 음성 박테리아 숙주 세포.
3. 실시양태 1 또는 2에 있어서, 꼬리 특이적 프로테아제 활성의 결핍이 (i) 서열번호 33으로 제시된 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제, 서열번호 33의 상동체, 또는 서열번호 33과 적어도 30% 유사한 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제 관련 단백질; (ii) 서열번호 35로 제시된 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제, 서열번호 35의 상동체, 또는 서열번호 35와 적어도 30% 유사한 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제 관련 단백질; 또는 (iii) 서열번호 71로 제시된 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제, 서열번호 71의 상동체, 또는 서열번호 71과 적어도 30% 유사한 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
4. 실시양태 1 내지 3 중 어느 한 실시양태에 있어서, 뮤레인 DD-엔도펩티다제 활성의 결핍이
(i) 서열번호 1로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 1의 상동체, 또는 서열번호 1과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
(ii) 서열번호 63으로 제시된 아미노산 서열을 가진 MepM 뮤레인 DD-엔도펩티다제, 서열번호 63의 상동체, 또는 서열번호 63과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
(iii) 서열번호 65로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 65의 상동체, 또는 서열번호 65와 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; 및
(iv) 서열번호 66으로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 66의 상동체, 또는 서열번호 66과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질
중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
5. 실시양태 2 내지 4 중 어느 한 실시양태에 있어서, (c)의 숙주 세포는 1개 내지 10개의 상이한 추가 프로테아제 활성이 결핍되어 있거나; (d)의 숙주 세포는 1개 내지 5개의 상이한 자가용해 인자 활성이 결핍되어 있거나; (e)의 숙주 세포는 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현하고, 이때 각각의 불활성화된 프로테아제는 상이하거나; (f)의 숙주 세포는 1개 내지 10개의 상이한 폴딩 조절인자를 과발현하거나, 이들의 임의의 조합이 이루어진 것인 재조합 그람 음성 박테리아 숙주 세포.
6. 실시양태 2 내지 5 중 어느 한 실시양태에 있어서,
(c)의 하나 이상의 추가 프로테아제 활성의 결핍이 세랄라이신 전구체, 막 국소화 프로테아제, 뮤레인 L,D 트랜스펩티다제, 헤모라이신 전구체, D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 주변세포질 세린 엔도프로테아제, AAA+ 패밀리 단백질용해 기구, 및 (a)와 상이한 뮤레인 DD-엔도펩티다제로부터 독립적으로 선택된 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (d)의 하나 이상의 자가용해 인자 활성의 결핍이 S형 피오신, 선형 그라미시딘 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신 및 포린으로부터 독립적으로 선택된 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (e)의 하나 이상의 불활성화된 프로테아제가 돌연변이체 주변세포질 세린 엔도프로테아제이고; (f)의 하나 이상의 폴딩 조절인자가 디설파이드 이소머라제인 재조합 그람 음성 박테리아 숙주 세포.
7. 실시양태 6에 있어서, 세랄라이신 전구체가
서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 및 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질
로부터 선택되고;
막 국소화 프로테아제가 서열번호 39로 제시된 아미노산 서열을 가진 HtpX, 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체, 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질이고;
뮤레인 L,D 트랜스펩티다제가 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제, 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체, 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질이고;
헤모라이신 전구체가 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체, 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체, 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질이고;
D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체가 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체, 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질이고;
주변세포질 세린 엔도프로테아제가
서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질;
서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP의 상동체; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질;
서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP의 상동체; 및 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질
로부터 선택되고;
AAA+ 패밀리 단백질용해 기구가 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하고;
뮤레인 DD-엔도펩티다제가
서열번호 3으로 제시된 아미노산 서열을 가진 슈도모나스 플루오레센스 MepM2 프로테아제; 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 및 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질
로부터 선택되고;
S형 피오신이 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신, 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체, 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질이고;
선형 그라미시딘 합성효소가 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소, 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체, 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질이고;
류코톡신이 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신, 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체, 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질이고;
ShlB 헤모라이신 수송체가 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체, 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체, 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질이고;
하나 이상의 과발현된 불활성화된 프로테아제 각각이 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 및 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택되고;
하나 이상의 폴딩 조절인자 각각이 서열번호 60, 76, 77, 78, 80 및 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제의 상동체; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 한 서열번호로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 결합 이소머라제 관련 단백질; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제의 상동체; 및 서열번호 27 및 82 내지 98로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 단백질 디설파이드 이소머라제 관련 단백질로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
8. 상기 실시양태들 중 임의의 실시양태에 있어서, 돌연변이가 상응하는 유전자의 코딩 서열 또는 비코딩 서열에 있고, 돌연변이가 (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
9. 실시양태 8에 있어서, (iii)의 미스센스 돌연변이가 보존적 또는 비보존적 아미노산 치환을 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
10. 실시양태 8 또는 9에 있어서, 비코딩 서열이 조절 서열인 재조합 그람 음성 박테리아 숙주 세포.
11. 상기 실시양태들 중 임의의 실시양태에 있어서, 기능성 프로테아제 활성을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포로서, 기능성 프로테아제 활성이 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
12. 상기 실시양태들 중 임의의 실시양태에 있어서, 기능성 프로테아제 활성을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포로서, 기능성 프로테아제 활성이 서열번호 7로 제시된 아미노산 서열을 가진 MepS2; 서열번호 7로 제시된 아미노산 서열을 가진 MepS2의 상동체; 또는 서열번호 7로 제시된 슈도모나스 플루오레센스 MepS2 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS2 관련 단백질인 재조합 그람 음성 박테리아 숙주 세포.
13. 실시양태 11 또는 12에 있어서, 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포.
14. 상기 실시양태들 중 임의의 실시양태에 있어서, 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포로서, 제1 프로테아제 활성의 결핍이 슈도모나스 플루오레센스 Prc1을 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이 및/또는 슈도모나스 플루오레센스 Prc2를 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
15. 상기 실시양태들 중 임의의 실시양태에 있어서, 제2 프로테아제 활성이 제2 프로테아제 활성을 가진 프로테아제의 활성 부위 아미노산 또는 알로스테릭 부위 아미노산의 보존적 또는 비보존적 치환을 야기하는 돌연변이로 인해 결핍된 것인 재조합 그람 음성 박테리아 숙주 세포.
16. 상기 실시양태들 중 임의의 실시양태에 있어서, 제2 프로테아제 활성의 결핍이 제2 프로테아제 유전자의 적어도 하나의 돌연변이로부터 비롯되고, 이때 돌연변이가 (i) 서열번호 1의 잔기 134 내지 145 중 어느 하나 이상의 잔기; (ii) 서열번호 1의 잔기 319 내지 411 중 어느 하나 이상의 잔기; (iii) 서열번호 1의 잔기 361 내지 378 중 어느 하나 이상의 잔기; (iv) 서열번호 1의 248, 319, 330, 332, 334, 337, 378, 410 및 411로부터 선택된 어느 하나 이상의 잔기; 또는 (i), (ii), (iii) 및 (iv)의 임의의 조합에 상응하는 위치에서 아미노산 서열의 파괴를 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
17. 상기 실시양태들 중 임의의 실시양태에 있어서, 슈도모나스 플루오레센스인 재조합 그람 음성 박테리아 숙주 세포로서, 제2 프로테아제 활성의 결핍이 Y248stop, G332S, D334N, A337T, H411Y, P410L로부터 선택된 서열번호 1의 아미노산 치환, 및 R319, H330, D334, H378 및 H411 중 어느 하나의 임의의 보존적 또는 비보존적 아미노산 치환을 야기하는 유전자 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
18. 상기 실시양태들 중 임의의 실시양태에 있어서, 배양물에서 고밀도 세포 생장을 할 수 있는 재조합 그람 음성 박테리아 숙주 세포.
19. 실시양태 18에 있어서, 배양물에서의 고밀도 세포 생장이 약 80 내지 약 300의 OD575까지의 생장을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
20. 실시양태 18 또는 19에 있어서, 배양물에서의 고밀도 세포 생장이 대조군 세포에 비해 약 2배 내지 약 15배 증가되는 것인 재조합 그람 음성 박테리아 숙주 세포.
21. 실시양태 20에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
(i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
(ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(c)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(c)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
(iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
22. 실시양태 21에 있어서, 2(c)의 추가 프로테아제 활성이 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
23. 상기 실시양태들 중 임의의 실시양태에 있어서, 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 각각 포함하는 적어도 하나의 발현 구축물을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
24. 실시양태 23에 있어서, 관심 있는 재조합 단백질이 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 또는 이종 단백질인 재조합 그람 음성 박테리아 숙주 세포.
25. 실시양태 23에 있어서, 관심 있는 재조합 단백질이 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 항체 기반 약물, 비항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
26. 실시양태 23 내지 25 중 어느 한 실시양태에 있어서, 관심 있는 재조합 단백질이 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질인 재조합 그람 음성 박테리아 숙주 세포.
27. 실시양태 25 또는 26에 있어서, 항체, 항체 단편 또는 이의 유도체가 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 트리바디; 인트라바디; 나노바디; 소형 모듈식 면역약제(SMIP); 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; 및 VHH로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
28. 실시양태 27에 있어서, VHH 함유 항체가 VHH 연쇄 항체인 재조합 그람 음성 박테리아 숙주 세포.
29. 실시양태 25 내지 28 중 어느 한 실시양태에 있어서, 항체, 항체 단편 또는 이의 유도체가 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자, 및 혈액 인자로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
30. 실시양태 25 내지 29 중 어느 한 실시양태에 있어서, 항체, 항체 단편 또는 이의 유도체가 Fab'인 재조합 그람 음성 박테리아 숙주 세포.
31. 실시양태 30에 있어서, Fab'가 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
32. 실시양태 25 내지 31 중 어느 한 실시양태에 있어서, 항체, 항체 단편, 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄가 전체 길이 또는 중쇄 단편이고, 경쇄가 전체 길이 또는 경쇄 단편인 재조합 그람 음성 박테리아 숙주 세포.
33. 실시양태 32에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
34. 실시양태 32 또는 33에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 동일한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
35. 실시양태 32 또는 33에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 상이한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
36. 실시양태 34 또는 35에 있어서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각이 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
37. 실시양태 36에 있어서, 주변세포질 분비 신호가 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
38. 실시양태 34 내지 37 중 어느 한 실시양태에 있어서, 발현 구축물이 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 항체 중쇄를 코딩하는 핵산 서열; 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 경쇄를 코딩하는 핵산 서열; 또는 이들 둘 다를 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
39. 실시양태 25 내지 38 중 어느 한 실시양태에 있어서, 항체, 항체 단편 또는 이의 유도체가 인간화된 것인 재조합 그람 음성 박테리아 숙주 세포.
40. 실시양태 30 내지 39 중 어느 한 실시양태에 있어서, Fab'가 세르톨리주맙인 재조합 그람 음성 박테리아 숙주 세포.
41. 실시양태 40에 있어서, Fab' 중쇄가 서열번호 21로 제시된 아미노산 서열을 갖고, Fab' 경쇄가 서열번호 23으로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
42. 실시양태 32 내지 41 중 어느 한 실시양태에 있어서, 중쇄를 코딩하는 핵산 서열이 서열번호 11로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결되고, 경쇄를 코딩하는 핵산 서열이 서열번호 13으로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
43. 실시양태 1 내지 42 중 어느 한 실시양태에 있어서,
(i) 제1 프로테아제 활성;
(ii) 제2 프로테아제 활성;
(iii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체, 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체, 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성;
(iv) 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및
(v) 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질
이 결핍된 재조합 그람 음성 박테리아 숙주 세포.
44. 실시양태 43에 있어서, 외인성 불활성화된 DegP를 추가로 과발현하는 재조합 그람 음성 박테리아 숙주 세포로서, 불활성화된 DegP가 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 및 위치 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 하나 이상의 위치의 보존적 또는 비보존적 아미노산 치환 또는 파괴를 포함하는 서열번호 31로 제시된 아미노산 서열을 가진 각각의 프로테아제로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
45. 실시양태 43 또는 44에 있어서, 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 또는 73으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 이소머라제; 및 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 및 73으로 제시된 아미노산 서열을 가진 디설파이드 이소머라제의 상동체 중 어느 하나로부터 선택된 외인성 디설파이드 이소머라제를 과발현하는 재조합 그람 음성 박테리아 숙주 세포.
46. 실시양태 1 내지 45 중 어느 한 실시양태에 있어서, 슈도모나드 숙주 세포; 이. 콜라이 숙주 세포; 및 비브리오 숙주 세포로부터 선택된 재조합 그람 음성 박테리아 숙주 세포.
47. 실시양태 46에 있어서, 슈도모나스 숙주 세포가 슈도모나스 숙주 세포인 재조합 그람 음성 박테리아 숙주 세포.
48. 실시양태 47에 있어서, 슈도모나스 숙주 세포가 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사인 재조합 그람 음성 박테리아 숙주 세포.
49. 실시양태 47 또는 48에 있어서,
(i) lsc::lacIQ1;
(ii) Prc1-;
(ii) Prc2-;
(iii) HslU-;
(iv) HslV-;
(v) MepM1-;
(vi) PyrF-; 및
(vii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체의 결핍
을 나타내는 재조합 그람 음성 박테리아 숙주 세포로서, 세랄라이신 전구체 결핍이 세랄라이신 전구체를 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
50. 실시양태 49에 있어서, 슈도모나스 플루오레센스인 재조합 그람 음성 박테리아 숙주 세포로서, Prc1이 서열번호 33으로 제시된 아미노산 서열을 갖고, Prc2가 서열번호 35로 제시된 아미노산 서열을 갖고, HslU가 서열번호 37로 제시된 아미노산 서열을 갖고, HslV가 서열번호 38로 제시된 아미노산 서열을 갖고, MepM1이 서열번호 1로 제시된 아미노산 서열을 갖고, 세랄라이신 전구체가 서열번호 9로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
51. 실시양태 50에 있어서, DegP2 S219A(서열번호 29)를 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
52. 실시양태 50 또는 51에 있어서, 디설파이드 이소머라제 PDIA6(서열번호 27)을 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
53. 실시양태 1 내지 52 중 어느 한 실시양태에 있어서, 재조합 단백질을 코딩하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
54. 실시양태 53에 있어서, 발현 벡터가 Fab'를 코딩하는 것인 재조합 그람 음성 박테리아 숙주 세포.
55. 실시양태 54에 있어서, DegP2 S219A 또는 디설파이드 이소머라제 PDIA6을 코딩하는 핵산 서열을 포함하는 발현 벡터가 Fab'를 코딩하는 핵산 서열을 추가로 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
56. 실시양태 54 또는 55에 있어서, Fab' 중쇄가 서열번호 21에 의해 코딩되고, Fab' 경쇄가 서열번호 23에 의해 코딩되는 것인 재조합 그람 음성 박테리아 숙주 세포.
57. 실시양태 1에 있어서, 균주 STR94975, STR94976 또는 STR94977의 유전형을 가진 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포.
58. 실시양태 57에 있어서, 재조합 항-TNF-알파 Fab'를 생성하는 데 사용하기 위한, STR94975, STR94976 또는 STR94977의 발현 구축물 또는 구축물들을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
59. (a) 적합한 발효 조건 하에서 배양된 실시양태 1 내지 57 중 어느 한 실시양태의 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하는 관심 있는 재조합 단백질의 제조 방법으로서, 상기 재조합 그람 음성 숙주 세포가 관심 있는 재조합 단백질을 코딩하는 핵산을 포함하는 플라스미드에 의해 형질전환된 것인 방법.
60. 실시양태 59에 있어서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열의 전사가 유도성 프로모터에 의해 조절되는 것인 방법.
61. 실시양태 60에 있어서, 유도성 프로모터가 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터 및 아라비노스 프로모터로부터 선택되는 것인 방법.
62. 실시양태 59 내지 61 중 어느 한 실시양태에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 높은 세포 밀도까지 생장할 수 있는 것인 방법.
63. 실시양태 62에 있어서, 높은 세포 밀도가 약 80 내지 약 300의 OD575를 포함하는 것인 방법.
64. 실시양태 58 내지 63 중 어느 한 실시양태에 있어서, 적합한 발효 조건이 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 33℃의 온도, 유가식, 및 약 0.2 내지 약 5 g/ℓ의 역가 범위에서 유도성 프로모터의 유도를 포함하는 것인 방법.
65. 실시양태 64에 있어서, 유도성 프로모터를 IPTG로 유도하고, IPTG를 약 0.08 내지 0.3 mM의 최종 농도로 첨가하는 것인 방법.
66. 실시양태 65에 있어서, IPTG를 약 0.2 mM의 최종 농도로 첨가하는 것인 방법.
67. 실시양태 63 내지 66 중 어느 한 실시양태에 있어서, 유도를 약 6.0 내지 약 6.5의 배양 pH에서 수행하는 것인 방법.
68. 실시양태 63 내지 67 중 어느 한 실시양태에 있어서, 유도를 약 28℃ 내지 33℃의 온도에서 수행하는 것인 방법.
69. 실시양태 68에 있어서, 유도를 약 32℃의 온도에서 수행하는 것인 방법.
70. 실시양태 59 내지 69 중 어느 한 실시양태에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 동일한 발효 조건 하에서 생장된 대조군 세포에 비해 증가된 세포 밀도까지 생장하는 것인 방법.
71. 실시양태 70에 있어서, 세포 밀도의 증가가 약 2배 내지 약 15배인 방법.
72. 실시양태 59 내지 71 중 어느 한 실시양태에 있어서, (b) 재조합 그람 음성 박테리아 숙주 세포로부터 회수된 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
73. 실시양태 72에 있어서, 온전한, 가용성 및/또는 활성 재조합 단백질의 측정된 수율이 약 0.1 내지 약 10 g/ℓ인 방법.
74. 실시양태 72 또는 73에 있어서, (c) 대조군 세포로부터 회수된 온전한, 가용성, 활성 또는 이들의 조합 형태인 관심 있는 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
75. 실시양태 74에 있어서, (d) 단계 (b)에서 측정된 수율을 단계 (c)에서 측정된 수율과 비교하는 단계를 추가로 포함하는 방법.
76. 실시양태 75에 있어서, 단계 (b)에서 측정된 수율이 단계 (c)에서 측정된 수율보다 약 2배 내지 약 100배 더 높은 것인 방법.
77. 실시양태 70 내지 76 중 어느 한 실시양태에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
(i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
(ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(a)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(a)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
(iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
로부터 선택되는 것인 방법.
78. 실시양태 1 내지 45 중 어느 한 실시양태, 또는 실시양태 47 내지 77 중 어느 한 실시양태에 있어서, 이. 콜라이가 아닌 재조합 그람 음성 박테리아 숙주 세포.
79. 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드로서, 상기 분비 신호 펩티드가 서열번호 11로 제시된 아미노산 서열을 가진 것인 재조합 폴리펩티드.
80. 실시양태 79에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 재조합 폴리펩티드.
81. 실시양태 79 또는 80에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 재조합 폴리펩티드.
82. 실시양태 80 또는 81에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 재조합 폴리펩티드.
83. 실시양태 80에 있어서, 효소가 치료 효소인 재조합 폴리펩티드.
84. 실시양태 83에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택되는 것인 재조합 폴리펩티드.
85. 실시양태 80에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 재조합 폴리펩티드.
86. 실시양태 79 내지 85 중 어느 한 실시양태에 있어서, 링커를 추가로 포함하는 재조합 폴리펩티드.
87. 실시양태 79 내지 86 중 어느 한 실시양태에 있어서, 절단 도메인을 추가로 포함하는 재조합 폴리펩티드.
88. 실시양태 79 내지 87 중 어느 한 실시양태에 있어서, 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도하는 것인 재조합 폴리펩티드.
89. 실시양태 88에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 재조합 폴리펩티드.
90. 실시양태 88에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 재조합 폴리펩티드.
91. 실시양태 89에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 재조합 폴리펩티드.
92. 실시양태 90에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 재조합 폴리펩티드.
93. 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 단계를 포함하는, 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 방법으로서, 상기 원핵 숙주 세포가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 상기 분비 신호 펩티드가 서열번호 11의 아미노산 서열을 포함하고, 상기 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아닌 것인 방법.
94. 실시양태 93에 있어서, 생성된 관심 있는 단백질 또는 폴리펩티드를 단리하는 단계를 추가로 포함하는 방법.
95. 실시양태 94에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 방법.
96. 실시양태 95에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 방법.
97. 실시양태 95 또는 96에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 방법.
98. 실시양태 95에 있어서, 효소가 치료 효소인 방법.
99. 실시양태 98에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택되는 것인 방법.
100. 실시양태 95에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 방법.
101. 실시양태 93 내지 100 중 어느 한 실시양태에 있어서, 핵산이 링커를 코딩하는 것인 방법.
102. 실시양태 101에 있어서, 링커가 절단 도메인을 포함하는 것인 방법.
103. 실시양태 93 내지 102 중 어느 한 실시양태에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 방법.
104. 실시양태 93 내지 102 중 어느 한 실시양태에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 방법.
105. 실시양태 93에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 방법.
106. 실시양태 94에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 방법.
107. 실시양태 79 내지 92 중 어느 한 실시양태의 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터.
108. 실시양태 107의 발현 벡터를 포함하는 원핵 숙주 세포.
109. 실시양태 108에 있어서, 그람 음성 박테리아인 원핵 숙주 세포.
110. 실시양태 108에 있어서, 그람 양성 박테리아인 원핵 숙주 세포.
111. 실시양태 109에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 원핵 숙주 세포.
112. 실시양태 110에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 원핵 숙주 세포.
113. 실시양태 108 내지 112 중 어느 한 실시양태에 있어서, 재조합 폴리펩티드를 코딩하는 핵산 서열이 원핵 숙주 세포에서 발현되도록 최적화된 것인 원핵 숙주 세포.
114. 원핵 숙주 세포의 주변세포질 또는 세포외 공간에서 관심 있는 단백질 또는 폴리펩티드를 발현시키기 위한, 실시양태 79 내지 92 중 어느 한 실시양태의 재조합 폴리펩티드, 실시양태 107의 발현 벡터, 또는 실시양태 108 내지 113 중 어느 한 실시양태의 원핵 숙주 세포의 용도.
본 발명의 바람직한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태가 단지 예로서 제공된다는 것은 당업자에게 자명할 것이다. 다수의 변경, 변화 및 치환이 본 발명을 벗어나지 않으면서 당업자에게 인식될 것이다. 본원에 기재된 본 발명의 실시양태의 다양한 대안이 본 발명을 실시하는 데 사용될 수 있다는 것을 이해해야 한다. 하기 청구범위는 본 발명의 범위를 정의하고, 이 청구범위 내의 방법과 구조 및 이들의 등가물은 이에 의해 커버된다.
실시예
하기 실시예는 본 개시내용의 다양한 실시양태를 예시할 목적으로 제공되며 어떤 방식으로든 본 개시내용을 제한하기 위한 것이 아니다. 본원에 기재된 방법과 함께 본 실시예는 현재 대표적인 실시양태이고, 예시하는 것이며, 범위를 제한하고자 하는 것이 아니다. 청구범위에 의해 정의된 본 개시내용의 사상 내에 포함되는 변경 및 다른 용도는 당업자에게 인식될 것이다.
실시예 1. 프로테아제 결핍 박테리아 숙주 세포에서의 재조합 단백질 발현
온전한 재조합 단백질의 생성을 위한 프로테아제 결핍 숙주 세포 균주의 스크리닝을 0.5 ㎖ 규모로 수행하였다. 15개의 상이한 프로테아제 결핍 슈도모나스 플루오레센스 균주들 각각에서, 10개의 항-TNF Fab'(세르톨리주맙) 과발현 플라스미드 각각을 시험하였다. 10개의 과발현 플라스미드(구축물 1 내지 10) 각각은 동일한 프로모터인 Ptac의 조절 하에 항-TNF-알파 Fab' 중쇄(HC, 서열번호 22에 의해 코딩되는 서열번호 21) 및 항-TNF-알파 Fab' 경쇄(LC, 서열번호 24에 의해 코딩되는 서열번호 23)를 코딩하는 발현 구축물을 함유하였다. 구축물 1 내지 9 각각은 5'에서 3'으로, 리더 1(L1) - HC(서열번호 22에 의해 코딩되는 서열번호 21) - 리더 2(L2) - LC(서열번호 24에 의해 코딩되는 서열번호 23) - DsbC(서열번호 79에 의해 코딩되는 서열번호 60)(공-전사 슈도모나스 플루오레센스 DsbC 단백질 디설파이드 이소머라제)를 코딩하는 서열을 가진 발현 구축물을 포함하는 플라스미드를 함유하였다. 구축물 10은 DsbC를 공-발현하지 않는 p688-005를 함유하였다. 구축물 1 내지 9처럼, 구축물 10은 5'에서 3'으로, 리더 1(L1) - HC(HC, 서열번호 22에 의해 코딩되는 서열번호 21) - 리더 2(L2) - LC(서열번호 24에 의해 코딩되는 서열번호 23)를 코딩하는 서열을 포함하였다. 상기 10개의 플라스미드는 분비 신호 서열의 차이와 구축물 10에 대해 언급된 차이를 제외하고는 동일하였다. 구축물 1 내지 9 각각에서, L1은 상이한 분비 신호이었고; 구축물 3과 10은 동일한 분비 신호를 가졌다. 구축물 1 내지 10 각각에서, L2는 Azu 주변세포질 분비 신호(서열번호 14에 의해 코딩되는 서열번호 13)이었다. 구축물 8에서, L1은 Slmt 분비 신호(서열번호 12에 의해 코딩되는 서열번호 11)이었다. 경쇄 및 중쇄 유전자 각각은 시작 코돈의 업스트림에서 높은 번역 효율의 리보좀 결합 서열(정규 샤인-달가노(Shine-Dalgarno) 서열의 활성의 100%를 가짐, 서열번호 59)을 포함하였다.
발현 플라스미드를 어레이 형식으로 슈도모나스 플루오레센스 숙주 균주에 형질전환시켰다. 슈도모나스 플루오레센스 형질전환능 세포와 플라스미드 DNA를 혼합함으로써 형질전환 반응을 시작하였다. 혼합물의 25 ㎕ 분취액을 96-멀티웰 Nucleovette® 플레이트(Lonza)로 옮겼다. Nucleofector™ 96-웰 Shuttle™ 시스템(Lonza AG)을 사용하여 전기천공을 수행한 후, 전기천공된 세포를, 1% 글루코스 배지로 보충된 500 ㎕ M9 염 및 미량 원소가 함유된 새로운 96-웰 딥 웰 플레이트로 옮겼다. 플레이트를 48시간 동안 진탕시키면서 30℃에서 인큐베이션하여, 시드(seed) 배양물을 생성하였다.
시드 배양물의 10 ㎕ 분취액을 96-웰 딥 웰 플레이트에 이중으로 옮겼다. 각각의 웰은 미량 원소 및 5% 글리세롤로 보충된 500 ㎕의 HTP-YE 배지(Teknova)를 함유하였다. 글리세롤로 보충된 HTP 배지에 플레이팅된 시드 배양물을 30℃의 진탕기에서 24시간 동안 인큐베이션하였다. 이소프로필-β-D-1-티오갈락토피라노사이드(IPTG)를 0.3 mM의 최종 농도로 각각의 웰에 첨가하여 Fab'의 발현을 유도하였다. 24시간의 유도 후, 600 nm에서 광학 밀도(OD600)를 측정하여 세포 밀도를 계산하였다. 그 후, 세포를 수거하고 400 ㎕의 최종 부피까지 1X 인산염 완충 식염수(PBS)로 1:3 희석하고, 추후 처리를 위해 냉동시켰다.
분석적 특징규명을 위한 가용성 용해물 샘플 준비 : 수거된 세포 샘플을 희석하고 24 프로브 팁 호른(tip horn)을 사용하여 세포 용해 자동화 초음파처리 시스템(CLASS, Scinomix)으로 초음파처리함으로써 용해시켰다. 용해물을 8℃에서 5,500 x g로 15분 동안 원심분리하였다. 상청액을 모아 가용성 분획으로서 표지하였다. 펠릿을 모으고, 또 다른 라운드의 초음파처리로 400 ㎕의 1X PBS(pH 7.4)에 재현탁하고 불용성 분획으로서 표지하였다.
비환원 SDS-CGE 분석 : HT 단백질 익스프레스(Protein Express) v2 칩 및 상응하는 시약(각각 제품 번호 760499 및 760328, Caliper LifeSciences)과 함께 LabChip GXII 기기(Caliper LifeSciences)를 사용하여 HTP 마이크로칩 SDS 모세관 겔 전기영동으로 가용성 분획 및 불용성 분획을 분석하였다. 샘플을 제조업체의 프로토콜(단백질 사용자 가이드 문서 번호 450589, Rev. 3)에 따라 준비하였다. 요약하건대, 가용성 또는 불용성 분획 샘플의 4 ㎕ 분취액을 95℃에서 5분 동안 가열된 96-웰 폴리프로필렌 원뿔형 웰 PCR 플레이트에서 14 ㎕의 완충제와 혼합하고 70 ㎕ 탈이온수로 희석하였다. Fab' 발현 플라스미드로 형질전환시키지 않은 null 숙주 균주의 용해물뿐만 아니라, 구축물 10로 형질전환시킨 숙주 균주의 용해물도 시험 샘플과 함께 대조군으로서 실행하였고, 시스템 내부 표준물을 사용하여 정량하였다.
도 1은 DC1032 및 시험된 4개의 다른 프로테아제 결핍 슈도모나스 플루오레센스 균주들에 의해 생성된 Fab' 단백질의 비환원 SDS-CGE 분석을 보여준다. 각각의 균주에 대한 12개의 레인은 왼쪽에서 오른쪽으로 다음을 보여준다: 가장 왼쪽 레인 - MW가 16, 20, 29, 48 및 68 kD인 MW 래더; 1 내지 10으로 넘버링된 레인 - Fab' 중쇄 및 경쇄를 각각 코딩하고 중쇄 유전자에 작동 가능하게 연결된 상이한 주변세포질 분비 신호를 코딩하는 핵산 서열을 각각 갖고 경쇄 유전자에 작동 가능하게 연결된 Azu 분비 신호를 코딩하는 핵산 서열을 각각 가진 구축물 1 내지 10을 사용함으로써 발현된 단백질. 구축물 1 내지 9 각각은 각각 슈도모나스 플루오레센스 유래 DsbC를 공-발현하는 반면, 구축물 10은 공-발현하지 않는다. 레인 12(각각의 세트에서 가장 오른쪽 레인) - null 숙주 균주(null 발현 플라스미드를 가짐). 왼쪽에서 오른쪽으로, 처음 12개의 레인은 숙주 균주 DC1084에서의 Fab' 발현을 보여주고; 두 번째 12개의 레인은 DC977에서의 Fab' 단백질 발현을 보여주며; 세 번째 12개의 레인은 DC441에서의 Fab' 단백질 발현을 보여주고; 네 번째 12개의 레인은 DC1032에서의 Fab' 단백질 발현을 보여주고; 다섯 번째 12개의 레인은 DC509에서의 Fab' 단백질 발현을 보여준다. DC1032 레인 아래의 화살표는 Fab' 분해 생성물에 대한 이동 면적을 표시한다. 단백질 L 농후화 Fab'의 HPLC 및 LC-MS 분석은 관찰된 단편이 Fab'로부터 유래하였음을 확인시켜주었다.
결론 : 시험된 다른 14개 숙주 균주들과 대조적으로, (유전자 녹아웃에 의한) Prc1, Prc2 및 HslUV 프로테아제 결핍을 가진 DC1032는 분해를 감소시키면서(Fab'를 표시하는 오른쪽 화살표 참조) 고수율의 조립된 Fab'(최대 130 mg/ℓ)를 생성하였다. 구축물 8은 중쇄 유전자에 작동 가능하게 연결된 분비 신호 Slmt(서열번호 11)를 코딩하는 핵산 서열, 및 경쇄 유전자에 작동 가능하게 연결된 분비 신호 Azu(서열번호 13)를 코딩하는 핵산 서열을 포함하였고, 가장 높은 조립된 Fab' 수율을 생성하였고 분해를 감소시켰다.
실시예 2. 프로테아제 결핍 박테리아 숙주 세포 생장의 회복
확인된 숙주 균주의 대규모 생장
0.5 ㎖ 규모에서 실시예 1에 기재된 바와 같이 확인된 슈도모나스 플루오레센스 숙주 균주를 2 리터(2 ℓ) 규모(통상적인 생물반응기, CBR)에서 생장시켰다. 슈도모나스 플루오레센스에서 두 꼬리 특이적 단백질 유전자들(Prc)의 완전한 불활성화는 생물반응기에서 높은 세포 밀도 생장을 방해하였다. 유사한 효과가 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제9,493,559호, 유럽 특허 제1341899B1호("Bacterial host strains"), 및 문헌[Hara, H. et al., 1991]에 의해 이. 콜라이 꼬리 특이적 프로테아제 돌연변이체에 관해 보고되었다.
도 2는 2 ℓ 규모에서 DC1032 숙주 세포 균주에 대한 생장 곡선(OD575 대 발효 시간(시))을 보여준다. 세포를 32℃ 및 pH 6.5에서 생장시키고 25.5시간에서 IPTG로 유도하였고, 유도기를 36시간 동안 진행시켰다. 균주 STR36306(DC1032 + p688-048(Fab' 발현 플라스미드))은 약 27의 최대 OD575까지 생장하였고, STR94998(DC1032 + null 플라스미드)은 약 50의 최대 OD575까지 생장하였다. 이러한 Prc 결핍 균주들은 20 내지 50의 OD575를 넘어 생장하지 못하였고 세포 용해의 증거를 보였다. 대조적으로, Prc의 기능성 카피(Prc1 및 Prc2) 둘 다를 발현하는 균주는 18시간 내지 26시간 이내에 2 ℓ 생물반응기에서 최대 130의 OD575까지 생장하였다(데이터는 제시되지 않음).
이. 콜라이 전략은 슈도모나스 숙주 균주의 고밀도 세포 생장을 회복시키지 못한다 .
선행 연구는 이. 콜라이에서 꼬리 특이적 프로테아제 Tsp/Prc(슈도모나스 Prc의 오르톨로그)를 코딩하는 유전자의 결실이 고밀도 발효에서 생장을 억제하고, 아미노산 치환에 의한 Spr(슈도모나스 MepS1의 이. 콜라이 유사체)의 불활성화가 이. 콜라이 생장을 575 nm에서 200 이상의 OD까지 회복시켰음을 보여주었다(예를 들어, 미국 특허 제9,493,559호, 유럽 특허 제1341899B1호, 및 문헌[Hara, H. et al., 1991]). 이 전략은 슈도모나스 플루오레센스 Prc null 균주에서는 성공적이지 못한 것으로 입증되었다. 도 2에 나타낸 바와 같이, Prc null 균주의 생장은 MepS1, MepS2 또는 이들 둘 다의 결핍에 의해 회복되지 않았다. 확인된 바와 같이, MepS1 결실을 추가로 가진 DC1032인 균주 STR94994는 약 23의 최대 OD575까지 생장하였고, MepS2 결실을 가진 DC1032인 균주 STR94995는 약 33의 최대 OD575까지 생장하였고, MepS1 및 MepS2 둘 다의 결실을 가진 DC1032인 균주 STR94996은 약 23의 최대 OD575까지 생장하였다. (균주 STR94994, STR94995 및 STR94996 각각은 p688-048을 함유하였다).
Prc1 및 Prc2 결핍 숙주 세포의 적응 실험실 진화
높은 세포 밀도 생장이 회복된 Prc 결핍 숙주 균주를 개발하였다.
DC954는 Prc null 균주에 치명적인 생장 조건 하에서 적응 실험실 진화(ALE)를 거쳤다. 예를 들어, 이. 콜라이에서의 ALE 및 유사한 전략은 문헌, 예를 들어, 문헌[Hara, H. et al., 1991]에 기재되어 있다. ALE에서, 스트레스에 대한 내성이 감소된 박테리아 균주(프로테아제 결핍 돌연변이체를 포함함)는, 추가 염색체 돌연변이가 발생하지 않는 한, 생장을 방해하는 준최적 생장 조건(여기서, 낮은 염 및 고온)에 노출된다.
DC954를 문헌[Hara et al., 1991]에 기재된 것과 유사한 변형된 저장성 루리아-버타니(Luria-Bertani)(LB) 배지 한천 레시피 상에서 고온(30℃ 내지 32℃의 세포 최적 생장 온도와 대조적으로 36℃)에서 생장시켰다. 도 3a는 36℃에서 NaCl이 존재하지 않고 pyrF 결실을 고려하여 생장을 허용하기 위해 첨가된 우라실이 존재하는 1X LB 한천 배지에서 DC954 콜로니의 생장을 보여준다. 확인된 바와 같이, 이 조건 하에서 DC954는 배경 생장이 있는 콜로니를 형성하였다. 도 3b에서, 왼쪽 플레이트는 36℃에서 NaCl의 부재 하에 우라실을 함유하는 1/2X LB 한천 배지에서만 DC454(본질적으로 야생형)의 생장을 보여준다. 생장은 1X LB에서의 생장보다 더 느렸으나, 이 생장 조건은 DC454에 치명적이지 않았다. 도 3b에서 오른쪽 플레이트는 36℃에서 NaCl의 부재 하에 우라실을 함유하는 1/2X LB 한천 배지에서 DC954의 생장을 보여준다. 이 생장 조건 하에서, 배경 생장은 크게 감소되었거나 제거되었으나, 몇몇 강력한 단일 콜로니가 생존하였다. 표시된 바와 같이, 상기 단일 콜로니는 추가 돌연변이에 의해 준최적 생장 조건에 적응(진화)한 세포를 암시하였다. 추가 특징규명을 위해 이 콜로니를 선택하였다.
진화된 세포에서 염색체 MepS, MepM 및 MepH 오르톨로그를 시퀀싱하였다. MepM1은 그의 불활성화와 일치하는 돌연변이를 획득한 것으로 밝혀졌다. 확인된 돌연변이는 Y248stop, D334N, G332S, A337T, H411Y 및 P410L이었다. 이 돌연변이들은 우라실에 대한 영양요구성을 레스큐하는 빈 벡터와 함께 공-발현되었을 때 2 ℓ 규모에서 생장을 회복시켰다. 따라서, MepM1의 불활성화는 DC954의 높은 세포 밀도 생장을 회복시켰다.
도 4는 진화된 Prc null 균주 #1 및 #3이 진화되지 않은 Prc+ 균주 #4와 마찬가지로 높은 세포 밀도(132 내지 150의 OD575)까지 생장하였음을 보여준다. 그러나, 진화되지 않은 Prc null 균주 2는 50 미만의 OD575까지 생장하였다(표 5 참조), 생성기를 32℃ 및 pH 6.5에서 48시간 동안 수행하였다.
Prc null 배경에서 조합적 MepS 및 MepM 결핍의 생성
Prc 결핍 슈도모나스 플루오레센스(Δprc1Δprc2,ΔpyrF)에서의 체계적인 시험을 위해 일련의 MepS 및 MepM 녹아웃 돌연변이체들을 생성하였다. MepS1, MepS2, MepM1 및 MepM2에 대한 상동 영역을 합성하고 블런트 말단 제한 분해로 비-슈도모나스 복제 벡터에 서브클로닝하고 우라실에 대한 레스큐된 원영양성으로 선택하였다.
1 ㎍의 플라스미드 DNA를 전기 형질전환능 prc 녹아웃 슈도모나스 플루오레센스 세포주에 전기천공함으로써 형질전환을 수행하였다. 형질전환된 세포를 M9 최소 배지 + 1 mM MgCl2 + 1.5% 한천에 플레이팅함으로써 통합을 위한 선택을 수행하였고 30℃에서 2일 내지 3일 동안 선택하였다. 단일 콜로니를 LB 배지 + 250 ㎍/㎖ 우라실에 떼어 넣음으로써 하룻밤 동안 두 번째 재조합 단계를 선택하였다. 다음날, 포화된 배양물의 여러 희석액을 0.5X LB, 500 ㎍/㎖ 5-FOA + 250 ㎍/㎖ 우라실 1.5% 한천 플레이트에 도말하였다. 이 두 번째 재조합 사건은 오픈 리딩 프레임을 녹아웃시키고, 비복제 플라스미드는 pyrF 유전자의 5-FOA 역선택을 통해 세포로부터 제거된다. 단일 콜로니를 액체 0.5X LB, 500 ㎍/㎖ 5-FOA + 250 ㎍/㎖ 우라실에 떼어 넣고 30℃에서 밤새 생장시켰다. 콜로니 PCR을 위해, 상기 상동성 아암 영역 외부에서 프라이머를 설계하였고, PCR에 의한 증폭 후 브롬화에티듐 염색 아가로스에서 크기 분석으로 녹아웃을 확인하였다.
조합적 돌연변이체의 스크리닝
생장 표현형 분석을 위해, pyrF 결실을 고려하여 생장을 허용하기 위해 녹아웃 균주를 M9 배지 + 1 mM MgCl2 + 250 ㎍/㎖ 우라실(M9/Ura)에서 밤새 생장시켰다. 다음날, 포화된 액체 배양물을 M9/Ura로 1:100 희석한 후, M9/Ura로 5회 10배 연속 희석하였다. 그 다음, 배양물을 0.5X LB(NaCl 없음, 250 ㎍/㎖ 우라실) 1.5% 한천 플레이트에 점적하고(5 ㎕) 36℃에서 48시간 동안 인큐베이션함으로써 준최적 조건 하에서 인큐베이션하였다.
표 6은 스크리닝된 조합적 Mep 결핍 돌연변이체를 보여준다. 이. 콜라이에서 보고된 Spr 돌연변이에 의한 Tsp 돌연변이체의 레스큐와 달리, 슈도모나스 플루오레센스의 MepS1 결핍은 예상외로 Prc 결핍 돌연변이체의 고밀도 생장을 회복시키지 못하였다. 도 5는 스크리닝 결과를 보여준다. 순차적으로 더 낮은 희석액을 도면에 표시된 방향대로 플레이트 상에서 각각의 행의 위에서 아래로 적용하였다. 제1열은 준최적 조건 하에서 생장하지 못하는 Prc 결핍 돌연변이체 DC1032를 함유하고, 제10행은 동일한 조건 하에서 Prc+ ΔpyrF 균주(야생형 대조군)의 생장을 보여준다. 다른 행에서 관찰된 바와 같이:
제2열 - MepM1 결핍의 존재는 모든 역가에서 Prc 결핍 돌연변이체의 생장을 성공적으로 회복시킨다.
제3열 - MepS1 결핍의 존재는 생장을 회복시키는 MepM1 결핍의 능력을 제거한다.
제4열 - MepS2 결핍의 존재는 생장을 회복시키는 MepM1 결핍의 능력에 영향을 미치지 않는다.
제5열 - MepS1 및 MepS2 결핍의 존재는 생장을 회복시키는 MepM1 결핍의 능력을 제거한다.
제6열 - MepM2 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 못한다.
제7열 - MepM2 및 MepS1 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 않는다.
제8열 - MepM2 및 MepS2 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 않는다.
제9열 - MepM2, MepS1 및 MepS2 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 않는다.
4가지 결핍(MepM1, MepM2, MepS1 및 MepS2) 모두를 가진 숙주 세포는 성공적으로 단리되지 않았으며, 이는 Prc 결핍 돌연변이체의 치사성을 암시한다.
도 5에서 관찰된 생장은 표 6의 제4열에 기재되어 있다.
결론 : MepM1 결핍은 Prc 결핍 슈도모나스 균주의 생장을 회복시킨다. MepS1, MepS2 및 MepM2 활성 중 어느 하나 이상의 활성의 결핍은 슈도모나스 Prc 결핍 돌연변이체의 생장을 회복시키지 못한다. 예상외로, MepM1 결핍에 의해 부여된 생장 이점은 MepS1 결핍의 존재 하에 제거된다. Prc 결핍 슈도모나스 플루오레센스의 높은 세포 밀도 생장을 회복시키기 위해서는 MepS1의 기능성 카피를 남기면서 MepM1을 불활성화시킬 필요가 있다.
실시예 3. 재조합 숙주 균주에 의한 강력한 생장 및 Fab' 생성을 위한 최적 조건
조합적 녹아웃 데이터를 기반으로, 상이한 프로테아제 녹아웃을 갖고 항-TNF-알파 Fab' 발현 플라스미드인 p688-48을 함유하는 2개의 숙주 균주를 생성하였고 두 온도(25℃ 및 32℃), pH(6 및 7.2) 및 유도 OD575(60 및 120)를 포함하는 다양한 유도 조건 하에서 생장 및 재조합 단백질 생성에 대해 시험하였다. 표 7은 상기 2개의 균주인 STR87639(ΔprcΔ1prc2, ΔhslUV, ΔmepM1, ΔpyrF, lsc::lacIQ1) + p688-048 및 STR87640(Δprc1Δprc2, ΔhslUV, ΔmepM1, ΔmepS2, ΔpyrF, lsc::lacIQ1) + p688-048 각각에 대해 유도 후 24시간, 48시간, 72시간 및 120시간에서 pH, 온도, 유도 OD575 및 Fab' 역가를 보여준다. 유도 후 24시간, 48시간 및 72시간에서 수거된 전체 발효 브로쓰의 가용성 분획으로부터 분석 샘플을 준비하였다. 희석된 전체 발효물을 초음파처리한 후 원심분리하여 가용성 분획과 불용성 분획을 분리함으로써 가용성 분획을 준비하였다. 유도 후 120시간에서, 세포 펠릿과 무세포 브로쓰를 분리하기 위한 전체 브로쓰의 원심분리 후 무세포 배양 상청액(무세포 브로쓰)으로부터 분석 샘플을 준비하였다. 시스템 내부 질량 래더를 사용하는 비환원 SDS-CGE 분석을 이용하여 조립된 Fab의 역가를 측정하였다.
STR87639 용해물을 LC-MS로 분석하였고, 이 용해물이 HC/LC/LC 이량체, HC 및 LC 둘 다의 단편, 및 HC 및 LC 단편을 포함하는 조립체를 포함하는, 비환원된 온전한 질량의 여러 종을 함유한다는 것을 발견하였다. 정확한 Fab 질량(47,761)은 낮은 존재도로 관찰되었다.
결론 : STR87639 및 STR87640 둘 다가 pH 6.0 및 32℃에서 60의 OD575에서 유도되었을 때 가장 높은 Fab' 수율을 생성하였다. STR87639는 가장 높은 수율을 생성하였으나, Fab' 중쇄 및 경쇄의 단백질용해 단편을 축적시켰다.
실시예 4. 재조합 단백질 생성을 위한 숙주 균주의 최적화 I: 재조합 단백질 품질에 영향을 미치는 추가 프로테아제의 확인
프로테아제의 확인
항-TNF-알파 Fab' 단편의 단백질용해에 영향을 미치는 다른 인자를 확인하기 위해, 항-TNF-알파 Fab' 중쇄와 경쇄, 및 공-전사 슈도모나스 플루오레센스 DsbC 단백질 디설파이드 이소머라제의 오픈 리딩 프레임을 함유하는 플라스미드 p688-048을 숙주 배경 DC1032: Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1(STR36036 생성), 및 DC867: Δprc1Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1(PF1558 생성)에 도입함으로써 2개의 중간 균주를 생성하였다. 생물학적 복제물을 이중으로 생장시켰고, 낮은 세포 밀도에서 시딩된 초기 배양물, 중간 대수기 생장, 12시간 및 48시간의 유도 후 시간(I)을 나타내는 생장 곡선을 따라 샘플링하였다. 제네위즈(Genewiz)(캘리포니아주 샌디에고)에서 전체 전사물 RNA 시퀀싱을 위해 샘플을 처리하였다. 품질 트리밍된 Fastq 파일을 돌려받았고, 소스 코드로부터 컴파일링되고 하기 파라미터를 사용함으로써 실행된 오픈 소스 소프트웨어 STAR 정렬기를 사용하여 상기 파일을 처리하였다: outSAMtype BAM SortedByCoordinate and quantMode GeneCounts. (예를 들어. 본원에 참고로 포함되는 문헌[Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan 1;29(1):15-21. doi: 10.1093/bioinformatics/bts635. Epub 2012 Oct 25. PMID: 23104886; PMCID: PMC3530905] 참조). 소스 코드로부터 컴파일링된 오픈 소스 피쳐카운트(featurecounts) 소프트웨어를 사용하여, 정량된 유전자를 데이터 프레임에 주석달았고(본원에 참고로 포함되는 문헌[Liao Y, Smyth GK and Shi W. featureCounts: an efficient general-purpose program for assigning sequence reads to genomic features. Bioinformatics, 30(7):923-30, 2014]에 기재됨), 데이터를 정규화하고, 상호작용을 가진 선형 회귀 모델에 피팅하였다. STR36306(기능성 MepM1)과 PF1558(결핍 MepM1) 사이의 평균 정규화된 유전자 수의 Wald 검정을 기반으로 p 값을 계산함으로써, 유전자 수의 통계적 유의성을 수행하였다. 시드와 I12 사이에서 시간 경과에 따라 누적적으로 평균 정규화된 전사물 수의 log2배 변화와 대비하여 통계적 유의성(p 값)을 작도함으로써, 상향조절에 영향을 미치는 유전자를 화산 플롯(volcano plot)으로 가시화하였다. 주성분 분석을 통해 가장 큰 변화를 나타내는 샘플로부터 비교에 사용된 시점을 얻었다. 결과는 표 8 및 9에 제시되어 있다.
결론 : 이 비교 분석은 매트릭스 메탈로프로테아제 클래스 EC 3.4.24.40(서열번호 9)에 속하는 세포외 알칼리 메탈로프로테아제 RXF04495.2가 Prc 결핍 MepM1+ 숙주 세포와 비교되었을 때 MepM1 결핍을 가진 Prc 결핍 숙주 세포에서 발효 시간 전체에 걸쳐 누적적 및 일시적으로 상향조절된다는 것을 보여주었다.
실시예 5. 재조합 단백질 생성를 위한 숙주 균주의 최적화 II: 추가 프로테아제 돌연변이의 도입 및 균주 평가
세포외 알칼리 메탈로프로테아제 RXF04495.2 결핍
유전형 Δprc1, Δprc2, ΔhslUV, ΔmepM1의 슈도모나스 플루오레센스 숙주를 사용하여, 실시예 2에 기재된 유전자의 조합적 녹아웃을 생성하는 데 이용된 방법과 유사한 방법으로 RXF04495.2 결핍 숙주를 제조하였다(이 경우, RXF04495.2 상동성 아암(서열번호 61)을 사용함). 콜로니 PCR 검증된 녹아웃을 사용하여, 하기 유전형을 가진 PF1596 숙주 배경을 생성하였다: Δprc1, Δprc2, ΔhslUV, ΔmepM1, ΔRXF04495.2 메탈로프로테아제, ΔpyrF, lsc::lacIQ1. 이어서, Slmt 분비 신호에 작동 가능하게 연결된 Fab' 중쇄(서열번호 25) 및 Azu 분비 신호에 작동 가능하게 연결된 Fab' 경쇄(서열번호 26)를 코딩하는 Fab' 단독 발현 카세트를 함유하는 플라스미드 pFNX7800을 사용하여 생성된 숙주 PF1596을 형질전환시켰다. 이들 중쇄 및 경쇄는 IPTG 유도성 발현을 위한 tac 프로모터의 조절 하에 다양한 숙주 배경에서 공-전사적으로 발현되었다.
추가 프로테아제 결핍 및 과발현된 단백질
재조합 단백질 발현을 위해 숙주 균주에서 불활성화시키고 시험할 추가 프로테아제로서 DegP2를 선택하였다. 그러나, 2000개 이상의 클론의 스크리닝에도 불구하고, 후보 프로테아제 결핍 숙주 배경에서는 DegP2 불활성화가 얻어지지 않았다. 대안적인 접근법으로서, 내인성 프로테아제를 능가하는, 촉매 활성이 없는 DegP2 프로테아제(DegP2 S219A, 서열번호 29)를 만니톨 프로모터(Pmtl)의 조절 하에 별도의 플라스미드, 또는 Pmtl의 조절 하에 동일한 플라스미드에서 발현시켰거나, Fab' HC 및 LC와 함께 공-전사적으로 발현시켰다. 폴딩 조절인자 PDIA6(서열번호 27)을 공-전사적으로 발현시켰다.
프로테아제 결핍 숙주 균주의 평가
표 10에 기재된 재조합 숙주 균주에 의해 생성된 항-TNF-알파 Fab'를 경쇄 단백질용해 및/또는 중쇄 클립핑(clipping)에 대해 평가하였다.
상기 표 10의 숙주 균주를 하기 표 11에 제시된 설계에 따라 배양하고 유도하였다.
균주를 탄소원으로서 글리세롤을 함유하는 무기염 배지에서 pH 6.0 및 32℃에서 생장시키고 표시된 OD575에서 유도하고 유도 후 24시간, 36시간 또는 48시간에서 수거하였다. 수거된 세포를 75 mM 인산염 및 100 mM 염화나트륨(pH 7)에 25% 고체로 현탁시켰다. 이어서, 세포 현탁액을 용해/균질화시키고 15,000 x g에서 30분 동안 원심분리하였다. 그 다음, 정화된 용해물을 75 mM 인산염 및 100 mM NaCl(pH 7.4)에 의해 사전평형화된 단백질 L 수지에 로딩하였다. 친화성 포획된 Fab'를 3 컬럼 부피(CV)의 50 mM BisTris 및 1 M NaCl(pH 7.0)으로 세척한 후, 3 CV의 50 mM Tris(pH 7.2)로 세척하였다. Fab'를 3 내지 10 CV의 용출 완충제(75 mM 아세테이트, pH 3.4)로 용출하고 2.4 M Tris 염기로 pH 7 내지 8까지 즉시 중화시켰다. 환원 SDS-CGE 및 비환원 SDS-CGE로 Fab'의 순도를 평가하였다.
프로테아제 결핍 숙주 균주에서의 경쇄 단백질용해
Capto-L 친화성 크로마토그래피를 이용하여 Fab'를 농후화한 후, 농후화된 단편의 NR-SDS-CGE로 영상화하고 정량함으로써 Fab' 단편의 단백질용해를 정량하였다. 결과는 도 6에 제시되어 있다. 균주를 생장시키고 y-축에 표시된 유도 후 시간(시)에서 수거하였고, 재조합 단백질을 Capto-L 농후화하고 NR-SDS-CGE로 분석하였다. x-축은 각각의 레인에서 단백질용해된 경쇄 종의 퍼센트를 보여준다. 시험된 균주의 간략한 요약은 아래 표 12에 제시되어 있다.
도 6에 나타낸 바와 같이, MepM1 및 RXF04495.2 메탈로프로테아제가 결핍된 STR94974에 의해 생성된 재조합 Fab' 경쇄는 가장 적게 단백질용해되었다. 단백질용해는 I24 및 I36에서 크게 감소되었다. I24에서는 RXF04495.2의 결실을 함유하는 배경에서 단백질용해가 사실상 관찰되지 않았다. PF1596에서의 Fab' 발현은 I36에서 단백질용해가 절반으로 추가 감소함을 보여준다. RXF04495.2 결핍은 Fab의 경쇄(LC)의 분해를 현저히 감소시켰다.
프로테아제 결핍 숙주 균주에 의해 생성된 재조합 Fab'의 역가
TNF-α 결합 활성을 측정하는 옥테트 레드(Octet Red) 96 시스템을 사용하는 생물층 간섭측정을 통해 항-TNF-알파 Fab' 샘플 역가를 수득하였다. 데이터를 데이터 획득 소프트웨어 버전 11.0에서 수집하였다. 모든 실험을 1X 동역학 완충제(Sartorius, 제품 번호 18-1105)에서 수행하였다. 고정밀 스트렙트아비딘 바이오센서(Sartorius, 제품 번호 18-5117)를 115 nM 바이오티닐화된 TNF-α(Acro Biosystem, 제품 번호 TNA-H8211)와 함께 60초 동안 인큐베이션한 후, 어세이 완충제에서 60초 동안 인큐베이션하여 기준선을 확립하였다. 그 다음, 샘플의 결합을 측정하여 활성 Fab'를 검출하였다. 가장 높은 역가의 활성 Fab'를 생성한 발현 균주에 대한 결과는 아래에 요약되어 있다.
도 7은 숙주 균주 STR94974, STR94975 및 STR94977에서 항-TNF-알파 Fab' 단편이 NR-SDS-CGE, 또는 고정된 TNF-알파를 사용한 생물층 간섭측정(BLI)에 의해 평가되었을 때 24시간에서 최대 1 g/ℓ 및 72시간에서 4 g/ℓ의 역가로 생성되었음을 보여준다. 숙주 세포주 PF1596도 DsbA 및 Azu 분비 신호와 각각 중쇄 및 경쇄 아미노산 서열의 융합체를 함유하는 발현 카세트에 의해 형질전환될 수 있으며, 이것은 NR-CGE에 의해 분석될 때 MepM KO prc null 세포주에서 2 ℓ 규모에서 최대 1 g/ℓ의 Fab' 역가를 생성할 수 있다(데이터는 제시되지 않음).
프로테아제 결핍 숙주 균주의 생장 비교
도 8a 및 8b는 각각 유도 후 24시간 및 48시간 동안 Prc 및 MepM1이 결핍된 STR87639의 생장을 STR92557, STR92567, STR94974 및 STR94976과 비교한다. 생장기를 32℃ 및 pH 6.5에서 수행하였고 유도 목표는 OD575=80이었다. 세포를 IPTG로 유도하였고 생성기를 32℃ 및 pH 6.5에서 24시간 또는 48시간 동안 수행하였다. 다양한 폴딩 조절인자의 과발현은 생장에 유의미한 영향을 미치는 것으로 보이지 않았고, 메탈로프로테아제 결실(STR94974 및 STR94976)의 중복도 생장에 유의미한 영향을 미치는 것으로 보이지 않았다. STR87639를 제외한 모든 균주들이 유도 후 일정 시간 동안 세포 밀도를 계속 증가시켰다.
도 9는 슈도모나스 플루오레센스 Prc 결핍 Fab' 발현 균주 STR87639, STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장을 비교한다(표 13 참조). 생장기를 32℃ 및 pH 6.5에서 수행하였다. 유도 목표 OD575는 32℃ 및 pH 6에서 수행하였을 때(STR87639, STR92473) 100이었거나, 32℃ 및 pH 6.5에서 수행하였을 때(다른 균주들) 80이었다.
선, 위에서 아래로:
닫힌 원, 실선: STR87639(MepM1 결핍)
삼각형, 실선: STR92473(MepM1 및 MepM2 결핍)
다이아몬드, 실선: STR94995(MepS2 결핍)
원, 파선: STR94998(MepM 또는 MepS가 결핍되지 않음; 발현 구축물 없음)
열린 원, 실선: STR94996(MepS1 및 MepS2 결핍)
사각형, 실선: STR94994(MepS1 결핍)
결과는 MepS1, MepS2, 또는 MepS1과 MepS2 둘 다의 결핍이 Prc 결핍 숙주 세포의 생장을 회복시키지 못하였음을 보여주었다. MepM1, 또는 MepM1과 MepM2 둘 다의 결핍은 Prc 결핍 숙주 세포의 생장을 회복시켰다.
SEQUENCE LISTING
<110> PFENEX INC.
<120> BACTERIAL HOSTS FOR RECOMBINANT PROTEIN EXPRESSION
<130> 94931-0628.757601WO
<140> PCT/US2022/032911
<141> 2022-06-09
<150> 63/209,239
<151> 2021-06-10
<160> 98
<170> PatentIn version 3.5
<210> 1
<211> 468
<212> PRT
<213> Pseudomonas fluorescens
<400> 1
Met Thr Thr Glu Pro Ser Lys Ala Pro Pro Leu Tyr Pro Lys Thr His
1 5 10 15
Leu Leu Ala Ala Ser Gly Ile Ala Ala Leu Leu Ser Leu Ala Leu Leu
20 25 30
Val Phe Pro Ser Ser Asp Val Glu Ala Lys Arg Thr Ser Leu Ser Leu
35 40 45
Asp Leu Glu Ser Pro Val Glu Gln Leu Thr Gln Asp Gln Asp Ala Ser
50 55 60
Asp Ala Gln Gln Ala Thr Asn Thr Ala Thr Glu Ser Pro Phe Ala Gln
65 70 75 80
Ile Glu Ser Thr Pro Glu Asp Thr Gln Gln Ala Ala Gln Glu Ala Pro
85 90 95
Ala Ala Ala Lys Ser Pro Gln His Arg Glu Val Ile Val Gly Lys Gly
100 105 110
Asp Thr Leu Ser Thr Leu Phe Glu Lys Val Gly Leu Pro Ala Ala Ala
115 120 125
Val Asn Asp Val Leu Ala Ser Asp Lys Gln Ala Lys Gln Phe Thr Gln
130 135 140
Leu Lys Arg Gly Gln Lys Leu Glu Phe Glu Leu Thr Pro Asp Gly Gln
145 150 155 160
Leu Asn Asn Leu Tyr Thr Ser Ile Ser Asp Leu Glu Ser Ile Ser Leu
165 170 175
Ser Lys Gly Ala Lys Gly Phe Ala Phe Asn Arg Ile Thr Thr Lys Pro
180 185 190
Val Met Arg Ser Ala Tyr Val His Gly Val Ile Asn Ser Ser Leu Ser
195 200 205
Gln Ser Ala Ala Arg Ala Gly Leu Ser His Ser Met Thr Met Asp Met
210 215 220
Ala Ser Val Phe Gly Tyr Asp Ile Asp Phe Ala Gln Asp Ile Arg Gln
225 230 235 240
Gly Asp Glu Phe Asp Val Ile Tyr Glu Gln Lys Val Ala Asn Gly Lys
245 250 255
Val Val Gly Thr Gly Asn Ile Leu Ser Ala Arg Phe Thr Asn Arg Gly
260 265 270
Lys Thr Tyr Thr Ala Val Arg Tyr Thr Asn Lys Gln Gly Asn Ser Ser
275 280 285
Tyr Tyr Thr Ala Asp Gly Asn Ser Met Arg Lys Ala Phe Ile Arg Thr
290 295 300
Pro Val Asp Phe Ala Arg Ile Ser Ser Arg Phe Ser Met Gly Arg Lys
305 310 315 320
His Pro Ile Leu Asn Lys Ile Arg Ala His Lys Gly Val Asp Tyr Ala
325 330 335
Ala Pro Arg Gly Thr Pro Ile Lys Ala Ala Gly Asp Gly Lys Val Leu
340 345 350
Leu Ala Gly Arg Arg Gly Gly Tyr Gly Asn Thr Val Ile Ile Gln His
355 360 365
Gly Asn Thr Tyr Arg Thr Leu Tyr Gly His Met Gln Gly Phe Ala Lys
370 375 380
Gly Val Lys Thr Gly Gly Asn Val Lys Gln Gly Gln Val Ile Gly Tyr
385 390 395 400
Ile Gly Thr Thr Gly Leu Ser Thr Gly Pro His Leu His Tyr Glu Phe
405 410 415
Gln Val Asn Gly Val His Val Asp Pro Leu Gly Gln Lys Leu Pro Met
420 425 430
Ala Asp Pro Ile Ala Lys Ala Glu Arg Ala Arg Phe Met Gln Gln Ser
435 440 445
Gln Pro Leu Met Ala Arg Met Asp Gln Glu Arg Ser Thr Leu Leu Ala
450 455 460
Ser Ala Lys Arg
465
<210> 2
<211> 1407
<212> DNA
<213> Pseudomonas fluorescens
<400> 2
atgaccactg aaccgtctaa agcgccgccg ctttacccga agacccacct gctcgccgca 60
agtggtatcg ccgcccttct cagcctggca ctgctggtat tcccttccag tgacgttgaa 120
gccaaacgaa catccctgag ccttgatctg gaaagcccag ttgaacaact gacacaagat 180
caagacgctt ccgacgctca acaagccaca aacactgcaa ctgaatcacc tttcgcccag 240
atcgaaagca cacccgaaga cacccagcaa gccgcccagg aagcacctgc agcagccaag 300
agtccccagc atcgcgaagt catcgtgggc aaaggcgaca cactctcgac cctgttcgaa 360
aaagttgggt tgcctgccgc cgctgtaaat gacgtgctcg ccagcgataa gcaagccaag 420
caattcactc agctcaaacg tggtcaaaag cttgaatttg agctgacgcc agacggccag 480
ttgaacaacc tgtacaccag catcagtgac ttggaaagca tcagcctgag caaaggcgcc 540
aaaggcttcg cattcaacag aatcaccacc aaacccgtca tgcgttccgc ctacgtacat 600
ggcgtgatca acagctccct gtcgcagtcg gccgcgcgtg cgggcctgtc gcatagcatg 660
accatggaca tggccagcgt atttggctac gacatcgact tcgcccagga catccgtcaa 720
ggcgacgaat tcgacgtgat ctacgaacag aaagtagcca acggaaaagt ggtcggcact 780
ggcaacattc tttctgcacg cttcacaaac cgtggcaaaa cctacaccgc cgtgcgctac 840
accaacaaac aaggcaacag cagctactac acggctgatg gcaacagcat gcgtaaggcc 900
ttcatccgta cacccgttga ctttgcccgt attagctcgc gtttctccat gggccgcaag 960
catccaattc tgaacaaaat tcgcgcacac aagggcgtcg actatgccgc gccgcgtggc 1020
acgccaatca aagcagcggg cgacggcaag gtcttgttgg cggggcgccg tggtggttac 1080
ggcaatacgg tgatcatcca gcacggcaac acttaccgca cgctgtacgg ccacatgcaa 1140
gggttcgcca agggcgtcaa gacaggcggc aacgtgaaac agggccaagt gatcggctac 1200
atcggtacca ccggcctctc caccggcccg cacttgcact acgagttcca ggtcaacggc 1260
gtacacgtcg acccattggg ccagaagctg ccgatggccg acccgattgc caaggccgaa 1320
cgcgcgcgct tcatgcaaca gagccagccg ctgatggcac ggatggatca agagcgctcc 1380
accttgctgg cttcggcgaa gcgttaa 1407
<210> 3
<211> 273
<212> PRT
<213> Pseudomonas fluorescens
<400> 3
Met Pro Arg Leu Leu Ser Leu Leu Met Leu Leu Cys Leu Thr Phe Asn
1 5 10 15
Ala His Ala Asp Ser Tyr Ile Thr Arg Thr Leu Asn Lys Pro Val Pro
20 25 30
Gly Gly Val Ala Val Val Glu Leu Gly Pro Ser Ala Thr Ala Pro Lys
35 40 45
Ala Thr Tyr Gln Gly Lys Pro Val Leu Val Val Lys Glu Gln Asp Asn
50 55 60
Trp Leu Ala Ile Val Gly Ile Pro Leu Thr Val Lys Pro Gly Asn Glu
65 70 75 80
Arg Ile Ser Ser Gly Gly Arg Asn Leu Pro Phe Ile Val Gly Tyr Lys
85 90 95
Lys Tyr Pro Glu Gln Arg Ile Thr Leu Lys Asn Lys Ser Gln Val Asn
100 105 110
Pro Asp Pro Ala Gln Leu Lys Arg Ile Glu Gly Glu Leu Ala Val Gln
115 120 125
Leu Lys Ala Tyr Arg Ser Phe Ser Pro Asn Leu Pro Ser Asn Leu Val
130 135 140
Leu Asp Lys Pro Val Asn Gly Pro Leu Ser Ser Lys Phe Gly Val Arg
145 150 155 160
Arg Phe Phe Asn Gly Glu Glu Arg Asn Pro His Ser Gly Leu Asp Phe
165 170 175
Ala Val Pro Ala Gly Thr Pro Ile Lys Thr Pro Ala Asn Gly Lys Val
180 185 190
Ile Leu Val Gly Asn Tyr Phe Phe Asn Gly Asn Thr Val Phe Val Asp
195 200 205
His Gly Gln Gly Phe Ile Ser Met Phe Cys His Met Ser Lys Ile Asp
210 215 220
Val Arg Val Gly Gln Gln Leu Val Arg Gly Ala Val Val Gly Lys Val
225 230 235 240
Gly Ser Thr Gly Arg Ala Thr Gly Pro His Met His Trp Asn Val Ser
245 250 255
Leu Asn Asp Ala Arg Val Asp Pro Ala Ile Phe Ile Gly Ala Phe Gln
260 265 270
Pro
<210> 4
<211> 822
<212> DNA
<213> Pseudomonas fluorescens
<400> 4
atgccacgcc tactgagcct gttgatgctg ttgtgcctca cgtttaacgc ccacgccgac 60
agctacatca cgcgaaccct gaacaaaccc gtgcctggcg gcgtggccgt cgtcgaacta 120
ggcccttcgg ccacagcgcc gaaagccacc taccagggca agccggtgct ggtggtcaag 180
gagcaggaca actggctggc gattgtcggc atcccgttga cggtcaagcc tggcaacgag 240
cgcatcagca gcggggggcg caacctgccg tttatcgtcg gctacaagaa gtatccggaa 300
caacgcatca ccttgaagaa caaaagccag gtcaaccccg acccggccca gctcaagcgc 360
atcgaaggcg aattggcagt gcagctcaag gcttaccgca gcttcagccc gaatttgccg 420
agcaatctgg tgctggataa accggtgaac gggccgctgt cgagcaagtt cggggtgcga 480
cgcttcttca acggcgaaga gcgcaacccg cactcgggcc tggacttcgc cgtaccggcc 540
ggcacaccga tcaagacacc cgccaatggc aaggtgattc tggtcggcaa ttacttcttc 600
aacggcaata ccgtgtttgt cgaccatggc caggggttta tcagcatgtt ctgccatatg 660
tcgaagatcg atgtgagggt gggtcagcaa ctggtgcgcg gtgcggtagt cggcaaagta 720
ggctcgacag gccgggccac tgggccgcat atgcactgga acgtcagcct gaacgatgca 780
cgggtagatc cggcgatttt tatcggcgcg tttcaaccct ga 822
<210> 5
<211> 209
<212> PRT
<213> Pseudomonas fluorescens
<400> 5
Met Leu Asn Arg Phe Ala Pro Leu Val Pro Leu Ala Leu Val Thr Leu
1 5 10 15
Leu Phe Gly Cys Ala Ser His Pro Gln Gln Val Ala Glu Gln Gln Lys
20 25 30
Pro Gln Val Gln Asn Gln Ala Lys Phe Val Ala Ala Gln Ser Ala Ser
35 40 45
Val Tyr Glu Glu Glu Val Ala Thr Glu Lys Glu Leu Ala Glu Phe Ser
50 55 60
Asp Ser Lys Pro Tyr Gln Leu Pro Leu Leu Ala Asp Ser Ile Leu Glu
65 70 75 80
Arg Gly Met Ser Leu Ile Gly Thr Arg Tyr Arg Phe Gly Gly Thr Ser
85 90 95
Glu Ala Gly Phe Asp Cys Ser Gly Phe Ile Gly Tyr Leu Phe Arg Glu
100 105 110
Glu Ala Gly Met Asn Leu Pro Arg Ser Thr Arg Glu Met Ile Asn Val
115 120 125
Asn Ala Pro Leu Val Ala Arg Asn Asn Leu Lys Pro Gly Asp Leu Leu
130 135 140
Phe Phe Ser Thr Ser Gly Arg Gly Arg Val Ser His Ala Gly Ile Tyr
145 150 155 160
Leu Gly Asp Asn Gln Phe Ile His Ser Ser Ser Arg Arg Ser Gly Gly
165 170 175
Val Arg Val Asp Asn Leu Gly Asp Ser Tyr Trp Ser Lys Thr Phe Ile
180 185 190
Glu Ala Lys Arg Ala Leu Ala Met Ala Pro Thr Thr Val Thr Ala Ser
195 200 205
Lys
<210> 6
<211> 630
<212> DNA
<213> Pseudomonas fluorescens
<400> 6
atgctaaatc gcttcgcacc cctcgtgcct ctcgcactcg ttaccctgtt gtttggttgc 60
gcctcccacc ctcagcaggt ggcagaacag caaaaaccac aggttcaaaa tcaggcaaag 120
ttcgttgctg cacagtctgc ttctgtttat gaagaagagg tggcaaccga aaaagaactc 180
gccgagttct ccgacagcaa gccttaccag ctgccacttc tggccgacag catccttgag 240
cgcggcatgt ccttgatcgg tacccgttac cgtttcggcg gcacctcgga agccggtttt 300
gattgcagcg gtttcattgg ctacctgttt cgtgaagaag ccggtatgaa cctgccgcgc 360
tccacgcgcg agatgatcaa cgtgaatgca ccgttggtcg cacgaaacaa cctcaagccc 420
ggtgatctgc ttttctttag taccagtggc cgcggtcgtg tcagccacgc cggtatctac 480
ctgggcgata accagtttat tcattccagc agccgccgca gtggtggtgt tcgggtcgat 540
aacctcggtg acagctactg gagcaaaacc ttcatcgaag ccaagcgcgc actcgccatg 600
gccccgacga cggttaccgc tagtaagtaa 630
<210> 7
<211> 179
<212> PRT
<213> Pseudomonas fluorescens
<400> 7
Met Ser Thr Ser Ala Arg Leu Met Leu Ile Val Cys Ala Ala Leu Leu
1 5 10 15
Ser Ala Cys Ala Ser Arg Thr Pro Pro Pro Ala Pro Val Ala Val Lys
20 25 30
Pro Lys Pro Val Phe Asn Tyr Ala Thr Gln Asn Phe Ser Pro Ala Ala
35 40 45
Glu Asp Val Leu Phe Arg Ala Leu Gly Leu Val Gly Thr Pro Tyr Arg
50 55 60
Trp Gly Gly Asn Thr Pro Asp Ser Gly Phe Asp Cys Ser Gly Leu Ile
65 70 75 80
Gly Phe Val Phe Arg Asp Ala Ala Gly Ile Ser Leu Pro Arg Thr Thr
85 90 95
Arg Glu Leu Ile Val Met Arg Ala Gln Asp Val Ser Glu Gln Asn Leu
100 105 110
Gln Thr Gly Asp Leu Leu Phe Phe Ala Thr Gly Gly Gly Ser Arg Val
115 120 125
Ser His Ala Gly Ile Tyr Val Gly Glu Gly Arg Phe Val His Ala Pro
130 135 140
Gln Thr Gly Gly Thr Val Lys Leu Asp Thr Leu Ser Lys Ala Tyr Trp
145 150 155 160
Gln Asn Ala Tyr Leu Ser Ala Lys Arg Val Leu Pro Gly Asn Leu Ala
165 170 175
Arg Asn Pro
<210> 8
<211> 540
<212> DNA
<213> Pseudomonas fluorescens
<400> 8
atgtcgacct cggcccgcct gatgcttatt gtttgcgccg cgctgctcag cgcctgcgcc 60
agtcgcacac cgccgcccgc gcccgtcgcg gtcaagccta agccggtgtt caactatgcc 120
acccagaatt tctcgccagc tgccgaagac gtgctctttc gtgcgctggg cctggtcggc 180
acgccttatc gctggggcgg caacacaccg gactcgggtt ttgattgcag cggcctgatc 240
ggctttgtat tccgcgacgc tgctggcatc tcattgccgc gcaccacccg tgaactgatc 300
gtgatgcgtg cccaggacgt cagcgaacaa aacctgcaga ccggcgacct gctgttcttc 360
gccaccggtg gtggttcgcg ggtcagccat gcgggtattt atgtggggga ggggcgcttc 420
gtacacgcgc cgcaaaccgg cggtacggtg aagctggata cgctatccaa agcgtattgg 480
cagaatgcct acctgagtgc caaacgcgtg ttgccaggga atctggcgcg taacccctga 540
<210> 9
<211> 509
<212> PRT
<213> Pseudomonas fluorescens
<400> 9
Met His Ile Pro Val Arg Gln Ser Ser Tyr Ser Arg Pro Ser Asp Lys
1 5 10 15
Leu Gln Pro Asp Leu Ser Pro Asp Glu His Gln Val Val Leu Trp Ala
20 25 30
Asn Asn Lys Lys Ser Phe Thr Thr Asp Gln Ala Ala Lys His Ile Thr
35 40 45
Arg Gly Gly Phe Lys Phe His Asp Arg Asn Asn Asp Gly Lys Ile Val
50 55 60
Val Gly Tyr Asn Phe Ala Gly Gly Phe Asn Ala Ala Gln Lys Glu Arg
65 70 75 80
Ala Arg Gln Ala Leu Gln Tyr Trp Ala Asp Val Ala Asn Ile Glu Phe
85 90 95
Val Glu Asn Gly Pro Asn Thr Asp Gly Thr Ile Ser Ile Lys Gly Val
100 105 110
Pro Gly Ser Ala Gly Val Ala Gly Leu Pro Asn Lys Tyr Asn Ser Asn
115 120 125
Val Gln Ala Asn Ile Gly Thr Gln Gly Gly Gln Asn Pro Ala Met Gly
130 135 140
Ser His Phe Leu Gly Leu Leu Ile His Glu Leu Gly His Thr Leu Gly
145 150 155 160
Leu Ser His Pro Gly Lys Tyr Asp Gly Gln Gly Phe Asn Tyr Asp Arg
165 170 175
Ala Ala Glu Tyr Ala Gln Asp Thr Lys Ala Arg Ser Val Met Ser Tyr
180 185 190
Trp Thr Glu Thr His Gln Pro Gly His Asn Phe Ala Gly Arg Ser Pro
195 200 205
Gly Ala Pro Met Met Asp Asp Ile Ala Ala Ala Gln Arg Leu Tyr Gly
210 215 220
Ala Asn Thr Lys Thr Arg Asn Thr Asp Thr Thr Tyr Gly Phe Asn Ser
225 230 235 240
Asn Ser Gly Arg Glu Ala Tyr Ser Leu Lys Gln Gly Ser Asp Lys Pro
245 250 255
Ile Phe Thr Val Trp Asp Gly Gly Gly Asn Asp Thr Leu Asp Phe Ser
260 265 270
Gly Phe Thr Gln Asn Gln Thr Ile Asn Leu Lys Ala Glu Ser Phe Ser
275 280 285
Asp Val Gly Gly Leu Arg Gly Asn Val Ser Ile Ala Lys Gly Val Ser
290 295 300
Val Glu Asn Ala Ile Gly Gly Thr Gly Asn Asp Thr Leu Thr Gly Asn
305 310 315 320
Glu Gly Asn Asn Arg Leu Thr Gly Gly Lys Gly Ala Asp Lys Leu His
325 330 335
Gly Gly Ala Gly Ala Asp Thr Phe Val Tyr Arg Arg Ala Ser Asp Ser
340 345 350
Thr Pro Gln Ala Pro Asp Ile Ile Gln Asp Phe Gln Ser Gly Ser Asp
355 360 365
Lys Ile Asp Leu Thr Gly Val Val Gln Glu Ala Gly Leu Lys Ser Leu
370 375 380
Ser Phe Val Glu Lys Phe Ser Gly Lys Ala Gly Glu Ala Val Leu Gly
385 390 395 400
Gln Asp Ala Lys Thr Gly Arg Phe Thr Leu Ala Val Asp Thr Thr Gly
405 410 415
Asn Gly Thr Ala Asp Leu Leu Val Ala Ser Gln Ser Gln Ile Lys Gln
420 425 430
Ala Asp Val Ile Trp Asn Gly Gln Ala Pro Thr Val Thr Pro Thr Pro
435 440 445
Glu Pro Thr Val Val Pro Val Ser Asp Pro Val Pro Thr Pro Thr Ser
450 455 460
Glu Pro Thr Glu Pro Glu Pro Thr Pro Glu Pro Ala Pro Leu Pro Val
465 470 475 480
Pro Thr Pro Arg Pro Gly Gly Gly Phe Ile Gly Lys Ile Phe Ser Ser
485 490 495
Phe Lys Gly Phe Ile Lys Lys Val Trp Ser Ile Phe Arg
500 505
<210> 10
<211> 1530
<212> DNA
<213> Pseudomonas fluorescens
<400> 10
atgcatatcc ctgttaggca gtcttcttac tcgcgtcctt cagataagtt acagcccgat 60
ctttcacccg atgaacacca agttgttctc tgggccaaca ataaaaaatc tttcaccacg 120
gatcaggccg cgaaacacat cacccgcggt ggcttcaagt ttcatgatcg caacaatgat 180
ggaaaaatcg tcgtgggtta taactttgcg ggcggcttca atgcggctca gaaagaacgg 240
gccaggcaag cccttcagta ctgggcggat gttgctaata tcgaatttgt tgaaaatggc 300
ccgaacacgg atggcacaat aagcatcaag ggtgttccgg gttcggcagg cgtcgcgggg 360
ttgcccaaca aatataattc gaacgtccag gccaatatag gcacccaggg tgggcaaaac 420
ccggcgatgg gcagtcactt cctgggctta ttgatccatg aactggggca taccctgggg 480
ctgagtcatc caggtaaata cgacggccag ggtttcaatt acgatcgggc tgccgaatat 540
gcccaggaca ccaaggctcg cagtgtcatg agctattgga cggagactca tcagccgggg 600
cacaattttg ccgggcgcag cccgggtgcc ccgatgatgg acgatatcgc cgccgcccag 660
cggctctacg gcgccaacac caaaacccgg aataccgaca ccacctacgg cttcaattcc 720
aattcaggcc gggaggctta tagcctcaag caggggagcg acaagccgat cttcaccgtc 780
tgggacggtg gaggtaatga cacgctcgac ttctccgggt tcacccagaa ccaaaccatc 840
aacctcaagg ctgagtcatt ctcggacgtg gggggcttgc gaggaaatgt gtcgattgcc 900
aagggtgtga gtgtggaaaa cgccattggc ggtacaggca acgatacctt gacggggaac 960
gagggcaaca atcggctcac gggcggcaag ggggccgata agctgcacgg cggagctgga 1020
gcagacacgt ttgtttaccg ccgcgccagc gattcaacgc cgcaggcacc ggacatcatc 1080
caggacttcc agagcgggag cgacaagatc gacctgaccg gtgttgttca ggaggcgggg 1140
ctcaagtcgc tgagcttcgt cgagaaattc agcggcaagg cgggcgaggc cgtgctcggc 1200
caagacgcga aaaccggccg tttcacgttg gcggtggaca caacgggaaa tggtacggcg 1260
gatctactgg ttgccagcca aagccagatc aaacaggcgg atgtgatctg gaacggtcag 1320
gcgccgacag tgacgccaac gcctgaaccc actgtggtgc ctgtgtcaga tcccgtgccg 1380
acccctactt cagagccgac tgaacctgaa cccacgcctg agcccgcccc tttgcccgtc 1440
ccgactccac ggcctggagg agggtttatc gggaaaattt tttcatcatt caaggggttc 1500
ataaaaaaag tgtggtcgat attcaggtga 1530
<210> 11
<211> 24
<212> PRT
<213> Pseudomonas fluorescens
<400> 11
Met Arg Ser Arg Leu Phe Asn Phe Leu Ser Cys Leu Leu Leu Ser Ala
1 5 10 15
Thr Ala Val Gln Ser Ala Gln Ala
20
<210> 12
<211> 69
<212> DNA
<213> Pseudomonas fluorescens
<400> 12
atgcgcagtc gccttttcaa ctttttatct tgtctgcttc tttccgccac tgccgttcaa 60
tccgcccag 69
<210> 13
<211> 20
<212> PRT
<213> Pseudomonas fluorescens
<400> 13
Met Phe Ala Lys Leu Val Ala Val Ser Leu Leu Thr Leu Ala Ser Gly
1 5 10 15
Gln Leu Leu Ala
20
<210> 14
<211> 57
<212> DNA
<213> Pseudomonas fluorescens
<400> 14
atgtttgcca aactcgttgc tgtttccctg ctgactctgg cgagcggcca gttgctt 57
<210> 15
<211> 22
<212> PRT
<213> Pseudomonas fluorescens
<400> 15
Met Arg Asn Leu Ile Leu Ser Ala Ala Leu Val Thr Ala Ser Leu Phe
1 5 10 15
Gly Met Thr Ala Gln Ala
20
<210> 16
<211> 63
<212> DNA
<213> Pseudomonas fluorescens
<400> 16
atgcgtaatc tgatcctcag cgccgctctc gtcactgcca gcctcttcgg catgaccgca 60
caa 63
<210> 17
<211> 25
<212> PRT
<213> Pseudomonas fluorescens
<400> 17
Met Lys Ser Ala Leu Lys Asn Val Ile Pro Gly Ala Leu Ala Leu Leu
1 5 10 15
Leu Leu Phe Pro Val Ala Ala Gln Ala
20 25
<210> 18
<211> 75
<212> DNA
<213> Pseudomonas fluorescens
<400> 18
atgaaatctg cattgaagaa cgttattccg ggcgccctgg cccttctgct gctattcccc 60
gtcgccgccc aggcc 75
<210> 19
<211> 21
<212> PRT
<213> Pseudomonas fluorescens
<400> 19
Met Lys Lys Ser Thr Leu Ala Val Ala Val Thr Leu Gly Ala Ile Ala
1 5 10 15
Gln Gln Ala Gly Ala
20
<210> 20
<211> 63
<212> DNA
<213> Pseudomonas fluorescens
<400> 20
atgaagaagt ccaccttggc tgtggctgta acgttgggcg caatcgccca gcaagcaggc 60
gcc 63
<210> 21
<211> 229
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 21
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Val Phe Thr Asp Tyr
20 25 30
Gly Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Met
35 40 45
Gly Trp Ile Asn Thr Tyr Ile Gly Glu Pro Ile Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Phe Ser Leu Asp Thr Ser Lys Ser Thr Ala Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Gly Tyr Arg Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr
100 105 110
Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
115 120 125
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
130 135 140
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
145 150 155 160
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
165 170 175
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
180 185 190
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
195 200 205
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
210 215 220
His Thr Cys Ala Ala
225
<210> 22
<211> 687
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 22
gaagtgcaac tggtggagag cggcggtggc ttggttcagc cgggtggctc cctgcgtctg 60
tcgtgtgcgg cctccgggta cgtgttcacc gactacggca tgaactgggt ccgccaggcc 120
ccagggaagg gtctggaatg gatgggctgg atcaacacgt atatcggcga accgatttat 180
gcggacagcg taaaagggcg cttcaccttt agcttggata cctccaaaag tacggcctac 240
ctgcagatga attccctgcg ggcagaggat accgcggtgt attactgcgc tcgcggctac 300
cgcagctacg cgatggacta ctggggccaa ggcaccctgg tgacggtgag ttcggccagc 360
accaagggcc ctagcgtgtt cccactcgcc cccagcagca aatcgacctc gggcggtacg 420
gccgcactcg gctgcctggt gaaggactat ttcccggagc cggtgaccgt cagttggaac 480
agtggtgccc tgactagcgg cgtgcacacc tttcccgccg ttctgcagag ctcgggcttg 540
tactccttgt cgtccgtcgt aactgtgccc agcagctcgc tcggcaccca gacctacatc 600
tgcaatgtca accacaagcc gagcaacacc aaagtggata agaaggtcga accgaagtcc 660
tgcgacaaga cccatacctg tgcggcc 687
<210> 23
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 23
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Asn Val Gly Thr Asn
20 25 30
Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Ala Leu Ile
35 40 45
Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Tyr Arg Phe Ser Gly
50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Asn Ile Tyr Pro Leu
85 90 95
Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205
Phe Asn Arg Gly Glu Cys
210
<210> 24
<211> 642
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
gacattcaga tgacccagag ccccagcagc ctgagcgcca gcgtagggga ccgcgtgacc 60
atcacctgta aagccagtca aaacgtcggt accaacgtgg catggtatca acaaaaaccg 120
ggtaaagccc ccaaagcgtt gatctactcc gccagtttcc tgtatagcgg cgtgccgtac 180
cgcttcagcg gctccggcag cggtaccgac tttaccctga ccatttcctc gctgcaaccc 240
gaggactttg cgacctacta ttgccagcag tataacatct acccgctgac gttcgggcag 300
ggcacgaagg tcgaaatcaa acggaccgta gcggcaccga gtgtgttcat cttccctccg 360
agcgacgaac agttgaagtc cggcaccgcc tcggtcgtgt gcctgctcaa taacttctac 420
ccacgcgagg ctaaggtgca atggaaggtg gacaacgccc tgcagtcggg caatagtcag 480
gaatcggtga ctgaacagga ttccaaggat agcacctact cgctcagcag cacgctgacc 540
ttgtcgaagg ccgattacga gaagcataag gtctacgcgt gcgaagtgac gcaccagggc 600
ctgtcctcgc cggttactaa gagctttaac cgtggcgagt gc 642
<210> 25
<211> 253
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Met Arg Ser Arg Leu Phe Asn Phe Leu Ser Cys Leu Leu Leu Ser Ala
1 5 10 15
Thr Ala Val Gln Ser Ala Gln Ala Glu Val Gln Leu Val Glu Ser Gly
20 25 30
Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
35 40 45
Ser Gly Tyr Val Phe Thr Asp Tyr Gly Met Asn Trp Val Arg Gln Ala
50 55 60
Pro Gly Lys Gly Leu Glu Trp Met Gly Trp Ile Asn Thr Tyr Ile Gly
65 70 75 80
Glu Pro Ile Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Phe Ser Leu
85 90 95
Asp Thr Ser Lys Ser Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala
100 105 110
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Tyr Arg Ser Tyr Ala
115 120 125
Met Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser
130 135 140
Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr
145 150 155 160
Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro
165 170 175
Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val
180 185 190
His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser
195 200 205
Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile
210 215 220
Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val
225 230 235 240
Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Ala Ala
245 250
<210> 26
<211> 234
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 26
Met Phe Ala Lys Leu Val Ala Val Ser Leu Leu Thr Leu Ala Ser Gly
1 5 10 15
Gln Leu Leu Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Asn
35 40 45
Val Gly Thr Asn Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro
50 55 60
Lys Ala Leu Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Tyr
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
85 90 95
Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Asn
100 105 110
Ile Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
115 120 125
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
130 135 140
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
145 150 155 160
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
165 170 175
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
180 185 190
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
195 200 205
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
210 215 220
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210> 27
<211> 421
<212> PRT
<213> Homo sapiens
<400> 27
Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro Ser Asn Phe
1 5 10 15
Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val Glu Phe Tyr
20 25 30
Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu Trp Lys Lys
35 40 45
Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala Val Asp Ala
50 55 60
Asp Lys His His Ser Leu Gly Gly Gln Tyr Gly Val Gln Gly Phe Pro
65 70 75 80
Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg Pro Glu Asp Tyr Gln
85 90 95
Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu Ser Ala Leu
100 105 110
Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Ser Gly Gly Tyr Ser
115 120 125
Ser Gly Lys Gln Gly Arg Ser Asp Ser Ser Ser Lys Lys Asp Val Ile
130 135 140
Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val Leu Asp Ser Glu Asp
145 150 155 160
Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Asn
165 170 175
Leu Glu Pro Glu Trp Ala Ala Ala Ala Ser Glu Val Lys Glu Gln Thr
180 185 190
Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val Asn Gln Val
195 200 205
Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile Lys Ile Phe
210 215 220
Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg Thr Arg Ser
225 230 235 240
Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn Ala Pro Pro
245 250 255
Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile Ala Lys Arg Thr Cys
260 265 270
Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His Ile Leu Asp
275 280 285
Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu Leu Lys Leu
290 295 300
Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp Thr Glu Ala
305 310 315 320
Gly Ala Gln Ser Glu Leu Glu Thr Ala Leu Gly Ile Gly Gly Phe Gly
325 330 335
Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys Phe Ala Leu
340 345 350
Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe Leu Arg Glu
355 360 365
Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly Gly Ala Phe
370 375 380
Pro Thr Ile Val Glu Arg Glu Pro Trp Asp Gly Arg Asp Gly Glu Leu
385 390 395 400
Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu Asp Asp Leu
405 410 415
Gly Lys Asp Glu Leu
420
<210> 28
<211> 442
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 28
Met Lys Lys Ser Thr Leu Ala Val Ala Val Thr Leu Gly Ala Ile Ala
1 5 10 15
Gln Gln Ala Gly Ala Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu
20 25 30
Thr Pro Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp
35 40 45
Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr
50 55 60
Pro Glu Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val
65 70 75 80
Gly Ala Val Asp Ala Asp Lys His His Ser Leu Gly Gly Gln Tyr Gly
85 90 95
Val Gln Gly Phe Pro Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg
100 105 110
Pro Glu Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala
115 120 125
Ala Leu Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg
130 135 140
Ser Gly Gly Tyr Ser Ser Gly Lys Gln Gly Arg Ser Asp Ser Ser Ser
145 150 155 160
Lys Lys Asp Val Ile Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val
165 170 175
Leu Asp Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys
180 185 190
Gly His Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Ser Glu
195 200 205
Val Lys Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala
210 215 220
Thr Val Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro
225 230 235 240
Thr Ile Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly
245 250 255
Gly Arg Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser
260 265 270
Asp Asn Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile
275 280 285
Ala Lys Arg Thr Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu
290 295 300
Pro His Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu
305 310 315 320
Val Leu Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp
325 330 335
Leu Trp Thr Glu Ala Gly Ala Gln Ser Glu Leu Glu Thr Ala Leu Gly
340 345 350
Ile Gly Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys
355 360 365
Met Lys Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn
370 375 380
Glu Phe Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val
385 390 395 400
Gly Gly Gly Ala Phe Pro Thr Ile Val Glu Arg Glu Pro Trp Asp Gly
405 410 415
Arg Asp Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val
420 425 430
Glu Leu Asp Asp Leu Gly Lys Asp Glu Leu
435 440
<210> 29
<211> 478
<212> PRT
<213> Pseudomonas fluorescens
<400> 29
Met Ser Ile Pro Arg Leu Lys Ser Tyr Leu Ser Ile Val Ala Thr Val
1 5 10 15
Leu Val Leu Gly Gln Ala Leu Pro Ala Gln Ala Val Glu Leu Pro Asp
20 25 30
Phe Thr Gln Leu Val Glu Gln Ala Ser Pro Ala Val Val Asn Ile Ser
35 40 45
Thr Thr Gln Lys Leu Pro Asp Arg Lys Val Ser Asn Gln Gln Met Pro
50 55 60
Asp Leu Glu Gly Leu Pro Pro Met Leu Arg Glu Phe Phe Glu Arg Gly
65 70 75 80
Met Pro Gln Pro Arg Ser Pro Arg Gly Gly Gly Gly Gln Arg Glu Ala
85 90 95
Gln Ser Leu Gly Ser Gly Phe Ile Ile Ser Pro Asp Gly Tyr Ile Leu
100 105 110
Thr Asn Asn His Val Ile Ala Asp Ala Asp Glu Ile Leu Val Arg Leu
115 120 125
Ala Asp Arg Ser Glu Leu Lys Ala Lys Leu Ile Gly Thr Asp Pro Arg
130 135 140
Ser Asp Val Ala Leu Leu Lys Ile Glu Gly Lys Asp Leu Pro Val Leu
145 150 155 160
Lys Leu Gly Lys Ser Gln Asp Leu Lys Ala Gly Gln Trp Val Val Ala
165 170 175
Ile Gly Ser Pro Phe Gly Phe Asp His Thr Val Thr Gln Gly Ile Val
180 185 190
Ser Ala Ile Gly Arg Ser Leu Pro Asn Glu Asn Tyr Val Pro Phe Ile
195 200 205
Gln Thr Asp Val Pro Ile Asn Pro Gly Asn Ala Gly Gly Pro Leu Phe
210 215 220
Asn Leu Ala Gly Glu Val Val Gly Ile Asn Ser Gln Ile Tyr Thr Arg
225 230 235 240
Ser Gly Gly Phe Met Gly Val Ser Phe Ala Ile Pro Ile Asp Val Ala
245 250 255
Met Asp Val Ser Asn Gln Leu Lys Ser Gly Gly Lys Val Ser Arg Gly
260 265 270
Trp Leu Gly Val Val Ile Gln Glu Val Asn Lys Asp Leu Ala Glu Ser
275 280 285
Phe Gly Leu Asp Lys Pro Ala Gly Ala Leu Val Ala Gln Ile Gln Asp
290 295 300
Asn Gly Pro Ala Ala Lys Gly Gly Leu Lys Val Gly Asp Val Ile Leu
305 310 315 320
Ser Met Asn Gly Gln Pro Ile Ile Met Ser Ala Asp Leu Pro His Leu
325 330 335
Val Gly Ala Leu Lys Ala Gly Gly Lys Ala Lys Leu Glu Val Ile Arg
340 345 350
Asp Gly Lys Arg Gln Asn Val Glu Leu Thr Val Gly Ala Ile Pro Glu
355 360 365
Glu Gly Ala Thr Leu Asp Ala Leu Gly Asn Ala Lys Pro Gly Ala Glu
370 375 380
Arg Ser Ser Asn Arg Leu Gly Ile Ala Val Val Glu Leu Thr Ala Glu
385 390 395 400
Gln Lys Lys Thr Phe Asp Leu Gln Ser Gly Val Val Ile Lys Glu Val
405 410 415
Gln Asp Gly Pro Ala Ala Leu Ile Gly Leu Gln Pro Gly Asp Val Ile
420 425 430
Thr His Leu Asn Asn Gln Ala Ile Asp Thr Thr Lys Glu Phe Ala Asp
435 440 445
Ile Ala Lys Ala Leu Pro Lys Asn Arg Ser Val Ser Met Arg Val Leu
450 455 460
Arg Gln Gly Arg Ala Ser Phe Ile Thr Phe Lys Leu Ala Glu
465 470 475
<210> 30
<211> 1434
<212> DNA
<213> Pseudomonas fluorescens
<400> 30
atgtcgatac cacgtttgaa gtcttactta tccatagtcg ccacagtgct ggtgctgggt 60
caggccttac ctgcgcaagc ggtcgagttg cctgacttca cccaactggt ggagcaggcc 120
tcgcctgccg tggtgaacat cagtaccacg cagaagctgc cggatcgcaa agtctcgaac 180
cagcagatgc ccgacctgga aggcttgccg cccatgctgc gcgagttctt cgaacgaggg 240
atgccgcaac cacgctcccc ccgtggcggc ggtggccagc gcgaagccca atccctgggc 300
tccggcttca tcatttcgcc tgacggctat atcctcacca acaaccacgt gattgccgat 360
gccgacgaga ttctcgtgcg cctggccgac cgcagtgaac tcaaggccaa gctgattggc 420
accgatccac gttccgacgt ggccttgctt aaaatcgagg gcaaggactt gccggtgctt 480
aagctgggca agtcccagga cctgaaggcc ggtcagtggg tggtcgcgat cggttcgccg 540
ttcggctttg accacaccgt tacccaaggc atcgtcagcg ccatcggtcg cagcctgccg 600
aacgaaaact acgtaccgtt catccagacc gacgtgccga tcaacccggg taacgccggt 660
ggcccgctgt tcaacctggc cggcgaagtg gtggggatca actcgcagat ctacacccgc 720
tccggcggct tcatgggcgt gtctttcgcg atcccaatcg atgtggccat ggacgtctcc 780
aatcagctca aaagcggcgg caaggtcagc cgcggctggt tgggcgtggt aatccaggaa 840
gtgaacaagg acctggctga gtccttcggt ctcgacaagc cggccggtgc cctggttgcg 900
cagattcagg acaatggccc tgcggccaaa ggcggcctga aagtcggtga cgtcatcctg 960
agcatgaacg gccagccgat catcatgtcg gcagacttgc ctcatttggt cggcgcgctc 1020
aaggccggcg gcaaagccaa gctggaagtg attcgtgatg gcaagcgcca gaacgtcgaa 1080
ctgaccgtag gtgccatccc ggaagaaggc gcgaccctgg atgccctggg caacgccaag 1140
cccggtgccg agcgcagcag taaccgcctg ggtatcgccg tggttgaact gaccgccgag 1200
cagaagaaaa ccttcgacct gcaaagcggt gtggtgatca aggaagttca ggacggccca 1260
gccgccttga tcggcctgca accgggtgac gtgatcactc acttgaacaa ccaggcaatc 1320
gataccacca aggaattcgc cgacatcgcc aaggcgttgc cgaagaatcg ctcggtgtcg 1380
atgcgcgtcc tgcgtcaagg ccgtgccagc ttcattacct tcaagctggc tgag 1434
<210> 31
<211> 478
<212> PRT
<213> Pseudomonas fluorescens
<400> 31
Met Ser Ile Pro Arg Leu Lys Ser Tyr Leu Ser Ile Val Ala Thr Val
1 5 10 15
Leu Val Leu Gly Gln Ala Leu Pro Ala Gln Ala Val Glu Leu Pro Asp
20 25 30
Phe Thr Gln Leu Val Glu Gln Ala Ser Pro Ala Val Val Asn Ile Ser
35 40 45
Thr Thr Gln Lys Leu Pro Asp Arg Lys Val Ser Asn Gln Gln Met Pro
50 55 60
Asp Leu Glu Gly Leu Pro Pro Met Leu Arg Glu Phe Phe Glu Arg Gly
65 70 75 80
Met Pro Gln Pro Arg Ser Pro Arg Gly Gly Gly Gly Gln Arg Glu Ala
85 90 95
Gln Ser Leu Gly Ser Gly Phe Ile Ile Ser Pro Asp Gly Tyr Ile Leu
100 105 110
Thr Asn Asn His Val Ile Ala Asp Ala Asp Glu Ile Leu Val Arg Leu
115 120 125
Ala Asp Arg Ser Glu Leu Lys Ala Lys Leu Ile Gly Thr Asp Pro Arg
130 135 140
Ser Asp Val Ala Leu Leu Lys Ile Glu Gly Lys Asp Leu Pro Val Leu
145 150 155 160
Lys Leu Gly Lys Ser Gln Asp Leu Lys Ala Gly Gln Trp Val Val Ala
165 170 175
Ile Gly Ser Pro Phe Gly Phe Asp His Thr Val Thr Gln Gly Ile Val
180 185 190
Ser Ala Ile Gly Arg Ser Leu Pro Asn Glu Asn Tyr Val Pro Phe Ile
195 200 205
Gln Thr Asp Val Pro Ile Asn Pro Gly Asn Ser Gly Gly Pro Leu Phe
210 215 220
Asn Leu Ala Gly Glu Val Val Gly Ile Asn Ser Gln Ile Tyr Thr Arg
225 230 235 240
Ser Gly Gly Phe Met Gly Val Ser Phe Ala Ile Pro Ile Asp Val Ala
245 250 255
Met Asp Val Ser Asn Gln Leu Lys Ser Gly Gly Lys Val Ser Arg Gly
260 265 270
Trp Leu Gly Val Val Ile Gln Glu Val Asn Lys Asp Leu Ala Glu Ser
275 280 285
Phe Gly Leu Asp Lys Pro Ala Gly Ala Leu Val Ala Gln Ile Gln Asp
290 295 300
Asn Gly Pro Ala Ala Lys Gly Gly Leu Lys Val Gly Asp Val Ile Leu
305 310 315 320
Ser Met Asn Gly Gln Pro Ile Ile Met Ser Ala Asp Leu Pro His Leu
325 330 335
Val Gly Ala Leu Lys Ala Gly Gly Lys Ala Lys Leu Glu Val Ile Arg
340 345 350
Asp Gly Lys Arg Gln Asn Val Glu Leu Thr Val Gly Ala Ile Pro Glu
355 360 365
Glu Gly Ala Thr Leu Asp Ala Leu Gly Asn Ala Lys Pro Gly Ala Glu
370 375 380
Arg Ser Ser Asn Arg Leu Gly Ile Ala Val Val Glu Leu Thr Ala Glu
385 390 395 400
Gln Lys Lys Thr Phe Asp Leu Gln Ser Gly Val Val Ile Lys Glu Val
405 410 415
Gln Asp Gly Pro Ala Ala Leu Ile Gly Leu Gln Pro Gly Asp Val Ile
420 425 430
Thr His Leu Asn Asn Gln Ala Ile Asp Thr Thr Lys Glu Phe Ala Asp
435 440 445
Ile Ala Lys Ala Leu Pro Lys Asn Arg Ser Val Ser Met Arg Val Leu
450 455 460
Arg Gln Gly Arg Ala Ser Phe Ile Thr Phe Lys Leu Ala Glu
465 470 475
<210> 32
<211> 188
<212> PRT
<213> Escherichia coli
<400> 32
Met Val Lys Ser Gln Pro Ile Leu Arg Tyr Ile Leu Arg Gly Ile Pro
1 5 10 15
Ala Ile Ala Val Ala Val Leu Leu Ser Ala Cys Ser Ala Asn Asn Thr
20 25 30
Ala Lys Asn Met His Pro Glu Thr Arg Ala Val Gly Ser Glu Thr Ser
35 40 45
Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu Asn Leu Val Arg Asn Val
50 55 60
Asp Val Lys Ser Arg Ile Met Asp Gln Tyr Ala Asp Trp Lys Gly Val
65 70 75 80
Arg Tyr Arg Leu Gly Gly Ser Thr Lys Lys Gly Ile Asp Cys Ser Gly
85 90 95
Phe Val Gln Arg Thr Phe Arg Glu Gln Phe Gly Leu Glu Leu Pro Arg
100 105 110
Ser Thr Tyr Glu Gln Gln Glu Met Gly Lys Ser Val Ser Arg Ser Asn
115 120 125
Leu Arg Thr Gly Asp Leu Val Leu Phe Arg Ala Gly Ser Thr Gly Arg
130 135 140
His Val Gly Ile Tyr Ile Gly Asn Asn Gln Phe Val His Ala Ser Thr
145 150 155 160
Ser Ser Gly Val Ile Ile Ser Ser Met Asn Glu Pro Tyr Trp Lys Lys
165 170 175
Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser Arg Ser
180 185
<210> 33
<211> 693
<212> PRT
<213> Pseudomonas fluorescens
<400> 33
Met Lys His Leu Phe Pro Ser Thr Ala Leu Ala Phe Phe Ile Gly Leu
1 5 10 15
Gly Phe Ala Ser Met Ser Thr Asn Thr Phe Ala Ala Asn Ser Trp Asp
20 25 30
Asn Leu Gln Pro Asp Arg Asp Glu Val Ile Ala Ser Leu Asn Val Val
35 40 45
Glu Leu Leu Lys Arg His His Tyr Ser Lys Pro Pro Leu Asp Asp Ala
50 55 60
Arg Ser Val Ile Ile Tyr Asp Ser Tyr Leu Lys Leu Leu Asp Pro Ser
65 70 75 80
Arg Ser Tyr Phe Leu Ala Ser Asp Ile Ala Glu Phe Asp Lys Trp Lys
85 90 95
Thr Gln Phe Asp Asp Phe Leu Lys Ser Gly Asp Leu Gln Pro Gly Phe
100 105 110
Thr Ile Tyr Lys Arg Tyr Leu Asp Arg Val Lys Ala Arg Leu Asp Phe
115 120 125
Ala Leu Gly Glu Leu Asn Lys Gly Val Asp Lys Leu Asp Phe Thr Gln
130 135 140
Lys Glu Thr Leu Leu Val Asp Arg Lys Asp Ala Pro Trp Leu Thr Ser
145 150 155 160
Thr Ala Ala Leu Asp Asp Leu Trp Arg Lys Arg Val Lys Asp Glu Val
165 170 175
Leu Arg Leu Lys Ile Ala Gly Lys Glu Pro Lys Ala Ile Gln Glu Leu
180 185 190
Leu Thr Lys Arg Tyr Lys Asn Gln Leu Ala Arg Leu Asp Gln Thr Arg
195 200 205
Ala Glu Asp Ile Phe Gln Ala Tyr Ile Asn Thr Phe Ala Met Ser Tyr
210 215 220
Asp Pro His Thr Asn Tyr Leu Ser Pro Asp Asn Ala Glu Asn Phe Asp
225 230 235 240
Ile Asn Met Ser Leu Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Ser
245 250 255
Asp Asn Asp Gln Val Lys Ile Val Arg Leu Val Pro Ala Gly Pro Ala
260 265 270
Asp Lys Thr Lys Gln Val Ala Pro Ala Asp Lys Ile Ile Gly Val Ala
275 280 285
Gln Ala Asp Lys Glu Met Val Asp Val Val Gly Trp Arg Leu Asp Glu
290 295 300
Val Val Lys Leu Ile Arg Gly Pro Lys Gly Ser Val Val Arg Leu Glu
305 310 315 320
Val Ile Pro His Thr Asn Ala Pro Asn Asp Gln Thr Ser Lys Ile Val
325 330 335
Ser Ile Thr Arg Glu Ala Val Lys Leu Glu Asp Gln Ala Val Gln Lys
340 345 350
Lys Val Leu Asn Leu Lys Gln Asp Gly Lys Asp Tyr Lys Leu Gly Val
355 360 365
Ile Glu Ile Pro Ala Phe Tyr Leu Asp Phe Lys Ala Phe Arg Ala Gly
370 375 380
Asp Pro Asp Tyr Lys Ser Thr Thr Arg Asp Val Lys Lys Ile Leu Thr
385 390 395 400
Glu Leu Gln Lys Glu Lys Val Asp Gly Val Val Ile Asp Leu Arg Asn
405 410 415
Asn Gly Gly Gly Ser Leu Gln Glu Ala Thr Glu Leu Thr Ser Leu Phe
420 425 430
Ile Asp Lys Gly Pro Thr Val Leu Val Arg Asn Ala Asp Gly Arg Val
435 440 445
Asp Val Leu Glu Asp Glu Asn Pro Gly Ala Phe Tyr Lys Gly Pro Met
450 455 460
Ala Leu Leu Val Asn Arg Leu Ser Ala Ser Ala Ser Glu Ile Phe Ala
465 470 475 480
Gly Ala Met Gln Asp Tyr His Arg Ala Leu Ile Ile Gly Gly Gln Thr
485 490 495
Phe Gly Lys Gly Thr Val Gln Thr Ile Gln Pro Leu Asn His Gly Glu
500 505 510
Leu Lys Leu Thr Leu Ala Lys Phe Tyr Arg Val Ser Gly Gln Ser Thr
515 520 525
Gln His Gln Gly Val Leu Pro Asp Ile Asp Phe Pro Ser Ile Ile Asp
530 535 540
Thr Lys Glu Ile Gly Glu Ser Ala Leu Pro Glu Ala Met Pro Trp Asp
545 550 555 560
Thr Ile Arg Pro Ala Ile Lys Pro Ala Ser Asp Pro Phe Lys Pro Phe
565 570 575
Leu Ala Gln Leu Lys Ala Asp His Asp Thr Arg Ser Ala Lys Asp Ala
580 585 590
Glu Phe Val Phe Ile Arg Asp Lys Leu Ala Leu Ala Lys Lys Leu Met
595 600 605
Glu Glu Lys Thr Val Ser Leu Asn Glu Ala Asp Arg Arg Ala Gln His
610 615 620
Ser Ser Ile Glu Asn Gln Gln Leu Val Leu Glu Asn Thr Arg Arg Lys
625 630 635 640
Ala Lys Gly Glu Asp Pro Leu Lys Glu Leu Lys Lys Glu Asp Glu Asp
645 650 655
Ala Leu Pro Thr Glu Ala Asp Lys Thr Lys Pro Glu Asp Asp Ala Tyr
660 665 670
Leu Ala Glu Thr Gly Arg Ile Leu Leu Asp Tyr Leu Lys Ile Thr Lys
675 680 685
Gln Val Ala Lys Gln
690
<210> 34
<211> 2082
<212> DNA
<213> Pseudomonas fluorescens
<400> 34
atgaagcatc tgttccccag caccgccctc gcttttttca ttggtctcgg cttcgcgtcg 60
atgtcgacca atacgttcgc agccaatagc tgggacaacc ttcagcctga tcgcgatgag 120
gtgattgcca gccttaacgt cgtcgagttg cttaagcgcc atcactacag caagccgccg 180
ctggacgacg ctcgctcagt gatcatctac gacagctacc tcaagctgct ggacccgtcg 240
cgcagctact tcctggccag cgatatcgct gagttcgaca agtggaagac gcaattcgac 300
gacttcctca agagcggcga cctgcagcct ggcttcacca tctacaagcg ctacctagac 360
cgcgtcaaag cgcgtctgga cttcgccctg ggtgagctga acaaaggcgt cgacaagctc 420
gatttcaccc agaaagaaac ccttctggtg gaccgcaagg acgccccttg gctgaccagc 480
accgcagccc tagacgacct gtggcgcaaa cgcgtcaagg acgaagtgct gcgcttgaag 540
atcgccggca aagagcccaa ggccattcaa gagctgttga ccaagcgcta caaaaaccag 600
ctggcgcgcc tggaccagac ccgtgccgag gatatcttcc aggcctacat caacaccttt 660
gcgatgtcct acgacccgca caccaattat ctgtcgccag ataacgcgga aaatttcgat 720
atcaatatga gtctgtccct ggaaggcatc ggtgccgtcc tgcaaagcga caatgaccag 780
gtgaagattg tacgtctggt gccggcaggc ccggctgaca aaaccaagca agtggcaccg 840
gccgacaaga tcatcggcgt ggcccaggcc gacaaagaga tggtcgatgt ggtcggctgg 900
cgcctggacg aagtggtcaa gctgatccgt gggcctaaag gcagcgtggt gcgcctggaa 960
gtgattccgc acaccaatgc accgaacgac cagaccagca agatcgtgtc catcacccgt 1020
gaagcggtga agctcgaaga ccaggccgtg cagaagaaag tcctcaacct caagcaggat 1080
ggcaaggact acaagctggg ggtgattgaa atcccggcct tctacctgga cttcaaggcg 1140
ttccgtgccg gtgatccgga ctacaagtcc accacccgcg acgtgaagaa aatcctcaca 1200
gaactgcaga aagagaaagt cgacggcgtg gtcatcgacc tgcgcaacaa cggcggcggc 1260
tccctgcagg aagccaccga gctgaccagc ctgtttatcg acaagggccc gaccgtgttg 1320
gtacgcaacg ctgacggccg tgtcgacgtg ctcgaagacg agaacccggg ggccttctac 1380
aaagggccga tggcgctgct ggtcaaccgc ctctcggcct cggcctcgga gattttcgcc 1440
ggtgccatgc aggactacca ccgtgcactg atcatcggcg gccagacctt cggcaaaggc 1500
accgtgcaga ccatccagcc gctgaaccat ggcgagctta agctgacact ggccaagttc 1560
taccgggtct ccgggcagag cacccagcat cagggcgtac tgccggatat cgatttcccg 1620
tcgatcatcg acaccaagga aattggcgaa agcgccctgc ctgaagccat gccgtgggac 1680
accatccgcc ctgcgatcaa gccggcgtcg gatccgttca agccgttcct ggcacagctg 1740
aaggctgacc acgacacccg ctctgccaag gatgccgagt tcgtgtttat ccgcgacaag 1800
ctggccctgg ccaagaagct gatggaagag aagaccgtca gcctcaacga agcggatcgc 1860
cgtgcacagc actccagcat cgagaatcag caactggtgc tggaaaacac ccgccgcaag 1920
gccaaaggtg aagacccgct caaagagctg aagaaagaag atgaagacgc gctgccgacc 1980
gaggcggata aaaccaagcc ggaagacgac gcctacttgg ccgagactgg ccggatcctg 2040
ctggattacc tgaagatcac caagcaggtg gccaagcagt aa 2082
<210> 35
<211> 437
<212> PRT
<213> Pseudomonas fluorescens
<400> 35
Met Leu His Leu Ser Arg Leu Thr Ser Leu Ala Leu Thr Ile Ala Leu
1 5 10 15
Val Ile Gly Ala Pro Leu Ala Phe Ala Asp Gln Ala Ala Pro Ala Ala
20 25 30
Pro Ala Thr Ala Ala Thr Thr Lys Ala Pro Leu Pro Leu Asp Glu Leu
35 40 45
Arg Thr Phe Ala Glu Val Met Asp Arg Ile Lys Ala Ala Tyr Val Glu
50 55 60
Pro Val Asp Asp Lys Ala Leu Leu Glu Asn Ala Ile Lys Gly Met Leu
65 70 75 80
Ser Asn Leu Asp Pro His Ser Ala Tyr Leu Gly Pro Glu Asp Phe Ala
85 90 95
Glu Leu Gln Glu Ser Thr Ser Gly Glu Phe Gly Gly Leu Gly Ile Glu
100 105 110
Val Gly Ser Glu Asp Gly Gln Ile Lys Val Val Ser Pro Ile Asp Asp
115 120 125
Thr Pro Ala Ser Lys Ala Gly Ile Gln Ala Gly Asp Leu Ile Val Lys
130 135 140
Ile Asn Gly Gln Pro Thr Arg Gly Gln Thr Met Thr Glu Ala Val Asp
145 150 155 160
Lys Met Arg Gly Lys Leu Gly Gln Lys Ile Thr Leu Thr Leu Val Arg
165 170 175
Asp Gly Gly Asn Pro Phe Asp Val Thr Leu Ala Arg Ala Thr Ile Thr
180 185 190
Val Lys Ser Val Lys Ser Gln Leu Leu Glu Ser Gly Tyr Gly Tyr Ile
195 200 205
Arg Ile Thr Gln Phe Gln Val Lys Thr Gly Asp Glu Val Ala Lys Ala
210 215 220
Leu Ala Lys Leu Arg Lys Asp Asn Gly Lys Lys Leu Asn Gly Ile Val
225 230 235 240
Leu Asp Leu Arg Asn Asn Pro Gly Gly Val Leu Gln Ser Ala Val Glu
245 250 255
Val Val Asp His Phe Val Thr Lys Gly Leu Ile Val Tyr Thr Lys Gly
260 265 270
Arg Ile Ala Asn Ser Glu Leu Arg Phe Ser Ala Thr Gly Asn Asp Leu
275 280 285
Ser Glu Asn Val Pro Leu Ala Val Leu Ile Asn Gly Gly Ser Ala Ser
290 295 300
Ala Ser Glu Ile Val Ala Gly Ala Leu Gln Asp Leu Lys Arg Gly Val
305 310 315 320
Leu Met Gly Thr Thr Ser Phe Gly Lys Gly Ser Val Gln Thr Val Leu
325 330 335
Pro Leu Asn Asn Glu Arg Ala Leu Lys Ile Thr Thr Ala Leu Tyr Tyr
340 345 350
Thr Pro Asn Gly Arg Ser Ile Gln Ala Gln Gly Ile Val Pro Asp Ile
355 360 365
Glu Val Arg Arg Ala Lys Ile Thr Asn Glu Ile Asp Gly Glu Tyr Tyr
370 375 380
Lys Glu Ala Asp Leu Gln Gly His Leu Gly Asn Gly Asn Gly Gly Ala
385 390 395 400
Asp Gln Pro Thr Gly Ser Arg Ala Lys Ala Lys Pro Met Pro Gln Asp
405 410 415
Asp Asp Tyr Gln Leu Ala Gln Ala Leu Ser Leu Leu Lys Gly Leu Ser
420 425 430
Ile Thr Arg Ser Arg
435
<210> 36
<211> 1314
<212> DNA
<213> Pseudomonas fluorescens
<400> 36
atgctgcatt tgtcccgcct cacttcgctg gccctgacga tcgccctggt gatcggcgcg 60
cctctggctt ttgccgacca ggccgcaccg gctgcacccg ccacggctgc gacgaccaag 120
gcgccattgc cgctggacga gctgcgtacc tttgccgagg tcatggaccg gatcaaggca 180
gcgtatgtcg aacccgtaga cgacaaggcc ctgctggaaa atgccatcaa gggcatgctc 240
agcaacctcg acccgcactc cgcctacctg ggcccggaag atttcgccga gctgcaggaa 300
agcaccagcg gtgagttcgg cggcctgggc atcgaagtgg gctccgaaga cggccagatc 360
aaagtggtct cgcctatcga cgacaccccg gcgtccaagg ccggtatcca ggccggcgac 420
ctgatcgtga agatcaacgg ccagccaacc cgcggccaga ccatgaccga agccgtcgac 480
aagatgcgcg gcaagctcgg ccagaagatc accctgaccc tggtacgcga cggcggcaac 540
ccgtttgacg tgaccctggc ccgcgcgacc atcacggtca agagcgtgaa aagccagctg 600
ctggagtcgg gctacggtta tatccgtatc acccagttcc aggtcaagac cggcgacgaa 660
gtggccaagg ccctggccaa gctgcgcaaa gacaacggca agaagctcaa cggcatcgtg 720
cttgacctgc gcaacaaccc aggcggcgtg ttgcagtcgg cggtcgaggt ggtcgaccac 780
ttcgtcacca agggcctgat cgtctacacc aagggccgta tcgccaactc agagttgcgc 840
ttctcggcca ccggcaacga cctcagcgag aacgtgccac tggcggtatt gatcaacggt 900
ggcagcgcct cggcttcgga aatcgtcgcc ggtgccctgc aagacctcaa gcgcggcgtg 960
ctgatgggca ccaccagctt cggcaaaggc tcggtgcaga ccgtattgcc gctgaacaac 1020
gagcgtgcgc tgaagatcac cacggcgctg tactacacgc ccaacggccg ctcgatccag 1080
gcccagggca tcgtgccgga catcgaagta cgccgcgcca agatcaccaa cgagatcgac 1140
ggcgaatact acaaagaggc cgacctgcaa ggtcacctgg gcaatggcaa cggcggtgcc 1200
gaccagccaa ccggcagccg cgccaaggcc aagccgatgc cgcaggacga tgactaccaa 1260
ctggcccagg cactcagcct gctcaagggc ttgagcatca cccgcagccg ttga 1314
<210> 37
<211> 445
<212> PRT
<213> Pseudomonas fluorescens
<400> 37
Met Ser Met Thr Pro Arg Glu Ile Val His Glu Leu Asn Arg His Ile
1 5 10 15
Ile Gly Gln Asp Asp Ala Lys Arg Ala Val Ala Ile Ala Leu Arg Asn
20 25 30
Arg Trp Arg Arg Met Gln Leu Pro Glu Glu Leu Arg Val Glu Val Thr
35 40 45
Pro Lys Asn Ile Leu Met Ile Gly Pro Thr Gly Val Gly Lys Thr Glu
50 55 60
Ile Ala Arg Arg Leu Ala Lys Leu Ala Asn Ala Pro Phe Ile Lys Val
65 70 75 80
Glu Ala Thr Lys Phe Thr Glu Val Gly Tyr Val Gly Arg Asp Val Glu
85 90 95
Ser Ile Ile Arg Asp Leu Ala Asp Ala Ala Leu Lys Met Leu Arg Glu
100 105 110
Gln Glu Val Thr Lys Val Ser His Arg Ala Glu Asp Ala Ala Glu Glu
115 120 125
Arg Ile Leu Asp Ala Leu Leu Pro Pro Ala Arg Met Gly Phe Asn Glu
130 135 140
Asp Ala Ala Pro Ala Thr Asp Ser Asn Thr Arg Gln Leu Phe Arg Lys
145 150 155 160
Arg Leu Arg Glu Gly Gln Leu Asp Asp Lys Glu Ile Glu Ile Glu Val
165 170 175
Ala Glu Val Ser Gly Val Asp Ile Ser Ala Pro Pro Gly Met Glu Glu
180 185 190
Met Thr Ser Gln Leu Gln Asn Leu Phe Ala Asn Met Gly Lys Gly Lys
195 200 205
Lys Lys Ser Arg Lys Leu Lys Val Lys Glu Ala Leu Lys Leu Val Arg
210 215 220
Asp Glu Glu Ala Gly Arg Leu Val Asn Glu Glu Glu Leu Lys Ala Lys
225 230 235 240
Ala Leu Glu Ala Val Glu Gln His Gly Ile Val Phe Ile Asp Glu Ile
245 250 255
Asp Lys Val Ala Lys Arg Gly Asn Ser Gly Gly Val Asp Val Ser Arg
260 265 270
Glu Gly Val Gln Arg Asp Leu Leu Pro Leu Ile Glu Gly Cys Thr Val
275 280 285
Asn Thr Lys Leu Gly Met Val Lys Thr Asp His Ile Leu Phe Ile Ala
290 295 300
Ser Gly Ala Phe His Leu Ser Lys Pro Ser Asp Leu Val Pro Glu Leu
305 310 315 320
Gln Gly Arg Leu Pro Ile Arg Val Glu Leu Lys Ala Leu Thr Pro Gly
325 330 335
Asp Phe Glu Arg Ile Leu Ser Glu Pro His Ala Ser Leu Thr Glu Gln
340 345 350
Tyr Arg Glu Leu Leu Lys Thr Glu Gly Leu Gly Ile Glu Phe Gln Ala
355 360 365
Asp Gly Ile Lys Arg Leu Ala Glu Ile Ala Trp Gln Val Asn Glu Lys
370 375 380
Thr Glu Asn Ile Gly Ala Arg Arg Leu His Thr Leu Leu Glu Arg Leu
385 390 395 400
Leu Glu Glu Val Ser Phe Ser Ala Gly Asp Met Ala Gly Ala Gln Asn
405 410 415
Gly Glu Ala Ile Lys Ile Asp Ala Asp Tyr Val Asn Ser His Leu Gly
420 425 430
Glu Leu Ala Gln Asn Glu Asp Leu Ser Arg Tyr Ile Leu
435 440 445
<210> 38
<211> 176
<212> PRT
<213> Pseudomonas fluorescens
<400> 38
Met Thr Thr Ile Val Ser Val Arg Arg His Gly Lys Val Val Met Gly
1 5 10 15
Gly Asp Gly Gln Val Ser Leu Gly Asn Thr Val Met Lys Gly Asn Ala
20 25 30
Lys Lys Val Arg Arg Leu Tyr His Gly Gln Val Leu Ala Gly Phe Ala
35 40 45
Gly Ala Thr Ala Asp Ala Phe Thr Leu Phe Glu Arg Phe Glu Gly Gln
50 55 60
Leu Glu Lys His Gln Gly His Leu Val Arg Ala Ala Val Glu Leu Ala
65 70 75 80
Lys Glu Trp Arg Thr Asp Arg Ser Leu Ser Arg Leu Glu Ala Met Leu
85 90 95
Ala Val Ala Asn Lys Asp Ala Ser Leu Ile Ile Thr Gly Asn Gly Asp
100 105 110
Val Val Glu Pro Glu His Gly Leu Ile Ala Met Gly Ser Gly Gly Gly
115 120 125
Tyr Ala Gln Ala Ala Ala Ser Ala Leu Leu Lys Lys Thr Asp Leu Ser
130 135 140
Ala Arg Glu Ile Val Glu Thr Ala Leu Gly Ile Ala Gly Asp Ile Cys
145 150 155 160
Val Phe Thr Asn His Asn Gln Thr Ile Glu Glu Gln Asp Leu Ala Glu
165 170 175
<210> 39
<211> 295
<212> PRT
<213> Pseudomonas fluorescens
<400> 39
Met Met Arg Ile Leu Leu Phe Leu Ala Thr Asn Leu Ala Val Val Leu
1 5 10 15
Ile Ala Ser Val Thr Leu Ser Leu Phe Gly Phe Asn Gly Phe Met Ala
20 25 30
Ala Asn Gly Val Asp Leu Asn Leu Asn Gln Leu Leu Ile Phe Cys Ala
35 40 45
Val Phe Gly Phe Ala Gly Ser Leu Phe Ser Leu Phe Ile Ser Lys Trp
50 55 60
Met Ala Lys Met Ser Thr Ser Thr Gln Ile Ile Thr Gln Pro Arg Thr
65 70 75 80
Arg His Glu Gln Trp Leu Met Gln Thr Val Glu Gln Leu Ser Gln Glu
85 90 95
Ala Gly Ile Lys Met Pro Glu Val Gly Ile Phe Pro Ala Tyr Glu Ala
100 105 110
Asn Ala Phe Ala Thr Gly Trp Asn Lys Asn Asp Ala Leu Val Ala Val
115 120 125
Ser Gln Gly Leu Leu Glu Arg Phe Ser Pro Asp Glu Val Lys Ala Val
130 135 140
Leu Ala His Glu Ile Gly His Val Ala Asn Gly Asp Met Val Thr Leu
145 150 155 160
Ala Leu Val Gln Gly Val Val Asn Thr Phe Val Met Phe Phe Ala Arg
165 170 175
Ile Ile Gly Asn Phe Val Asp Lys Val Ile Phe Lys Asn Glu Glu Gly
180 185 190
Arg Gly Ile Ala Tyr Phe Val Ala Thr Ile Phe Ala Glu Leu Val Leu
195 200 205
Gly Phe Leu Ala Ser Ala Ile Val Met Trp Phe Ser Arg Lys Arg Glu
210 215 220
Phe Arg Ala Asp Glu Ala Gly Ala Arg Leu Ala Gly Thr Ser Ala Met
225 230 235 240
Ile Gly Ala Leu Gln Arg Leu Arg Ser Glu Gln Gly Leu Pro Val His
245 250 255
Met Pro Asp Ser Leu Thr Ala Phe Gly Ile Asn Gly Gly Ile Lys Gln
260 265 270
Gly Leu Ala Arg Leu Phe Met Ser His Pro Pro Leu Glu Glu Arg Ile
275 280 285
Asp Ala Leu Arg Arg Arg Gly
290 295
<210> 40
<211> 888
<212> DNA
<213> Pseudomonas fluorescens
<400> 40
atgatgcgca tcctgctgtt cttggccact aacctggcgg tcgtactgat tgccagcgtc 60
accctgagcc tttttggctt caacgggttc atggcggcca atggggttga tctgaacctc 120
aatcagctgc tgattttctg tgcggtcttt ggttttgccg gctcgctgtt ctcgctgttc 180
atctccaagt ggatggcgaa gatgagcacc agcacccaga tcatcactca accccgcact 240
cgccatgaac aatggctgat gcaaaccgtg gagcagttgt ctcaagaagc aggcatcaaa 300
atgcccgaag tggggatttt tcctgcttat gaggccaacg cctttgccac cggctggaac 360
aagaacgacg cactggtggc tgtgagccag ggcctgctgg agcggttttc gcccgatgaa 420
gtcaaggcgg tgctggccca cgagatcggc cacgtagcca acggcgacat ggtcaccctg 480
gcactggtac agggcgtggt gaacaccttc gtgatgttct ttgcgcggat catcggcaac 540
tttgtcgaca aggtcatctt caagaacgaa gaaggccgtg gcattgccta cttcgtggcg 600
accattttcg ccgagttggt cctgggcttc ctggccagcg ccatcgtgat gtggttctcg 660
cgcaaacgcg agttccgcgc agatgaagcc ggcgcacgcc tggcgggcac cagcgcaatg 720
atcggcgcgc tgcaacgcct gcgctccgaa cagggcctgc cggtgcatat gccggacagc 780
ctgaccgcct tcggcatcaa cggcggcatc aagcagggcc tggctcgctt gttcatgagc 840
cacccgccgc tggaagagcg gattgacgca ctgcgtcgcc ggggctga 888
<210> 41
<211> 533
<212> PRT
<213> Pseudomonas fluorescens
<400> 41
Met Phe Lys Lys His Ala Cys Tyr Leu Ser Ile Cys Leu Leu Val Ala
1 5 10 15
Pro Leu Val Ala Thr Ala Glu Thr Leu Pro Leu Glu Pro Leu Pro Val
20 25 30
Thr Thr Pro Ala Pro Val Ala Leu Ala Pro Leu Gln Gln Ala Leu Ala
35 40 45
Gln Leu Thr Ser Val Cys Pro His Leu Ala Pro Arg Ile Asp Ala Ala
50 55 60
Ala Leu Ala Arg Leu Gln Thr Phe Tyr Gln Gln Gln Gly Asp Ala Pro
65 70 75 80
Leu Trp Ala Ala Asp Glu Arg Arg Gln Ala Leu His Ala Gln Leu Leu
85 90 95
Met Leu Ala Asp Asp Gly Leu Asp Pro Thr His Tyr Ser Leu Pro Ala
100 105 110
Val Asp Ala Thr Ala Asn Val Leu Cys Ser Asp Ile Ala Asn Ser Gln
115 120 125
Gln Tyr Leu Gln Ala Leu Gln Asp Leu His Tyr Gly Arg Leu Gln Gln
130 135 140
Ser Arg Phe Glu Pro Leu Trp His Ser Gln Pro Pro Ser Gly Asp Pro
145 150 155 160
Asn Thr Glu Val Leu Ala Phe Ala Ala Thr Gly Leu His Asp Met Ala
165 170 175
Gln Ala Phe Asp Gln Ala Arg Pro Ser Ala Asp Leu Tyr Arg Ser Leu
180 185 190
Arg Asn Ala Tyr Ala Gly Val Arg Gln Gln Pro Leu Pro His Trp Asp
195 200 205
Pro Val Ala Glu Gly Thr Leu Leu Arg Pro Gly Met Asn Asp Pro Arg
210 215 220
Val Pro Glu Leu Ala Arg Arg Leu His Ser Gly Gly Tyr Leu Ala Gln
225 230 235 240
Leu Pro Ser Gly Asn Gly Lys Gln Tyr Gln Gly Glu Leu Val Lys Ala
245 250 255
Val Lys Ala Phe Gln Leu Ser His Ser Leu Gln Ala Asp Gly Val Ile
260 265 270
Gly Ala Gly Thr Val Ala Glu Leu Asn Ile Ser Pro Ala Met Arg Arg
275 280 285
Glu Gln Leu Arg Ile Asn Leu Glu Arg Phe Arg Trp Leu Ala Gln Asp
290 295 300
Leu Glu Pro Glu Gly Val Val Val Asn Val Ala Ala Ala Gln Leu Ser
305 310 315 320
Val Tyr Gln Ser Gly Ile Pro Val Trp Gln Thr Arg Leu Gln Val Gly
325 330 335
Arg Ala Glu Arg Gln Thr Pro Leu Leu Lys Ser Arg Ile Thr Arg Leu
340 345 350
Thr Leu Asn Pro Thr Trp Thr Ile Pro Pro Thr Ile Met Arg Glu Asp
355 360 365
Lys Leu Pro Ala Ile Arg Leu Asn Pro Glu Tyr Leu Arg Gln Gln Asn
370 375 380
Leu Gln Val Leu Asp Ala Glu Gly His Pro Leu Thr Pro Asp Gln Val
385 390 395 400
Asp Trp Ala Arg Pro Gly Asn Ile Leu Leu Arg Gln Gln Ala Gly Pro
405 410 415
Arg Asn Pro Leu Gly Lys Ile Val Met Arg Phe Pro Asn Pro Tyr Ser
420 425 430
Val Tyr Leu His Asp Thr Pro Ser Gln Pro Leu Phe Thr Lys Gly Pro
435 440 445
Arg Ala Phe Ser Ser Gly Cys Val Arg Val Glu Gln Pro Leu Leu Leu
450 455 460
Arg Asp Leu Leu Val Thr Pro Ala Glu Arg Thr Arg Thr Asp Glu Leu
465 470 475 480
Leu Ala Thr Gly Glu Thr His Glu Phe Arg Leu Ala Thr Pro Val Pro
485 490 495
Val Leu Leu Gly Tyr Trp Thr Val Glu Val Asp Arg Gln Gly Glu Leu
500 505 510
Val Tyr Ala Pro Asp Ile Tyr Ala Arg Asp Pro Ala Leu Ile Lys Ala
515 520 525
Met Gly Ser Val Leu
530
<210> 42
<211> 1602
<212> DNA
<213> Pseudomonas fluorescens
<400> 42
atgttcaaaa aacacgcatg ttacttgagc atttgcctgc tcgttgcacc attggtcgct 60
acagccgaaa cgctgccgtt agaaccactg cccgtcacca cccctgcacc ggtcgcgctc 120
gcgccgctgc aacaggcctt ggcgcagttg accagtgtct gcccgcacct tgcgccgcgt 180
atcgatgccg ccgcgttggc gcgcctgcaa accttttacc agcagcaggg cgatgccccg 240
ctatgggcgg ctgacgaacg ccggcaagcc ttgcatgccc agttgctgat gcttgccgac 300
gatggcctgg accccaccca ctatagcttg cctgcggtgg atgccacggc caacgtgctg 360
tgcagcgata tcgccaacag ccagcagtac ctgcaagctc tgcaggattt gcactacggg 420
cgcctgcagc aatcgcgctt tgagcccctc tggcattccc agccacccag tggcgatccg 480
aataccgagg tgctggcgtt cgccgccacc ggcctgcacg acatggccca agccttcgat 540
caggcccggc ccagcgccga tttgtaccgc agcctgcgca atgcctatgc cggcgtgcgc 600
cagcaaccgc tgccccattg ggacccggtc gccgagggca cgttgttgcg tcctgggatg 660
aatgaccctc gcgtgccgga actggcgcgg cgcctgcaca gcggcggcta cctggcccag 720
ttacccagcg gcaacggcaa gcagtaccag ggcgaactgg tcaaggcggt gaaagccttc 780
cagctcagcc actcgttgca ggccgacggc gtgatcggcg ccggcaccgt ggccgaactc 840
aatatcagcc cggcgatgcg tcgtgaacaa ctgcgcatca acctcgagcg tttccgctgg 900
ctggcccagg acctggagcc tgaaggcgtc gtggtcaatg tggccgccgc gcaactgagc 960
gtgtaccaga gcggcatccc agtgtggcaa acccgcctgc aagtgggccg ggccgaacgc 1020
cagacgccgt tgctcaagtc gcgcatcacc cggctgaccc tcaaccccac ctggaccatc 1080
ccgccgacca tcatgcgcga ggacaaactg ccggccatcc gcctcaaccc tgaatacctg 1140
cgccagcaaa acctgcaagt gctcgacgcc gaaggtcacc cgttgacccc cgaccaggtc 1200
gactgggcgc gccccggcaa tatcctgctg cgccagcagg ccggcccgcg taacccgctg 1260
ggcaagattg tgatgcgttt ccccaatccg tattccgtat atctgcacga cacccccagc 1320
caacccttgt tcaccaaggg gccgcgggcg ttcagttcgg gatgcgtgcg ggtcgagcaa 1380
ccgttgttat tgcgcgacct gctggtaacg ccggccgaac gcactcgcac cgatgagctg 1440
ctggcgaccg gcgaaaccca tgaattcagg ttggccacgc cggtaccggt gctgttgggg 1500
tattggaccg tggaagtgga tcgccagggc gagctggtgt acgcgccgga tatttatgcg 1560
cgtgacccgg cgttgatcaa ggccatgggt agcgtgttat ag 1602
<210> 43
<211> 2665
<212> PRT
<213> Pseudomonas fluorescens
<400> 43
Met Asp Val Arg Gln Phe Ala Phe Leu Ala Arg Gln Pro Ser Ala Ala
1 5 10 15
Leu Lys Arg Arg Asp Ala Phe Phe Gly Leu Pro Lys Arg Gly Leu Ala
20 25 30
Leu Ile Leu Ala Asn Ala Leu Phe Trp Gln Pro Leu Leu Ala Gln Ala
35 40 45
Glu Gly Ile Val Val Ser Ala Pro Gly Thr Thr Val Gly Ala Ala Gly
50 55 60
Asn Gly Val Pro Val Val Asn Ile Ala Thr Pro Asn Gly Ala Gly Leu
65 70 75 80
Ser His Asn Gln Phe Lys Asp Tyr Asn Val Gly Pro Asn Gly Val Ile
85 90 95
Leu Asn Asn Gly Asn Gly Ala Met Val Asn Thr Gln Leu Gly Gly Ile
100 105 110
Ile Val Gly Asn Pro Asn Leu Lys Gly Gly Ala Ala Asn Val Ile Leu
115 120 125
Asn Glu Val Asn Gly Gly Ser Pro Ser Gln Leu Arg Gly Tyr Thr Glu
130 135 140
Val Ala Gly Gln Ser Ala Lys Val Ile Val Ala Asn Pro Tyr Gly Val
145 150 155 160
Thr Cys Ser Gly Cys Gly Phe Ile Asn Thr Pro Asn Val Thr Leu Thr
165 170 175
Thr Gly Lys Pro Val Leu Asp Ala Ser Gly Gln Leu Gln Arg Tyr Glu
180 185 190
Val Asp Gly Gly Ala Val Thr Ile Asp Gly Gln Gly Leu Asn Ala Ser
195 200 205
Asn Val Glu Arg Phe Asp Ile Ile Thr Arg Ser Ala Lys Ile Asn Ala
210 215 220
Gln Ile Asn Ala Arg Glu Leu Asn Val Ile Ala Gly Arg Asn Asp Val
225 230 235 240
Asp Ala Gln Ser Leu Lys Thr Thr Ala Arg Ala Asp Asp Gly Ser Ala
245 250 255
Lys Pro Glu Leu Ala Ile Asp Ser Ser Ala Leu Gly Gly Met Tyr Ala
260 265 270
Gly Ala Ile Lys Leu Val Gly Thr Glu Ala Gly Val Gly Val Lys Leu
275 280 285
Asp Gly Thr Leu Ala Ala Ser Gly Gly Asp Ile Gln Leu Asp Ala Asn
290 295 300
Gly Arg Leu Ser Met Ala Gln Ala Ala Ala Thr Gly Asn Val Lys Val
305 310 315 320
Thr Ala Gln Asn Val Asp Leu Thr Asp Lys Val Tyr Ala Asn Gly Asn
325 330 335
Val Gln Val Thr Ser Ala Gln Ala Leu Val Asn Arg Lys Ser Ile Ala
340 345 350
Ala Gly Gln Arg Ile Glu Ile Asn Ala Ala Ser Val Asn Asn Pro Gly
355 360 365
Ile Ile Glu Ala Gly Val Ala Ala Asp Asn Ser Arg Asn Thr Thr Gly
370 375 380
Asp Leu Val Val Asn Ala Gln Thr Val Thr Thr Ser Gly Asn Leu Leu
385 390 395 400
Ala Ser Arg Ala Leu Ala Ile Thr Ala Ala Gln Ala Leu Thr Asn Gln
405 410 415
Gly Ala Ile Ile Gln Ala Lys Thr Val Glu Val Ser Ser Ala Lys Leu
420 425 430
Thr Asn Gln Gly Ala Ser Ala Arg Leu Phe Gly Glu Gln Ser Leu Ala
435 440 445
Ile Asn Ser Pro Ala Ile Val Asn Leu Gly Gly Leu Ile Arg Phe Gly
450 455 460
Glu Gly Gln Ala Ala Thr Leu Asn Ser Ala Ser Leu Asp Asn Arg Gln
465 470 475 480
Gly Arg Ile Glu Met Ala Gly Gly Ser Leu Val Leu Thr Ser Ala Asp
485 490 495
Leu Asn Asn Ser Gly Gly Gln Val Ile Ala Asn Asp Leu Thr Val Asn
500 505 510
Ala Gly Asn Leu Asn Asn Gln Asn Gly Val Leu Val Ala Lys Thr Ala
515 520 525
Thr Val Thr Ala Ser Asn Leu Asp Asn Ser Leu Lys Gly Leu Ile Gln
530 535 540
Ala Asp Gly Gly Ala Leu Asn Leu Ala Val Ser Asn Thr Phe Asn Asn
545 550 555 560
Asn Gln Gly Phe Ala Gln Ala Ser Thr Asp Leu Asn Val Thr Ala Gly
565 570 575
Thr Leu Ser Ser Asn Ala Gly Gly Val Leu Ser Ala Asp Thr Gly Lys
580 585 590
Leu Thr Leu Thr Ala Ala Gln Gln Leu Asn Asn Ala Gln Gly Arg Leu
595 600 605
Gln Ala Gly Gln Gly Asp Ile Glu Leu His Ala Ala Asn Leu Asp Asn
610 615 620
Gln Ser Gly Thr Ile Val Gly Lys Gln Leu Leu Leu Asp Val Ala Gly
625 630 635 640
Gly Asp Ile Asp Asn Arg Ala Gly Arg Val Leu Gly Asp His Leu Asp
645 650 655
Val Arg Ala Ser Gly Leu Asp Asn Arg Asn Ala Gly Leu Leu Ala Gly
660 665 670
Gly Ala Gln Gly Val Ser Leu Leu Leu Lys Gly Pro Gly Gln Leu Leu
675 680 685
Asn Ala Gln Gly Arg Ile Gln Ser Glu Gly Leu Leu Gln Leu Gln Gly
690 695 700
Glu Arg Phe Asp Asn Ser Ala Gly Ile Leu Leu Gly Gln Thr Val Asp
705 710 715 720
Val Thr Ala Gln Thr Phe Asn Asn Ser Asn Lys Gly Ala Leu Val Ser
725 730 735
Asp Gly Gly Asp Val Val Phe Lys Val Ser Asp Leu Leu Thr Asn Val
740 745 750
Gly Gly Gln Ile Asp Ala Gly Glu Arg Ser Val Leu Val Lys Gln Leu
755 760 765
Thr Thr Leu Asn Asn Asp Gly Gly Thr Leu Arg Gly Lys Arg Leu Asp
770 775 780
Ile Ala Ala Gln His Leu Asn Asn Asp Asn Gly Gln Leu Leu Ala Gly
785 790 795 800
Ala Glu Gly Leu Ser Tyr Ser Gly Gln Asp Val Ser Asn Arg Lys Gly
805 810 815
Leu Ile Leu Ser Gly Gly Ala Leu Thr Glu Leu Asn Thr Thr Arg Leu
820 825 830
Asp Asn Gln Gly Gly Thr Val Gln Gly Asp Ser Leu Thr Val Thr Ala
835 840 845
Asn Asn Val Asp Asn Gly Ser Gly Gly Leu Met Ala Ser Leu Val Gly
850 855 860
Asn Leu Gln Leu Thr Val Glu Ala Leu Ala Asn Arg Gly Gly Lys Leu
865 870 875 880
Phe Gly Lys Glu Gln Val Thr Val Ser Gly Ala Ser Leu Asp Asn Ser
885 890 895
Ala Gly Gln Ile Ser Gly Asn Gln Ile Asn Leu Thr Ser Arg Asp Thr
900 905 910
Leu Thr Asn Gln Gly Gly Leu Val Glu Ala Asn Gln Gly Leu Thr Leu
915 920 925
Thr Gly Gly Asn Leu Asp Asn Ser Ala Asn Gly Gln Leu Arg Ala Leu
930 935 940
Gly Gly Ala Ser Ser Arg Val Asn Leu Ser Gly Ala Leu Asn Asn Gln
945 950 955 960
Asn Gly Thr Leu Glu Phe Gly Ser Gln Ala Phe Ser Leu Asp Ala Ala
965 970 975
Ser Leu Asn Asn Gln Asn Gly Met Leu Gln His Ala Gly Thr Gly Leu
980 985 990
Phe His Leu Asn Ile Ala Ser Leu Glu Gly Ser Gln Gly Asn Ile Gln
995 1000 1005
Gly Met Gly Ser Ala Asp Trp Ala Phe Gly Lys Val Asp Gly Leu
1010 1015 1020
Gly Arg Val Gln Leu Asn Asp Val Leu Thr Tyr Lys Ser Asp Gln
1025 1030 1035
Gly Leu Ala Leu Gln Ala Gly Asp Arg Met Ala Ser Ala Lys Gly
1040 1045 1050
Leu Ile Leu Asn Val Ala Ser Leu Asp Asn Gly Gly Glu Leu Leu
1055 1060 1065
Ser Asp Gly Asp Ile Ser Ile Thr Thr Gly Asp Ile Thr Asn Ser
1070 1075 1080
Gly Arg Val Ser Ala Leu Gln Thr Leu Thr Val Ala Ala Asn Asn
1085 1090 1095
Leu Ser Gln Asn Gly Gly Arg Leu Ala Ala Thr Asn Ala Arg Leu
1100 1105 1110
Thr Leu Gly Gly Thr Leu Asp Asn Leu Gly Phe Leu Thr Ala Arg
1115 1120 1125
Gln Gln Leu Asp Ile Ala Ala Ala Gln Ile Asn Asn Arg Gly Thr
1130 1135 1140
Leu Gly Ala Gln Gly Ala Val Asn Leu Thr Ala Val Asn Gly Ile
1145 1150 1155
Thr Asn Ala Ala Asp Thr Leu Leu Phe Ser Gly Gly Asp Met Thr
1160 1165 1170
Leu Arg Ser Asn Gly Phe Ser Asn Ser Tyr Gly Asp Val Tyr Ser
1175 1180 1185
Lys Gly Asn Leu Ser Phe Ala Ala Arg Asp Gly Gly Arg Ala Val
1190 1195 1200
Leu Phe Ser Asn Arg Ser Gly Thr Val Glu Ser Glu Gly Ser Ile
1205 1210 1215
Gly Ile Asn Ala Gly Phe Ile Glu Asn Ala Lys Asp Glu Phe Glu
1220 1225 1230
Leu Gly Gln Thr Leu Thr Thr Gly Ser Leu Ser Trp Ile Cys Gly
1235 1240 1245
Gln His Cys Gly Glu Ser Asp Asn Trp Glu Arg Gly Glu Ile Thr
1250 1255 1260
Ile Tyr Glu Thr Tyr Leu Glu Ala Ala Thr Lys Asp Ser Val Ala
1265 1270 1275
Ala Arg Leu Val Ala Gly Lys Asn Met Leu Leu Gln Gly Asp Thr
1280 1285 1290
Val Gln Asn Arg Tyr Ser Leu Met Ala Ala Asn Gly Asp Leu Ser
1295 1300 1305
Ile Thr Ala Gly Asp Leu Leu Asn Gln Gly Ala Ala Thr Arg Thr
1310 1315 1320
Gly Gln Arg Lys Leu Val Ile Gly Thr Pro Gly His Val Ser Asp
1325 1330 1335
Asp Leu Phe Glu Arg Met Gln Tyr Val Asp Val Pro Ala Phe Asn
1340 1345 1350
Ala Ala Thr Ala Ala Gly Asn Phe Asp Lys Ala Arg Phe Glu Glu
1355 1360 1365
Leu Lys Ser Arg Ser Pro Asn Ser Leu Pro Phe Ala Tyr Ala Ser
1370 1375 1380
Asp Val Thr Thr Trp Thr Asn Asn Ser Gly Pro Gly Tyr Asp Ala
1385 1390 1395
Thr Leu Gln Ala Gly Gly Thr Val Asn Leu Asn Val Ala Arg Thr
1400 1405 1410
Leu Gln Asn Gly Thr Leu His Asn Asn Thr Leu Ala Gln Leu Thr
1415 1420 1425
Gly Thr Leu Gly Asp Asp Gln Thr Gly Ile Pro Val Gly Gly Ile
1430 1435 1440
Asn Ile Asn Leu Ser Lys His Ala Asn Asp Pro Ser Ala Gln Ala
1445 1450 1455
Pro Gly Ser Val Leu Pro Val Val Gly Val Ala Pro Gly Gly Gly
1460 1465 1470
Phe Val Pro Val Asp Tyr Thr Gly Thr Ala Phe Ala Pro Val Asp
1475 1480 1485
Pro Thr Thr Ser Pro Thr Phe Gln Leu Pro Lys Gly Glu Tyr Gly
1490 1495 1500
Leu Phe Val Lys Asn Ala Asp Pro Thr Ser His Tyr Leu Ile Glu
1505 1510 1515
Thr Asn Pro Glu Phe Thr Ser Val Ser Gly Phe Phe Ser Ser Asp
1520 1525 1530
Tyr Met Leu Gly Lys Leu Gly Phe Thr Ala Asp Asn Ala Trp Arg
1535 1540 1545
Arg Leu Gly Asp Gly Gln Tyr Glu Thr Arg Leu Ile Arg Asp Ala
1550 1555 1560
Val Leu Ala Gln Thr Gly Gln Arg Phe Leu Ala Gly Gly Leu Tyr
1565 1570 1575
Ser Asp Ala Asp Gln Phe Arg Tyr Leu Met Asp Asn Gly Leu Ala
1580 1585 1590
Ser Lys Asp Ala Leu Arg Leu Ser Leu Gly Val Ala Leu Thr Asp
1595 1600 1605
Gln Gln Val Gly Ala Leu Thr His Asp Ile Val Trp Met Glu Asn
1610 1615 1620
Arg Val Ile Glu Gly Gln Thr Val Leu Val Pro Val Leu Tyr Leu
1625 1630 1635
Ala Gln Ala Asp Ser Arg Asn Val Arg Gly Asn Ser Leu Ile Gln
1640 1645 1650
Gly Arg Asp Leu Asn Leu Val Thr Gly Gly Asp Leu Ile Asn Val
1655 1660 1665
Gly Thr Leu Arg Ala Ser Asn Asn Leu Ser Ala Ile Ser Ser Gly
1670 1675 1680
Ser Ile Tyr Thr Gly Gly Leu Val Glu Ala Gly Asn Asn Leu Ser
1685 1690 1695
Leu Leu Ala Gln Asp Ser Ile Arg Asn Ala Met Ala Gly Glu Ile
1700 1705 1710
Arg Gly Lys Gln Val Ser Leu Thr Ala Leu Lys Gly Asp Ile Thr
1715 1720 1725
Asn Glu Thr Thr Ala Ile Gln Val Arg Asp Gly Ala Gly Met Arg
1730 1735 1740
Thr Leu Thr Asp Thr Ser Ala Gly Thr Ile Val Ala Arg Glu Asn
1745 1750 1755
Leu Ala Ile Asp Ala Gly Arg Asp Leu Thr Asn Arg Gly Ala Leu
1760 1765 1770
Val Ala Gly Asn Asp Ala Asn Leu Thr Ala Gly Arg Asp Leu Asn
1775 1780 1785
Leu Ile Ala Ala Ser Asp Thr Arg Val Lys His Glu Thr Arg Asp
1790 1795 1800
Gly Gly Glu Lys Ser Ser Ile Thr Thr Asp Val Lys Asn Leu Ala
1805 1810 1815
Ala Ser Val Thr Ala Gly Gly Asn Leu Asn Met Gln Ala Gly Gln
1820 1825 1830
Asp Val Asn Ile Ile Gly Ser Asn Ala Thr Ala Gly Lys Asp Leu
1835 1840 1845
Asn Ile Ala Ala Gly Arg Asp Leu Asn Val Ala Ser Val Ser Asp
1850 1855 1860
Met His Asn Val Glu Gly Lys Glu Lys Asp Gly Lys Lys Arg Ile
1865 1870 1875
Arg Thr Ser Asp Asp Gln Thr Thr Gln Val Ala Ser Val Leu Thr
1880 1885 1890
Ala Gly Gly Asp Phe Val Ser Gln Ala Gly Arg Asp Thr Thr Ile
1895 1900 1905
Val Ala Ser Met Ile Ser Ala Gly Asn Glu Ala Tyr Leu Tyr Ser
1910 1915 1920
Gly Asp Lys Leu Ser Leu Leu Ala Ala Glu Asn Ser Thr His Thr
1925 1930 1935
Leu Tyr Asp Met Lys Glu Lys Gly Ser Trp Gly Ala Lys Lys Ala
1940 1945 1950
Gln Met Asp Glu Val Thr Arg Thr Thr Gln Val Gly Thr Glu Ile
1955 1960 1965
Lys Thr Gly Gly Asn Leu Val Leu Lys Ser Asp Gly Asp Gln Leu
1970 1975 1980
Tyr Gln Val Ala Lys Leu Asn Ser Gly Lys Asp Ile Ile Leu Asp
1985 1990 1995
Ser Gly Gly Ala Ile Val Phe Glu Gly Val Lys Asp Leu His Asp
2000 2005 2010
Glu Ser His Thr Lys Ser Lys Ser Asp Leu Ser Trp Phe Ser Ala
2015 2020 2025
Lys Gly Lys Gly Asn Thr Asp Glu Thr Leu Arg Gln Ser Glu Leu
2030 2035 2040
Val Ala Gln Gly Gln Leu Val Ile Lys Ala Ala Glu Gly Ile Arg
2045 2050 2055
Ile Asp Val Lys Gln Val Asp Gln Gln Thr Val Ser Gln Thr Val
2060 2065 2070
Asp Ala Met Val Lys Ala Asp Pro Asn Leu Ala Trp Leu Lys Gln
2075 2080 2085
Ala Glu Ala Arg Gly Asp Ile Asp Trp Arg Gln Val Lys Glu Ile
2090 2095 2100
His Glu Ser Phe Lys Tyr Asp Asn Ser Gly Leu Gly Ala Gly Ala
2105 2110 2115
Lys Ile Ala Ile Ala Ile Met Met Ala Ala Ile Met Gly Pro Val
2120 2125 2130
Gly Phe Gly Leu Gln Gly Ala Thr Leu Ala Val Ser Thr Ser Leu
2135 2140 2145
Ser Thr Thr Ala Val Thr Ser Thr Ile Asn Asn Lys Gly Asn Leu
2150 2155 2160
Gly Ala Ala Leu Lys Glu Thr Val Ser Ala Asn Ser Leu Lys Ser
2165 2170 2175
Ala Ala Val Ala Gly Phe Thr Ala Gly Ala Leu Glu Tyr Ala Asp
2180 2185 2190
Thr Asn Trp Phe Ala Gly Ala Asp Gly Ala Gly Ala Gly Ala Gly
2195 2200 2205
Thr Ser Thr Ser Thr Val Gln Gly Val Thr Pro Ser Thr Gly Ser
2210 2215 2220
Thr Leu Ala Val Thr Asn Ser Ser Lys Asp Ile Phe Thr Trp Thr
2225 2230 2235
Ser Ala Gly Asp Ile Ala Leu Arg Thr Gly Gly Arg Ala Val Ile
2240 2245 2250
Ser Ser Gly Ile Ser Thr Ala Ile Gln Gly Gly Ser Phe Gly Asp
2255 2260 2265
Asn Phe Asn Ala Ala Leu Leu Gly Glu Ala Gly Asn Val Ala Met
2270 2275 2280
Ala Thr Gly Phe Asn Trp Val Gly Asp Tyr Val Thr Phe Pro Asn
2285 2290 2295
Gly Ser Pro Gln Lys Ile Ile Ala His Ala Leu Met Gly Gly Leu
2300 2305 2310
Leu Ala Glu Ala Thr Gly Ser Asp Phe Lys Thr Gly Ala Ala Ala
2315 2320 2325
Ala Gly Leu Asn Glu Ala Leu Ile Asn Gln Leu Val Trp Ala Ala
2330 2335 2340
Gln Gly Asn Asp Asp Ile Thr Leu Met Leu Ser Gln Leu Thr Gly
2345 2350 2355
Leu Leu Ala Ala Ala Ala Val Asp Gly Asp Leu Glu Lys Gly Ser
2360 2365 2370
Gln Ile Ala Gln Lys Ala Thr Thr Phe Asn Tyr Leu Tyr His Glu
2375 2380 2385
Glu Val Glu Glu Met Leu Arg Glu Val Asp Ser Lys Thr Thr Glu
2390 2395 2400
Gln Glu Lys Arg Glu Val Arg Gln Arg Tyr Ala Glu Leu Asp Gln
2405 2410 2415
Gln Arg Asn Asp Glu Leu Asp Ala Leu Cys Ala Arg Asp Pro Gln
2420 2425 2430
Arg Cys Arg Gly Ile Ala Thr Ser Leu Ala Asn Asp Asp Gln Lys
2435 2440 2445
Leu Val Asp Leu Val Gly Arg Leu Arg Ser Gln Gly Gln Gly Gly
2450 2455 2460
Ala Ala Ser Ala Val Gly Phe Val Ile Gly Asn Asn Leu Asp Ala
2465 2470 2475
Ser Ser Gln Ile Ala Ala Asp Ile Ser Ser Ala Gly Gly Gly Pro
2480 2485 2490
Leu Val Lys Leu Gly Ala Glu Ala Ile Lys Ala Gly Val Gly Ile
2495 2500 2505
Thr Leu Pro Ser Arg Ser Ser Ser Gly Lys Gly Lys Gly Ser Gln
2510 2515 2520
Val Gly Ala Gly Ser Leu Glu Glu Ala Ala Gly Pro Lys Ala Thr
2525 2530 2535
Gly Glu Val Val Pro Pro Ala Pro Ile Val Thr Ser Gly Ala Thr
2540 2545 2550
Arg Thr Gly Val Val Arg Thr Asn Ala Ala Asp Trp Arg Ala Leu
2555 2560 2565
Arg Asn Asn Trp Asp Asp Leu Gly Tyr Gly Gln Ile Leu Ser Thr
2570 2575 2580
Glu Asn Arg Ala Ala Ile Ala Lys Gly Arg Thr Pro Lys Val Asp
2585 2590 2595
Asp Ala Trp Val Lys Val Phe Pro Glu Asp Ala Gly Leu Lys Gly
2600 2605 2610
Glu Arg Ile Pro Met His His Val Gln Gly Ser Pro Leu Thr Val
2615 2620 2625
Pro Leu Pro Asp Thr Arg His Leu Asp Ala His Met Pro Gly Gly
2630 2635 2640
Phe Arg Tyr Asn Pro Gly Gly Pro Gly Ser Ala Leu Pro Ala Tyr
2645 2650 2655
Pro Pro Lys Lys Gly Ala Glu
2660 2665
<210> 44
<211> 7998
<212> DNA
<213> Pseudomonas fluorescens
<400> 44
atggatgttc gccaattcgc cttcctggcc cgccaacctt ctgccgccct gaagcgccgg 60
gacgcgttct tcggcctgcc caagcgcggg ctggccttga tccttgccaa cgcactgttc 120
tggcagccgc tgctggccca ggccgagggc attgtggtca gtgcgccggg caccaccgtg 180
ggcgcggcag gcaatggcgt gccggtggta aacattgcca cccccaatgg cgcgggcttg 240
tcccataacc agttcaagga ctacaacgtc ggccccaacg gcgtgattct caacaatggc 300
aacggcgcca tggtcaacac ccagctgggc gggatcatcg tcggcaaccc caacctcaag 360
ggcggcgcgg cgaacgtcat cctcaacgaa gtcaacggcg gcagccccag ccagttgcgc 420
ggctataccg aagtggcggg gcagtcggcc aaggtcatcg tggccaaccc gtacggcgtg 480
acgtgcagcg gttgcggctt tatcaacacc cccaacgtca ccctcaccac cggcaaaccg 540
gtgctcgacg ccagcggtca attgcagcgc tatgaagtgg atggcggcgc ggtgaccatc 600
gacggccaag gcttgaacgc cagcaacgtc gaacgcttcg acatcatcac ccgctcggcc 660
aagatcaacg cacaaatcaa cgcccgcgaa ctcaacgtga tcgccgggcg caacgacgtc 720
gatgcgcaaa gcctgaaaac caccgcccgc gccgatgacg gcagcgccaa gcccgagctg 780
gcgatcgact cgtcggccct gggcggcatg tatgccggcg cgatcaaact ggtgggcacc 840
gaggccggtg tgggcgtgaa gctcgacggc accctggccg ccagtggcgg cgatattcag 900
ctcgacgcca acgggcgcct gagcatggcg caggcggcgg ccaccggtaa cgtcaaggtc 960
accgcgcaaa acgtcgacct caccgacaag gtctacgcca acggcaacgt gcaggtcacc 1020
agcgcccagg ctttggtcaa ccgcaagagc atcgccgccg gccagcgcat cgagatcaac 1080
gcggccagcg tgaacaaccc cggcatcatc gaagccggcg tcgccgccga taacagccgc 1140
aacaccacgg gcgacctggt ggtgaacgcg caaaccgtca ccaccagcgg caacctgttg 1200
gccagccgcg ccctggcgat cactgccgcg caagcgctga ccaaccaggg cgcgatcatc 1260
caggccaaga ccgtcgaggt cagcagcgcc aaactcacca accagggcgc cagcgctcgc 1320
ctgtttggcg agcagagcct ggcgatcaac tcgccggcca tcgtcaacct cggcggcttg 1380
atccgcttcg gcgaaggcca ggccgccacg ctcaacagcg cctccctgga caaccgccaa 1440
ggccgtatcg aaatggccgg tggcagcctg gtgctcacca gtgccgacct gaacaacagc 1500
ggcgggcaag tcatcgccaa cgacctgacc gtcaacgccg gcaacctgaa caaccagaac 1560
ggcgtgctgg tggccaagac cgcgaccgtc actgccagca accttgacaa cagcctcaag 1620
ggtttgatcc aggctgacgg tggcgcgctc aacctcgccg tttccaacac cttcaacaac 1680
aaccagggtt tcgcccaggc cagcaccgat ctgaacgtta cggccggcac cctcagcagc 1740
aacgcaggcg gcgtactgag cgccgacacc ggcaagctca ccctcaccgc cgcacaacaa 1800
ctcaacaacg cccagggccg cttgcaggcc gggcagggcg atatcgaact gcacgccgcg 1860
aacctggata accagagcgg cacgatcgtc ggcaagcaac tgctgctcga cgtggccggc 1920
ggcgacatcg acaaccgtgc cgggcgcgtg ttgggtgacc acctcgacgt gcgcgcctcg 1980
ggcctggaca accgcaacgc cggcctgctg gccggtggtg cccagggcgt aagcctgctg 2040
ctcaaaggcc cgggccagtt gctcaacgcc cagggccgca tccagagcga gggcctgctg 2100
caactgcaag gcgagcgctt cgacaacagc gccggcatcc tgctgggcca gaccgtcgac 2160
gtgaccgcgc agaccttcaa caacagcaac aaaggcgcgc tggtcagcga tggcggtgat 2220
gtggtgttca aggtcagcga cctgctcacc aacgtcggtg gccagatcga cgcgggcgaa 2280
cgcagcgtgt tggtcaagca gctcaccacc ctcaacaacg acggcggcac cctgcgcggc 2340
aagcgcctgg acatcgccgc ccagcacctg aacaacgaca acggccaact gctggccggc 2400
gccgaaggcc tgagctacag cggccaggat gtgagcaacc gcaagggcct gatcctcagc 2460
ggcggcgccc tcaccgaact gaacaccacc cgcctggata atcagggcgg cactgtgcag 2520
ggcgacagcc tgaccgtcac cgccaacaac gtcgacaacg gcagcggcgg cctgatggca 2580
agcctggtcg gcaacctgca gctcactgtc gaagccctgg ccaaccgtgg cggcaagctg 2640
ttcggcaaag aacaagtgac cgtcagcggc gccagcctcg acaacagcgc gggccagatc 2700
agcggcaatc agatcaacct gacctcacgc gacacgctca ccaaccaggg cggtttggtt 2760
gaagccaacc agggcctgac cctcactggt ggcaacctcg ataacagcgc caacggccaa 2820
ctgcgtgccc tgggcggcgc cagcagccgc gtcaacctca gcggtgcgtt gaacaaccag 2880
aacggcaccc tcgaattcgg tagccaggcc ttcagccttg acgcggccag cctcaacaac 2940
cagaacggga tgctgcaaca cgccggcacc ggcctgttcc acctcaacat cgccagcctc 3000
gaaggcagcc agggcaatat ccagggcatg ggcagcgccg actgggcatt cggcaaggtc 3060
gacggcctgg gccgcgtgca actcaacgat gtgctcacct acaagagcga ccaagggctg 3120
gccctccagg ccggcgaccg catggccagc gccaagggct tgatcctcaa cgtggccagc 3180
ctggacaacg gcggcgaact gctcagcgac ggtgacatca gcatcaccac cggcgatatc 3240
accaacagcg gccgcgtctc ggccctgcaa acactcaccg tcgccgccaa caacctcagc 3300
cagaacggcg gccgcctggc cgcaaccaat gcccgcctga ccctgggcgg caccctggac 3360
aacctcggtt tcctcaccgc ccgccagcaa ctggacatcg ccgccgcgca aatcaacaac 3420
cgtggcaccc tcggtgccca gggcgcagtg aacctcacgg cggtcaacgg catcaccaac 3480
gccgccgaca cgctgctgtt cagcggcggc gacatgaccc tgcgcagcaa tggcttcagc 3540
aacagctatg gcgatgtcta cagcaaaggc aacctgagtt tcgccgcccg cgatggcgga 3600
cgtgccgtgc tgttcagcaa ccgctccggc accgtggaaa gcgaaggctc aattggcatc 3660
aatgcaggct ttatcgaaaa cgccaaagac gaattcgaac tcgggcagac actgaccacc 3720
ggtagcttga gctggatctg tggccagcac tgcggcgaga gcgacaactg ggaacgtggc 3780
gagatcacca tctacgaaac gtacctcgag gcggcgacca aggactcggt agcggcgcgc 3840
ctggtggcgg gcaaaaacat gctgctgcaa ggcgacacgg tgcagaaccg ctacagcctg 3900
atggccgcca atggcgacct gagcatcact gccggagacc tgctcaacca gggcgccgcc 3960
acgcgcacgg gccagcgcaa gcttgtcatc ggcacgccag gtcacgtctc cgacgatttg 4020
tttgaacgca tgcaatatgt tgatgtgccc gcgttcaatg cggccacggc ggctgggaat 4080
ttcgacaagg cgcgcttcga agaactcaaa agccgctcac ccaatagcct gccgttcgcc 4140
tacgccagtg acgtcaccac ctggaccaac aacagcggcc ccggctacga cgccaccctg 4200
caagcgggcg gcacggtcaa cctcaacgtc gcccgcaccc tgcaaaacgg cacgctgcac 4260
aacaacaccc tggcccagtt gaccggcacc ctcggcgacg accagaccgg catccccgtc 4320
ggcggcatca acatcaacct gagcaaacac gccaacgacc cgagcgccca ggcgcccggc 4380
agtgtcttgc ccgtcgtggg cgtggcccct ggtggcggct tcgtgcccgt ggattacacc 4440
ggcaccgcgt ttgccccggt cgaccccacc acctcgccca ccttccaact gcccaagggc 4500
gaatacggcc tgttcgtcaa aaacgccgac cccaccagcc actacctgat cgagaccaac 4560
cccgagttca cctcggtgtc gggcttcttc agctccgact acatgctcgg caaactcggt 4620
ttcaccgccg acaacgcctg gcgccgcctc ggtgacggcc agtacgaaac ccgcctgatc 4680
cgcgacgccg tcctcgcgca aaccggccag cgcttcctcg ccggcggcct gtacagcgac 4740
gccgaccagt tccgctacct gatggacaac ggcctcgcca gcaaagacgc cctgcgcctg 4800
agcctgggcg tggccctcac cgaccagcaa gtcggcgccc tgacccacga catcgtgtgg 4860
atggaaaacc gcgtcatcga aggccagacc gtgctcgtgc cggtgctgta cctggcccag 4920
gccgactcgc gcaacgtgcg cggcaacagc ctcatccagg gccgcgacct caacctggtc 4980
accggcggcg acctgatcaa cgtcggcacc ctgcgcgcca gcaacaacct ctccgccatc 5040
agtagcggca gcatttatac cggcggcctg gtcgaagccg gcaacaatct cagcctgctg 5100
gcccaggaca gcatccgcaa cgccatggcc ggcgaaatcc gcggcaagca agtcagcctc 5160
acggcgctca aaggcgatat caccaacgaa accaccgcca tccaggtgcg tgacggcgcc 5220
ggtatgcgca ccctcaccga caccagcgcc ggcaccatcg tcgcccgcga aaacctcgcc 5280
atcgacgctg gccgcgacct caccaaccga ggcgcgctgg tagcgggcaa cgacgccaac 5340
ctcaccgccg gccgcgacct caacctcatc gccgccagcg acacccgcgt caaacacgag 5400
acccgcgacg gcggcgagaa atccagcatc accaccgacg tcaaaaacct cgccgccagc 5460
gtcacggcgg gcggcaacct caacatgcag gccgggcaag acgtcaacat catcggcagc 5520
aatgccacgg ccggcaaaga cctcaacatc gccgccggcc gcgacctcaa cgtcgcctcg 5580
gtcagcgaca tgcacaacgt cgagggcaag gaaaaggacg gcaaaaaacg catcaggacc 5640
tcggacgacc agaccactca agtggcaagc gtgctgacgg cgggtgggga ttttgtcagc 5700
caggcggggc gtgataccac gattgtggcg agcatgatca gtgcggggaa tgaggcttat 5760
ctgtatagcg gggataagtt gagtttgttg gcggctgaga acagtacgca tacgttgtat 5820
gacatgaagg agaagggaag ctggggcgct aaaaaggcgc agatggatga agtgacccgc 5880
accacccagg tagggaccga gatcaagaca ggtggcaacc tagtccttaa aagcgacggc 5940
gaccagctgt atcaagttgc gaagcttaat agcggcaagg acatcatcct tgatagcggt 6000
ggtgcaattg tctttgaagg cgtcaaggac ctgcacgatg agagccacac taagagcaaa 6060
agcgacctct cgtggttcag cgctaagggc aaaggtaata cagacgaaac cttgcgtcag 6120
agcgagttgg ttgcccaagg acagcttgtc atcaaggccg ccgaaggcat tcgtatcgac 6180
gtcaaacagg tcgatcagca gactgtaagc cagaccgttg atgcgatggt caaggctgat 6240
cctaatttgg cctggctcaa gcaagctgag gcacgtggcg acattgattg gcgccaggta 6300
aaggagattc acgagagctt caagtacgac aactcagggt tgggcgccgg tgccaagatt 6360
gcgattgcga tcatgatggc ggcgatcatg gggccggtag gattcgggtt gcagggagcc 6420
acccttgcgg tgagcaccag cctgagtacg acggcagtca ctagcaccat caacaacaaa 6480
ggcaatttgg gtgcagcgct taaggaaacg gtcagcgcca atagcctgaa aagcgcagca 6540
gtcgccgggt tcacggcggg ggctcttgag tatgccgaca ccaattggtt cgctggtgct 6600
gacggtgcag gtgcaggtgc aggcacaagt acaagcacag tccaaggtgt taccccgagt 6660
acgggttcaa ccttggcggt tacgaactcc tccaaagata ttttcacctg gacgtcagca 6720
ggcgatatcg cgctgcgtac cggtggccgg gcggtaatct ctagcggaat atcgacggcc 6780
attcaagggg gaagcttcgg cgacaacttc aatgcggccc tgttgggaga ggctggcaac 6840
gttgcaatgg ctaccggttt taattgggtg ggtgactacg tcacgttccc caatggcagc 6900
cctcaaaaga ttattgcgca cgctttgatg gggggattgc tggctgaagc cacaggtagc 6960
gatttcaaaa ccggggctgc cgctgccggg ctgaatgagg cactcatcaa tcagttggtg 7020
tgggctgctc aaggcaatga cgacatcacg ctgatgcttt cacagctgac aggcttgtta 7080
gcagctgcgg cggtcgatgg agatttggaa aaaggctctc agattgctca gaaggcgacg 7140
acgttcaact atctttacca cgaagaagtc gaggaaatgc ttcgggaggt agatagcaag 7200
actacggagc aagagaagcg tgaggtcagg cagcgctatg cggaacttga tcagcagaga 7260
aatgacgagt tggatgcgct ttgcgcacgc gatccgcaac gctgccgagg tattgccact 7320
tccttggcga acgatgatca gaaactcgtt gatctggtag gtaggttgag atcccaaggg 7380
cagggcggtg ctgcttctgc ggttggtttt gtgataggga acaacctaga cgcgtccagc 7440
caaattgcag cagatatcag ctctgcgggc ggtgggccat tagttaagct cggtgcggag 7500
gcaattaagg ccggagttgg gatcacactg ccttcacgtt caagctctgg taaggggaaa 7560
ggaagccaag tcggcgcggg ttcccttgaa gaggcggcgg gtccaaaggc gacaggcgaa 7620
gtagtgcctc ccgcgcctat tgtgacttct ggtgcgacta ggacaggtgt tgttcgtaca 7680
aatgccgcag attggagagc actgcgtaat aattgggatg accttgggta tggtcaaatc 7740
ttaagtactg aaaatcgggc cgcgattgct aaaggacgga ctccaaaagt cgacgatgca 7800
tgggttaagg tttttcctga agatgcaggg ctaaagggcg agagaattcc tatgcaccat 7860
gttcagggtt cgccacttac tgtgccactg cctgatacac ggcatttgga tgcgcatatg 7920
ccaggagggt ttagatataa tccaggcggt ccagggtcgg ctctcccggc ataccctcca 7980
aaaaaaggag ctgaataa 7998
<210> 45
<211> 607
<212> PRT
<213> Pseudomonas fluorescens
<400> 45
Met Phe Arg Arg Leu Arg Gly Ile Pro Leu Leu Gly Cys Leu Met Gly
1 5 10 15
Ser Ile Gly Cys His Ser Gln Pro Pro Ala Pro Pro Pro Ile Gln Lys
20 25 30
Gly Asp Tyr Gly Ala Ile Ile Arg Tyr Leu Gln Thr Arg Ile Pro Arg
35 40 45
Glu Met Ala Arg Asp Asn Val Ala Gly Leu Ser Ile Ala Leu Val Asn
50 55 60
Gly Gln Glu Leu Ile Trp Ala Arg Gly Phe Gly Leu Ala Asp Lys Asp
65 70 75 80
Gln Gly Val Pro Val Thr Pro Asn Thr Ala Phe Arg Ala Gly Gly Ile
85 90 95
Ser Lys Leu Leu Ser Ala Thr Ala Ala Leu Gln Leu Val Glu Gln His
100 105 110
His Leu Ala Leu Asp Ala Pro Ile Gln Gln Thr Leu Arg Glu Phe Tyr
115 120 125
Val Arg Ser Arg Phe His Ser Asp Gln Ala Glu Ala Asp Arg Ala Ile
130 135 140
Thr Leu Arg Arg Leu Leu Ser His Gln Ser Gly Leu Pro Ser Glu His
145 150 155 160
Leu Arg Asp Leu Arg Ser Thr Tyr Ala Met Gly Gln Met Pro Met Arg
165 170 175
Val Ser Gly Val Trp Leu Ser Ser Leu Pro Gly Ser Gln Val Ala Tyr
180 185 190
Ser Asn Leu Gly Tyr Ser Leu Val Gly Ala Ala Ile Glu Arg Ser Ser
195 200 205
Gly Lys Ser Phe Glu Ala Gln Leu Gln Ser Ser Leu Leu Thr Pro Leu
210 215 220
Arg Met Asn Gln Ser Ser Phe Val Gly Thr Gly Ala Gln Met Gly Phe
225 230 235 240
Arg Ala His Gly Tyr Glu Asp Gly Lys Ala Ser Thr Asp Ala Gln Val
245 250 255
Arg Asp Leu Ala Ala Gly Gly Leu Trp Thr Ser Pro Lys Asp Leu Ser
260 265 270
Arg Tyr Val Arg Met Leu Phe Ala Asn Gly Thr Tyr Lys Gly Ser Gln
275 280 285
Ile Leu Gly Ser Ala Ser Ile Asp Ala Met Phe Thr Gln Gln Asn Thr
290 295 300
Gly Asn Ala Leu Asp Phe Asp Cys Gln Ile Gly Leu Gly Trp Phe Leu
305 310 315 320
Ala Pro Cys Gly Asp Glu Pro Ile Gly Pro Gly Val Arg Thr Tyr Gln
325 330 335
His Ser Gly Gly Gly Asp Asp Phe Val Ala Gln Leu Thr Leu Leu Pro
340 345 350
Asp Gln Gln Leu Ala Val Ile Ile Met Ala Asn Asp Ser Asn Ala Glu
355 360 365
Asp Met Val Val Ser Leu Thr Thr Asp Ser Leu Arg Leu Met Leu Gln
370 375 380
Ala Gln Thr Gly Gln Pro Val Cys Ala Asp Asp Cys Gln Ala Pro Ser
385 390 395 400
His Gly Leu Lys Leu Arg His Val Pro Ala Ala Val Asp Arg Lys Arg
405 410 415
Leu Ala Gly Phe Tyr Ala Thr Ala Trp Gly Val Phe Arg Ile Arg Asp
420 425 430
Tyr His Ala Arg Leu Thr Gly Glu Leu Ala Gly Tyr Asp Phe Glu Leu
435 440 445
Leu Arg Asp Glu Gln Gly Trp Leu Arg Ala Gln Lys Lys Ile Leu Gly
450 455 460
Phe Trp Arg Lys Asp Leu Gly Glu Leu Gly Arg Val Gln Leu Asp Val
465 470 475 480
Ile Gln Val Gln Gly Arg Gln Met Leu Thr Ala Arg Ser His Gly Gln
485 490 495
Arg Ile Ala Ile Gly Glu Arg Ile Glu Pro Pro Pro Leu Pro Ala Ala
500 505 510
Trp Ala Asn Thr Val Gly Thr Tyr Gln Val Leu Ser Ser His Glu Pro
515 520 525
Asp Ala Pro Leu Ser Gly Ile Ser Val Arg Gln Glu Asp Gly Phe Leu
530 535 540
Val Ile Arg Gly Gln Leu His Gly Glu Pro Leu Thr Asp Tyr Ile Leu
545 550 555 560
Leu Pro Ile Asp Asn Ala His Ala Val Leu Ala Gly Asn Gly Tyr Gly
565 570 575
Leu Gly Asp Thr Val Ser Arg Gln Val Asn Gly Leu Ser Ala Ser Gly
580 585 590
Tyr Ser Phe Lys Arg Thr Gln Ser Pro His Ile Pro Ser Asn Phe
595 600 605
<210> 46
<211> 1824
<212> DNA
<213> Pseudomonas fluorescens
<400> 46
atgtttcgca ggttgcgcgg tattccgctc ttgggttgcc tgatgggcag tatcggttgc 60
cactcgcaac cgcctgcccc gccgccgatt caaaaaggcg attacggcgc aatcatccgc 120
tacttgcaaa cccgcattcc ccgggagatg gctcgggaca atgtggcagg tttgtcgatt 180
gcgctggtca atggccagga gctgatctgg gctcgtggct ttggcctggc tgacaaagac 240
cagggggtgc cggtcacgcc caataccgcg tttcgcgccg gtggcatttc caaactgctg 300
agcgccacgg cggcgctgca gctggtggag cagcaccacc tggcgctgga tgcaccgatc 360
cagcagaccc tgcgtgagtt ctacgtacgt tcacgctttc acagcgacca ggccgaggcg 420
gatcgagcga tcactttgcg gcgcttgctc agccatcaat ccggcttgcc cagcgagcac 480
ctgcgcgacc tgcgcagcac ctacgccatg gggcaaatgc caatgcgcgt gtcgggtgtg 540
tggctgagca gcctgccggg gtcccaggtg gcgtactcca accttggtta ttcactggtg 600
ggcgcggcca tcgagcgcag cagcggtaaa agctttgaag cccagttgca aagcagcctg 660
ctcacgcccc tgcgaatgaa ccagtccagc ttcgtaggca ccggtgcaca aatgggcttt 720
cgcgcccatg gttacgagga cggcaaggcc agcaccgacg cccaagtgcg tgacctcgcc 780
gccggtggcc tgtggaccag ccccaaagac ctcagccgct acgtacgcat gctgtttgcc 840
aacggcacct acaagggcag ccagatcctc ggcagcgctt ctatcgacgc catgtttacc 900
cagcaaaaca ccggcaacgc cctggatttc gactgccaga tcggcctggg ctggtttctg 960
gcgccctgcg gtgacgagcc catcggcccc ggtgtgcgca cctaccagca cagcggtggc 1020
ggcgatgact tcgtcgccca attgaccctg ctaccggatc agcagctggc ggtgatcatc 1080
atggccaacg acagcaacgc cgaagacatg gtggtgtcac tgaccaccga cagcctgcgc 1140
ctgatgctcc aggcacagac tggccagccc gtgtgcgccg atgactgcca ggcgccgagc 1200
cacggcctca agctgcgcca tgtgccggcg gcggtggatc gcaagcgcct ggctggtttc 1260
tatgcgaccg cctggggcgt gttccgcatc agggattacc atgcacgctt gaccggcgaa 1320
ctggccggct acgatttcga gctgttacgt gatgaacaag gctggctgcg cgcgcagaaa 1380
aagatcctcg gcttctggcg caaggacctg ggcgagttgg gccgcgtgca gttggatgta 1440
atccaggtac aaggccgcca aatgctcacc gcgcgcagcc acggccaacg cattgccatc 1500
ggtgaacgca tcgagccacc gcccttgcct gccgcctggg ccaacacggt cggcacctat 1560
caggtgctca gcagccatga acccgacgcg ccattgagtg gcatcagcgt gcgtcaggag 1620
gacggctttc tggtgattcg tggccaattg cacggcgagc cgctgaccga ctacatcctg 1680
ctacccatcg acaacgccca tgcggtactg gccggcaacg gttacggctt gggcgatacc 1740
gtcagccgcc aggtcaacgg gctgagcgct tcgggttatt ccttcaaacg tacccaatca 1800
ccccacatac cctcgaattt ctaa 1824
<210> 47
<211> 814
<212> PRT
<213> Pseudomonas fluorescens
<400> 47
Met Arg Val Pro Gly Pro Thr Ala Thr Asn Ser Asn Ala Gly Gln Val
1 5 10 15
Pro Asp Pro Arg Ser Gly Ile Ser Pro Glu Gly Pro Thr Gln Val Tyr
20 25 30
Thr Leu Asn Ser Lys Lys Thr Val Phe Thr Thr Glu Gln Ala Gly Lys
35 40 45
His Ile Thr Arg Ser Gly Phe Lys Phe His Asp Ser Asn Gly Asp Gly
50 55 60
Lys Thr Thr Leu Ser Tyr Arg Val Ser Lys Gly Phe Thr Pro Gln Gln
65 70 75 80
Ala Asp Gln Ala Arg Gln Ala Leu Gln Ser Trp Gln Asp Val Ala Asn
85 90 95
Val Thr Phe Thr Glu Lys Arg Gln Gly Ala Asp Gly His Ile Asp Ile
100 105 110
Asn Glu Met His Gly Thr Ser Gly Gly Met Ala Ser Leu Pro Asn Arg
115 120 125
Tyr Met Ser Gln Thr Phe Ala Asn Val Gly Thr Ala Asn Ala Gly Ala
130 135 140
Asn Pro Pro Arg Gly His Tyr Phe Arg Glu Val Leu Val His Glu Ile
145 150 155 160
Gly His Thr Ile Gly Leu Glu His Pro Gly Asp Tyr Asp Gly Ser Gly
165 170 175
Asn Tyr Gly Arg Asp Ala Ala Tyr Ala Gly Asp Thr Arg Ala Arg Ser
180 185 190
Val Met Ser Tyr Tyr Ser Glu Lys Asn Gln Pro Gly His Asp Phe Lys
195 200 205
Ser Leu Asn Pro Ser Ala Pro Met Met Asp Asp Ile Ser Ala Val Gln
210 215 220
Lys Leu Tyr Gly Ala Asn Thr Lys Thr Arg Asn Thr Asp Thr Thr Tyr
225 230 235 240
Gly Phe Asn Ser Asn Thr Asn Arg Glu Ala Tyr Ser Leu Lys Ser Ala
245 250 255
Asn Asp Thr Pro Ile Phe Cys Val Trp Asp Gly Gly Gly Asn Asp Thr
260 265 270
Leu Asp Phe Ser Gly Tyr Ser His His Gln Lys Ile Asn Leu Asn Ala
275 280 285
Glu Ser Phe Ser Asp Val Gly Ala Leu Lys Gly Asn Val Ser Val Ala
290 295 300
Lys Gly Val Thr Leu Glu Asn Ala Val Gly Gly Lys Gly Asp Asp Thr
305 310 315 320
Leu Ile Gly Asn His Val Ala Asn Arg Leu Lys Gly Gly Ala Gly Ala
325 330 335
Asp Arg Leu Ser Gly Gly Gly Gly Ala Asp Thr Phe Val Tyr Asp His
340 345 350
Ala Ser Asp Ser Thr Pro Asp Asn Pro Asp Val Ile Leu Asp Phe Ala
355 360 365
Ser Gly Ala Asp Lys Ile Asp Val Ser Ala Val Leu Lys Arg Ala Asn
370 375 380
Val Ser Ala Leu Lys Phe Val Asp Arg Leu Thr Gly Gln Pro Gly Gln
385 390 395 400
Ala Val Met Ser Tyr Asp Glu Gly Arg Asn Glu Gly Gly Leu Ala Leu
405 410 415
Asp Leu Thr Gly Asn Gly Lys Ala Asp Leu Leu Ile Lys Ser Ile Gly
420 425 430
Gln Ile Lys Ala Ala Asp Ile Leu Ala His Gly Asp Thr Thr Ala Pro
435 440 445
Asn Pro Glu Pro Lys Asp Pro Lys Pro Gln Pro Arg Pro Gln Pro Glu
450 455 460
Glu Pro Lys Pro Lys Pro Glu Ser Lys Pro Lys Glu Pro Lys Pro Glu
465 470 475 480
Glu Pro Lys Pro Arg Pro Asp Ser Cys Glu Pro Lys Pro Arg Pro Asp
485 490 495
Pro Cys Glu Pro Lys Pro Arg Pro Asp Pro Cys Glu Pro Lys Pro Arg
500 505 510
Pro Asp Ser Cys Glu Pro Lys Pro Arg Pro Asp Pro Cys Glu Pro Lys
515 520 525
Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro Asp Pro Arg Glu
530 535 540
Pro Gln Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro Asp Pro
545 550 555 560
Arg Glu Pro Gln Pro Cys Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro
565 570 575
Asp Pro Cys Glu Pro Gln Pro Arg Pro Asp Pro Cys Glu Pro Gln Pro
580 585 590
Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg Pro Asn Pro Arg Glu Pro
595 600 605
Gln Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Gln Pro Arg Pro Asp
610 615 620
Pro Arg Glu Pro Tyr Pro Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg
625 630 635 640
Pro Asn Pro Arg Glu Pro Arg Pro Arg Pro Asn Pro Arg Glu Pro Gln
645 650 655
Pro Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg Pro Asp Pro Cys Glu
660 665 670
Pro Gln Pro Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg Pro Asn Pro
675 680 685
Arg Glu Pro Gln Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro
690 695 700
Asp Pro Arg Glu Pro Arg Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro
705 710 715 720
Arg Pro Asp Pro Cys Glu Pro Gln Pro Arg Pro Glu Pro Cys Glu Pro
725 730 735
Arg Pro Arg Pro Asn Pro Arg Glu Pro Gln Pro Arg Pro Asp Pro Cys
740 745 750
Glu Pro Lys Pro Thr Pro Arg Thr Asp Pro Cys Glu Pro Lys Ala Val
755 760 765
Thr Arg Asn Val Arg Pro Ala Tyr Gly Leu Ser Ala His Ser Gly Glu
770 775 780
Tyr Arg Ala Met Gln Ala Pro Ala Phe Asp Ser Arg His Phe Gln Gly
785 790 795 800
Gly Leu Ala Gly Glu Phe Ile Arg Arg Gln Lys Arg Ala Glu
805 810
<210> 48
<211> 2445
<212> DNA
<213> Pseudomonas fluorescens
<400> 48
atgagagtgc caggaccaac cgcaacgaat tctaatgcag ggcaggtgcc agatccgagg 60
agtggcatca gcccggaggg ccctacgcag gtatatacac taaacagcaa aaaaaccgtc 120
ttcactacgg aacaggccgg gaaacatatc acccgcagcg gtttcaagtt tcatgacagt 180
aacggtgatg gcaaaaccac gttgtcctat cgtgtttcca agggctttac cccacagcag 240
gcagatcaag ccaggcaggc actgcaatcc tggcaggatg tcgctaacgt cacattcact 300
gaaaaaaggc agggggctga cggccatata gatatcaatg agatgcacgg aacctctggg 360
ggtatggcct cactccccaa ccgctatatg agtcaaactt tcgcaaatgt cggaacagcg 420
aatgcaggtg caaaccctcc acggggtcat tattttcgcg aagttctagt tcacgaaata 480
ggccacacca ttgggctgga acacccgggg gactatgatg gctctggtaa ctatggacgg 540
gacgcagcgt atgccgggga tactcgagcg cgttctgtga tgagttacta ttcggaaaaa 600
aaccagccgg gacatgattt caaatcattg aacccctctg cgccgatgat ggatgatata 660
tcggccgttc agaaactcta tggggcgaat actaaaacgc gtaataccga tacgacgtat 720
ggatttaatt ccaatacaaa ccgtgaagcc tatagtttga agtcggctaa cgacacaccc 780
attttctgtg tgtgggatgg tggtggtaat gacacattgg atttctctgg gtattcacac 840
catcagaaaa tcaacctcaa tgccgagtcc ttttcggatg taggggcgtt gaaaggtaac 900
gtttccgttg ccaagggcgt cacgctggaa aatgcagtgg gcggtaaggg cgacgacaca 960
cttatcggta atcatgttgc caatcgcctc aaaggggggg cgggagccga cagactgtct 1020
ggggggggcg gcgcagatac ctttgtttac gaccatgcca gtgattccac cccggataac 1080
cctgatgtca tcctggattt tgcgagtggc gcagataaga ttgatgtatc cgcagtcctt 1140
aaaagagcga atgtcagtgc tctcaagttc gtcgatcgct taactggcca acccggccag 1200
gctgtgatga gttatgacga gggccgcaac gagggggggc tggccctgga tctgacaggc 1260
aacggcaagg ctgatctatt aataaaaagc attggccaga taaaagctgc tgatatcttg 1320
gcgcacggcg atacaaccgc gccaaaccct gaacccaaag atcccaagcc gcagccgcgt 1380
cctcaacccg aggagcccaa acccaagcct gaatccaaac cgaaggagcc aaaaccggag 1440
gaaccaaaac cgcgtccgga ctcgtgtgaa ccaaagccgc gtccggatcc gtgtgagccg 1500
aagccgcgtc cggatccgtg cgagccgaag ccgcgtccgg attcgtgtga gccaaagccg 1560
cgtccggatc cgtgcgagcc gaagccgcgt ccagatccac gcgaaccgca gccacgtccg 1620
gacccgcgcg agccgcagcc gcgtccagat ccacgcgaac cgcagccacg tccagaccca 1680
cgtgaaccgc agccatgtcc ggatccacgc gaaccgcagc cgcgtccgga cccgtgtgag 1740
ccgcagccgc gtccggaccc gtgtgagcca cagccgcgtc cagacccacg tgaaccgagg 1800
ccgcgtccga acccacgtga accgcagcca cgtccggacc cacgcgagcc gcagccgcag 1860
ccgcgtccgg acccacgtga accgtaccca cgtccagacc cacgtgaacc gaggccgcgc 1920
ccgaacccac gtgagccgag gccgcgtccg aacccacgtg aaccacagcc gcgtccagac 1980
ccacgtgagc cgaggccgcg tccggacccg tgtgagccac agccgcgtcc agacccacgt 2040
gagccgaggc cgcgtccgaa cccacgtgaa ccacagccgc gtccagaccc acgtgaaccg 2100
cagccacgcc cggacccgcg tgagccgagg ccgcgtccgg acccacgtga accgcagcca 2160
cgcccggacc cgtgtgagcc acagccgcgt ccggaaccat gtgagccgag accgcgtccg 2220
aacccacgtg aaccgcaacc acgtccggac ccgtgcgagc ctaaaccaac ccctcgcaca 2280
gatccttgcg agccgaaagc tgtcactcga aacgtaaggc cagcctatgg cttgagtgcc 2340
cattcaggcg agtaccgggc gatgcaggcg ccagcctttg atagtcgtca tttccagggc 2400
gggcttgcag gggaattcat tcgacgtcag aagcgcgctg aatag 2445
<210> 49
<211> 262
<212> PRT
<213> Pseudomonas fluorescens
<400> 49
Met Ala Ser Thr Arg Val Arg Phe Gln Phe Arg Gln Asp Glu Ser Gly
1 5 10 15
Glu Leu Arg Val Tyr Gly Leu His Thr Gln Pro Gly Ser Gly Ala Asp
20 25 30
Arg Val Pro Val Ala Gln Ala Arg Trp Asn Val Asp Lys Ser Ala Met
35 40 45
Val Ala Val Leu Asp Gly Ile Ser Ile Thr Trp Thr Pro Asn Leu Gly
50 55 60
Pro Val Val Ser Val Pro Ser Pro Tyr Pro Gly Thr Pro Glu Arg Leu
65 70 75 80
Asp Asn Met Phe Val His Pro Ile Ala Val Gly Gln Asp Ser Ala Ile
85 90 95
Ser His Tyr Pro Gly Arg Asp Ala Glu Asn Ile Thr Trp Gln Asp Thr
100 105 110
Ile Ile Ser Phe Pro Ala Asp Ser Gly Val Pro Pro Leu Tyr Leu Val
115 120 125
Phe Ala Lys Pro Ala Val Arg Pro Leu Glu Val Asp Ile Tyr Gly Ala
130 135 140
Phe Ser Gly Arg Leu Arg Asn Gly Leu His Val Asp His Ile Pro Ser
145 150 155 160
Gln Ala Ala Ile Arg Arg His Leu Glu Arg Tyr Ala Ile Ser Phe Thr
165 170 175
Glu Lys Gln Leu Lys Glu Ala Leu Asn Asn Ala Ala Ser Ile Ala Ile
180 185 190
Pro Ser Tyr Ile His Gln Lys Phe Ser Glu Thr Tyr Gly Trp Arg Asn
195 200 205
Thr Glu Lys Lys Gln Thr Leu Asp Ala Asp Asp Leu Arg Gln Ala Ala
210 215 220
Asp Asn Asn Phe Asp Ala Ile Lys Pro Tyr Leu Leu Asp His Gly Phe
225 230 235 240
Ala Glu Thr Asp Leu Glu Met Ala Arg Thr Arg Met His Lys Val Asn
245 250 255
Glu Asn Gln Gly Trp Tyr
260
<210> 50
<211> 789
<212> DNA
<213> Pseudomonas fluorescens
<400> 50
atggccagca cgcgagtgcg tttccagttt cgccaggatg agtccggtga actgcgtgtt 60
tacggcctac atacccaacc tggcagtggc gccgaccgtg tgccggttgc acaagcccgg 120
tggaatgtgg acaaaagcgc gatggtcgcg gtgctggatg gcatcagcat cacatggacg 180
ccgaacctcg gcccggttgt cagcgtgccg agcccgtatc ccggaacacc ggaacgcttg 240
gataacatgt ttgttcatcc gattgcggtg gggcaagatt cggcgatcag tcactatcca 300
gggcgggatg cagaaaacat cacctggcag gatacgatca tttcgtttcc ggctgattcg 360
ggtgtgccgc cgttgtattt ggtgtttgcc aagccggcgg tcaggccgtt ggaagttgat 420
atttacggtg cgttcagtgg acgactgcgc aacgggttgc acgtggatca cataccctcg 480
caggcagcga taagacgtca tctcgaacgc tatgcaataa gctttacaga gaagcagctc 540
aaggaagcgt taaataatgc tgcgagcatt gctattccgt cttacatcca tcaaaagttt 600
agtgagactt acggttggcg aaacacggag aaaaagcaga cgttagatgc cgacgatctt 660
cgtcaggcgg cagacaacaa ttttgatgct atcaagccat acctcctgga tcacggcttc 720
gctgagactg atctcgagat ggcacgcacc cgaatgcata aggtcaacga aaaccagggg 780
tggtactag 789
<210> 51
<211> 4677
<212> PRT
<213> Pseudomonas fluorescens
<400> 51
Met Asn Ala Glu Asp Ser Leu Lys Leu Ala Arg Arg Phe Ile Gly Leu
1 5 10 15
Pro Leu Glu Lys Arg Gln Leu Phe Leu Gln Ala Leu Gln Lys Glu Gly
20 25 30
Val Asp Phe Ser Arg Phe Pro Ile Pro Ala Gly Val Glu Val Glu Asp
35 40 45
Arg Gln Ala Leu Ser Tyr Ala Gln Gln Arg Met Trp Phe Leu Trp Gln
50 55 60
Leu Asp Pro Ala Ser Gly Ala Tyr Asn Leu Pro Gly Ala Val Arg Leu
65 70 75 80
Ser Gly Val Leu Ser Leu Pro Ala Leu Glu Gln Ala Phe Ala Ser Leu
85 90 95
Val Ala Arg His Glu Thr Leu Arg Thr Val Phe Gln Arg Gln Ala Asp
100 105 110
Glu Arg Leu Ala Gln Val Ala Val Glu Pro Ser Val Ala Val Glu His
115 120 125
Leu Asp Phe Thr Ala Leu Ala Phe Asp Ala Arg Glu Gln Ala Val Asn
130 135 140
Ala Ala Ala Thr Arg Gln Ser Leu Leu Pro Phe Asp Leu Glu His Gly
145 150 155 160
Pro Leu Leu Arg Val Gln Leu Leu Lys Leu Ala Glu Gln Glu His Val
165 170 175
Leu Leu Leu Thr Leu His His Ile Val Ser Asp Gly Trp Ser Met Asn
180 185 190
Val Leu Ile Asp Glu Phe Ile Arg Cys Tyr Asp Ala His Glu Arg Asp
195 200 205
Glu Ala Pro Gln Leu Pro Ala Leu Pro Ile Gln Tyr Ser Asp Tyr Ala
210 215 220
Leu Trp Gln Arg Arg Trp Leu Glu Ala Gly Glu Gln Ala Arg Gln Leu
225 230 235 240
Glu Tyr Trp Gln Ala Arg Leu Gly Asp Glu His Pro Val Leu Glu Leu
245 250 255
Pro Thr Asp His Pro Arg Pro Ala Met Pro Ser Tyr Gln Gly Thr Arg
260 265 270
His Asn Phe Ala Ile Glu Pro Ala Leu Ala Ala Gln Leu Arg Ser Cys
275 280 285
Ala Gln Lys His Asn Val Thr Leu Phe Met Leu Leu Leu Gly Ala Phe
290 295 300
Asn Val Leu Leu His Arg Tyr Thr Gly Gln Gly Asp Ile Arg Val Gly
305 310 315 320
Val Pro Ile Ala Asn Arg Asn Arg Thr Glu Val Glu Gly Leu Ile Gly
325 330 335
Phe Phe Val Asn Thr Gln Val Leu Arg Thr Glu Leu Ser Gly Gln Thr
340 345 350
Arg Val Ala Glu Leu Leu Gln Gly Ile Lys Glu His Ala Leu Gly Ala
355 360 365
Gln Ala His Gln Glu Leu Pro Phe Glu Arg Leu Val Glu Ala Leu Lys
370 375 380
Ile Glu Arg Ser Leu Ser His Thr Pro Leu Phe Gln Val Met Tyr Asn
385 390 395 400
His Gln Pro Val Val Ala Asp Ile Ala Ser Val Ser Thr Ala Ser Gly
405 410 415
Leu Glu Leu Ala Leu Val Glu Trp Gln Gly Arg Thr Thr Gln Phe Asp
420 425 430
Leu Thr Leu Asp Thr Tyr Glu Lys Ser Gly Thr Leu His Ala Ala Leu
435 440 445
Thr Tyr Ala Asn Asp Leu Phe Asp Thr Pro Thr Ile Glu Arg Met Ala
450 455 460
Arg His Trp Thr Arg Leu Leu Gln Ala Met Val Leu Asp Gly Glu Gln
465 470 475 480
Arg Ile Gly Glu Leu Pro Met Leu Asp Ala Ala Glu Gln Gln Arg Leu
485 490 495
Leu His Thr Trp Asn His Thr Ala Glu Ala Tyr Pro Thr Glu Arg Gly
500 505 510
Ile His His Leu Ile Glu Asp Gln Ala Arg Arg Ser Pro Asp Ala Pro
515 520 525
Ala Leu Val Phe Gly Thr Thr Thr Leu Thr Tyr Ala Gln Leu Asp Ala
530 535 540
Arg Ala Asn Gln Leu Ala His Ala Leu Gly Glu Gln Gly Val Gly Pro
545 550 555 560
Asp Val Leu Val Gly Ile Cys Ile Glu Arg Ser Ile Glu Met Val Val
565 570 575
Gly Leu Leu Ala Ile Leu Lys Ala Gly Gly Ala Tyr Val Pro Leu Asp
580 585 590
Pro Glu Tyr Pro Gln Glu Arg Leu Ala Tyr Met Ile Glu Asp Ser Gly
595 600 605
Ile Gln Leu Leu Leu Ser Gln Gln Ser Leu Leu Ala Ser Leu Pro Val
610 615 620
Ala Gly Ile Gln Val Ile Ala Leu Asp Gln Pro Ala Leu Trp Leu Asp
625 630 635 640
Gly Tyr Ser Ser Glu Ser Pro Asn Val Ala Leu His Ala Leu Asn Leu
645 650 655
Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Ala
660 665 670
Gly Asn Ser His Arg Ala Leu Val Asn Arg Leu Ser Trp Met Gln Gln
675 680 685
Ala Tyr Gly Leu Gly Ala Asn Asp Ala Val Leu Gln Lys Thr Pro Phe
690 695 700
Ser Phe Asp Val Ser Val Trp Glu Phe Phe Trp Pro Leu Met Ser Gly
705 710 715 720
Ala Arg Leu Val Val Ala Ala Pro Gly Glu His Arg Glu Pro Ala Arg
725 730 735
Leu Ile Asp Thr Ile Gly Arg His Ala Ile Thr Thr Leu His Phe Val
740 745 750
Pro Ser Met Leu Gln Ala Phe Ile His Glu Pro Gly Val Gln Ala Cys
755 760 765
Ala Ser Leu Thr Arg Ile Val Cys Ser Gly Glu Ala Leu Pro Leu Asp
770 775 780
Ala Gln Gln Gln Val Phe Ala Lys Leu Pro Ala Ala Ala Leu Tyr Asn
785 790 795 800
Leu Tyr Gly Pro Thr Glu Ala Ala Ile Asp Val Thr His Trp Thr Cys
805 810 815
Ile Asp Glu Gly Val Asp Ser Val Pro Ile Gly Arg Pro Ile Ala Asn
820 825 830
Leu Gly Thr Tyr Val Leu Asp Ala Gln Leu Asn Pro Val Pro Ala Gly
835 840 845
Val Ser Gly Glu Leu Tyr Leu Gly Gly Val Gly Leu Ala Arg Ser Tyr
850 855 860
His Arg Arg Pro Ala Leu Thr Ala Glu Arg Phe Val Pro Ser Pro Phe
865 870 875 880
Val Thr Gly Glu Arg Leu Tyr Arg Thr Gly Asp Arg Val Arg Gln Arg
885 890 895
Ala Asp Gly Val Ile Glu Tyr Leu Gly Arg Leu Asp His Gln Val Lys
900 905 910
Leu Arg Gly Leu Arg Ile Glu Leu Gly Glu Ile Glu Ala Arg Leu Met
915 920 925
Gln His Pro His Val Arg Glu Ala Val Val Leu Val His Gly Gly Lys
930 935 940
Gln Leu Val Ala Tyr Leu Val His Pro Gly Glu Ala Pro Thr Asp Leu
945 950 955 960
Lys Ala Trp Leu Leu Ser Ser Leu Pro Glu Tyr Met Val Pro Thr His
965 970 975
Phe Ile Ala Leu Pro Lys Leu Pro Val Thr Ala Asn Gly Lys Leu Asp
980 985 990
Arg Lys Ala Leu Pro Val Pro Asp Ala Ala Leu Gln Gln Ala Phe Val
995 1000 1005
Ala Pro Gln Gly Asp Leu Gln Thr Ala Leu Ala Ala Ile Trp Ser
1010 1015 1020
Asp Val Leu Gly Val Glu Glu Val Gly Gln Asp Asp Asn Phe Phe
1025 1030 1035
Glu Leu Gly Gly Asp Ser Ile Ile Ser Ile Gln Val Val Ser Arg
1040 1045 1050
Ala Arg Gln Ala Gly Ile Arg Leu Ser Pro Arg Asp Leu Phe Gln
1055 1060 1065
Tyr Gln Ser Ile Arg Ser Leu Ala Leu Val Ala Arg Phe Glu Gln
1070 1075 1080
Val Ser Leu Ile Asp Gln Gly Pro Val Ser Gly Glu Val Met Leu
1085 1090 1095
Thr Pro Val Gln His Ser Phe Phe Asp Gln Pro Ile Pro Ala Arg
1100 1105 1110
His His Trp Asn Gln Ser Leu Leu Leu Val Pro Gly Glu Val Leu
1115 1120 1125
Glu Pro Ala Arg Leu Glu Ala Thr Leu Ala Arg Leu Ile Glu His
1130 1135 1140
His Asp Ala Leu Arg Leu Arg Phe Val Gln Gln Ala Asp Gly Trp
1145 1150 1155
Gln Gln Ser His Ala Ala Tyr Val Ser Glu Pro Leu Leu Trp Gln
1160 1165 1170
Cys Gln Ala Ser Thr Asp Ala Glu Leu Ala Ala Leu Cys Asp Glu
1175 1180 1185
Ala Gln Arg Ser Leu Asp Leu Ala Gln Gly Pro Leu Leu Arg Ala
1190 1195 1200
Ala Leu Val Asn Leu Ala Asp Gly Ser Gln Arg Val Leu Leu Val
1205 1210 1215
Ile His His Leu Val Val Asp Gly Val Ser Trp Arg Ile Leu Leu
1220 1225 1230
Glu Asp Leu Gln Gln Ala Tyr Arg Asp Gln Ala Leu Pro Ala Lys
1235 1240 1245
Thr Ser Ala Tyr Gln Arg Trp Ala Gln Gln Leu His Arg His Ala
1250 1255 1260
Gln Ser Leu Asp Gln Gln Leu Pro Tyr Trp Gln Ala Gln Ser Ile
1265 1270 1275
Asp Ala Glu Leu Pro Cys Asp His Pro Glu Gly Gly Leu Gln Asn
1280 1285 1290
Arg Leu Gly Ala Lys Leu Glu Thr Arg Leu Asp Val Glu His Thr
1295 1300 1305
Arg Arg Leu Leu Gln Asp Ala Pro Ala Ala Tyr Arg Thr Gln Val
1310 1315 1320
Asn Asp Leu Leu Leu Thr Ala Leu Ala Arg Val Ile Ser Arg Trp
1325 1330 1335
Ser Glu Gln Pro Ala Ala Leu Ile Gln Leu Glu Gly His Gly Arg
1340 1345 1350
Glu Asp Leu Phe Asp Asp Ile Asp Leu Ser Arg Thr Val Gly Trp
1355 1360 1365
Phe Thr Ser Leu Tyr Pro Val Arg Leu His Ala Glu Gly Glu Leu
1370 1375 1380
Ser Ala Ala Ile Lys Ser Val Lys Glu Gln Leu Arg Ala Val Pro
1385 1390 1395
Asn Lys Gly Ile Gly Tyr Gly Leu Leu Arg Tyr Leu Gly Thr Pro
1400 1405 1410
Asp Thr Arg Glu Ala Leu Ser Thr Leu Ala Ala Pro Arg Ile Thr
1415 1420 1425
Phe Asn Tyr Leu Gly Gln Phe Asp Arg Gln Phe Asn Asp Ser Ala
1430 1435 1440
Leu Phe Val Pro Ala Arg Gln Gly Ser Gly Gln Ala Gln Asp Ala
1445 1450 1455
Glu Ala Pro Leu Ala Asn Trp Leu Thr Val Glu Gly Gln Val Tyr
1460 1465 1470
Gly Gly Glu Leu Ser Leu Gln Trp Gly Phe Ser Arg Glu Met Phe
1475 1480 1485
Glu Ala Ala Thr Val Gln Arg Leu Ala Asp Glu Tyr Ala Ala Glu
1490 1495 1500
Leu Asn Ala Leu Ile Glu His Cys Cys Ala Thr Pro Ala Gly Gln
1505 1510 1515
Val Ser Pro Ser Asp Phe Pro Leu Ala Arg Leu Thr Gln Gln Gln
1520 1525 1530
Leu Asp Ala Leu Pro Val Ala Gly Pro Ala Ile Ala Asp Leu Tyr
1535 1540 1545
Pro Leu Ser Pro Met Gln Gln Gly Met Leu Phe His Thr Leu Leu
1550 1555 1560
Glu Pro Glu Ala Gln Ala Tyr Ile Asn Gln Leu Arg Leu Asp Ile
1565 1570 1575
Glu Gly Leu Asp Val Leu Ala Phe Gly Arg Ala Trp Gln Ala Ala
1580 1585 1590
Leu Asp Arg His Asp Ile Leu Arg Ser Ser Phe His Trp Leu Gly
1595 1600 1605
Leu Asp Ser Ala His Gln Leu Ile Gln Arg Gln Val Asp Leu Gln
1610 1615 1620
Leu Gln Val Ile Glu Asp Pro Asn Ala Asp Phe Asp Thr Leu Ala
1625 1630 1635
His Ala Glu Arg Glu Arg Gly Phe Ala Leu Asn Ala Ala Pro Leu
1640 1645 1650
Phe Arg Leu Thr Leu Val Arg Gly Ala Gly Ala Ala Trp His Phe
1655 1660 1665
Ile Phe Thr Ser His His Ile Leu Met Asp Gly Trp Ser Asn Ala
1670 1675 1680
Gln Leu Leu Ala Glu Val Ile Ala His Tyr Ala Gly Gln Ala Val
1685 1690 1695
Pro Ala Pro Leu Gly Gln Phe Arg Asp Tyr Leu Ala Trp Leu Gln
1700 1705 1710
Gln Gln Ser Ser Gly Glu Ala Phe Trp Lys Thr Ala Leu Ala Ala
1715 1720 1725
Leu Pro Ala Pro Thr Leu Leu Ala Gln Ala Leu Arg Thr Pro Val
1730 1735 1740
Asp Gly Val Gly Met Ala Asp His His Val Ala Leu Glu Ser Asn
1745 1750 1755
Phe Thr Arg Arg Leu Gly Glu Phe Ala Arg Gln His Lys Val Thr
1760 1765 1770
Leu Asn Thr Leu Leu Gln Gly Ala Trp Ser Leu Leu Leu Gln Arg
1775 1780 1785
Tyr Thr Gly Gln Asp Cys Val Ala Phe Gly Ala Thr Val Ala Gly
1790 1795 1800
Arg Ser Ala Pro Leu Pro Gly Ile Glu Gln Gln Leu Gly Leu Phe
1805 1810 1815
Ile Asn Thr Leu Pro Ile Ile Ser Ala Ala Ser Pro Ala Gln Ser
1820 1825 1830
Ala Ala Thr Trp Leu Ser Glu Leu Gln Val Leu Asn Leu Ser Leu
1835 1840 1845
Arg Asp His Glu His Val Pro Leu Tyr Asp Ile Gln Gly Trp Ala
1850 1855 1860
Gly Gln Gln Gly Ala Leu Phe Asp Thr Leu Leu Val Phe Glu Asn
1865 1870 1875
Phe Pro Val Ala Glu Ala Leu Lys Gln Gly Ala Pro Ala Gly Leu
1880 1885 1890
Thr Phe Gly Arg Leu His Asn His Glu Arg Thr His Tyr Pro Leu
1895 1900 1905
Thr Leu Gly Ile Glu Leu Gly Ala Ser Leu Arg Leu Glu Phe Ser
1910 1915 1920
Tyr Asp Arg Ala Gln Phe Ser Glu Ala Gln Val Ala Gln Leu Ser
1925 1930 1935
Ala Asn Leu Gln His Leu Leu Ala Gln Leu Leu Ala Asp Ala His
1940 1945 1950
Met Pro Leu Gly Asn Leu Arg Leu Leu Asp Ala Pro Ala Gln Gln
1955 1960 1965
Gln Met Leu Ala Leu Ser Arg Ser Ala Ala Ala Pro Gln Ala Asn
1970 1975 1980
Glu Arg Val His Gln Arg Ile Ala Ala Gln Ala Glu Ala Thr Pro
1985 1990 1995
Asp Ala Leu Ala Val Gln Ala Gly Asp Ala Ser Val Ser Tyr Ala
2000 2005 2010
Gln Leu Asn Gln Arg Ala Asn Arg Leu Ala His Arg Leu Leu Ala
2015 2020 2025
Leu Gly Val Gly Pro Gly Gln Arg Val Gly Leu Ala Ser Arg Arg
2030 2035 2040
Gly Pro Gln Leu Ile Val Ser Leu Leu Ala Val Leu Lys Ser Gly
2045 2050 2055
Ala Ala Tyr Val Pro Leu Asp Pro Glu Tyr Pro Ala Glu Arg Leu
2060 2065 2070
Ala Tyr Met Leu Ala Asp Ser Arg Leu Asp Leu Leu Leu Ser Glu
2075 2080 2085
Thr Gly Leu Leu Ala Asp Leu Pro Leu Pro Arg Gly Leu Thr Arg
2090 2095 2100
Val Asp Phe Ser Ala Cys Gly Glu Glu Leu Thr Gly Tyr Pro Thr
2105 2110 2115
Thr Asn Pro Pro Asn His Ala Ala Ala Ala Asp Leu Ala Tyr Val
2120 2125 2130
Ile Tyr Thr Ser Gly Ser Thr Gly Gln Pro Lys Gly Val Ala Ile
2135 2140 2145
Asp His Ala Ala Leu Gly Gln Phe Cys Asp Ser Ala Thr Leu Tyr
2150 2155 2160
Ser Arg Leu Ser Ala Glu Asp Arg Val Leu Gln Phe Ala Thr Phe
2165 2170 2175
Ser Phe Asp Gly Phe Val Glu Gln Cys Phe Pro Pro Leu Cys Ala
2180 2185 2190
Gly Ala Ala Leu Ile Met Arg Gly Asp Glu Leu Trp Asp Ala Gly
2195 2200 2205
Gln Leu Ala Arg Glu Ile Val Glu Gln Gly Val Thr Leu Ala Asp
2210 2215 2220
Leu Pro Ala Ala Tyr Trp Tyr Leu Leu Ala Gln Glu Cys Ala Glu
2225 2230 2235
His Arg Arg Ser Leu Gly Lys Leu Arg Gln Val His Val Gly Gly
2240 2245 2250
Glu Ala Met Ser Val Glu Gly Val Arg Ala Trp Tyr Ala Ala Gly
2255 2260 2265
Leu Gly Asn Val Arg Leu Val Asn Thr Tyr Gly Pro Thr Glu Ala
2270 2275 2280
Thr Val Val Ser Ser Val His Glu Cys Gln Leu Ala Asp Ala Asn
2285 2290 2295
Asp Ala Tyr Gly Val Pro Ile Gly Gln Ala Ile Ala Gly Arg Ala
2300 2305 2310
Leu Tyr Val Leu Asp Asn Gly Phe Glu Leu Leu Ala Thr Asp Gly
2315 2320 2325
Val Gly Glu Leu Cys Ile Gly Ala Glu Val Gly Leu Ala Gln Arg
2330 2335 2340
Tyr Phe Asp Arg Pro Ala Leu Thr Ala Glu Arg Phe Leu Pro Asp
2345 2350 2355
Pro Ile Ser Ala Thr Pro Gly Ala Arg Leu Tyr Arg Ser Gly Asp
2360 2365 2370
Leu Ala Arg Tyr Asn Pro Ala Gly Ala Leu Glu Tyr Val Gly Arg
2375 2380 2385
Ile Asp His Gln Val Lys Ile Arg Gly Leu Arg Ile Glu Met Gly
2390 2395 2400
Glu Ile Glu Ala Ser Leu Gln Ala Leu Ser Asn Val Arg Glu Ala
2405 2410 2415
Ala Val Leu Ala Gln Pro Ser Ala Thr Gly Val Gln Leu Val Ala
2420 2425 2430
Tyr Val Val Pro Ala Glu Gly Gln Ala Leu Ala Thr Gln Ala Leu
2435 2440 2445
Ala Ala Arg Leu Arg Gln Thr Leu Pro Asp Tyr Met Val Pro Gly
2450 2455 2460
His Trp Val Ala Leu Asp Ala Leu Pro Leu Asn His Asn Gly Lys
2465 2470 2475
Leu Asp Arg Arg Ala Leu Pro Thr Pro Asp Leu Asn Gln Ala Ser
2480 2485 2490
Thr Thr Tyr Val Ala Pro Gln Ser Pro Leu Gln Ile Gln Leu Ala
2495 2500 2505
Ala Ile Trp Gln Ala Val Leu Gln Val Glu Gln Val Gly Leu Glu
2510 2515 2520
Asp His Phe Phe Glu Arg Gly Gly His Ser Leu Leu Ala Thr Gln
2525 2530 2535
Val Ile Ser Arg Val Arg His Asp Leu Lys Leu Glu Val Pro Leu
2540 2545 2550
Arg Ala Leu Phe Glu Gln Pro Thr Leu Ala Ala Phe Ala Ala Ala
2555 2560 2565
Cys Ala Gly Val Gln Val Asp Thr Ala Pro Val Ile Gln Ala Val
2570 2575 2580
Gly Arg Asp Gln Pro Leu Ala Leu Ser Phe Ala Gln Glu Arg Gln
2585 2590 2595
Trp Phe Leu Trp Gln Leu Asp Pro Thr Ser Ala Ala Tyr His Val
2600 2605 2610
Pro Thr Ala Leu His Leu Arg Gly Glu Leu Asp Ile Ala Ala Leu
2615 2620 2625
Glu Arg Ala Val Glu Ala Leu Val Gln Arg His Glu Pro Leu Arg
2630 2635 2640
Thr Thr Phe Val Glu Ser Gly Glu His Thr Val Gln Val Ile His
2645 2650 2655
Pro Ser Leu Ala Val Pro Val Glu Gln Gln Lys Val Asp Ala Gly
2660 2665 2670
Thr Ile Glu Gln Ala Val Ile Glu Glu Ile Gln Arg Pro Phe Asp
2675 2680 2685
Leu Arg Asn Gly Pro Leu Met Arg Val Lys Leu Leu Ile Val Ala
2690 2695 2700
Pro Asp His His Val Leu Val Ile Thr Gln His His Ile Ile Ser
2705 2710 2715
Asp Gly Trp Ser Met Gln Val Met Ile Asp Glu Trp Val Ala Leu
2720 2725 2730
Tyr Gln Gly Asp Val Gly Leu Pro Ala Leu Pro Ile Gln Tyr Ala
2735 2740 2745
Asp Tyr Ala Gln Trp Gln Arg Asp Trp Met Ala Ala Gly Glu Gln
2750 2755 2760
Gln Arg Gln Leu Asp Tyr Trp Cys Ala Arg Leu Gly His Glu His
2765 2770 2775
Ser Leu Leu Asp Leu Pro Leu Asp His Pro Arg Pro Ala Val Gln
2780 2785 2790
Ser His Arg Gly Ala Arg Arg Gln Ile His Leu Glu Arg Val Leu
2795 2800 2805
Leu Thr Glu Leu Lys Ala Leu Ala Gln Arg Gln Asp Val Thr Leu
2810 2815 2820
Phe Met Leu Leu Leu Ala Ser Phe Gln Thr Leu Leu His Arg Tyr
2825 2830 2835
Ser Gly Gln Ala Gln Val Arg Val Gly Val Pro Val Ala Asn Arg
2840 2845 2850
Asn Arg Phe Glu Thr Glu Arg Leu Leu Gly Phe Phe Val Asn Thr
2855 2860 2865
Gln Val Leu Gln Ala Asp Val His Gly Gln Met Pro Phe Asp Gln
2870 2875 2880
Leu Leu Ala Gln Val Lys Leu Arg Ala Leu Glu Ala Gln Ala His
2885 2890 2895
Gln Asp Leu Pro Phe Glu Gln Leu Val Gln Val Leu Gln Pro Glu
2900 2905 2910
Arg Ser Leu Ser His Asn Pro Leu Phe Gln Val Met Phe Asn His
2915 2920 2925
Gln Asp Ser Leu Arg Ser Ala Pro Val Gln Leu Pro Gly Leu Ala
2930 2935 2940
Leu Gln Pro Val Asp Trp Ala Gly His Ser Thr Gln Phe Asp Leu
2945 2950 2955
Asn Leu Glu Thr Glu Glu Ser Val Asp Gly Leu Trp Ala Ser Leu
2960 2965 2970
Thr Tyr Ala Thr Asp Leu Phe Asp Ala Ala Thr Ala Glu Arg Leu
2975 2980 2985
Ala Glu His Trp Gln Asn Leu Leu Arg Ala Val Leu Gln Asp Ala
2990 2995 3000
Ser Val Ala Leu Asp Asp Leu Ala Met Leu Ser Pro Ser Gln Ser
3005 3010 3015
Gln Gln Met Val His Asp Trp Asn Arg Ser Asp Thr Asp Tyr Pro
3020 3025 3030
Arg Glu Arg Cys Val His Gln Leu Phe Glu Ala Gln Ala Ala Ala
3035 3040 3045
Gln Pro Asp Ala Ile Ala Leu His Phe Asn Asp Glu Arg Leu Ser
3050 3055 3060
Tyr Gly Glu Leu Asn Arg Arg Ala Asn Arg Leu Ala His Arg Leu
3065 3070 3075
Ile Asp Met Gly Val Gly Pro Asp Val Leu Val Ala Val His Val
3080 3085 3090
Glu Arg Ser Leu Asp Met Val Val Gly Leu Leu Ala Thr Leu Lys
3095 3100 3105
Ala Gly Gly Ala Tyr Val Pro Leu Asp Pro Gln Phe Pro Ala Glu
3110 3115 3120
Arg Leu Ala Tyr Met Leu Glu Asp Ser Arg Ala Arg Val Leu Leu
3125 3130 3135
Thr Gln Pro His Leu Leu Gly His Leu Ala Gln Pro His Gly Val
3140 3145 3150
Gln Val Leu Met Val Glu Glu Ala Gly Thr Ala Gln His Asn Pro
3155 3160 3165
Gln Val Ala Val Thr Pro Glu His Leu Ala Tyr Val Ile Tyr Thr
3170 3175 3180
Ser Gly Ser Thr Gly Lys Pro Lys Gly Val Met Val Arg His Lys
3185 3190 3195
Ala Leu Cys Ser Phe Thr Ser Ala Met Ala Gly Thr Leu Ser Ile
3200 3205 3210
Gly Gln Asp Ala Arg Leu Leu Ser Leu Thr Thr Phe Ser Phe Asp
3215 3220 3225
Ile Phe Ala Leu Glu Leu Tyr Val Pro Leu Ser Val Gly Gly Thr
3230 3235 3240
Val Leu Leu Ser Ala Gln Ala Met Ala Leu Asp Pro Glu Ala Ile
3245 3250 3255
Leu Asp Leu Ala Gln Arg Gln Ala Ala Asn Val Leu Gln Ala Thr
3260 3265 3270
Pro Ser Thr Trp Arg Met Leu Leu Asp Ser Pro Arg Ala His Ala
3275 3280 3285
Leu Arg Gly Ile Ala Cys Leu Cys Gly Gly Glu Ala Leu Pro Val
3290 3295 3300
Asp Leu Ala Gln Arg Met Leu Asp Leu Gln Gly Pro Leu Trp Asn
3305 3310 3315
Leu Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Ala Ala His Arg
3320 3325 3330
Leu His Gln Ala Leu Pro Phe Val Gly Arg Pro Ile Ala Asn Thr
3335 3340 3345
Arg Leu Phe Ile Leu Asn Ala Gly Leu Thr Pro Cys Pro Gln Gly
3350 3355 3360
Val Ser Gly Glu Leu Leu Ile Gly Gly Val Gly Leu Ala Arg Gly
3365 3370 3375
Tyr His Gly Gln Pro Ala Leu Thr Ala Glu Arg Phe Val Pro Asn
3380 3385 3390
Pro Phe Gly Ala Ser Gly Glu Arg Leu Tyr Arg Thr Gly Asp Leu
3395 3400 3405
Ala Arg Tyr Gln Ala Asp Gly Val Val Glu Tyr Ile Gly Arg Val
3410 3415 3420
Asp His Gln Val Lys Val Arg Gly Phe Arg Ile Glu Leu Gly Glu
3425 3430 3435
Ile Glu Ala Cys Leu Arg Glu Phe Asp Gly Val Arg Glu Ala Val
3440 3445 3450
Val Leu Ala Asp Asn Asp Arg Leu Ile Ala Tyr Leu Val Ser Thr
3455 3460 3465
Ala Pro Gln Ala Pro Gln Val Tyr Lys Ala Ala Leu Arg Glu Arg
3470 3475 3480
Leu Pro Asp Tyr Met Val Pro Ala Gln Trp Leu Phe Leu Asp Ser
3485 3490 3495
Leu Pro Leu Thr Pro Asn Gly Lys Leu Asp Arg Lys Ala Leu Pro
3500 3505 3510
Lys Pro Asp Ala Ser Leu Ser Leu Lys Gly His Val Ala Pro Val
3515 3520 3525
Thr Pro Arg Glu Gln Gln Val Ala Ala Ile Trp Ala Glu Val Leu
3530 3535 3540
Glu Leu Pro Arg Val Gly Leu Asp Asp His Phe Phe Glu Leu Gly
3545 3550 3555
Gly His Ser Leu Leu Ala Thr Arg Val Val Ser Arg Val Arg Gln
3560 3565 3570
Ala Leu Ala Leu Glu Val Pro Leu Lys Ala Leu Phe Glu Gln Pro
3575 3580 3585
Leu Leu Gly Asp Phe Val Arg Ala Leu Gly Glu Glu Gly Val Thr
3590 3595 3600
Ala Pro Ala Leu Ile Lys Ala Asp Arg Thr Gln Pro Leu Pro Leu
3605 3610 3615
Ser Tyr Ala Gln Glu Arg Gln Trp Phe Leu Trp Gln Leu Asp Pro
3620 3625 3630
Ala Gly Ala Ala Tyr His Ile Pro Ser Ala Leu Arg Leu Gln Gly
3635 3640 3645
Pro Leu Asp Leu Thr Ala Leu Gln Glu Ser Phe Asp Ser Leu Leu
3650 3655 3660
Ala Arg His Glu Ser Leu Arg Thr Tyr Phe Arg Gln Asp Ala Thr
3665 3670 3675
Gly Ala Val Gln Val Ile Asp Ala Gln Ser Arg Val Asp Ile Glu
3680 3685 3690
Gln Val Asp Ser Asp Tyr Ala Gly Leu Lys Ala Arg Val Ala Gln
3695 3700 3705
Val Val Ala Gln Pro Phe Asp Leu Leu Arg Gly Pro Leu Leu Arg
3710 3715 3720
Val Thr Leu Leu Arg Leu Ala Glu Asp Asp His Val Leu Val Leu
3725 3730 3735
Val Gln His His Ile Val Ser Asp Gly Trp Ser Met Gln Leu Met
3740 3745 3750
Val Glu Glu Leu Val Gln Ala Tyr Ala Ala Asn Ser Gln Gly Gln
3755 3760 3765
Asp Val Gln Leu Pro Thr Leu Pro Ile Gln Tyr Ala Asp Tyr Ala
3770 3775 3780
Val Trp Gln Arg Asp Trp Met Glu Ala Gly Glu Gln Ala Arg Gln
3785 3790 3795
Leu Ala Tyr Trp Arg Glu Gln Leu Ser Gly Glu Gln Pro Val Leu
3800 3805 3810
Glu Leu Pro Phe Asp His Pro Arg Pro Ala Gln Pro Ser His Arg
3815 3820 3825
Gly Ala Arg Leu Gly Ile Glu Leu His Pro Glu Leu Leu Gly Ser
3830 3835 3840
Leu Arg Ala Leu Ala Gln His Ala Gly Val Thr Leu Pro Met Leu
3845 3850 3855
Leu Leu Ala Ser Tyr Gln Ala Leu Leu His Arg Tyr Ser Gly Gln
3860 3865 3870
Glu Asp Val Arg Val Gly Val Pro Ile Ala Asn Arg Asn Arg Leu
3875 3880 3885
Glu Thr Glu Gly Leu Ile Gly Phe Phe Val Asn Thr Gln Val Leu
3890 3895 3900
Lys Ala Asp Ile His Gly Gln Met Ser Thr Glu Gln Leu Leu His
3905 3910 3915
Gln Val Arg Gln Arg Ser Leu Glu Ala Gln Ala His Gln Asp Leu
3920 3925 3930
Pro Phe Glu Gln Leu Val Gln Ala Leu Gln Pro Glu Arg Ser Leu
3935 3940 3945
Ser Leu Ser Pro Leu Phe Gln Val Leu Phe Asn His Arg Val Ser
3950 3955 3960
Ala Ala Asp Ser His Leu His Arg Leu Ala Asp Leu His Val Glu
3965 3970 3975
Val Leu Asp Leu Asp Glu Gly Val Ala Gln Phe Asp Leu Ala Leu
3980 3985 3990
Asp Val Glu Glu Ser Pro Thr Ala Leu Arg Ala Ser Leu Ser Tyr
3995 4000 4005
Ala Thr Asp Leu Phe Ala Val Ala Thr Ile Glu Arg Met Ala Gly
4010 4015 4020
His Trp Gln Asn Leu Leu Arg Ala Met Val Val Asp Pro Gln Gln
4025 4030 4035
Pro Ile Ser Gln Leu Ser Leu Leu Gly Glu Asp Glu Gln Gln Gln
4040 4045 4050
Ile Leu Glu Leu Trp Asn Gln Thr Asp Ala Gly Phe Ser Ala Glu
4055 4060 4065
Arg Leu Val His Glu Leu Val Gly Asp Arg Ala Arg Glu Thr Pro
4070 4075 4080
Asp Ala Val Ala Val Lys Phe Asp Ala Gln Thr Leu Ser Tyr Gly
4085 4090 4095
Glu Leu Asp Arg Gln Ala Asn Arg Leu Ala His Ala Leu Ile Ala
4100 4105 4110
Arg Gly Val Gly Arg Glu Val Arg Val Ala Ile Ala Met Pro Arg
4115 4120 4125
Ser Ala Glu Ser Met Val Ala Phe Leu Ala Val Met Lys Ala Gly
4130 4135 4140
Gly Val Tyr Val Pro Leu Asp Ile Glu Tyr Pro Arg Asp Arg Leu
4145 4150 4155
Leu Tyr Met Met Gln Asp Ser Arg Ala Gln Leu Leu Leu Thr His
4160 4165 4170
Ser Arg Ala Leu Gln Gln Leu Pro Val Pro Glu Gly Leu Glu Thr
4175 4180 4185
Leu Ala Ile Asp Arg Thr Glu Glu Trp Ala Gly Tyr Ser Asp Thr
4190 4195 4200
Ala Pro Asp Val Ala Leu Asp Gly Asp Asn Leu Ala Tyr Val Ile
4205 4210 4215
Tyr Thr Ser Gly Ser Thr Gly Leu Pro Lys Gly Val Ala Val Ser
4220 4225 4230
His Gly Pro Leu Val Ala His Ile Ile Ala Thr Gly Glu Arg Tyr
4235 4240 4245
Glu Thr Ser Pro Ala Asp Cys Glu Leu His Phe Met Ser Phe Ala
4250 4255 4260
Phe Asp Gly Ser His Glu Gly Trp Met His Pro Leu Ile Asn Gly
4265 4270 4275
Ala Ser Val Leu Ile Arg Asp Asp Ser Leu Trp Leu Pro Glu Tyr
4280 4285 4290
Thr Tyr Glu Gln Met His Arg His Asn Val Thr Met Ala Val Phe
4295 4300 4305
Pro Pro Val Tyr Leu Gln Gln Leu Ala Glu His Ala Glu Arg Asp
4310 4315 4320
Gly Asn Pro Pro Ala Val Arg Val Tyr Cys Phe Gly Gly Asp Ala
4325 4330 4335
Val Ala Gln Ala Ser Tyr Asp Leu Ala Trp Arg Ala Leu Lys Pro
4340 4345 4350
Lys Tyr Leu Phe Asn Gly Tyr Gly Pro Thr Glu Thr Val Val Thr
4355 4360 4365
Pro Leu Leu Trp Lys Ala Arg Lys Gly Asp Pro Cys Gly Ala Val
4370 4375 4380
Tyr Ala Pro Ile Gly Thr Leu Leu Gly Asn Arg Ser Gly Tyr Val
4385 4390 4395
Leu Asp Ala Gln Leu Asn Leu Gln Pro Ile Gly Val Ala Gly Glu
4400 4405 4410
Leu Tyr Leu Gly Gly Glu Gly Val Ala Arg Gly Tyr Leu Glu Arg
4415 4420 4425
Pro Ala Leu Thr Ala Glu Arg Phe Val Pro Asp Pro Phe Gly Lys
4430 4435 4440
Pro Gly Ser Arg Val Tyr Arg Ser Gly Asp Leu Thr Arg Gly Arg
4445 4450 4455
Pro Asp Gly Val Val Asp Tyr Leu Gly Arg Val Asp His Gln Val
4460 4465 4470
Lys Ile Arg Gly Phe Arg Ile Glu Leu Gly Glu Ile Glu Ala Arg
4475 4480 4485
Leu Arg Glu Gln Ala Ser Val Gly Glu Thr Val Val Val Ala Gln
4490 4495 4500
Glu Gly Pro Thr Gly Lys Gln Leu Val Ala Tyr Val Val Pro Ala
4505 4510 4515
Asp Ala Ser Leu Ala Asp Pro Val Glu Phe Arg Asp Ala Leu Arg
4520 4525 4530
Arg Ala Leu Lys Ala Asp Leu Pro Asp Tyr Met Val Pro Ser His
4535 4540 4545
Phe Val Phe Leu Ala Gln Met Pro Leu Thr Pro Asn Gly Lys Leu
4550 4555 4560
Asp Arg Lys Gly Leu Pro Leu Pro Asp Ala Ser Gln Met Gln Gln
4565 4570 4575
Gln Tyr Leu Ala Pro Gln Thr Glu Leu Glu Gln Gln Ile Ala Thr
4580 4585 4590
Ile Trp Ala Asp Ile Leu His Leu Pro Gln Val Gly Leu Asn Asp
4595 4600 4605
Asn Phe Phe Asp Val Gly Gly His Ser Leu Leu Ala Ile Gln Ile
4610 4615 4620
Thr Ser Arg Val Gln Ala Glu Leu Gly Leu Asp Val Pro Leu Met
4625 4630 4635
Glu Leu Phe Gln Thr Glu Ser Leu Arg Ala Tyr Val Gln Ala Ala
4640 4645 4650
Ala Thr Phe Arg Ala Gly Ser Val Glu Asp Phe Asp Asp Leu Arg
4655 4660 4665
Asp Phe Leu Ser Glu Leu Glu Ala Ile
4670 4675
<210> 52
<211> 14034
<212> DNA
<213> Pseudomonas fluorescens
<400> 52
atgaatgctg aagactcctt gaaacttgct cgccggttta tcgggctgcc cctggaaaaa 60
cgccaattgt tcctgcaagc cttgcagaaa gaaggcgtgg atttttcaag gtttccgatt 120
ccggcagggg tggaggtgga ggaccgccag gcgctgtcct acgcacagca gcgcatgtgg 180
tttctatggc agttggaccc ggccagtggc gcctacaatt tgcccggcgc ggtgcgttta 240
agtggcgtgt tgagcctgcc agcgctggag caagcgttcg ccagcctggt ggcgcgtcac 300
gaaaccctgc gcacagtgtt ccagcgtcag gccgatgagc ggctggcgca ggtggcggtg 360
gagccgtcgg tggccgtcga gcacctggac ttcaccgcct tggcctttga tgcgcgggag 420
caggccgtca acgccgccgc cacccgtcaa tcgctgttgc cgttcgacct ggaacatggg 480
ccactgctgc gcgtgcaact gctcaagctt gccgagcagg aacacgtgct gctgctgacc 540
ctgcaccaca tcgtctccga cggttggtcg atgaatgtgc tgatcgacga attcatccgt 600
tgctatgacg cccacgagcg cgacgaagcg ccccaactgc cggcgctgcc catccaatac 660
agcgactacg ccctgtggca gcgccgctgg ctggaagcgg gcgagcaggc gcgccaattg 720
gaatattggc aggcccgcct gggtgatgag catccggtgc tggaactgcc cactgatcac 780
ccacgccccg cgatgcccag ctaccagggc acacggcata acttcgcgat tgagccggca 840
ctggccgcgc aactgcgcag ttgcgcgcaa aaacacaacg ttaccctgtt catgctgctg 900
ctcggtgcct tcaatgtgct gttgcaccgc tataccggcc agggcgacat tcgcgtcggt 960
gtgccgattg ccaatcgcaa tcgcaccgaa gtcgagggcc tgatcggttt cttcgtcaac 1020
acccaggtgt tgcgcaccga actgagcggg caaacccggg ttgccgagtt gctgcaaggt 1080
atcaaggagc atgccctggg cgcccaggct catcaggaat tgccctttga acgtctggtg 1140
gaagcgctga aaatcgagcg cagcctgagc cacacgccgc tgtttcaggt gatgtataac 1200
catcagccgg tagtcgccga catcgcctcg gtcagtaccg catcgggtct ggaattggcc 1260
ctggtggaat ggcaaggccg taccacccag ttcgacctga ccctggacac ctatgaaaag 1320
tccggcaccc tgcatgccgc gctgacctac gccaatgact tgttcgatac gcccaccatc 1380
gagcgcatgg cccggcactg gacccgcctg ctgcaagcta tggtgctcga tggcgaacag 1440
cgcattggcg aattgcccat gcttgacgcg gctgaacagc aacggttgct ccacacctgg 1500
aaccacaccg ccgaggcgta cccgaccgag cgcggcattc atcacctgat cgaagaccag 1560
gcacggcgca gccccgatgc tccggcactg gtgttcggta ccaccacctt gacctacgcc 1620
caactggatg cgcgcgccaa ccaattggcc catgccctgg gcgagcaggg cgtagggccc 1680
gacgtattgg tgggtatctg catcgagcgc tccatcgaaa tggtggttgg cctgctggcg 1740
attctcaagg ccggtggcgc ctacgtgccc ctcgaccctg agtaccccca ggaacgcctg 1800
gcctacatga tcgaagacag tggcattcag ttgttactca gccagcagag cctgctggcg 1860
tcgctgcccg tcgccggtat ccaggtgatt gccctggacc agccggcgct atggctcgac 1920
ggatacagca gcgaatcgcc gaacgtggcc ctgcatgccc tgaacctggc ctatgtgatc 1980
tacacctcgg gctccaccgg caagcccaaa ggcgctggca acagccatcg cgcgttggtc 2040
aaccgcttga gctggatgca acaggcgtat ggcctgggtg ccaatgacgc ggtcttgcag 2100
aaaaccccat tcagctttga tgtgtcggtg tgggagttct tctggccgct gatgagcggc 2160
gcacgcctgg tggtcgcggc gcctggcgag caccgtgaac cggcgcgcct gattgacacc 2220
attggccggc acgccatcac caccttgcac ttcgtgccgt cgatgttgca ggcgtttatc 2280
catgagccgg gcgtacaggc gtgcgcgagc ctcacgcgta tcgtctgcag cggcgaagcc 2340
ttgcccctgg atgcgcaaca gcaagtgttc gccaagttgc ccgctgcggc gctgtacaac 2400
ctctatggcc cgaccgaggc ggccatcgac gtcacgcact ggacctgcat tgacgaaggc 2460
gtcgacagcg tgcccatcgg ccgccccatc gccaacctcg gcacctacgt gctggacgca 2520
caactcaacc cggtgccggc tggcgtcagc ggcgaactct atctcggcgg cgttggcctg 2580
gcgcgcagtt accaccgacg cccggcgctg accgccgaac gttttgtgcc cagcccgttc 2640
gtgacgggcg agcgcctgta tcgcaccggt gaccgcgtgc gccaacgtgc cgatggggtg 2700
atcgaatacc tcggccgtct cgatcatcag gtcaagttgc gcggcttgcg tatcgagctg 2760
ggcgaaatcg aagcacgcct gatgcagcat ccacacgtgc gcgaagccgt ggtactggta 2820
catggcggca agcagttggt cgcctatctg gtgcacccag gcgaggcgcc aacggacctc 2880
aaggcctggt tgctcagcag cttgccggaa tacatggtgc cgacgcattt catcgcgctg 2940
cccaagctgc cggtgaccgc caatggcaag ctcgatcgca aggcgttgcc agtgccagac 3000
gcggcactgc aacaggcgtt tgtcgccccc caaggcgacc tgcaaacagc cctggctgcc 3060
atctggagcg acgtactggg cgttgaggag gtcggccagg acgataactt cttcgagctg 3120
ggcggcgatt cgatcatctc catccaagta gtcagccgcg cccgtcaggc cggcattcgc 3180
ctgagcccgc gtgacctgtt ccagtaccag agcatccgca gcctggccct ggtggcgcgc 3240
tttgagcagg tcagcctgat cgaccagggc ccggtcagcg gcgaggtcat gctgacgccc 3300
gtgcaacaca gctttttcga ccagccgatc ccggcgcggc atcactggaa tcaatccttg 3360
ttgctggtgc ccggcgaggt gcttgagcct gcacggttgg aggcaacgct ggcgcggttg 3420
atcgagcatc acgacgcctt gcgcctgcgt tttgtgcagc aggctgacgg ctggcagcag 3480
agccatgccg cctacgtcag cgaaccgctg ttgtggcaat gccaggccag caccgacgcc 3540
gaactggcgg cgctgtgtga tgaagcccag cgcagccttg accttgccca aggcccgctg 3600
ctgcgcgccg cgttggtgaa tttggccgat ggcagccaac gtgtgctgct ggtgatccac 3660
cacctggtgg tggatggcgt gtcctggcgc atcctgcttg aagacctgca acaggcctac 3720
cgcgaccagg cgctgccggc gaaaaccagt gcctaccagc gctgggcgca acagttgcac 3780
cgccacgcgc agtccctcga ccagcaactg ccgtactggc aagcccaatc catcgacgcc 3840
gagctgccgt gtgatcaccc cgaaggcggc ctgcaaaacc gcctgggtgc caagctggaa 3900
acacgcctcg acgtcgagca cacccgccga ctgctgcaag acgcgccagc ggcctatcgc 3960
acccaggtca acgacctgct gttgaccgcc ctggcgcggg tgatcagccg ttggagcgag 4020
caacctgctg cgctcattca attggaaggt catggtcggg aagacctgtt tgacgacatc 4080
gacctgagcc gcaccgtcgg ctggttcacc agcctgtacc cggtgcgcct gcacgccgaa 4140
ggggaactgt cggcggcgat caagtcggtg aaggagcaac tgcgcgccgt gccgaacaaa 4200
ggcattggct acggcctgtt gcgttacctc ggcacgcctg acacccgcga agcgttgtcg 4260
accctggccg cgccgcgcat cacgttcaac tacctgggcc agttcgaccg ccagttcaat 4320
gactcggcac tgttcgtgcc ggcccgccag ggcagtgggc aggctcagga tgcagaggca 4380
ccgctggcca actggttgac ggtggaaggg caggtgtatg gcggtgagct gtcgcttcaa 4440
tggggcttca gtcgagagat gttcgaggcg gcaactgtgc agcgtctggc ggatgagtac 4500
gcagccgaac tcaatgcgct gatcgagcat tgctgtgcca cgccggcagg ccaggtgagc 4560
ccgtcggatt tcccgctggc acgcctcacc cagcagcaac tggatgcgtt gcccgtggcc 4620
gggccggcga ttgccgacct ttatccgctg tcgccgatgc agcaaggcat gctgttccac 4680
accctgttgg aacccgaggc ccaggcctac atcaaccagt tgcgcctcga catcgagggc 4740
ctcgatgtgc tcgctttcgg gcgtgcctgg caggctgcac tggatcgtca tgacatcctg 4800
cgcagcagct tccattggct gggcctggac agtgctcatc agctgatcca gcgccaggtc 4860
gacctgcaac tgcaagtgat cgaagaccca aacgccgact tcgacaccct ggcccacgcc 4920
gaacgcgaac gtggttttgc cctgaatgcc gcgccgctgt ttcgcctgac gctggtgcgt 4980
ggtgccggtg cggcctggca ctttatcttt accagccacc acatcctcat ggacggctgg 5040
agtaacgcgc agttgctcgc cgaggtcatc gcgcattatg cggggcaggc agtaccggcg 5100
ccgctcgggc agttccgcga ttacctcgcc tggctgcaac aacagtcctc gggcgaggcg 5160
ttctggaaaa ccgccctggc ggcattgccg gcgccgactc tgctggcgca agcgctgcgc 5220
acgccggtcg acggggtggg catggctgac catcacgtgg cactggagag caactttacc 5280
cgccgcctcg gcgagttcgc acgccagcac aaagtcaccc tcaataccct gttgcaaggg 5340
gcttggagcc tgttgctgca acgctacacc ggccaggact gcgtcgcctt cggtgccacg 5400
gtggccgggc gttccgcgcc gctgccgggg atcgagcagc aactgggcct gttcatcaac 5460
accttgccga tcatcagcgc agcctcgcca gcccagtcgg ctgcgacttg gctcagcgaa 5520
ctgcaagtgc tcaacctcag cctgcgcgac catgaacatg tgccgctcta cgacatccag 5580
ggctgggccg gccagcaagg cgcgctgttc gacaccttgc tggtgttcga gaacttcccg 5640
gtcgccgagg cgctcaagca aggcgcgccg gccggcctga ccttcggtcg cctgcacaac 5700
catgagcgca cgcactatcc attaaccctg ggcatcgaac tgggcgccag cctgcgcctg 5760
gagttcagct atgaccgtgc ccagttcagc gaggcgcaag tggcgcagtt gagcgccaac 5820
ctgcaacacc tgctggcgca attgctcgca gacgctcaca tgccgctggg caacctgcgc 5880
cttctcgacg cccctgcgca acagcagatg ctcgcgctga gccgctcagc cgcagcgcca 5940
caggccaacg agcgcgtgca tcagcgtata gccgcccagg ccgaggcgac gccggacgcc 6000
ctggctgtgc aggccggtga cgccagcgtg agctacgccc agttgaacca gcgcgccaac 6060
cgcctggccc atcgcctgtt ggcgctgggt gtcggccccg gccaacgggt gggcctggct 6120
tcgcggcgtg gcccgcagtt gatcgtcagc ctgctggcag tgctcaaaag cggggcggcc 6180
tacgtaccgc tggaccctga atacccggcg gagcgtttgg cctacatgct cgccgacagc 6240
cgcctggacc tgctgctcag cgaaaccggc ttgctcgccg acttgccttt gccccgcggc 6300
ctgacccgcg tggatttcag cgcctgtggc gaggagctca ccggctaccc gacgaccaat 6360
ccgcctaatc acgcagcggc ggctgacctg gcctacgtga tctacacctc tggctccacc 6420
ggccagccca agggtgtggc catcgaccat gccgccctcg gccagttctg cgacagcgcc 6480
acgctgtaca gccgactgag cgccgaggac cgcgtgttgc agtttgcgac cttcagtttc 6540
gatggttttg tcgaacagtg cttcccgccc ctgtgtgcgg gtgcggcgtt gatcatgcgt 6600
ggcgatgaac tctgggacgc cgggcaactg gcgcgagaaa tcgttgagca gggcgtgact 6660
ctggccgatt tgcccgccgc ctactggtac ctgttggcgc aggaatgcgc cgagcaccgt 6720
cgctccctgg gcaagctgcg ccaggtgcat gtgggtggtg aagccatgtc agtggaaggc 6780
gtgcgtgcgt ggtacgccgc gggcttgggc aatgtgcgcc tggtcaacac ctacgggccc 6840
accgaagcca cggttgtgtc cagtgtgcat gagtgccaat tggccgatgc caacgacgcc 6900
tacggcgtgc caatcgggca ggcgattgcc gggcgcgcgc tgtatgtact cgacaacggt 6960
ttcgaactgt tggccaccga tggcgtgggc gagctgtgca ttggcgccga ggttggcttg 7020
gcgcaacgct acttcgaccg cccggcgctg accgccgagc gcttcttgcc ggacccgatt 7080
tccgccacgc ccggtgcgcg gctttatcgc agtggcgacc tggcccggta caacccggcg 7140
ggtgcgctgg agtacgtcgg gcgtatcgac catcaagtga agattcgtgg cctgcgtatc 7200
gaaatgggcg aaatcgaagc cagcctgcaa gccttgtcca atgtgcgcga agccgccgtg 7260
cttgcgcagc cgagcgcgac cggcgtgcag ttggtggcgt acgtggtgcc agccgaaggc 7320
caagcgctgg cgacccaggc actggcagcg cgcttgcgcc agacattgcc ggactacatg 7380
gtgccgggcc attgggtggc ccttgatgcc ttgccgttga accacaacgg caagctcgac 7440
cgccgtgcac tgcccacacc cgacctgaac caagccagca ccacctacgt ggcgccgcag 7500
agtccattgc aaatccagtt ggcggcgatc tggcaagcag tgttgcaggt cgagcaggtt 7560
ggcctggaag atcacttctt cgaacgcggc ggccactctt tgttggctac ccaagtgatc 7620
tcccgggtgc gccacgacct caagctggaa gtgccgttgc gggcgctgtt cgaacagccg 7680
acgctggcag cctttgctgc ggcgtgcgca ggcgtgcagg tcgatacggc gcccgtgatc 7740
caggcagttg gccgtgacca gccactggcg ttgtcatttg ctcaggaacg gcagtggttt 7800
ctctggcaat tggatcccac cagcgcggcc tatcatgtgc ccaccgcttt gcacctgcgc 7860
ggtgaactcg acatcgcggc gctggagcgc gccgtcgagg ccctggtgca gcgccatgaa 7920
ccgctgcgca ccacctttgt ggagtcgggc gagcacactg tgcaagtcat ccacccaagc 7980
ctggcagtgc cggttgagca acaaaaggtc gacgccggca ctatcgagca ggctgtcatc 8040
gaagagatcc agcgcccgtt cgacctgcgc aacggcccgc tgatgcgcgt caagttgctg 8100
atcgtcgcgc ctgatcacca tgtgctggtt atcacccagc accacatcat ctctgacggc 8160
tggtcgatgc aagtgatgat cgacgagtgg gtggcgctgt accaaggcga cgttggcttg 8220
ccggccttgc cgatccagta cgccgactac gcccagtggc agcgcgactg gatggcggct 8280
ggggaacaac aacgccagct cgattactgg tgcgctcgtc tgggtcacga acattcgctg 8340
ctggacctgc ccctcgacca tccgcgcccc gcagtgcaga gccatcgtgg cgcgcgccgc 8400
cagattcatc tggaacgtgt gctgttgact gaactcaagg ccctggccca gcgtcaggac 8460
gtgacgctgt tcatgctgtt gctggcctcg ttccagacct tgctgcaccg ctacagcggc 8520
caggcgcagg tgcgtgtcgg cgtgccggtc gccaaccgta atcgcttcga aaccgaacga 8580
ctgctgggct ttttcgtcaa cacccaggtg ctgcaagctg acgtgcacgg acagatgccg 8640
ttcgaccagt tgctggccca ggtcaagctg cgtgccctgg aggcgcaggc ccatcaggac 8700
ctgccgttcg agcagctcgt gcaagtgttg cagcccgagc gcagcctgag ccataacccg 8760
ctgttccagg tgatgttcaa ccatcaggac agcctgcgtt cagcgccggt gcaattgccc 8820
ggcctggctt tgcagcccgt ggattgggcc ggtcacagca cgcagttcga cctgaacctg 8880
gaaaccgagg aatcggtgga cggtctctgg gcctcgctga cttacgccac ggatctgttt 8940
gacgcggcga ccgcggaacg cctggccgag cattggcaaa acctgctgcg cgcggtcctg 9000
caggatgcct cggtggcctt ggacgacctg gcgatgctca gcccgtcgca atcgcagcaa 9060
atggtgcacg actggaaccg cagcgacact gactacccgc gcgaacgctg cgtacaccag 9120
ttgtttgagg cccaggccgc ggcgcaaccc gacgccattg cgctgcactt caatgacgag 9180
cgcctgagct acggcgaact caaccgccgc gccaatcggc tggcccatcg tctgatcgac 9240
atgggcgtcg gcccggacgt gctggtggcg gtgcacgtgg agcgttccct ggacatggtg 9300
gttggcttgc tcgcgaccct caaggccggt ggcgcctatg tgccgctcga cccacaattc 9360
ccggcagagc gcctggccta catgcttgaa gacagccgcg cccgggtatt gctgacgcaa 9420
ccgcacctgc tggggcacct ggcgcagccg cacggcgtgc aggtgctgat ggtggaggag 9480
gccggcacag cgcagcacaa tccccaggtt gccgtgacac cggagcatct ggcctacgtg 9540
atctacacct ctggctccac tggcaagccc aaaggggtga tggttcgtca caaggcgctg 9600
tgcagcttca ccagcgccat ggccggcacg ttgagtatcg gccaggatgc gcggctgttg 9660
tcgctgacca ccttctcgtt cgacattttc gccctggagc tgtatgtgcc gctgagtgtc 9720
ggcggtaccg tgttgctgag cgcccaggca atggccctcg acccggaggc gatcctcgat 9780
ctggcccagc gccaggcggc gaatgtgctg caagccacgc cctcgacctg gcgcatgttg 9840
ctcgacagcc cacgggctca tgcactgcgt ggcatcgcct gcctctgcgg tggcgaagcg 9900
ctgcccgtcg atttggccca gcgcatgctc gatctgcaag gcccgttgtg gaacctctat 9960
ggtccgacgg aaaccaccat ctggtcggcg gctcatcgtt tgcaccaggc attgccgttc 10020
gtggggcggc ccatcgccaa tacccgcttg ttcattctca atgccggtct cacgccatgc 10080
ccccaaggtg tgtccggtga gctgctgatc ggcggtgtcg gcctggcgcg cggttaccac 10140
gggcagccgg cgctgaccgc cgaacgcttc gtgcctaacc cgtttggggc atcgggcgaa 10200
cgcctgtacc gtaccggcga cctggcacgc tatcaggcgg acggcgtggt ggaatacatc 10260
ggccgtgtcg accatcaggt caaggtccgg ggtttccgta tcgagctggg tgaaatcgaa 10320
gcctgcctgc gtgagttcga cggcgtacgt gaagccgtgg tgctggccga taacgaccgg 10380
ctgatcgctt acctggtcag caccgcgccg caggcaccgc aggtgtataa agccgcgctg 10440
cgcgagcgtc tgccggacta catggtgcca gcgcagtggc tgttcctcga cagcctgccg 10500
ctgaccccca acggtaagct cgaccgcaag gcactgccca aaccggatgc cagcctgtcg 10560
ctcaaaggcc atgtagcgcc cgtcaccccg cgcgagcagc aggtggcggc gatctgggcc 10620
gaggtactgg aattgccccg tgtgggcctc gacgatcatt tcttcgagtt gggcgggcat 10680
tcattgctgg ccacgcgggt ggtgtcacgg gtgcgtcagg ccctggcgct ggaggtccca 10740
ctcaaagcct tgttcgaaca gccgctactg ggtgatttcg tgcgggcctt gggcgaggag 10800
ggcgtcaccg cgcctgcgct gatcaaggcc gaccgcacgc aacctctacc gctgtcttat 10860
gcccaggagc gccaatggtt cctttggcaa ctggacccgg ccggcgccgc gtatcacatc 10920
cccagcgcct tgcgtttgca ggggccgttg gacctgaccg cgctgcaaga gagcttcgat 10980
agcttgctgg ctcgccatga aagcctgcgc acgtatttcc gtcaggacgc caccggcgcg 11040
gttcaagtca ttgacgcgca gagccgggtc gatatcgagc aggtcgacag cgactatgcc 11100
ggcctcaagg cgcgggtcgc gcaggtggtc gcccagcctt tcgacctgct gcgtgggccg 11160
ctgctgcggg ttaccttgct gcgcctggcc gaggacgacc atgtgctggt gctggtgcag 11220
catcacatcg tctctgacgg ctggtcgatg cagttgatgg tcgaggaact ggtgcaggcg 11280
tatgccgcta acagccaagg ccaggacgtg caattgccga cgctgccgat ccagtacgcc 11340
gattatgccg tgtggcagcg cgattggatg gaggcgggtg agcaggcgcg tcaattggcc 11400
tactggcgtg agcaattgag cggcgagcaa ccggtgctgg agttgccgtt cgaccacccg 11460
cgcccggcac agccaagcca tcgcggcgca cgcttgggta tcgagttgca tccggagttg 11520
ttgggcagtt tgcgcgcgct ggcgcagcac gctggcgtca cgctgccgat gctgctgctg 11580
gcgtcttacc aggcattgct gcatcgctac agcggccagg aagatgtgcg cgtgggcgtg 11640
ccgattgcca accgtaatcg cctggaaacc gaggggttga tcggcttctt cgtcaacacc 11700
caagtgctca aggccgatat ccacgggcaa atgagcaccg agcaattgct gcaccaggtg 11760
cgtcagcgtt ccctcgaggc ccaggctcac caggacctgc cgttcgaaca gcttgtgcag 11820
gcattgcaac cggagcgcag cctgagcctg agcccgttgt tccaagtgtt gttcaaccac 11880
cgtgtgagcg ctgccgacag ccacctgcat cgcctggccg acctgcacgt cgaagtcctg 11940
gatttggacg agggcgtggc ccagttcgac ctggcgctgg atgtggaaga aagcccgacg 12000
gccctgcgtg cctccctgag ttatgccacc gacctgttcg ccgtggcgac catcgagcgc 12060
atggccgggc attggcagaa cctgttgcgg gcaatggtgg tcgacccaca gcagcccatt 12120
agccaattga gcctgctggg cgaggatgag caacagcaga ttcttgaatt gtggaaccag 12180
accgacgccg gtttttcagc cgagcgcctg gtgcacgaat tggtcggtga tcgcgcccgg 12240
gaaaccccgg acgcggtggc ggtgaaattc gatgctcaaa ccctgagtta cggcgagctg 12300
gatcgtcagg ccaaccgcct ggcccatgcc ttgatcgccc gtggcgtcgg cagggaagtg 12360
cgggtggcca tcgccatgcc gcgcagtgcc gagagcatgg tggcgttcct ggcggtgatg 12420
aaagccggcg gtgtgtatgt gccgctggat atcgaatacc cacgtgatcg cctgctgtac 12480
atgatgcaag acagccgtgc gcaactgctg ctgactcaca gccgggcgct gcagcaactg 12540
ccagtccccg agggcctgga gaccctggcg attgatcgca ccgaagagtg ggccggttac 12600
agcgatacgg caccggatgt ggcgctggac ggcgacaacc ttgcctacgt gatctatacc 12660
tccggctcca ccggtttgcc caagggcgtg gcggtgtcac acgggccgct ggtggcgcat 12720
atcatcgcta ccggcgagcg ctatgaaacc tcaccggccg attgcgaact gcacttcatg 12780
tccttcgcct tcgacggttc ccacgaaggc tggatgcacc cgctgatcaa cggcgccagc 12840
gtgttgatcc gtgacgacag cctgtggctg ccggaataca cctacgagca gatgcaccgc 12900
cacaacgtga ccatggcggt gttcccaccg gtgtacttgc aacagttggc cgaacatgcc 12960
gagcgcgacg gcaacccgcc ggcggtgcgg gtgtattgct tcggcggtga tgccgttgct 13020
caagccagct atgacctggc ctggcgcgcg ctgaaaccca agtacctgtt caacggctat 13080
ggcccgacgg aaaccgtggt tacaccgttg ttgtggaagg cccgcaaagg cgatccctgc 13140
ggcgctgtct atgcgcccat cggcaccttg ctgggcaacc gcagtggcta cgtgctggat 13200
gcgcaactga atctgcaacc catcggcgtg gccggcgagt tgtacctggg cggcgagggc 13260
gtggcccggg gttacctgga gcgtccggca ctgactgccg agcgtttcgt accggacccg 13320
ttcggcaaac cgggcagccg cgtgtatcgc agcggcgacc tgacccgtgg gcgtccggat 13380
ggcgtggtgg attacctggg gcgtgtggac catcaagtga agatccgcgg ttttcgtatc 13440
gaactggggg aaatcgaagc gcgtctgcgt gagcaagcca gtgtcggtga aaccgtggtg 13500
gtggcccagg aggggccgac cggtaagcaa ctggtggcct atgtggtacc ggccgacgcc 13560
agcctggccg acccggttga gttccgtgac gccctgcgtc gtgccctgaa agccgacctg 13620
ccggactaca tggtgcccag ccacttcgta ttcctggcgc agatgccgct gacccccaac 13680
ggcaagctcg accgcaaggg cctgccgctg ccggatgcga gccagatgca gcagcagtac 13740
ctggctccgc aaaccgagct tgagcagcag atcgccacga tctgggccga catcctgcac 13800
ctgccgcaag tgggcctgaa cgacaacttc tttgacgtcg gtggccactc cttgctggcg 13860
atccagatta cctcgcgggt gcaggccgag ctcggcctgg acgtaccgtt gatggaactg 13920
ttccagaccg aatcgctgcg cgcctacgtg caggccgcag ccactttccg cgccggcagc 13980
gtggaagatt ttgatgacct tcgtgacttt ttgagcgaac tagaggcgat ttga 14034
<210> 53
<211> 2321
<212> PRT
<213> Pseudomonas fluorescens
<400> 53
Met Thr Gly Gly Glu His Phe Glu Asn Leu Val Pro Gly Thr Thr Pro
1 5 10 15
Val Asn Thr Thr Val Thr Asp Thr Pro Gly Thr Asp Asn Thr Thr Thr
20 25 30
Val Thr Leu Thr Ala Pro Ser Ala Val Asn Glu Gly Gly Gln Ile Thr
35 40 45
Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly Thr Asp Val Thr Leu Lys
50 55 60
Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys Ala Gly Glu Thr Val Gly
65 70 75 80
Thr Val Thr Val Pro Ala Pro Thr Asp Asp Val Phe Ile Asp Lys Ser
85 90 95
Thr Gln Thr Val Lys Ile Thr Glu Thr Thr Gly Gly Asn Phe Glu Lys
100 105 110
Leu Glu Val Ala Gly Asn Gly Ala Thr Thr Thr Ile Asn Asp Thr Ile
115 120 125
Asp Lys Val Asp Val Val Leu Thr Ala Thr Thr Thr Val Gly Glu Gly
130 135 140
Gly Asn Ile Val Tyr Thr Ala Ser Leu Val Asp Lys Asn Gly Ala Pro
145 150 155 160
Val Thr Asn Ile Thr Asn Pro Leu Thr Val Thr Leu Asp Asn Gly Gln
165 170 175
Thr Ile Thr Ile Gly Val Asn Gln Ser Ser Gly Ser Ile Thr Thr Ile
180 185 190
Ala Pro Asp Asp Val Tyr Lys Gly Asp Gln Thr Val Thr Thr Ala Ile
195 200 205
Lys Gly Val Thr Gly Gly Glu His Phe Glu Asn Leu Val Pro Gly Thr
210 215 220
Thr Pro Val Asn Thr Thr Val Thr Asp Thr Pro Gly Thr Asp Asn Thr
225 230 235 240
Thr Thr Val Thr Leu Thr Ala Pro Ala Glu Ala Asn Glu Gly Gly Gln
245 250 255
Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly Thr Asp Val Thr
260 265 270
Leu Lys Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys Ala Gly Asp Thr
275 280 285
Val Gly Thr Val Thr Val Pro Ala Pro Ser Asp Asp Val Phe Ile Asp
290 295 300
Lys Ser Thr Gln Thr Val Lys Ile Thr Asp Ala Ser Gly Gly Asn Phe
305 310 315 320
Glu Lys Leu Glu Val Ala Gly Asn Gly Ala Thr Thr Thr Ile Asn Asp
325 330 335
Thr Ile Asp Lys Val Asp Val Val Leu Thr Ala Thr Thr Thr Val Gly
340 345 350
Glu Gly Gly Asn Ile Val Tyr Thr Ala Ser Leu Val Asp Lys Asn Gly
355 360 365
Ala Pro Val Thr Asn Ile Thr Asn Pro Leu Thr Val Thr Leu Asp Asn
370 375 380
Gly Lys Thr Ile Thr Ile Gly Val Asn Gln Ser Ser Gly Ser Val Ser
385 390 395 400
Val Leu Ala Pro Asp Asp Val Tyr Lys Gly Asp Gln Thr Val Thr Thr
405 410 415
Ala Ile Lys Gly Val Thr Gly Gly Glu His Phe Glu Asn Leu Val Pro
420 425 430
Gly Thr Thr Ala Val Asn Thr Thr Val Thr Asp Thr Pro Gly Thr Asp
435 440 445
Asn Thr Thr Thr Val Thr Leu Thr Ala Pro Ser Ala Val Asn Glu Gly
450 455 460
Gly Gln Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly Thr Asp
465 470 475 480
Val Thr Leu Lys Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys Ala Gly
485 490 495
Glu Thr Val Gly Thr Val Thr Val Pro Ala Pro Thr Asp Asp Val Phe
500 505 510
Ile Asp Lys Ser Thr Gln Thr Val Lys Ile Thr Asp Ala Ser Gly Gly
515 520 525
Asn Phe Glu Lys Leu Glu Val Ala Gly Ser Gly Ala Thr Thr Thr Ile
530 535 540
Asn Asp Thr Ile Asp Lys Val Asp Val Val Leu Thr Ala Thr Thr Thr
545 550 555 560
Val Gly Glu Gly Gly Asn Ile Val Tyr Thr Ala Ser Leu Val Asp Lys
565 570 575
Asn Gly Ala Pro Val Thr Asn Ile Thr Asn Pro Leu Thr Val Thr Leu
580 585 590
Asp Asn Gly Lys Thr Ile Thr Ile Gly Val Asn Gln Ser Ser Gly Ser
595 600 605
Val Ser Val Leu Ala Pro Asp Asp Val Tyr Lys Gly Asp Gln Thr Val
610 615 620
Thr Thr Ala Ile Lys Gly Val Thr Gly Gly Glu His Phe Glu Asn Leu
625 630 635 640
Val Pro Gly Thr Thr Pro Val Asn Thr Thr Val Thr Asp Thr Pro Gly
645 650 655
Thr Asp Asn Thr Thr Thr Val Thr Leu Thr Ala Pro Ser Ala Val Asn
660 665 670
Glu Gly Gly Gln Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly
675 680 685
Thr Asp Val Thr Leu Lys Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys
690 695 700
Ala Gly Glu Thr Val Gly Thr Val Thr Val Pro Ala Pro Thr Asp Asp
705 710 715 720
Val Phe Ile Asp Lys Ser Thr Gln Thr Val Lys Ile Thr Glu Thr Thr
725 730 735
Gly Gly Asn Phe Glu Lys Leu Glu Val Ala Gly Asn Gly Ala Thr Thr
740 745 750
Thr Ile Asn Asp Thr Ile Asp Lys Val Asp Val Val Leu Thr Ala Thr
755 760 765
Thr Thr Val Gly Glu Gly Gly Asn Ile Val Tyr Thr Ala Ser Leu Val
770 775 780
Asp Lys Asn Gly Ala Pro Val Thr Asn Ile Thr Asn Pro Leu Thr Val
785 790 795 800
Thr Leu Asp Asn Gly Lys Thr Ile Thr Ile Gly Val Asn Gln Ser Ser
805 810 815
Gly Ser Ile Thr Thr Val Ala Pro Asn Asp Val Tyr Lys Gly Asp Gln
820 825 830
Thr Val Thr Thr Ala Ile Lys Gly Val Thr Gly Gly Glu His Phe Glu
835 840 845
Asn Leu Val Pro Gly Thr Thr Ala Val Asn Thr Thr Val Thr Asp Thr
850 855 860
Pro Gly Ser Thr Asp Leu Thr Thr Val Thr Leu Thr Ala Pro Thr Ala
865 870 875 880
Val Asn Glu Gly Gly Gln Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys
885 890 895
Ala Gly Ser Asp Met Leu Val Gln Leu Asp Asn Gly Ser Ser Ile Thr
900 905 910
Ile Lys Gln Gly Glu Thr Val Gly Thr Val Thr Val Pro Ala Pro Thr
915 920 925
Asp Asp Val Phe Ile Asp Lys Ser Thr Gln Thr Val Lys Ile Thr Gly
930 935 940
Thr Thr Gly Gly Asn Phe Glu Gly Val Thr Ile Thr Pro Ala Gly Ala
945 950 955 960
Thr Thr Thr Ile Asn Asp Thr Ile Asp Asp Val Thr Val Val Leu Lys
965 970 975
Ala Thr Gly Ser Val Ser Glu Gly Gly Gln Ile Val Tyr Thr Ala Ser
980 985 990
Leu Val Asp Lys Asn Gly Val Ala Val Asn Asn Val Gly Ser Asp Leu
995 1000 1005
Val Val Lys Leu Asp Asn Gly Ser Thr Ile Thr Ile Gly Asn Gly
1010 1015 1020
Lys Ser Thr Ser Phe Thr Thr Ala Thr Ala Pro Asn Asp Ala Tyr
1025 1030 1035
Val Gly Ala Asn Asp Val Thr Thr Lys Ile Thr Gly Val Val Ser
1040 1045 1050
Gly Gly Asp Lys Tyr Glu His Leu Ile Val Asp Gly Ser Thr Val
1055 1060 1065
Val Thr Lys Val Thr Asp Val Val Ser Asn Thr Thr Ile Ser Ile
1070 1075 1080
Thr Gly Asp Ala Ser Val Thr Glu Gly Gly Thr Ala His Tyr Thr
1085 1090 1095
Leu Thr Leu Ser Asn Pro Pro Gln Thr Asp Val Thr Val Thr Leu
1100 1105 1110
Lys Tyr Ser Gly Thr Ala Thr Asp Gly Ser Asp Phe Asn Gly Val
1115 1120 1125
Tyr Thr Val Lys Ile Pro Ala Gly Ser Ser Ser Val Pro Phe Asp
1130 1135 1140
Ile Arg Thr Leu Asp Asp Lys Ile Thr Glu Pro Thr Glu Asn Ile
1145 1150 1155
Val Ile Thr Ile Asp Lys Thr Thr Gly Gly Asn Phe Glu Asn Leu
1160 1165 1170
Val Val Gly Asn Gly Ser Val Thr Thr Asn Ile Ile Asp Asn Asp
1175 1180 1185
Ala Pro Pro Val Ile Asp Leu Asp Ala Asn Asn Ser Ser Gly Ala
1190 1195 1200
Ser Gly Ala Asp Phe Lys Thr Thr Phe Thr Glu Gly Gly Thr Gly
1205 1210 1215
Val Ser Ile Ala Asp Thr Asp Ile Lys Ile Thr Asp Pro Asp Ser
1220 1225 1230
Thr Gln Leu Thr Gly Ala Thr Val Val Leu Thr Asn Ser Gln Pro
1235 1240 1245
Gly Asp Ser Leu Asn Phe Ser Gly Val Ser Gly Ile Thr Val Thr
1250 1255 1260
Pro Thr Thr Asp Pro Val Thr Gly Lys Ile Thr Leu Thr Leu Thr
1265 1270 1275
Gly Thr Ala Ser Leu Ala Asp Tyr Met Gln Gln Ile Lys Asn Ile
1280 1285 1290
Thr Phe Thr Asn Asn Ser His Asp Pro Ser Thr Thr Pro Arg Thr
1295 1300 1305
Ile Thr Val Thr Val Thr Asp Gly Gly Asn Tyr Ser Asn Val Ala
1310 1315 1320
Thr Thr Thr Val Asn Val Val Ala Val Asn Asp Ala Pro Val Ala
1325 1330 1335
Thr Gly Gly Ala Val Thr Gly Thr Glu Asp Thr Ala Leu Ala Leu
1340 1345 1350
Thr Trp Ala Asn Phe Gly Val Ser Asp Val Asp Ser Pro Gln Ala
1355 1360 1365
Ser Leu Gly Val Lys Ile Thr Glu Leu Pro Val Ala Gly Lys Leu
1370 1375 1380
Gln Tyr Leu Ala Ala Asp Gly Ser Thr Trp Thr Asn Val Thr Ser
1385 1390 1395
Gly Gln Thr Phe Thr Lys Ala Gln Ile Asp Gly Gly Gln Leu Arg
1400 1405 1410
Phe Thr Pro Asn Ala Asn Glu Ser Gly Ala Asp Gly Tyr Gly Gly
1415 1420 1425
Thr Gly Val Gly Asn Lys Gln Ala Asp Tyr Ala Gln Phe Lys Phe
1430 1435 1440
Gln Pro Thr Asp Gly Lys Asp Leu Gly Thr Ser Ala Thr Val Lys
1445 1450 1455
Val Asp Ile Thr Pro Val Ala Asp Ala Pro Thr Leu Ser Val Ala
1460 1465 1470
Asp Asn Asn Val Ala Ser Thr Gly Leu Val Lys Gln Gly Trp Asn
1475 1480 1485
Ser Ile Ala Gly Leu Gly Asn Asn Gly Asn Gly Ala Ala Pro Asp
1490 1495 1500
Val Leu Lys Lys Ala Ile Asp Asn Ala Gly Thr Pro Asn Asn Thr
1505 1510 1515
Ser Val Val Thr Asn Val Glu Ser Val Asp Asn Val Ala Ala Gly
1520 1525 1530
Ser Gly Ser Lys Ile Ser Gly Leu Ile Tyr Met Glu Ala Gly Lys
1535 1540 1545
Ser Tyr Thr Phe Ser Gly Ile Ala Asp Asp Ser Val Val Val Asn
1550 1555 1560
Val Gly Gly Lys Asp Val Ala Ser Gly Leu Trp Gly Thr Asn Ser
1565 1570 1575
Gly Lys Phe Ser Gly Ser Phe Thr Pro Thr Thr Thr Gly Tyr Tyr
1580 1585 1590
Ser Leu Glu Ile Tyr Gln Ala Asn Gln Ala Gly Pro Gly Ser Phe
1595 1600 1605
Asp Val Asn Leu Ser Ile Asn Gly Gly Ala Val Gln Asn Leu Ser
1610 1615 1620
Thr Ser Thr Val Pro Leu Tyr Thr Gly Leu Thr Asp Leu Thr Asn
1625 1630 1635
Ala Gly Val Thr Val Ser Asp Leu His Gly Ser Asn Gly Asp Gly
1640 1645 1650
Tyr Tyr Val Gly Tyr Lys Leu Asn Glu Gly Gln Glu Asn Gly Thr
1655 1660 1665
Val Lys Leu Ser Lys Val Thr Thr Ala Leu Thr Asp Thr Asp Gly
1670 1675 1680
Ser Glu Thr Leu Ser Val Lys Ile Ser Gly Ile Pro Ala Gly Ser
1685 1690 1695
Val Leu Thr Asp Ala Ser Gly His Thr Phe Thr Ala Gly Lys Thr
1700 1705 1710
Val Gly Glu Val Asn Val Thr Gly Trp Asp Leu Asn Thr Leu Thr
1715 1720 1725
Ile Lys Pro Pro Thr Tyr Tyr Ser Gly Gln Phe Asn Leu Thr Val
1730 1735 1740
Thr Ser Thr Ser Thr Glu Ser Ile Gly Gly Ser Ala Thr Thr Thr
1745 1750 1755
Ala Gln Leu Pro Val Thr Val His Pro Ala Thr Tyr Asn Ser Val
1760 1765 1770
Thr Gly Thr Ser Gly Ser Asp Thr Ile Asn Gly Ser Asp Gly Asn
1775 1780 1785
Asp Ile Val Val Ala Asp Ile Ala Gly Leu Asn Val Val Gln Gly
1790 1795 1800
Lys Asn Tyr Asn Ile Ala Phe Met Val Asp Ser Ser Gly Ser Met
1805 1810 1815
Ser Val Ala Ser Leu Asp Ala Ala Lys Ala Ser Leu Thr Ser Val
1820 1825 1830
Phe Asn Ser Leu Lys Asp Ser Leu Gly Ala Asn Thr Ser Gly Thr
1835 1840 1845
Val Asn Ile Phe Leu Ala Asp Phe Asp Ser Gln Val Lys Lys Ser
1850 1855 1860
Val Ala Ile Asn Leu Asn Asp Pro Asn Ala Leu Thr Gln Leu Lys
1865 1870 1875
Ala Val Leu Asp Ser Met Ala Ser Gly Gly Gly Thr Asn Tyr Glu
1880 1885 1890
Asp Val Phe Lys Ala Thr Ala Asn Phe Phe Gln Ser Asp Leu Ala
1895 1900 1905
Thr Lys Asn Thr Gly Ala Thr Asn Leu Thr Tyr Phe Ile Thr Asp
1910 1915 1920
Gly Lys Pro Thr Tyr His Gln Ser Gly Glu Gln Ile Asn Pro Val
1925 1930 1935
Val Thr Asp Phe Tyr Asp Phe Arg Thr Thr Asp Gly Arg Leu Asp
1940 1945 1950
Asp Tyr Ile Ser Ala Asn Asn Tyr Val Leu Gly Asn Thr Phe Ser
1955 1960 1965
Ile Asn Val Asn Gly Ala Asn Leu Gln Leu Ile Asp Ser Gln Gly
1970 1975 1980
Gln Leu His Gln Trp Lys Gln Thr Phe Leu Gly Gly Trp Tyr Asp
1985 1990 1995
Asn Gly Val Ile Gly Thr Val His Ala Gln Gly Asp Gly Thr Phe
2000 2005 2010
Glu Val Ser Tyr Leu Asp Gly Ser Gly Ser Ser Thr Thr Thr Ala
2015 2020 2025
Thr Ile Asn Asn Ala Asn Ser Gly Phe Ala Leu Leu Lys Gly Leu
2030 2035 2040
Ser Ala Val Glu Ala Ile Gly Ile Asn Gly Asp Ile Ser Leu Asp
2045 2050 2055
Asp Leu Lys Pro Tyr Asp Thr Asp Gly Lys Pro Gln Thr Asn Ile
2060 2065 2070
Asp Pro Lys Asp Leu Ala Asn Ala Ile Leu Gly His Thr Glu Ala
2075 2080 2085
Thr Leu Pro Gly Ala Asp Thr Val Ser Gly Gly Asp Gly Asn Asp
2090 2095 2100
Ile Leu Phe Gly Asp Leu Val Ser Phe Ser Gly Ile Asn Gly Glu
2105 2110 2115
Gly Tyr Asn Ala Leu Gln Ala Phe Val Ala Gln Lys Thr Gly Val
2120 2125 2130
Ala Val Ser Ala Val Thr Ala Ser Asn Val His Gln Tyr Val Thr
2135 2140 2145
Glu His Tyr Val Asp Phe Asp Val Ser Gly Ala Lys Asp Ala Gly
2150 2155 2160
Asp Thr Leu Leu Gly Gly Ala Gly Asp Asp Ile Leu Phe Gly Gln
2165 2170 2175
Gly Gly Asn Asp Thr Leu Asp Gly Gly Lys Gly Asn Asp Ile Leu
2180 2185 2190
Leu Gly Gly Thr Gly Asn Asp Thr Leu Ile Gly Gly Gln Gly Asn
2195 2200 2205
Asp Ile Leu Ile Gly Gly Ser Gly Ala Asp Thr Phe Val Trp Lys
2210 2215 2220
Ser Gly Asp Ile Gly Asn Asp Val Ile Lys Asp Phe Lys Ala Ser
2225 2230 2235
Glu Gly Asp Arg Ile Asp Leu Arg Asp Leu Leu Lys Gly Glu Thr
2240 2245 2250
Asp Ser Thr Ile Asp Asn Tyr Leu Lys Ile Thr Thr Val Asp Gly
2255 2260 2265
Val Ser Thr Leu Gln Val Ser Ser Glu Gly Lys Leu Asn Ala Ala
2270 2275 2280
Gly Gly Leu Ala Asn Ala Asp Val Thr Ile Lys Leu Glu Gly Asn
2285 2290 2295
Asp Trp Ser His Thr Ser Ile Asn Ser Leu Ile Ser Gly Ala Asp
2300 2305 2310
Pro Thr Ile Lys Ile Asp His Thr
2315 2320
<210> 54
<211> 6966
<212> DNA
<213> Pseudomonas fluorescens
<400> 54
atgaccggcg gcgagcactt tgaaaatctg gttccaggta ctaccccggt taacaccacc 60
gttacggaca caccgggtac cgataacacc accaccgtta cgctgacagc gccaagtgcc 120
gttaacgaag gtgggcagat tacgtacacc gcaacgcttt ccaataaagc gggcactgat 180
gtcacgctga agttagataa cggttcgtcg atcaccatca aggccggcga aaccgtcggc 240
accgtgactg tccctgcgcc taccgatgac gtgtttatcg ataagagcac ccagaccgtc 300
aagatcaccg aaaccactgg cggcaacttc gaaaaactcg aagtggcagg aaacggcgca 360
accaccacga tcaacgacac catcgacaaa gtcgatgtgg tcctgaccgc cactaccacc 420
gtcggcgaag gcggcaatat cgtctacacc gccagccttg tggataagaa cggcgcaccg 480
gtgaccaaca tcaccaatcc gctgaccgtg acattggata acggccagac catcactatt 540
ggcgtaaacc agtcgagcgg ttctatcacc accatcgcgc cagacgatgt ctacaaaggc 600
gaccagaccg tcactaccgc catcaaaggc gtgaccggcg gcgagcactt tgaaaatctg 660
gttccaggta ctaccccggt taataccacc gttacggata caccaggcac tgacaacacc 720
actacggtga cgctgaccgc tccggccgag gcaaacgaag gtgggcagat cacgtacacc 780
gccacgcttt ccaacaaagc gggcactgac gtaacgctga aactcgacaa cggttcttcg 840
atcaccatca aggctggcga cactgttggc actgtgactg tgcccgctcc aagcgatgac 900
gtgttcatcg ataaaagtac ccagaccgtc aagattactg acgcttccgg cggcaacttc 960
gaaaaactcg aagtcgcagg taacggcgca acgaccacga tcaacgacac catcgacaag 1020
gtggatgtag ttctaactgc taccactacc gtcggcgaag gcggcaacat cgtctacacc 1080
gccagccttg tggataagaa cggcgcgccg gtgaccaaca tcaccaaccc gctgaccgtg 1140
acattggata acggtaaaac catcaccatc ggcgtaaacc aatcgagcgg tagcgtttcg 1200
gttcttgctc ctgatgatgt gtacaagggc gaccaaactg tcaccaccgc tataaagggt 1260
gtgaccggcg gcgagcattt cgagaacctg gtgcctggca ctacggcagt gaacaccact 1320
gtcaccgata cccccggtac cgacaacacc accactgtga cgctgacagc gccaagtgcc 1380
gttaacgaag gtggtcagat cacttacacc gcgaccttga gcaacaaggc cggtactgac 1440
gtcaccttga agctggataa cggctcttcg atcaccatca aagctggcga gaccgtcggt 1500
actgtgaccg tgcctgcgcc taccgatgac gtgttcatcg ataagagcac tcagaccgtc 1560
aagatcaccg acgcttcggg cggtaacttc gaaaaactgg aagttgcagg cagcggcgcg 1620
accactacga tcaacgacac tatcgacaag gtcgatgtgg tcctgaccgc caccaccacc 1680
gtcggcgaag gcggcaacat cgtttacacc gccagcctcg tggataaaaa cggcgcaccg 1740
gtgaccaaca tcaccaatcc gctgaccgtg accctggata acggcaagac catcaccatc 1800
ggcgtaaacc aatcgagcgg tagcgtttcg gttcttgctc cggatgatgt gtacaagggc 1860
gaccaaactg tcaccaccgc tatcaagggt gtgaccggcg gcgagcactt tgaaaatctg 1920
gttccaggta ctaccccggt taacaccacc gttacggaca caccgggtac cgataacacc 1980
accaccgtta cgctgacagc gccaagtgcc gttaacgaag gtgggcagat tacgtacacc 2040
gcaacgcttt ccaataaagc gggcactgat gtcacgctga agttagataa cggttcgtcg 2100
atcaccatca aggccggcga aaccgtcggc accgtgactg tccctgcgcc taccgatgac 2160
gtgtttatcg ataagagcac ccagaccgtc aagatcaccg aaaccactgg cggcaacttc 2220
gaaaaactcg aagtggcagg aaacggcgca accaccacga tcaacgacac catcgacaaa 2280
gtcgatgtgg tcctgaccgc cactaccacc gtcggcgaag gcggcaacat cgtctacacc 2340
gccagccttg tggataagaa cggcgcaccg gtgaccaaca tcaccaatcc gctgaccgtg 2400
accctggata acggcaagac catcaccatc ggtgtgaatc agtcgagcgg ttccatcacc 2460
accgtagcgc caaacgacgt ctacaaaggc gaccaaaccg tcaccaccgc catcaaaggc 2520
gtgaccggcg gcgagcactt cgagaacctg gtgccgggca cgacggcggt gaacaccacc 2580
gtcaccgaca caccaggctc caccgacctg accaccgtta ccctgactgc cccgaccgcg 2640
gtcaacgaag gcggccagat cacctacacc gccaccttga gcaacaaggc cggtagcgac 2700
atgctggtcc agctcgacaa cggttcgagc atcactatca agcaaggtga gaccgtgggc 2760
acggtgaccg tcccggcgcc taccgatgac gtgttcatcg acaagagcac ccagaccgtc 2820
aagatcaccg gcaccaccgg cggcaatttc gagggcgtga ccatcacacc tgcgggcgcc 2880
acgaccacca tcaacgacac catcgatgac gtgaccgtgg tactcaaggc cactggctcg 2940
gtcagcgaag gcgggcagat cgtgtacacc gcgtccctgg tcgacaagaa cggtgtggcg 3000
gtgaacaacg ttggctcaga cctggtcgtc aagctggata acggctcgac cattaccatc 3060
ggcaatggca agtccaccag cttcaccacc gccaccgcac ctaacgatgc gtatgtcggc 3120
gccaatgacg tcaccactaa aatcacgggt gtggtcagcg gtggcgacaa gtacgaacac 3180
ttgatcgtcg acggcagcac cgtggttacc aaagtgaccg atgtggtcag caacaccacc 3240
atcagcatta ccggcgatgc gtcggtgact gaaggcggta cggcgcacta cacgctgacc 3300
ctgagcaacc cgccgcaaac cgacgtgacc gtgacgctca agtacagcgg caccgctacc 3360
gacggttcag acttcaatgg cgtgtacacc gtgaagattc cggcaggctc cagcagcgta 3420
ccgtttgata tccgcacgct cgacgacaag atcaccgagc cgacggaaaa tatcgtcatc 3480
accatcgaca agaccactgg cggcaacttc gaaaacctgg tggtcggcaa tggcagtgtt 3540
accaccaaca tcatcgacaa tgatgcgccg ccggtcatcg atctggatgc caacaactcc 3600
agcggcgcca gcggtgcgga cttcaagacc accttcaccg aaggcggcac cggtgtgtca 3660
attgctgaca ctgacattaa gatcaccgac ccggacagca cccaactgac cggcgccacc 3720
gtggtattga ccaacagcca gccaggcgac tcgctgaact tcagcggcgt gagcggcatc 3780
accgtgaccc cgactaccga ccctgtgacc ggtaaaatca ccttgaccct gaccgggacg 3840
gcgtcgctgg ccgactacat gcagcagatc aagaacatca cgttcaccaa caacagccac 3900
gacccgagca ccacgccgcg caccatcacc gtgacggtga ccgatggcgg caactactcc 3960
aacgtggcta ccaccaccgt caacgtggta gcagtcaacg atgcaccagt ggccactggc 4020
ggtgccgtga ccggtacgga agacaccgcg ctggccctga cctgggccaa cttcggcgtg 4080
agcgatgtgg actcgccaca agccagcctc ggggtgaaaa tcaccgagct gccggtagcc 4140
ggcaagctgc aatacctggc ggcggacggc agcacctgga ccaacgtgac cagcggccag 4200
acctttacca aggctcagat cgatggcggc caactgcgct ttacgccgaa cgccaacgag 4260
tccggcgccg acggttatgg cggcactggc gtgggtaaca agcaggcgga ttacgcgcag 4320
ttcaagttcc aaccaaccga tggcaaggac ctgggtacca gcgccacggt gaaagtcgat 4380
atcacgccgg tagccgacgc gccgaccctg agcgtggcag acaacaacgt tgcctccacc 4440
ggcctggtca aacagggctg gaacagcatt gccggcctcg gcaacaacgg caacggcgct 4500
gcaccggacg tgctgaaaaa agccatcgat aacgcgggca cgccgaacaa cacctcggtg 4560
gtgaccaacg tcgagtctgt cgacaatgtc gccgccggct ctggctcaaa aatctccggc 4620
ctgatctaca tggaagccgg caagagctac accttcagcg gcatcgccga tgacagcgtg 4680
gtggtcaacg ttggcggtaa agatgttgcc agcggtttgt ggggcaccaa cagcggcaag 4740
ttcagcggct cgttcacgcc aacgaccacc ggttactaca gccttgagat ctaccaggcc 4800
aaccaggcgg gcccaggcag cttcgacgtt aacctgtcga tcaacggcgg ggcggtgcag 4860
aacctgagca ccagcaccgt gccgttgtac accggcctta ccgacctgac caacgccggc 4920
gtcaccgtat ccgacctgca tggcagcaac ggtgacggct actacgtggg ctacaagctc 4980
aacgaaggcc aggaaaacgg cacggtcaaa ctgtccaagg tcaccaccgc gctgaccgat 5040
accgacggct ccgaaaccct gagcgtaaag atcagcggca ttccggcagg ctcggtgctt 5100
accgacgcgt cggggcacac ctttactgcg ggtaaaaccg tgggcgaagt gaatgtcacc 5160
ggctgggacc tgaacaccct gaccatcaag ccgccgacct actacagcgg ccagttcaac 5220
ctgacggtca cctcgacttc caccgagagc atcggcggtt cagcgaccac caccgcgcaa 5280
ttgccagtca cggtgcatcc ggcgacctac aattcggtca ccggcacctc gggcagcgac 5340
accatcaatg gcagcgatgg caacgacatc gtcgtggccg acatcgccgg cctgaacgtg 5400
gtgcagggta agaactacaa catcgcgttc atggtggaca gctccggcag tatgagcgtc 5460
gcctcgctcg acgcggcgaa ggcctcgttg acttcggtgt tcaactcgct caaggacagc 5520
ctgggcgcca acacatcggg gaccgtgaat atcttcctgg cggactttga tagccaagtg 5580
aaaaagtcgg tggctatcaa cctcaacgat cctaatgcat tgactcagct gaaagcggtg 5640
ctggactcga tggcatcggg aggaggtact aactacgaag acgtgttcaa ggccactgcc 5700
aacttcttcc agagcgacct ggcgaccaaa aacaccggtg caaccaactt gacgtacttc 5760
atcaccgacg gcaagccgac ctaccaccag agcggcgagc agatcaaccc ggtagtgact 5820
gacttctacg acttccgcac caccgatggg cgcttggacg actacatcag tgcgaacaac 5880
tatgtgctgg gtaacacgtt cagcatcaac gtcaatggcg ctaacctgca gttgatcgac 5940
agccagggcc aactgcacca atggaagcag acgttcctgg gtggctggta cgacaacggc 6000
gtcataggta ccgtgcacgc ccagggtgac gggacttttg aagtctccta cctcgacggc 6060
tccggtagta gcaccaccac cgcgaccatt aacaacgcca acagcggttt tgcactgctc 6120
aaaggtttgt cggcggtgga agcaatcggc atcaacggcg acatcagtct cgacgatctc 6180
aagccgtacg ataccgatgg caagccgcaa accaacatcg atccgaagga cctggccaac 6240
gctatcctcg gccacaccga ggcgacgttg ccgggcgcgg acaccgtcag cggtggcgac 6300
ggcaacgaca tcctgttcgg cgacctggtg agtttcagcg ggatcaatgg cgagggttac 6360
aacgcactgc aggcctttgt cgcacagaag accggcgtgg ctgtctcggc agtgactgcc 6420
tctaacgttc accagtacgt caccgagcac tatgtggact tcgacgtctc cggcgccaaa 6480
gatgccggcg acacactgtt gggcggcgct ggcgatgaca tcttgttcgg ccaaggcggc 6540
aacgacacgc tcgatggcgg caaaggcaat gacatcctgc tgggtggcac gggtaacgac 6600
acgttgattg gcggccaggg caacgacatc ctgatcggtg gctcgggtgc cgacaccttt 6660
gtgtggaagt ctggcgacat cggcaacgat gtgatcaagg acttcaaggc gtccgaaggc 6720
gaccgcattg acctgcgtga tttgttgaaa ggtgaaaccg acagcaccat cgacaactac 6780
ctcaagatca ccacggtaga cggcgtgtcg accctgcaag tgagcagtga aggcaagctc 6840
aacgccgccg gtggcttggc caatgccgat gtgacgatca agctggaagg caacgactgg 6900
tcccacacca gcatcaactc gctgatcagt ggtgccgacc cgaccatcaa gatcgaccac 6960
acttaa 6966
<210> 55
<211> 574
<212> PRT
<213> Pseudomonas fluorescens
<400> 55
Met Ser Leu Phe Leu Pro Arg Thr Trp Leu Leu Leu Gly Val Cys Leu
1 5 10 15
Leu Thr Gly Phe Ala Leu Asn Ser Ala Ser Ala Ala Pro Thr Pro Gly
20 25 30
Asp Gln Asp Leu Ile Arg Asp Arg Gln Asn Arg Leu Leu Glu Glu Gln
35 40 45
Gln Arg Arg Leu Glu Glu Leu Lys Asp Leu Pro Gly Asn Glu Ala Lys
50 55 60
Pro Val Ala Pro Ala Ala Pro Val Asn Thr Arg Cys Phe Pro Ile Lys
65 70 75 80
Asp Ile Glu Leu Lys Gly Ala Asp Ser Leu Pro Ala Ala Asp Arg Glu
85 90 95
Arg Leu Leu Lys Pro Tyr Ile Gly Gln Cys Leu Gly Val Ser Gln Leu
100 105 110
Asn Glu Leu Leu Lys Ala Ile Thr Asp Tyr Tyr Ile Asp Lys Gly Leu
115 120 125
Val Thr Ser Arg Ala Tyr Leu Pro Gln Gln Asp Leu Ser Lys Gly His
130 135 140
Leu Gln Val Leu Val Val Glu Gly Lys Leu Glu Gly Leu Lys Gly Ala
145 150 155 160
Asp Asn Ser Lys Leu Ser Asp Arg Glu Leu Ala Met Ala Phe Pro Gly
165 170 175
Lys Asn Gly Asp Leu Leu Asn Leu Arg Glu Ile Glu Gln Ala Ile Asp
180 185 190
Gln Leu Asn Arg Leu Pro Ser Asn Gln Ala Gln Met Glu Leu Thr Pro
195 200 205
Gly Asp Ala Val Gly Gly Ser Ser Val Leu Val Lys Asn Asn Pro Gln
210 215 220
Lys Pro Trp Arg Ala Ser Leu Ser Arg Asn Asn Asp Gly Gln Lys Ser
225 230 235 240
Thr Gly Glu Gln Gln Trp Gly Thr Gly Phe Glu Trp Asp Ser Pro Leu
245 250 255
Gly Leu Ala Asp Gln Leu Ile Leu Arg Gly Gly His Asp Ala Ile Ser
260 265 270
Asp His Gln Lys Thr Ser Lys Asn Val Leu Leu Tyr Tyr Asn Val Pro
275 280 285
Trp Gly Trp Trp Asn Phe Ser Tyr Ser Tyr Asn Gln Ser Asp Tyr Arg
290 295 300
Ser Val Ala Gln Ala Asp Thr Tyr Asn Phe Lys Gln Ser Gly Asp Ser
305 310 315 320
Gln Asn His Gln Leu Arg Ala Glu Arg Val Ile His Arg Asp Ala Val
325 330 335
Ser Lys Thr Ser Val Asn Val Gly Leu Ser His Leu Arg Thr Asn Asn
340 345 350
Tyr Ile Glu Asp Ser Arg Leu Asp Val Ser Ser Asn Arg Leu Ser Glu
355 360 365
Leu Gln Leu Gly Ile Asn His Gly Arg Arg Ile Gly Ser Ala Phe Val
370 375 380
Asn Ile Asp Leu Gly Val Gln Asn Gly Ile Gly Ala Phe Asp Ala Gln
385 390 395 400
Arg Asn Asp Gln Gln Arg Asp Gln Arg Gly Asn Leu Thr Pro Thr Pro
405 410 415
Asp Tyr Arg Lys Tyr Thr Ala Thr Val Ser Tyr Leu Gln Pro Phe Thr
420 425 430
Leu Trp Gly Glu Ser Phe Ser Phe Thr Ser Leu Ala Thr Gly Gln Arg
435 440 445
Ser Glu Asp Val Leu Phe Ser Pro Gln Arg Met Ser Leu Gly Gly Ser
450 455 460
Ser Ser Ile Arg Gly Phe Lys Asp Gln Gln Leu Thr Gly Asp Ser Gly
465 470 475 480
Gly Tyr Trp Arg Asn Asp Leu Arg Trp Ala Arg Pro Val Thr Trp Asp
485 490 495
Trp Met Arg Pro Val Phe Ala Glu Tyr Gly Ala Ser Val Gly Tyr Asp
500 505 510
Gln Gly Val Ile Arg Asn Asp Arg Tyr Asn Gly Glu Val His Gly Arg
515 520 525
Val Ser Ser Asn Ser Leu Glu Leu Phe Ala Arg Gly Lys Tyr Val Ser
530 535 540
Thr Ser Val Thr Phe Ala His Ser Leu Glu Arg Pro Ala Val Leu Thr
545 550 555 560
Glu Arg Glu Ala Pro Ile Tyr Phe Arg Met Gly Phe Phe Leu
565 570
<210> 56
<211> 1725
<212> DNA
<213> Pseudomonas fluorescens
<400> 56
atgtctttat tcctgccacg gacttggctg ctacttggcg tctgcctgct gactggcttc 60
gcgctgaaca gcgcgtcggc tgcacctacg cccggcgatc aggacttgat ccgcgaccgg 120
caaaatcgcc tgctggaaga acaacagcgg cgtcttgaag agctcaagga tttgcccggc 180
aacgaggcca agcccgtcgc tcccgccgct ccagtgaaca cccgttgctt ccccatcaaa 240
gacatcgagc tcaaaggcgc cgacagcctg cctgccgctg accgcgagcg cttgctcaag 300
ccctatatcg gccagtgcct gggtgtgtcc cagctcaatg aactgctcaa ggccatcacc 360
gattactaca tcgacaaagg cctggtcacc agccgagctt acttgccgca acaggacctg 420
tccaaggggc acctgcaagt gttggtggtg gaaggcaaac tcgaaggttt gaaaggcgcc 480
gacaacagca agctctcgga ccgcgaattg gccatggcct ttcccgggaa aaacggcgac 540
ttgctgaacc tgcgagaaat cgagcaagcc atcgaccaac tcaaccgctt gccatccaac 600
caggcgcaaa tggagctgac gccaggtgat gccgttggcg gcagttcggt gctggtgaaa 660
aacaacccac agaagccttg gcgcgccagc ttgtcgcgca ataacgacgg ccagaaaagc 720
accggcgaac agcaatgggg taccgggttt gaatgggaca gcccattggg cctggccgat 780
caactgattc tgcgcggcgg ccacgacgcc atcagtgacc accagaaaac ctcgaaaaac 840
gtgttgcttt actacaacgt gccctggggc tggtggaact tcagctacag ctacaaccag 900
agcgattacc gctcggttgc tcaggccgac acctacaact tcaagcaaag cggcgacagc 960
cagaaccacc aactgcgcgc cgaacgtgtg atccaccgcg acgctgtaag taagacctcg 1020
gttaacgtcg gcctatccca cctgcgcacc aacaactaca tcgaagacag ccgtctggac 1080
gtcagcagca atcgcttgag cgaactgcaa ctgggcatca accacgggcg acggatcggc 1140
agtgccttcg tcaacatcga cctcggtgtg cagaacggca taggtgcctt cgatgcccag 1200
cgcaacgatc agcagcgcga ccagcgtggc aacctcaccc ccaccccgga ctaccgcaaa 1260
tacaccgcga ccgtcagcta tttgcagccg ttcacgttgt ggggcgagtc cttcagcttt 1320
accagcctgg ccaccgggca gcgcagtgaa gacgtgctgt tcagccctca gcgcatgagc 1380
ctgggtggtt cgtcgtcgat acgcggtttc aaggaccagc aactgaccgg cgacagcggc 1440
ggctactggc gcaacgacct gcgctgggcg cgcccggtga cctgggattg gatgcgtccg 1500
gtttttgccg aatacggtgc cagtgtcggt tacgaccagg gtgtgattcg caatgaccgc 1560
tacaacgggg aagtgcacgg tcgggtgtcg agcaactcgc tggagctatt tgcccgcggc 1620
aaatacgtca gcaccagcgt gacctttgcc cattccctgg aacgaccggc agtgctgacc 1680
gagcgcgaag cgccgatcta cttccgcatg ggtttcttcc tgtaa 1725
<210> 57
<211> 1437
<212> DNA
<213> Pseudomonas fluorescens
<400> 57
atgtcgatac cacgtttgaa gtcttactta tccatagtcg ccacagtgct ggtgctgggt 60
caggccttac ctgcgcaagc ggtcgagttg cctgacttca cccaactggt ggagcaggcc 120
tcgcctgccg tggtgaacat cagtaccacg cagaagctgc cggatcgcaa agtctcgaac 180
cagcagatgc ccgacctgga aggcttgccg cccatgctgc gcgagttctt cgaacgaggg 240
atgccgcaac cacgctcccc ccgtggcggc ggtggccagc gcgaagccca atccctgggc 300
tccggcttca tcatttcgcc tgacggctat atcctcacca acaaccacgt gattgccgat 360
gccgacgaga ttctcgtgcg cctggccgac cgcagtgaac tcaaggccaa gctgattggc 420
accgatccac gttccgacgt ggccttgctt aaaatcgagg gcaaggactt gccggtgctt 480
aagctgggca agtcccagga cctgaaggcc ggtcagtggg tggtcgcgat cggttcgccg 540
ttcggctttg accacaccgt tacccaaggc atcgtcagcg ccatcggtcg cagcctgccg 600
aacgaaaact acgtaccgtt catccagacc gacgtgccga tcaacccggg taactccggt 660
ggcccgctgt tcaacctggc cggcgaagtg gtggggatca actcgcagat ctacacccgc 720
tccggcggct tcatgggcgt gtctttcgcg atcccaatcg atgtggccat ggacgtctcc 780
aatcagctca aaagcggcgg caaggtcagc cgcggctggt tgggcgtggt aatccaggaa 840
gtgaacaagg acctggctga gtccttcggt ctcgacaagc cggccggtgc cctggttgcg 900
cagattcagg acaatggccc tgcggccaaa ggcggcctga aagtcggtga cgtcatcctg 960
agcatgaacg gccagccgat catcatgtcg gcagacttgc ctcatttggt cggcgcgctc 1020
aaggccggcg gcaaagccaa gctggaagtg attcgtgatg gcaagcgcca gaacgtcgaa 1080
ctgaccgtag gtgccatccc ggaagaaggc gcgaccctgg atgccctggg caacgccaag 1140
cccggtgccg agcgcagcag taaccgcctg ggtatcgccg tggttgaact gaccgccgag 1200
cagaagaaaa ccttcgacct gcaaagcggt gtggtgatca aggaagttca ggacggccca 1260
gccgccttga tcggcctgca accgggtgac gtgatcactc acttgaacaa ccaggcaatc 1320
gataccacca aggaattcgc cgacatcgcc aaggcgttgc cgaagaatcg ctcggtgtcg 1380
atgcgcgtcc tgcgtcaagg ccgtgccagc ttcattacct tcaagctggc tgagtaa 1437
<210> 58
<211> 430
<212> PRT
<213> Vibrio cholera
<400> 58
Met Ile Ser Lys Ser Ile Ile Leu Arg Phe Ser Glu Leu Ser Met Arg
1 5 10 15
Lys Lys Val Thr Leu Val Gly Leu Pro Leu Leu Ala Val Ala Ala Ile
20 25 30
Ser Ser Ser Leu Asn Ser Pro Thr Arg Gln Gln Arg Ile Glu Leu Ser
35 40 45
Leu Pro Glu Ser Pro Leu Val Gln Phe Ser Ser Ala Glu His Thr Val
50 55 60
Glu Val Val Lys Val Gly His Pro Asp Tyr Glu Tyr Glu Ile Lys Pro
65 70 75 80
Gly Asp Asn Leu Ser Thr Ile Phe Asn Gln Leu Gly Phe Ala Tyr Thr
85 90 95
Glu Leu Met Lys Val Met Glu Thr Asp Leu Asn Tyr Leu Ala Leu Asp
100 105 110
Thr Leu Arg Pro Gly Asn Val Leu Arg Phe Trp Lys Gly Ser Asp Asn
115 120 125
Thr Leu Ala Lys Met Glu Leu Glu Phe Ser Leu Val Asp Arg Ala Val
130 135 140
Tyr Thr Arg Leu Asn Asp Gly Ser Tyr Glu Phe Glu Glu Arg Lys Ile
145 150 155 160
Pro Gly Thr Trp Lys Val Glu Pro Leu Ile Gly Glu Val Asp Gly Ser
165 170 175
Phe Ser Leu Ser Ala Asn Arg Ala Gly Leu Gly Ala Ala Asp Val Asp
180 185 190
Gln Ile Val Thr Leu Leu Lys Asp Lys Ile Asn Phe Gly Arg Asp Leu
195 200 205
Arg Arg Gly Asp Arg Phe Glu Val Val Leu Ser Arg Gln Leu Val Gly
210 215 220
Glu Lys Leu Thr Gly Asn Ser Glu Ile Gln Ala Ile Lys Ile Phe Asn
225 230 235 240
Arg Gly Lys Glu Ile Thr Ala Tyr Leu His Gln Asp Gly Gln Tyr Tyr
245 250 255
Asp Lys Asn Gly Asp Ser Leu Gln Arg Ala Phe Gln Arg Tyr Pro Val
260 265 270
Asp Ser Lys Trp Arg Ile Ser Ser Asn Phe Asp Pro Arg Arg Leu His
275 280 285
Pro Val Thr Lys Arg Val Ala Pro His Asn Gly Thr Asp Phe Ala Met
290 295 300
Pro Ile Gly Thr Pro Val Tyr Thr Ser Gly Asp Gly Val Val Val Met
305 310 315 320
Thr Arg Asn His Pro Tyr Ala Gly Asn Tyr Val Val Ile Gln His Gly
325 330 335
Asn Thr Tyr Met Thr Arg Tyr Leu His Leu Ser Lys Ile Leu Val Lys
340 345 350
Lys Gly Gln Lys Val Ser Arg Gly Gln Arg Ile Gly Leu Ser Gly Asn
355 360 365
Thr Gly Arg Val Thr Gly Pro His Leu His Tyr Glu Leu Ile Val Arg
370 375 380
Gly Arg Pro Val Asn Ala Met Lys Ala Asn Ile Pro Met Ala Ser Ser
385 390 395 400
Val Pro Lys Lys Glu Met Ala Gln Phe Ile Ala Lys Arg Lys Glu Leu
405 410 415
Asp Gln Met Leu Ala Arg Gln Glu Ser Met Leu Ala Ala Gln
420 425 430
<210> 59
<211> 6
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 59
aggagg 6
<210> 60
<211> 243
<212> PRT
<213> Pseudomonas fluorescens
<400> 60
Met Arg Leu Thr Gln Ile Ile Ala Ala Ala Ala Ile Ala Leu Val Ser
1 5 10 15
Thr Phe Ala Leu Ala Asp Asp Ala Ala Glu Gln Thr Ile Arg Lys Ser
20 25 30
Leu Ala Asn Leu Ala Leu Asp Thr Pro Ile Glu Ser Ile Ser Ala Ser
35 40 45
Pro Met Ala Gly Leu Tyr Glu Val Lys Leu Lys Gly Ser Arg Val Leu
50 55 60
Tyr Ala Ser Ala Asp Gly Gln Tyr Ile Val Gln Gly Tyr Leu Phe Gln
65 70 75 80
Leu Lys Asp Gly Lys Pro Val Asn Leu Thr Glu Lys Ala Glu Arg Leu
85 90 95
Gly Val Ser Lys Leu Ile Asn Gly Ile Pro Val Ala Glu Thr Val Val
100 105 110
Tyr Pro Ala Ile Gly Glu Thr Lys Thr His Ile Thr Val Phe Thr Asp
115 120 125
Thr Thr Cys Pro Tyr Cys His Lys Leu His Ala Glu Ile Pro Ala Leu
130 135 140
Asn Lys Leu Gly Val Glu Val Arg Tyr Val Ala Phe Pro Arg Gln Gly
145 150 155 160
Leu Gly Ser Pro Gly Asp Glu Gln Leu Gln Ala Val Trp Cys Ser Ala
165 170 175
Asp Lys Lys Ala Ala Met Asp Lys Met Val Asp Gly Lys Glu Ile Lys
180 185 190
Ser Ala Lys Cys Ala Asn Pro Val Ser Lys Gln Phe Ala Leu Gly Gln
195 200 205
Ser Ile Gly Val Asn Gly Thr Pro Ala Ile Val Leu Ala Asp Gly Gln
210 215 220
Val Ile Pro Gly Tyr Gln Pro Ala Pro Gln Val Ala Lys Leu Ala Leu
225 230 235 240
Gly Ala Lys
<210> 61
<211> 1038
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 61
gcttgacgct gctgggcacc ggtgatgcgc ggcaggttcc ggtgcatggc tgcgagtgtg 60
ctgcgtgcgg gttggcgcgc agtgatcaaa gccgccccag ccgcaggtgc cgcgtaatca 120
caatgacctg acgctggcgc tgcagagcat cgaagacacc ggggcgcagt tggggggggc 180
tgacccatgt ggggcatacg ttggatacgt ggttgctggc gcatcgtcat gagttgcccc 240
gacatgtctc ggtaggttgg gacaatcgag tcgtgtaagg cgtggccttg ttagcaatca 300
gacaagaagc ttgatgttca gtttgttttt tccagtgtgt ttgattgttt ttctggatgt 360
ttgaagcgtg tcgcttgatt gagtcaagtt tgttgtttgc actttttttt cttcggtggc 420
atcaaggttt gagagtgctt gggggatgcg agtattccac ctcgaataaa acatgtgtgg 480
ttttattact gccatgttta atggtgggtt gttgaaatga aatgtgagcc cagtcactat 540
tcgctaaccc cccccgacaa gcctgcccag gcaggcgtct gtgtgccagg caacgacctc 600
ccgtggggtt ctcagtccag ggaaccccac gattgcacta gaacctttct cttacttctg 660
accgtatacg cgtgcggcgc tgcgtgcctg cttatcaagt gagcatggct actttcaagc 720
cacgttcatg tcgtgttttt ttcaccaaac tatcaggggt tggtgatgcc ttccggtttt 780
ttcagttatt caaaactccc gttgactcac tcactgggtt tattgcctgt gcgttattca 840
tgttcccgtt tcagaggtgt cggactgatc gcctgttgca gtgcattgaa tgactcatgt 900
gcggcagacg gaagtcgctg tatgtggaat gctgattttt tccttcatgt tctattctat 960
tgttcgccat tcaagttggt agtcgcctgg gggacgtgaa aaatatgagg gtggatgcat 1020
attcaattgc gtctcagg 1038
<210> 62
<211> 474
<212> PRT
<213> Escherichia coli
<400> 62
Met Lys Lys Thr Thr Leu Ala Leu Ser Ala Leu Ala Leu Ser Leu Gly
1 5 10 15
Leu Ala Leu Ser Pro Leu Ser Ala Thr Ala Ala Glu Thr Ser Ser Ala
20 25 30
Thr Thr Ala Gln Gln Met Pro Ser Leu Ala Pro Met Leu Glu Lys Val
35 40 45
Met Pro Ser Val Val Ser Ile Asn Val Glu Gly Ser Thr Thr Val Asn
50 55 60
Thr Pro Arg Met Pro Arg Asn Phe Gln Gln Phe Phe Gly Asp Asp Ser
65 70 75 80
Pro Phe Cys Gln Glu Gly Ser Pro Phe Gln Ser Ser Pro Phe Cys Gln
85 90 95
Gly Gly Gln Gly Gly Asn Gly Gly Gly Gln Gln Gln Lys Phe Met Ala
100 105 110
Leu Gly Ser Gly Val Ile Ile Asp Ala Asp Lys Gly Tyr Val Val Thr
115 120 125
Asn Asn His Val Val Asp Asn Ala Thr Val Ile Lys Val Gln Leu Ser
130 135 140
Asp Gly Arg Lys Phe Asp Ala Lys Met Val Gly Lys Asp Pro Arg Ser
145 150 155 160
Asp Ile Ala Leu Ile Gln Ile Gln Asn Pro Lys Asn Leu Thr Ala Ile
165 170 175
Lys Met Ala Asp Ser Asp Ala Leu Arg Val Gly Asp Tyr Thr Val Ala
180 185 190
Ile Gly Asn Pro Phe Gly Leu Gly Glu Thr Val Thr Ser Gly Ile Val
195 200 205
Ser Ala Leu Gly Arg Ser Gly Leu Asn Ala Glu Asn Tyr Glu Asn Phe
210 215 220
Ile Gln Thr Asp Ala Ala Ile Asn Arg Gly Asn Ser Gly Gly Ala Leu
225 230 235 240
Val Asn Leu Asn Gly Glu Leu Ile Gly Ile Asn Thr Ala Ile Leu Ala
245 250 255
Pro Asp Gly Gly Asn Ile Gly Ile Gly Phe Ala Ile Pro Ser Asn Met
260 265 270
Val Lys Asn Leu Thr Ser Gln Met Val Glu Tyr Gly Gln Val Lys Arg
275 280 285
Gly Glu Leu Gly Ile Met Gly Thr Glu Leu Asn Ser Glu Leu Ala Lys
290 295 300
Ala Met Lys Val Asp Ala Gln Arg Gly Ala Phe Val Ser Gln Val Leu
305 310 315 320
Pro Asn Ser Ser Ala Ala Lys Ala Gly Ile Lys Ala Gly Asp Val Ile
325 330 335
Thr Ser Leu Asn Gly Lys Pro Ile Ser Ser Phe Ala Ala Leu Arg Ala
340 345 350
Gln Val Gly Thr Met Pro Val Gly Ser Lys Leu Thr Leu Gly Leu Leu
355 360 365
Arg Asp Gly Lys Gln Val Asn Val Asn Leu Glu Leu Gln Gln Ser Ser
370 375 380
Gln Asn Gln Val Asp Ser Ser Ser Ile Phe Asn Gly Ile Glu Gly Ala
385 390 395 400
Glu Met Ser Asn Lys Gly Lys Asp Gln Gly Val Val Val Asn Asn Val
405 410 415
Lys Thr Gly Thr Pro Ala Ala Gln Ile Gly Leu Lys Lys Gly Asp Val
420 425 430
Ile Ile Gly Ala Asn Gln Gln Ala Val Lys Asn Ile Ala Glu Leu Arg
435 440 445
Lys Val Leu Asp Ser Lys Pro Ser Val Leu Ala Leu Asn Ile Gln Arg
450 455 460
Gly Asp Ser Thr Ile Tyr Leu Leu Met Gln
465 470
<210> 63
<211> 440
<212> PRT
<213> Escherichia coli
<400> 63
Met Gln Gln Ile Ala Arg Ser Val Ala Leu Ala Phe Asn Asn Leu Pro
1 5 10 15
Arg Pro His Arg Val Met Leu Gly Ser Leu Thr Val Leu Thr Leu Ala
20 25 30
Val Ala Val Trp Arg Pro Tyr Val Tyr His Arg Asp Ala Thr Pro Ile
35 40 45
Val Lys Thr Ile Glu Leu Glu Gln Asn Glu Ile Arg Ser Leu Leu Pro
50 55 60
Glu Ala Ser Glu Pro Ile Asp Gln Ala Ala Gln Glu Asp Glu Ala Ile
65 70 75 80
Pro Gln Asp Glu Leu Asp Asp Lys Ile Ala Gly Glu Ala Gly Val His
85 90 95
Glu Tyr Val Val Ser Thr Gly Asp Thr Leu Ser Ser Ile Leu Asn Gln
100 105 110
Tyr Gly Ile Asp Met Gly Asp Ile Thr Gln Leu Ala Ala Ala Asp Lys
115 120 125
Glu Leu Arg Asn Leu Lys Ile Gly Gln Gln Leu Ser Trp Thr Leu Thr
130 135 140
Ala Asp Gly Glu Leu Gln Arg Leu Thr Trp Glu Val Ser Arg Arg Glu
145 150 155 160
Thr Arg Thr Tyr Asp Arg Thr Ala Ala Asn Gly Phe Lys Met Thr Ser
165 170 175
Glu Met Gln Gln Gly Glu Trp Val Asn Asn Leu Leu Lys Gly Thr Val
180 185 190
Gly Gly Ser Phe Val Ala Ser Ala Arg Asn Ala Gly Leu Thr Ser Ala
195 200 205
Glu Val Ser Ala Val Ile Lys Ala Met Gln Trp Gln Met Asp Phe Arg
210 215 220
Lys Leu Lys Lys Gly Asp Glu Phe Ala Val Leu Met Ser Arg Glu Met
225 230 235 240
Leu Asp Gly Lys Arg Glu Gln Ser Gln Leu Leu Gly Val Arg Leu Arg
245 250 255
Ser Glu Gly Lys Asp Tyr Tyr Ala Ile Arg Ala Glu Asp Gly Lys Phe
260 265 270
Tyr Asp Arg Asn Gly Thr Gly Leu Ala Lys Gly Phe Leu Arg Phe Pro
275 280 285
Thr Ala Lys Gln Phe Arg Ile Ser Ser Asn Phe Asn Pro Arg Arg Thr
290 295 300
Asn Pro Val Thr Gly Arg Val Ala Pro His Arg Gly Val Asp Phe Ala
305 310 315 320
Met Pro Gln Gly Thr Pro Val Leu Ser Val Gly Asp Gly Glu Val Val
325 330 335
Val Ala Lys Arg Ser Gly Ala Ala Gly Tyr Tyr Val Ala Ile Arg His
340 345 350
Gly Arg Ser Tyr Thr Thr Arg Tyr Met His Leu Arg Lys Ile Leu Val
355 360 365
Lys Pro Gly Gln Lys Val Lys Arg Gly Asp Arg Ile Ala Leu Ser Gly
370 375 380
Asn Thr Gly Arg Ser Thr Gly Pro His Leu His Tyr Glu Val Trp Ile
385 390 395 400
Asn Gln Gln Ala Val Asn Pro Leu Thr Ala Lys Leu Pro Arg Thr Glu
405 410 415
Gly Leu Thr Gly Ser Asp Arg Arg Glu Phe Leu Ala Gln Ala Lys Glu
420 425 430
Ile Val Pro Gln Leu Arg Phe Asp
435 440
<210> 64
<211> 267
<212> PRT
<213> Escherichia coli
<400> 64
Met Pro Arg Leu Leu Ala Pro Leu Leu Ala Leu Ser Leu Leu Leu Leu
1 5 10 15
Ala Gly Gly Ala Gln Ala Ser Tyr Ile Thr Arg Thr Leu Asn Lys Pro
20 25 30
Val Pro Gly Gly Val Ala Val Val Asp Leu Gly Pro Ala Ala Ser Ala
35 40 45
Pro Ser Ala Arg Phe Asp Gly Lys Pro Val Leu Val Val Lys Glu Gln
50 55 60
Asp Asn Trp Leu Ala Ile Val Gly Ile Pro Leu Thr Gln Lys Pro Gly
65 70 75 80
Thr Ala Val Leu Ser Gln Gly Gly Arg Thr Leu Pro Phe Thr Val Gly
85 90 95
Ser Lys Lys Tyr Pro Glu Gln Arg Ile Thr Leu Lys Asn Thr Arg Gln
100 105 110
Val Asn Pro Asn Pro Ala Asp Leu Lys Arg Ile Asp Arg Glu Leu Ala
115 120 125
Glu Gln Ile Lys Ala Tyr Arg Ser Phe Ser Pro Thr Leu Pro Ser Asn
130 135 140
Leu Ile Leu Asp Lys Pro Val Ser Gly Pro Leu Ser Ser Lys Phe Gly
145 150 155 160
Val Arg Arg Phe Phe Asn Gly Glu Glu Arg Asn Pro His Ala Gly Leu
165 170 175
Asp Phe Ala Val Pro Ala Gly Thr Pro Ile Lys Thr Pro Ala Asn Gly
180 185 190
Lys Val Ile Leu Val Gly Asp Tyr Phe Phe Asn Gly Arg Thr Val Phe
195 200 205
Val Asp His Gly Gln Gly Phe Ile Ser Met Phe Cys His Met Ser Lys
210 215 220
Ile Asp Val Gln Val Gly Gln Gln Leu Arg Arg Gly Glu Val Val Gly
225 230 235 240
Arg Val Gly Ser Thr Gly Arg Ala Thr Gly Pro His Met His Trp Asn
245 250 255
Val Ser Leu Asn Asp Ala Arg Val Asp Pro Ala
260 265
<210> 65
<211> 470
<212> PRT
<213> Pseudomonas putida
<400> 65
Met Thr Asn Glu Pro Thr Lys Ala Pro Pro Leu Tyr Pro Lys Ser His
1 5 10 15
Leu Leu Ala Ala Ser Gly Ile Ala Ala Leu Leu Ser Leu Ala Leu Leu
20 25 30
Val Phe Pro Ser Ser Glu Val Glu Ala Lys Lys Thr Thr Leu Asn Leu
35 40 45
Glu Leu Glu Ser Pro Ala Glu Gln Leu Lys Gln Gln Glu Thr Thr Gln
50 55 60
Ala Asp Val Arg Glu Glu Thr Thr Ala Ser Pro Phe Ala Gln Ile Asp
65 70 75 80
Thr Ala Pro Ala Pro Thr Glu Glu Thr Ala Lys Thr Glu Pro Thr Pro
85 90 95
Thr Ala Glu Pro Ala Lys Asp Pro Ser His Arg Glu Val Thr Val Ala
100 105 110
Arg Gly Asp Thr Leu Ser Thr Leu Phe Ala Lys Val Gly Leu Pro Ala
115 120 125
Asn Val Val His Glu Val Leu Ala Ser Asn Lys Gln Ala Lys Gln Phe
130 135 140
Ser Gln Leu Lys His Gly Gln Val Leu Glu Ile Glu Leu Asp Lys Asp
145 150 155 160
Gly Gln Leu Ala Ser Leu His Ser Lys Val Ser Asp Leu Glu Thr Ile
165 170 175
Arg Leu Thr Lys Gly Asp Lys Gly Tyr Ala Phe Asn Arg Glu Ile Thr
180 185 190
Lys Pro Val Val Arg Ser Ala Tyr Val His Gly Val Ile Lys Ser Ser
195 200 205
Leu Ser Ala Ser Ala Gln Arg Ala Gly Leu Asn His Ser Leu Thr Met
210 215 220
Asp Met Ala Arg Ile Phe Gly Tyr Asp Ile Asp Phe Ala Gln Asp Ile
225 230 235 240
Arg Gln Gly Asp Glu Phe Asp Val Ile Tyr Glu Gln Lys Val Val Asn
245 250 255
Gly Lys Val Val Gly Asn Gly Asn Ile Leu Ser Ala Arg Phe Thr Asn
260 265 270
Arg Gly Lys Ser Phe Thr Ala Val Arg Tyr Thr Asn Lys Gln Gly Asn
275 280 285
Thr Ser Tyr Tyr Thr Ala Asp Gly Asn Ser Met Arg Lys Ala Phe Ile
290 295 300
Arg Thr Pro Val Asp Phe Ala Arg Ile Ser Ser Arg Phe Ser Ala Gly
305 310 315 320
Arg Lys His Pro Ile Leu Asn Lys Ile Arg Ala His Lys Gly Val Asp
325 330 335
Tyr Ala Ala Pro Arg Gly Thr Pro Ile Lys Ala Ala Gly Asp Gly Lys
340 345 350
Val Leu Leu Ala Gly Arg Arg Gly Gly Tyr Gly Asn Thr Val Ile Ile
355 360 365
Lys His Gly Asn Thr Tyr Gln Thr Leu Tyr Gly His Met Gln Gly Phe
370 375 380
Ala Lys Gly Ile Lys Thr Gly Gly Thr Val Lys Gln Gly Gln Val Ile
385 390 395 400
Gly Tyr Ile Gly Thr Thr Gly Leu Ser Thr Gly Pro His Leu His Tyr
405 410 415
Glu Phe Gln Val Asn Gly Val His Val Asp Pro Leu Gly Gln Lys Leu
420 425 430
Pro Met Ala Asp Pro Ile Ala Lys Ala Glu Arg Gln Arg Phe Leu Gln
435 440 445
Gln Ser Gln Pro Leu Met Ala Arg Met Glu Gln Glu Lys Ala Thr Met
450 455 460
Leu Ala Ser Ala Lys Arg
465 470
<210> 66
<211> 447
<212> PRT
<213> Pseudomonas aeruginosa
<400> 66
Met Phe Pro Ser Ser Glu Val Glu Ala Lys Arg Thr Thr Leu Asn Leu
1 5 10 15
Glu Leu Glu Ser Asn Thr Asp Arg Leu Leu Gln Glu Lys Asp Asp Leu
20 25 30
Leu Pro Gln Ser Val Thr Asn Ser Ser Asp Glu Gly Thr Pro Phe Ala
35 40 45
Gln Val Glu Gly Ala Ser Asp Asp Asn Thr Ala Glu Gln Asp Ser Asp
50 55 60
Lys Pro Gly Ala Ser Val Ala Asp Ala Asp Thr Lys Pro Val Asp Pro
65 70 75 80
Glu Trp Lys Thr Ile Thr Val Ala Ser Gly Asp Thr Leu Ser Thr Val
85 90 95
Phe Thr Lys Ala Gly Leu Ser Thr Ser Ala Met His Asp Met Leu Thr
100 105 110
Ser Ser Lys Asp Ala Lys Arg Phe Thr His Leu Lys Val Gly Gln Glu
115 120 125
Val Lys Leu Lys Leu Asp Pro Lys Gly Glu Leu Gln Ala Leu Arg Val
130 135 140
Lys Gln Ser Glu Leu Glu Thr Ile Gly Leu Asp Lys Thr Asp Lys Gly
145 150 155 160
Tyr Ser Phe Lys Arg Glu Lys Ala Gln Ile Asp Leu His Thr Ala Tyr
165 170 175
Ala His Gly Arg Ile Thr Ser Ser Leu Phe Val Ala Gly Arg Asn Ala
180 185 190
Gly Leu Pro Tyr Asn Leu Val Thr Ser Leu Ser Asn Ile Phe Gly Tyr
195 200 205
Asp Ile Asp Phe Ala Leu Asp Leu Arg Glu Gly Asp Glu Phe Asp Val
210 215 220
Ile Tyr Glu Gln His Lys Val Asn Gly Lys Gln Val Ala Thr Gly Asn
225 230 235 240
Ile Leu Ala Ala Arg Phe Val Asn Arg Gly Lys Thr Tyr Thr Ala Val
245 250 255
Arg Tyr Thr Asn Lys Gln Gly Asn Thr Ser Tyr Tyr Arg Ala Asp Gly
260 265 270
Ser Ser Met Arg Lys Ala Phe Ile Arg Thr Pro Val Asp Phe Ala Arg
275 280 285
Ile Ser Ser Arg Phe Ser Leu Gly Arg Arg His Pro Ile Leu Asn Lys
290 295 300
Ile Arg Ala His Lys Gly Val Asp Tyr Ala Ala Pro Ile Gly Thr Pro
305 310 315 320
Ile Lys Ala Thr Gly Asp Gly Lys Ile Leu Glu Ala Gly Arg Lys Gly
325 330 335
Gly Tyr Gly Asn Ala Val Val Ile Gln His Gly Gln Arg Tyr Arg Thr
340 345 350
Ile Tyr Gly His Met Ser Arg Phe Ala Lys Gly Ile Arg Ala Gly Thr
355 360 365
Ser Val Lys Gln Gly Gln Ile Ile Gly Tyr Val Gly Met Thr Gly Leu
370 375 380
Ala Thr Gly Pro His Leu His Tyr Glu Phe Gln Ile Asn Gly Arg His
385 390 395 400
Val Asp Pro Leu Ser Ala Lys Leu Pro Met Ala Asp Pro Leu Gly Gly
405 410 415
Ala Asp Arg Lys Arg Phe Met Ala Gln Thr Gln Pro Met Ile Ala Arg
420 425 430
Met Asp Gln Glu Lys Lys Thr Leu Leu Ala Leu Asn Lys Gln Arg
435 440 445
<210> 67
<211> 274
<212> PRT
<213> Pseudomonas putida
<400> 67
Met Pro Arg Phe Phe Ala Pro Leu Leu Leu Leu Cys Leu Thr Ser Phe
1 5 10 15
Asn Ala His Ala Asp Ser Tyr Ile Thr Arg Leu Leu Asn Lys Pro Val
20 25 30
Pro Gly Gly Val Ala Val Val Asp Leu Gly Ser Ala Thr Gln Ala Ser
35 40 45
Lys Ala Thr Tyr Gln Gly Lys Pro Val Leu Val Val Lys Glu Gln Asn
50 55 60
Asn Trp Leu Ala Ile Val Gly Val Pro Leu Thr Val Lys Pro Gly Ser
65 70 75 80
Gln Gln Ile Ser Ser Gly Gly Arg Asn Leu Pro Phe Thr Val Gly Asn
85 90 95
Lys Lys Tyr Pro Glu Gln His Ile Thr Leu Lys Asn Thr Gln Gln Val
100 105 110
Asn Pro Asn Pro Ala Asn Leu Lys Arg Ile Glu Gly Glu Leu Ala Glu
115 120 125
Gln Ile Lys Ala Tyr Arg Ser Phe Ser Pro Asn Thr Pro Ser Asn Leu
130 135 140
Leu Leu Asp Lys Pro Val Asn Gly Pro Leu Ser Ser Lys Phe Gly Val
145 150 155 160
Arg Arg Phe Phe Asn Gly Glu Glu Arg Asn Pro His Ala Gly Leu Asp
165 170 175
Phe Ala Val Pro Ala Gly Thr Pro Ile Lys Thr Pro Ala Ala Gly Lys
180 185 190
Val Ile Leu Thr Gly Asn Tyr Phe Phe Asn Gly Asn Thr Val Phe Val
195 200 205
Asp His Gly Gln Gly Phe Ile Ser Met Phe Cys His Met Ser Lys Ile
210 215 220
Asp Val Lys Val Gly Asp Gln Leu Ala Arg Gly Ala Val Val Gly Lys
225 230 235 240
Val Gly Ser Thr Gly Arg Ala Thr Gly Pro His Met His Trp Asn Ile
245 250 255
Ser Leu Asn Asp Ala Arg Val Asp Pro Ala Ile Phe Ile Gly Ala Phe
260 265 270
Gln Pro
<210> 68
<211> 282
<212> PRT
<213> Pseudomonas aeruginosa
<400> 68
Met Pro Arg Thr Leu Ala Phe Val Ser Thr Leu Leu Leu Ala Ala Phe
1 5 10 15
Cys Ala Leu Pro Thr Gln Ala Asp Ser Phe Ile Met Arg Leu Leu Asn
20 25 30
Lys Pro Val Pro Gly Gly Val Ala Val Val Asp Leu Gly Glu Glu Gly
35 40 45
Pro Pro Pro Arg Ala Phe Tyr Gln Gly Lys Pro Val Leu Val Val Arg
50 55 60
Glu Glu Gly Arg Arg Trp Ile Ala Val Val Gly Ile Pro Leu Ser Thr
65 70 75 80
Lys Pro Gly Pro Gln Lys Leu Glu Val Arg Ala Ala Thr Gly Asn His
85 90 95
Glu Glu Arg Phe Ser Val Gly Ser Lys His Tyr Arg Glu Gln Arg Ile
100 105 110
Thr Leu Lys Asn Lys Arg Gln Val Asn Pro Leu Pro Glu Asp Leu Lys
115 120 125
Arg Ile Glu Arg Glu Leu Ala Glu Gln Thr Ala Ala Tyr Arg Arg Phe
130 135 140
Ser Pro Gly Leu Pro Ser Asn Leu Met Leu Asp Lys Pro Val Asp Gly
145 150 155 160
Pro Leu Ser Ser Pro Phe Gly Leu Arg Arg Phe Phe Asn Gly Glu Glu
165 170 175
Arg Asn Pro His Ser Gly Leu Asp Phe Ala Val Pro Ala Gly Thr Pro
180 185 190
Ile Lys Ala Pro Ala Ala Gly Lys Val Ile Leu Ile Gly Asp Tyr Phe
195 200 205
Phe Asn Gly Lys Thr Val Phe Val Asp His Gly Gln Gly Phe Ile Ser
210 215 220
Met Phe Cys His Leu Ser Lys Ile Asp Val Lys Leu Gly Gln Gln Val
225 230 235 240
Pro Arg Gly Gly Val Leu Gly Lys Val Gly Ala Thr Gly Arg Ala Thr
245 250 255
Gly Pro His Met His Trp Asn Val Ser Leu Asn Asp Ala Arg Val Asp
260 265 270
Pro Ala Ile Phe Ile Gly Ala Phe Gln Pro
275 280
<210> 69
<211> 386
<212> PRT
<213> Pseudomonas fluorescens
<400> 69
Met Leu Lys Ala Leu Arg Phe Phe Gly Trp Pro Leu Leu Ala Gly Val
1 5 10 15
Leu Ile Ala Met Leu Ile Ile Gln Arg Tyr Pro Gln Trp Val Gly Leu
20 25 30
Pro Thr Leu Asp Val Asn Leu Gln Gln Ala Pro Gln Thr Asn Thr Val
35 40 45
Val Gln Gly Pro Val Thr Tyr Ala Asp Ala Val Val Ile Ala Ala Pro
50 55 60
Ala Val Val Asn Leu Tyr Thr Thr Lys Val Ile Asn Lys Pro Ala His
65 70 75 80
Pro Leu Phe Glu Asp Pro Gln Phe Arg Arg Tyr Phe Gly Asp Asn Gly
85 90 95
Pro Lys Gln Arg Arg Met Glu Ser Ser Leu Gly Ser Gly Val Ile Met
100 105 110
Ser Pro Glu Gly Tyr Ile Leu Thr Asn Asn His Val Thr Thr Gly Ala
115 120 125
Asp Gln Ile Val Val Ala Leu Arg Asp Gly Arg Glu Thr Leu Ala Arg
130 135 140
Val Val Gly Ser Asp Pro Glu Thr Asp Leu Ala Val Leu Lys Ile Asp
145 150 155 160
Leu Lys Asn Leu Pro Ala Ile Thr Leu Gly Arg Ser Asp Gly Leu Arg
165 170 175
Val Gly Asp Val Ala Leu Ala Ile Gly Asn Pro Phe Gly Val Gly Gln
180 185 190
Thr Val Thr Met Gly Ile Ile Ser Ala Thr Gly Arg Asn Gln Leu Gly
195 200 205
Leu Asn Ser Tyr Glu Asp Phe Ile Gln Thr Asp Ala Ala Ile Asn Pro
210 215 220
Gly Asn Ser Gly Gly Ala Leu Val Asp Ala Asn Gly Asn Leu Thr Gly
225 230 235 240
Ile Asn Thr Ala Ile Phe Ser Lys Ser Gly Gly Ser Gln Gly Ile Gly
245 250 255
Phe Ala Ile Pro Val Lys Leu Ala Met Glu Val Met Lys Ser Ile Ile
260 265 270
Glu His Gly Gln Val Ile Arg Gly Trp Leu Gly Ile Glu Val Gln Pro
275 280 285
Leu Thr Lys Glu Leu Ala Glu Ser Phe Gly Leu Thr Gly Arg Pro Gly
290 295 300
Ile Val Val Ala Gly Ile Phe Arg Asp Gly Pro Ala Gln Lys Ala Gly
305 310 315 320
Leu Gln Leu Gly Asp Val Ile Leu Ser Ile Asp Gly Ala Pro Ala Gly
325 330 335
Asp Gly Arg Lys Ser Met Asn Gln Val Ala Arg Ile Lys Pro Thr Asp
340 345 350
Lys Val Ala Ile Leu Val Met Arg Asn Gly Lys Glu Ile Lys Leu Ser
355 360 365
Ala Glu Ile Gly Leu Arg Pro Pro Pro Ala Thr Ala Pro Val Lys Glu
370 375 380
Glu Gln
385
<210> 70
<211> 293
<212> PRT
<213> Escherichia coli
<400> 70
Met Met Arg Ile Ala Leu Phe Leu Leu Thr Asn Leu Ala Val Met Val
1 5 10 15
Val Phe Gly Leu Val Leu Ser Leu Thr Gly Ile Gln Ser Ser Ser Val
20 25 30
Gln Gly Leu Met Ile Met Ala Leu Leu Phe Gly Phe Gly Gly Ser Phe
35 40 45
Val Ser Leu Leu Met Ser Lys Trp Met Ala Leu Arg Ser Val Gly Gly
50 55 60
Glu Val Ile Glu Gln Pro Arg Asn Glu Arg Glu Arg Trp Leu Val Asn
65 70 75 80
Thr Val Ala Thr Gln Ala Arg Gln Ala Gly Ile Ala Met Pro Gln Val
85 90 95
Ala Ile Tyr His Ala Pro Asp Ile Asn Ala Phe Ala Thr Gly Ala Arg
100 105 110
Arg Asp Ala Ser Leu Val Ala Val Ser Thr Gly Leu Leu Gln Asn Met
115 120 125
Ser Pro Asp Glu Ala Glu Ala Val Ile Ala His Glu Ile Ser His Ile
130 135 140
Ala Asn Gly Asp Met Val Thr Met Thr Leu Ile Gln Gly Val Val Asn
145 150 155 160
Thr Phe Val Ile Phe Ile Ser Arg Ile Leu Ala Gln Leu Ala Ala Gly
165 170 175
Phe Met Gly Gly Asn Arg Asp Glu Gly Glu Glu Ser Asn Gly Asn Pro
180 185 190
Leu Ile Tyr Phe Ala Val Ala Thr Val Leu Glu Leu Val Phe Gly Ile
195 200 205
Leu Ala Ser Ile Ile Thr Met Trp Phe Ser Arg His Arg Glu Phe His
210 215 220
Ala Asp Ala Gly Ser Ala Lys Leu Val Gly Arg Glu Lys Met Ile Ala
225 230 235 240
Ala Leu Gln Arg Leu Lys Thr Ser Tyr Glu Pro Gln Glu Ala Thr Ser
245 250 255
Met Met Ala Leu Cys Ile Asn Gly Lys Ser Lys Ser Leu Ser Glu Leu
260 265 270
Phe Met Thr His Pro Pro Leu Asp Lys Arg Ile Glu Ala Leu Arg Thr
275 280 285
Gly Glu Tyr Leu Lys
290
<210> 71
<211> 682
<212> PRT
<213> Escherichia coli
<400> 71
Met Asn Met Phe Phe Arg Leu Thr Ala Leu Ala Gly Leu Leu Ala Ile
1 5 10 15
Ala Gly Gln Thr Phe Ala Val Glu Asp Ile Thr Arg Ala Asp Gln Ile
20 25 30
Pro Val Leu Lys Glu Glu Thr Gln His Ala Thr Val Ser Glu Arg Val
35 40 45
Thr Ser Arg Phe Thr Arg Ser His Tyr Arg Gln Phe Asp Leu Asp Gln
50 55 60
Ala Phe Ser Ala Lys Ile Phe Asp Arg Tyr Leu Asn Leu Leu Asp Tyr
65 70 75 80
Ser His Asn Val Leu Leu Ala Ser Asp Val Glu Gln Phe Ala Lys Lys
85 90 95
Lys Thr Glu Leu Gly Asp Glu Leu Arg Ser Gly Lys Leu Asp Val Phe
100 105 110
Tyr Asp Leu Tyr Asn Leu Ala Gln Lys Arg Arg Phe Glu Arg Tyr Gln
115 120 125
Tyr Ala Leu Ser Val Leu Glu Lys Pro Met Asp Phe Thr Gly Asn Asp
130 135 140
Thr Tyr Asn Leu Asp Arg Ser Lys Ala Pro Trp Pro Lys Asn Glu Ala
145 150 155 160
Glu Leu Asn Ala Leu Trp Asp Ser Lys Val Lys Phe Asp Glu Leu Ser
165 170 175
Leu Lys Leu Thr Gly Lys Thr Asp Lys Glu Ile Arg Glu Thr Leu Thr
180 185 190
Arg Arg Tyr Lys Phe Ala Ile Arg Arg Leu Ala Gln Thr Asn Ser Glu
195 200 205
Asp Val Phe Ser Leu Ala Met Thr Ala Phe Ala Arg Glu Ile Asp Pro
210 215 220
His Thr Asn Tyr Leu Ser Pro Arg Asn Thr Glu Gln Phe Asn Thr Glu
225 230 235 240
Met Ser Leu Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Met Asp Asp
245 250 255
Asp Tyr Thr Val Ile Asn Ser Met Val Ala Gly Gly Pro Ala Ala Lys
260 265 270
Ser Lys Ala Ile Ser Val Gly Asp Lys Ile Val Gly Val Gly Gln Thr
275 280 285
Gly Lys Pro Met Val Asp Val Ile Gly Trp Arg Leu Asp Asp Val Val
290 295 300
Ala Leu Ile Lys Gly Pro Lys Gly Ser Lys Val Arg Leu Glu Ile Leu
305 310 315 320
Pro Ala Gly Lys Gly Thr Lys Thr Arg Thr Val Thr Leu Thr Arg Glu
325 330 335
Arg Ile Arg Leu Glu Asp Arg Ala Val Lys Met Ser Val Lys Thr Val
340 345 350
Gly Lys Glu Lys Val Gly Val Leu Asp Ile Pro Gly Phe Tyr Val Gly
355 360 365
Leu Thr Asp Asp Val Lys Val Gln Leu Gln Lys Leu Glu Lys Gln Asn
370 375 380
Val Ser Ser Val Ile Ile Asp Leu Arg Ser Asn Gly Gly Gly Ala Leu
385 390 395 400
Thr Glu Ala Val Ser Leu Ser Gly Leu Phe Ile Pro Ala Gly Pro Ile
405 410 415
Val Gln Val Arg Asp Asn Asn Gly Lys Val Arg Glu Asp Ser Asp Thr
420 425 430
Asp Gly Gln Val Phe Tyr Lys Gly Pro Leu Val Val Leu Val Asp Arg
435 440 445
Phe Ser Ala Ser Ala Ser Glu Ile Phe Ala Ala Ala Met Gln Asp Tyr
450 455 460
Gly Arg Ala Leu Val Val Gly Glu Pro Thr Phe Gly Lys Gly Thr Val
465 470 475 480
Gln Gln Tyr Arg Ser Leu Asn Arg Ile Tyr Asp Gln Met Leu Arg Pro
485 490 495
Glu Trp Pro Ala Leu Gly Ser Val Gln Tyr Thr Ile Gln Lys Phe Tyr
500 505 510
Arg Val Asn Gly Gly Ser Thr Gln Arg Lys Gly Val Thr Pro Asp Ile
515 520 525
Ile Met Pro Thr Gly Asn Glu Glu Thr Glu Thr Gly Glu Lys Phe Glu
530 535 540
Asp Asn Ala Leu Pro Trp Asp Ser Ile Asp Ala Ala Thr Tyr Val Lys
545 550 555 560
Ser Gly Asp Leu Thr Ala Phe Glu Pro Glu Leu Leu Lys Glu His Asn
565 570 575
Ala Arg Ile Ala Lys Asp Pro Glu Phe Gln Asn Ile Met Lys Asp Ile
580 585 590
Ala Arg Phe Asn Ala Met Lys Asp Lys Arg Asn Ile Val Ser Leu Asn
595 600 605
Tyr Ala Val Arg Glu Lys Glu Asn Asn Glu Asp Asp Ala Thr Arg Leu
610 615 620
Ala Arg Leu Asn Glu Arg Phe Lys Arg Glu Gly Lys Pro Glu Leu Lys
625 630 635 640
Lys Leu Asp Asp Leu Pro Lys Asp Tyr Gln Glu Pro Asp Pro Tyr Leu
645 650 655
Asp Glu Thr Val Asn Ile Ala Leu Asp Leu Ala Lys Leu Glu Lys Ala
660 665 670
Arg Pro Ala Glu Gln Pro Ala Pro Val Lys
675 680
<210> 72
<211> 214
<212> PRT
<213> Pseudomonas putida
<400> 72
Met Pro Met Leu Lys Arg Phe Ala Pro Leu Val Pro Leu Ala Leu Val
1 5 10 15
Thr Leu Leu Phe Gly Cys Ala Ala Gln Gly Pro Val Ser Gln Pro Gln
20 25 30
Asp His Thr Pro Ile Thr Ala Gln Ser Ala Ile Asn Ala Lys Ala Ser
35 40 45
Ser Ser Ser Val Phe Gly Glu Pro Glu Glu Leu Ala Thr Glu Asp Asp
50 55 60
Leu Ala Ser Phe Ser Gly Gly Lys Pro Tyr Gln Leu Pro Val Leu Ala
65 70 75 80
Asp Ser Ile Leu Glu Arg Gly Met Ser Leu Ile Gly Thr Arg Tyr Arg
85 90 95
Phe Gly Gly Thr Ser Glu Lys Ser Gly Phe Asp Cys Ser Gly Phe Ile
100 105 110
Gly Tyr Leu Phe Arg Glu Glu Ala Gly Met Thr Leu Pro Arg Ser Thr
115 120 125
Arg Glu Met Ile Asn Val Asp Ala Pro Lys Val Ala Arg Asn Lys Leu
130 135 140
Lys Pro Gly Asp Leu Leu Phe Phe Ser Thr Asn Gly Arg Gly Arg Val
145 150 155 160
Ser His Ala Gly Ile Tyr Leu Gly Asp Asn Gln Phe Ile His Ser Ser
165 170 175
Ser Arg Arg Ser Gly Gly Val Arg Ile Asp Ser Leu Gly Asp Arg Tyr
180 185 190
Trp Ser Lys Thr Phe Ile Glu Ala Lys Arg Ala Leu Ala Met Ala Pro
195 200 205
Thr Asn Ile Ala Arg Asn
210
<210> 73
<211> 189
<212> PRT
<213> Pseudomonas aeruginosa
<400> 73
Met Val Lys Ser Gln Pro Ile Leu Arg Tyr Ile Leu Arg Val Ala Pro
1 5 10 15
Ala Ile Ala Val Ala Val Leu Leu Ser Ala Cys Ser Ser Thr Ser Thr
20 25 30
Ala Arg Asn Met His Ser Glu Thr His Ala Val Gly Ser Gly Asp Leu
35 40 45
Ser Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu Thr Met Val Arg Asn
50 55 60
Leu Asp Val Lys Ser Arg Leu Met Asp Gln Tyr Ala Ser Trp Lys Gly
65 70 75 80
Val Arg Tyr Arg Leu Gly Gly Ser Thr Arg Lys Gly Ile Asp Cys Ser
85 90 95
Ala Phe Val Gln Arg Thr Phe Arg Glu Gln Phe Gly Leu Glu Leu Pro
100 105 110
Arg Ser Thr Ser Glu Gln Gln Glu Thr Gly Lys Ser Ile Ser Arg Thr
115 120 125
Gln Leu Arg Thr Gly Asp Leu Val Leu Phe Arg Ala Gly Ser Thr Gly
130 135 140
Arg His Val Gly Ile Tyr Leu Gly Asn Asn Gln Phe Val His Ala Ser
145 150 155 160
Thr Ser Ser Gly Val Thr Ile Ser Ser Met Asp Glu Pro Tyr Trp Lys
165 170 175
Lys Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser Arg Ser
180 185
<210> 74
<211> 1338
<212> DNA
<213> Pseudomonas fluorescens
<400> 74
atgtccatga ctccccgcga aatcgtccat gaactcaatc gccatatcat cggccaggac 60
gatgccaagc gcgccgttgc cattgcgctg cgtaaccgct ggcgccggat gcaactgccg 120
gaagaactgc gcgttgaagt aacgcccaag aacatcctga tgatcggccc caccggcgtg 180
ggtaaaaccg agatcgcccg gcgcctggcc aaactggcca atgcaccgtt catcaaggtc 240
gaagcgacca agttcaccga agtcggctat gtgggccgcg atgtcgagtc gatcattcgt 300
gacctggctg acgccgccct gaagatgctg cgcgaacagg aagtaaccaa ggtcagccac 360
cgcgccgaag acgccgctga agagcgcatc ctcgacgccc tgttgccacc ggcacgcatg 420
ggtttcaacg aagacgccgc accggctacc gattccaaca ctcgccagct gttccgcaag 480
cgcctgcgtg aaggccagct ggatgacaag gaaatcgaga tcgaagtggc tgaagtgtcc 540
ggcgtggata tttctgcccc gcctggcatg gaagaaatga ccagccagct gcagaacctg 600
ttcgccaaca tgggcaaggg caagaagaaa agccgcaagc tcaaggtgaa agaggcgctc 660
aagctcgtgc gcgacgaaga agccgggcgc ctggtcaatg aggaagaact caaggccaag 720
gccctggaag cggtcgagca acatggcatc gtgtttatcg acgagatcga caaagtggcc 780
aagcgaggca actcaggcgg cgtggatgtg tcccgcgaag gcgtgcagcg cgatttgctg 840
ccgctgatcg agggctgcac ggtcaacacc aagctgggca tggtcaagac tgaccacatc 900
ctgtttatcg cttccggtgc tttccacctg agcaagccca gcgacctggt gcccgagctg 960
caaggccgct tgccgattcg ggtggagctc aaggcgctga cgccgggcga cttcgagcgc 1020
atcctcagcg agccgcatgc ctcgctcacc gagcagtacc gcgagttgct gaaaaccgaa 1080
gggctgggta tcgaattcca ggcagacggg atcaagcgcc tggcggagat cgcctggcag 1140
gtcaacgaga agaccgagaa catcggtgcc cgtcgcctgc ataccttgct tgagcgcctg 1200
ctggaggaag tgtccttcag tgccggcgac atggccggtg cgcagaatgg cgaagcgatc 1260
aagatcgatg ctgattacgt caacagccac ttgggcgaat tggcgcagaa cgaagatctg 1320
tctcgttata tcctgtaa 1338
<210> 75
<211> 531
<212> DNA
<213> Pseudomonas fluorescens
<400> 75
atgaccacca tcgtttcagt acgtcgccac ggcaaagttg tcatgggcgg cgacggccag 60
gtttccctgg gcaacaccgt gatgaaaggc aacgccaaga aagtgcgccg cctgtaccac 120
ggccaggtgc ttgccggctt cgcaggcgca accgccgacg cctttaccct gttcgagcgt 180
ttcgaaggcc agcttgagaa acaccagggc cacctggtgc gcgccgctgt ggaactagcc 240
aaagaatggc gcaccgaccg ctccctcagc cgcctggagg ccatgctcgc ggttgcgaac 300
aaagacgctt ccctgatcat cactggcaac ggcgacgtgg ttgaacccga gcatggcctg 360
atcgccatgg gttccggcgg cggctacgcc caggctgcgg ccagcgcgct gttgaagaaa 420
accgacctgt cggcccgtga aatcgtcgag accgccctgg gtatcgctgg cgatatctgc 480
gtgttcacca accacaacca gaccattgag gagcaggacc tcgccgagta a 531
<210> 76
<211> 196
<212> PRT
<213> Pseudomonas fluorescens
<400> 76
Met Ser Lys Thr Leu Glu Phe Phe Phe Asp Leu Gly Ser Pro Ala Thr
1 5 10 15
Tyr Leu Ala Tyr Thr Arg Leu Pro Ala Leu Cys Ala Glu Thr Gly Ala
20 25 30
Gln Val Val Tyr Gln Pro Met Leu Leu Gly Gly Val Phe Lys Ala Thr
35 40 45
Gly Asn Ala Ser Pro Ile Thr Val Pro Ala Lys Gly Arg Tyr Met Leu
50 55 60
Asp Asp Leu Ala Arg Tyr Ala Lys Arg Tyr Asn Val Pro Leu Arg Phe
65 70 75 80
Asn Pro His Phe Pro Ile Asn Thr Leu Leu Leu Met Arg Ala Val Thr
85 90 95
Gly Ile Gln Ile His Gln Pro Glu Arg Phe Leu Asp Phe Ile Gly Cys
100 105 110
Leu Phe Arg Ala Leu Trp Val Glu Gly Arg His Leu Gly Asp Pro Glu
115 120 125
Val Val Ala Asn Val Leu Thr Glu Gln Gly Phe Asp Pro Glu Gln Val
130 135 140
Leu Ala Leu Ser Asn Asp Ala Ala Val Lys Asp Ala Leu Lys Asp Lys
145 150 155 160
Thr Glu Gln Ala Ile Lys Arg Gly Val Phe Gly Ala Pro Ser Phe Phe
165 170 175
Val Gly Asn Gln Leu Phe Phe Gly Gln Asp Arg Leu Asp Phe Val Arg
180 185 190
Glu Ala Leu Ser
195
<210> 77
<211> 211
<212> PRT
<213> Pseudomonas fluorescens
<400> 77
Met Arg Asn Leu Ile Leu Ser Ala Ala Leu Val Thr Ala Ser Leu Phe
1 5 10 15
Gly Met Thr Ala Gln Ala Ala Asp Val Pro Leu Glu Ala Gly Lys Thr
20 25 30
Tyr Val Glu Leu Ala Asn Pro Val Pro Val Ala Val Pro Gly Lys Ile
35 40 45
Glu Val Val Glu Leu Phe Trp Tyr Gly Cys Pro His Cys Tyr Ala Phe
50 55 60
Glu Pro Thr Ile Asn Pro Trp Ala Glu Lys Leu Pro Lys Asp Val Asn
65 70 75 80
Phe Arg Arg Ile Pro Ala Met Phe Gly Gly Pro Trp Asp Ala His Gly
85 90 95
Gln Leu Phe Leu Thr Leu Glu Ala Met Gly Val Glu His Lys Val His
100 105 110
Asn Ala Val Phe Glu Ala Ile Gln Lys Gln Gly Lys Arg Leu Thr Lys
115 120 125
Pro Asp Glu Met Ala Asp Phe Val Ala Thr Gln Gly Val Asp Lys Asp
130 135 140
Lys Phe Leu Ala Thr Phe Asn Ser Phe Ala Ile Gln Gly Gln Ile Lys
145 150 155 160
Gln Ala Lys Glu Leu Ala Gln Lys Tyr Gly Val Gln Gly Val Pro Thr
165 170 175
Leu Ile Val Asn Gly Lys Tyr Arg Phe Asp Leu Gly Ser Thr Gly Gly
180 185 190
Pro Glu Ala Thr Leu Asn Val Ala Asp Gln Leu Ile Ala Lys Glu Arg
195 200 205
Ala Ala Lys
210
<210> 78
<211> 168
<212> PRT
<213> Pseudomonas fluorescens
<400> 78
Met Ile Asp Asp Met Arg Leu Gly Arg Glu Arg Arg Phe Leu Val Leu
1 5 10 15
Leu Gly Ile Ile Cys Leu Ala Leu Ile Gly Gly Ala Leu Tyr Met Gln
20 25 30
Val Val Leu Gly Glu Ala Pro Cys Pro Leu Cys Ile Leu Gln Arg Tyr
35 40 45
Ala Leu Leu Leu Ile Ala Leu Phe Ala Phe Ile Gly Ala Ala Met Arg
50 55 60
Thr Lys Gly Ala Leu Thr Phe Phe Glu Gly Leu Val Val Leu Ser Ala
65 70 75 80
Leu Gly Gly Val Ala Ala Ala Gly His His Val Tyr Thr Gln Phe Phe
85 90 95
Pro Gln Val Ser Cys Gly Ile Asp Val Leu Gln Pro Ile Val Asp Asp
100 105 110
Leu Pro Leu Ala Lys Val Phe Pro Leu Gly Phe Gln Val Asp Gly Phe
115 120 125
Cys Ser Thr Pro Tyr Pro Pro Ile Leu Gly Leu Ser Leu Ala Gln Trp
130 135 140
Ala Leu Val Ala Phe Val Leu Thr Ala Ile Leu Val Pro Leu Cys Ile
145 150 155 160
Tyr Arg Asn Arg His Pro Lys Ala
165
<210> 79
<211> 729
<212> DNA
<213> Pseudomonas fluorescens
<400> 79
atgcgcttga cccagattat tgccgccgca gccattgcgt tggtttccac ctttgcgctc 60
gccgatgatg cggccgagca gaccatccgc aagagcctgg ccaacctggc gctcgacacg 120
cctatcgaaa gcattagcgc cagccccatg gccggcctgt acgaagtcaa gctcaagggc 180
agccgcgtgc tgtacgccag tgccgatggc cagtacatcg tccagggcta cctgttccag 240
ctcaaggacg gcaagccggt caacctgacc gagaaggccg agcgcctggg cgtgtccaag 300
ctgatcaacg gcatcccggt ggctgaaacc gtggtttacc cggccattgg cgaaaccaag 360
acccacatca ccgtgttcac cgacaccacc tgcccgtact gccacaagct gcacgctgaa 420
atcccggcac tgaacaagct gggcgtggaa gtgcgctacg tcgcgttccc gcgccagggc 480
ctgggttcgc cgggtgacga gcagttgcaa gccgtatggt gttcggccga caaaaaggcg 540
gccatggaca agatggtcga cggcaaggaa atcaaatcgg ccaaatgcgc caacccggtt 600
tccaagcagt tcgccctggg ccagtccatt ggtgtgaacg gtacaccggc catcgttttg 660
gccgacggcc aggtgattcc gggctaccag ccggcgccgc aagttgccaa actggcactg 720
ggtgccaag 729
<210> 80
<211> 575
<212> PRT
<213> Pseudomonas fluorescens
<400> 80
Met Arg His Leu Phe Thr Phe Leu Leu Val Leu Phe Ala Gly Phe Ala
1 5 10 15
Gln Ala Ala Pro Gly Ser Pro Phe Glu Thr Lys Pro Asp Phe Leu Pro
20 25 30
Val Gly Lys Ala Phe Ala Phe Thr Ser Glu Arg Leu Glu Ser Gly Glu
35 40 45
Thr Gln Leu Phe Trp Gln Ile Ala Asp Gly Tyr Tyr Leu Tyr Gln Gln
50 55 60
Arg Met Lys Phe Asp Gly Leu Ala Glu Lys Pro Val Leu Pro Glu Gly
65 70 75 80
Glu Ala His Ser Asp Glu Phe Phe Gly Glu Gln Gln Val Tyr Arg Gln
85 90 95
Gly Leu Glu Val Lys Ile Pro Ala Gly Thr Thr Gly Gln Val Lys Leu
100 105 110
Gly Trp Gln Gly Cys Ala Asp Ala Gly Leu Cys Tyr Pro Pro Gln Ser
115 120 125
Ile Thr Val Asp Leu Gly Gly Asn Pro Ala Val Ala Ala Thr Ala Gln
130 135 140
Ala Gln Asp Gln Ser Leu Ala Ser Gly Leu Gln Gln Arg Ser Leu Gly
145 150 155 160
Trp Ser Leu Leu Val Phe Phe Gly Leu Gly Leu Leu Leu Ala Phe Ala
165 170 175
Pro Cys Ser Leu Pro Met Leu Pro Ile Leu Ala Gly Leu Val Val Gly
180 185 190
Ser Gly Ala Ser Pro Arg Arg Gly Phe Ala Leu Ala Gly Ser Tyr Val
195 200 205
Val Cys Met Ala Leu Val Tyr Ala Ala Leu Gly Val Met Ala Ala Leu
210 215 220
Leu Gly Ala Asn Leu Ala Ala Leu Leu Gln Thr Pro Trp Ile Leu Gly
225 230 235 240
Ser Phe Ala Ala Leu Phe Val Leu Leu Ala Leu Pro Met Phe Gly Phe
245 250 255
Phe Glu Leu Gln Leu Pro Ala Phe Leu Arg Asp Arg Leu Asp Asn Val
260 265 270
Ser Arg Gln Gln Ser Gly Gly Ser Leu Val Gly Ala Gly Val Leu Gly
275 280 285
Ala Leu Ser Gly Leu Leu Val Gly Pro Cys Met Thr Ala Pro Leu Ala
290 295 300
Gly Ala Leu Leu Tyr Ile Ala Gln Ser Gly Asn Ala Leu His Gly Gly
305 310 315 320
Leu Ile Leu Phe Ala Met Gly Ile Gly Ile Gly Ile Pro Leu Leu Leu
325 330 335
Leu Val Thr Val Gly Asn Arg Phe Leu Pro Lys Pro Gly Thr Trp Met
340 345 350
Asn Val Leu Lys Gly Ile Phe Gly Phe Leu Phe Leu Gly Thr Ala Val
355 360 365
Leu Met Ile Arg Pro Val Val Gly Asp Ser Leu Trp Ile Gly Leu Trp
370 375 380
Gly Ala Leu Ala Leu Val Met Ala Tyr Cys Gly Trp Ala Leu Ala Arg
385 390 395 400
Glu Ser Gly Leu Ala Ala Lys Val Phe Gly Ala Gly Ser Leu Val Leu
405 410 415
Gly Leu Trp Gly Ala Val Leu Val Val Gly Ala Ala Gly Gly Ser Asp
420 425 430
Glu Leu Trp Gln Pro Leu Lys Val Tyr Ser Gly Ser Arg Val Ala Asp
435 440 445
Ala Pro Ser Ala His Asp Ala Phe Thr Thr Val Ser Asp Pro Ala Val
450 455 460
Leu Gln Ser Gln Leu Asp Ser Ala Lys Ala Gln Gly Gln Trp Val Leu
465 470 475 480
Leu Asp Tyr Tyr Ala Asp Trp Cys Val Ser Cys Lys Ile Met Glu Lys
485 490 495
Gln Val Phe Gly Lys Pro Glu Val Met Asp Ala Leu Lys Asp Val Arg
500 505 510
Leu Leu Arg Leu Asp Val Thr Ala Asp Asn Ala Ala Ser Arg Glu Leu
515 520 525
Leu Gly Arg Tyr Lys Val Pro Gly Pro Pro Ser Phe Val Trp Ile Gly
530 535 540
Pro Asp Gly Glu Glu Arg Arg Ala Gln Arg Ile Thr Gly Glu Val Asp
545 550 555 560
Ala Ala Ala Phe Leu Gln Arg Trp Thr Gln Thr Arg Asp Ala Arg
565 570 575
<210> 81
<211> 253
<212> PRT
<213> Pseudomonas fluorescens
<400> 81
Met Pro Arg Leu Arg His Leu Leu Thr Leu Leu Pro Leu Thr Leu Ala
1 5 10 15
Ala Ala Leu Ala Gln Ala Glu Asp Leu Pro Ala Pro Ile Lys Gln Ile
20 25 30
Glu Ala Lys Gly Ala Lys Ile Ile Gly Lys Phe Asp Ala Pro Ser Gly
35 40 45
Leu Thr Gly Tyr Ala Ala Gln Tyr Gln Asn Arg Gly Met Ala Leu Tyr
50 55 60
Leu Thr Ala Asp Gly Lys Asn Val Ile Ala Gly Asn Leu Tyr Asp Ala
65 70 75 80
Gln Gly Asn Asp Leu Ser Thr Ala Pro Leu Glu Lys Leu Val Tyr Ala
85 90 95
Pro Met Ala Lys Glu Val Trp Ala Lys Met Glu Asn Ser Ser Trp Ile
100 105 110
Gln Asp Gly Asp Lys Asn Ala Pro Arg Thr Ile Tyr Leu Phe Ser Asp
115 120 125
Pro Asn Cys Pro Tyr Cys Asn Met Phe Trp Glu Gln Ala Arg Pro Trp
130 135 140
Val Lys Ala Gly Lys Val Gln Leu Arg His Ile Met Val Gly Ile Ile
145 150 155 160
Arg Glu Asp Ser Pro Gly Lys Ser Ala Ala Leu Leu Ala Ala Lys Asp
165 170 175
Pro Gln Lys Ala Leu Gln Asp His Glu Ala Ala Gly Lys Gly Ser Lys
180 185 190
Leu Lys Ala Leu Glu Lys Ile Pro Ala Glu Val Glu Ala Lys Leu Asp
195 200 205
Ala Asn Met Lys Leu Met Asp Glu Leu Glu Leu Ser Ala Thr Pro Ala
210 215 220
Ile Phe Tyr Leu Asp Asp Lys Gly Gly Leu Gln Gln Gln Gln Gly Ala
225 230 235 240
Pro Ser Pro Asp Lys Leu Val Lys Ile Leu Gly Pro Lys
245 250
<210> 82
<211> 440
<212> PRT
<213> Mus musculus
<400> 82
Met Ala Arg Leu Val Leu Gly Leu Val Ser Cys Thr Phe Phe Leu Ala
1 5 10 15
Val Ser Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro
20 25 30
Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Gly Leu Trp Leu Val
35 40 45
Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu
50 55 60
Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala
65 70 75 80
Val Asn Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln
85 90 95
Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Pro Glu
100 105 110
Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu
115 120 125
Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Ser Gly
130 135 140
Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp Ser Ser Ser Lys Lys
145 150 155 160
Asp Val Val Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp
165 170 175
Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His
180 185 190
Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys
195 200 205
Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val
210 215 220
Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Lys Gly Phe Pro Thr Ile
225 230 235 240
Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg
245 250 255
Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn
260 265 270
Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile Ala Lys
275 280 285
Lys Thr Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His
290 295 300
Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu
305 310 315 320
Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp
325 330 335
Thr Glu Ala Gly Ala Gln Tyr Glu Leu Glu Asn Ala Leu Gly Ile Gly
340 345 350
Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys
355 360 365
Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe
370 375 380
Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly
385 390 395 400
Gly Ser Phe Pro Thr Ile Thr Pro Arg Glu Pro Trp Asp Gly Lys Asp
405 410 415
Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu
420 425 430
Asp Asp Leu Glu Lys Asp Glu Leu
435 440
<210> 83
<211> 445
<212> PRT
<213> Mus musculus
<400> 83
Met Arg Val Ile Gly Met Ala Arg Leu Val Leu Gly Leu Val Ser Cys
1 5 10 15
Thr Phe Phe Leu Ala Val Ser Gly Leu Tyr Ser Ser Ser Asp Asp Val
20 25 30
Ile Glu Leu Thr Pro Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp
35 40 45
Gly Leu Trp Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln
50 55 60
Arg Leu Thr Pro Glu Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val
65 70 75 80
Val Lys Val Gly Ala Val Asn Ala Asp Lys His Gln Ser Leu Gly Gly
85 90 95
Gln Tyr Gly Val Gln Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn
100 105 110
Lys Asn Lys Pro Glu Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile
115 120 125
Val Asp Ala Ala Leu Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu
130 135 140
Gly Gly Arg Ser Gly Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp
145 150 155 160
Ser Ser Ser Lys Lys Asp Val Val Glu Leu Thr Asp Asp Thr Phe Asp
165 170 175
Lys Asn Val Leu Asp Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala
180 185 190
Pro Trp Cys Gly His Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala
195 200 205
Ala Thr Glu Val Lys Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala
210 215 220
Val Asp Ala Thr Met Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Lys
225 230 235 240
Gly Phe Pro Thr Ile Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp
245 250 255
Tyr Asp Gly Gly Arg Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp
260 265 270
Leu Phe Ser Asp Asn Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn
275 280 285
Glu Asp Ile Ala Lys Lys Thr Cys Glu Glu His Gln Leu Cys Val Val
290 295 300
Ala Val Leu Pro His Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser
305 310 315 320
Tyr Leu Glu Val Leu Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met
325 330 335
Trp Gly Trp Leu Trp Thr Glu Ala Gly Ala Gln Tyr Glu Leu Glu Asn
340 345 350
Ala Leu Gly Ile Gly Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn
355 360 365
Ala Arg Lys Met Lys Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln
370 375 380
Gly Ile Asn Glu Phe Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr
385 390 395 400
Ala Pro Val Gly Gly Gly Ser Phe Pro Thr Ile Thr Pro Arg Glu Pro
405 410 415
Trp Asp Gly Lys Asp Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu
420 425 430
Ser Asp Val Glu Leu Asp Asp Leu Glu Lys Asp Glu Leu
435 440 445
<210> 84
<211> 440
<212> PRT
<213> Rattus norvegicus
<400> 84
Met Ala Arg Leu Val Leu Gly Leu Val Ser Cys Thr Phe Phe Leu Ala
1 5 10 15
Val Ser Ala Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro
20 25 30
Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val
35 40 45
Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu
50 55 60
Trp Lys Lys Ala Ala Ser Ala Leu Lys Asp Val Val Lys Val Gly Ala
65 70 75 80
Val Asn Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln
85 90 95
Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Pro Glu
100 105 110
Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu
115 120 125
Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Ser Gly
130 135 140
Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp Ser Ser Ser Lys Lys
145 150 155 160
Asp Val Val Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp
165 170 175
Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His
180 185 190
Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys
195 200 205
Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val
210 215 220
Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Lys Gly Phe Pro Thr Ile
225 230 235 240
Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg
245 250 255
Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn
260 265 270
Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile Ala Lys
275 280 285
Lys Thr Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His
290 295 300
Ile Leu Asp Thr Gly Ala Thr Gly Arg Asn Ser Tyr Leu Glu Val Leu
305 310 315 320
Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp
325 330 335
Thr Glu Ala Gly Ala Gln Tyr Glu Leu Glu Asn Ala Leu Gly Ile Gly
340 345 350
Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys
355 360 365
Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe
370 375 380
Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly
385 390 395 400
Gly Ser Phe Pro Asn Ile Thr Pro Arg Glu Pro Trp Asp Gly Lys Asp
405 410 415
Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu
420 425 430
Asp Asp Leu Glu Lys Asp Glu Leu
435 440
<210> 85
<211> 448
<212> PRT
<213> Equus caballus
<400> 85
Met Lys Pro Ala Ile Asn Gly Val Leu Phe Val Val Ser Pro Gly Leu
1 5 10 15
Met Ser Cys Thr Leu Phe Leu Ala Val Asn Gly Leu Tyr Ser Ser Ser
20 25 30
Asp Asp Val Ile Glu Leu Thr Pro Ser Asn Phe Asn Arg Glu Val Ile
35 40 45
Gln Ser Asp Ser Leu Trp Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly
50 55 60
His Cys Gln Arg Leu Thr Pro Glu Trp Lys Lys Val Ala Thr Ala Leu
65 70 75 80
Lys Asp Val Val Lys Val Gly Ala Val Asp Ala Asp Lys His Gln Ser
85 90 95
Leu Gly Gly Gln Tyr Gly Val Gln Gly Phe Pro Thr Ile Lys Ile Phe
100 105 110
Gly Ala Asn Lys Asn Arg Pro Glu Asp Tyr Gln Gly Gly Arg Ser Gly
115 120 125
Glu Ala Ile Val Asp Ala Ala Leu Ser Ala Leu Arg Gln Leu Val Lys
130 135 140
Asp Arg Leu Gly Gly Arg Ser Gly Gly Tyr Ser Ser Gly Lys Gln Gly
145 150 155 160
Arg Ser Glu Ser Ser Ser Lys Lys Asp Val Ile Glu Leu Thr Asp Asp
165 170 175
Ser Phe Asp Lys Asn Val Leu Asp Ser Glu Asp Val Trp Met Val Glu
180 185 190
Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Asn Leu Glu Pro Glu Trp
195 200 205
Ala Ala Ala Ala Thr Glu Val Lys Glu Gln Thr Lys Gly Lys Val Lys
210 215 220
Leu Ala Ala Val Asp Ala Thr Val Asn Gln Val Leu Ala Ser Arg Tyr
225 230 235 240
Gly Ile Arg Gly Phe Pro Thr Ile Lys Ile Phe Gln Lys Gly Glu Ser
245 250 255
Pro Val Asp Tyr Asp Gly Gly Arg Thr Arg Ser Asp Ile Ile Ser Arg
260 265 270
Ala Leu Asp Leu Phe Ser Asp Asn Ala Pro Pro Pro Glu Leu Leu Glu
275 280 285
Ile Ile Asn Glu Asp Ile Ala Lys Lys Thr Cys Glu Glu His Gln Leu
290 295 300
Cys Val Val Ala Val Leu Pro His Ile Leu Asp Thr Gly Ala Ala Gly
305 310 315 320
Arg Asn Ser Tyr Leu Glu Val Leu Leu Lys Leu Ala Asp Lys Tyr Lys
325 330 335
Lys Lys Met Trp Gly Trp Leu Trp Thr Glu Ala Gly Ala Gln Ser Glu
340 345 350
Leu Glu Thr Ala Leu Gly Ile Gly Gly Phe Gly Tyr Pro Ala Met Ala
355 360 365
Ala Ile Asn Ala Arg Lys Met Lys Phe Ala Leu Leu Lys Gly Ser Phe
370 375 380
Ser Glu Gln Gly Ile Asn Glu Phe Leu Arg Glu Leu Ser Phe Gly Arg
385 390 395 400
Gly Ser Thr Ala Pro Val Gly Gly Gly Ala Phe Pro Ala Ile Ser Thr
405 410 415
Arg Glu Pro Trp Asp Gly Lys Asp Gly Glu Leu Pro Val Glu Asp Asp
420 425 430
Ile Asp Leu Ser Asp Val Glu Leu Asp Asp Leu Glu Lys Asp Glu Leu
435 440 445
<210> 86
<211> 590
<212> PRT
<213> Sus scrofa
<400> 86
Met Ala Arg Leu Val Leu Gly Leu Met Ser Cys Thr Leu Phe Val Ala
1 5 10 15
Val Asn Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro
20 25 30
Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val
35 40 45
Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu
50 55 60
Trp Lys Lys Val Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala
65 70 75 80
Val Asp Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln
85 90 95
Gly Phe Pro Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg Pro Glu
100 105 110
Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu
115 120 125
Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Gly Gly
130 135 140
Gly Tyr Ser Ser Gly Lys Gln Gly Arg Ser Glu Gly Ser Gly Lys Lys
145 150 155 160
Asp Val Ile Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp
165 170 175
Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His
180 185 190
Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys
195 200 205
Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val
210 215 220
Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile
225 230 235 240
Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg
245 250 255
Thr Arg Ser Asp Ile Val Thr Arg Ala Leu Asp Leu Phe Ser Asp Asn
260 265 270
Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Ser Glu Asp Val Ala Lys
275 280 285
Lys Ser Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His
290 295 300
Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu
305 310 315 320
Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp
325 330 335
Thr Glu Ala Gly Ala Gln Thr Glu Leu Glu His Ala Leu Gly Ile Gly
340 345 350
Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys
355 360 365
Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe
370 375 380
Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly
385 390 395 400
Gly Ala Phe Pro Ala Ile Ser Thr Arg Glu Pro Trp Asp Gly Lys Asp
405 410 415
Gly Glu Val Ser Pro Ala Thr Arg Glu Pro Gly Asp Gly Lys Asp Gly
420 425 430
Gln Ala Ser Pro Ala Thr Arg Glu Pro Trp Asp Gly Lys Asp Gly Gln
435 440 445
Ala Ser Pro Ala Thr Arg Glu Pro Gly Asp Gly Lys Asp Gly Glu Ala
450 455 460
Ser Pro Ala Glu Pro Arg Gly Gln Asp Ala Ser Arg Leu Trp Leu Ser
465 470 475 480
Phe Leu Ala Ser Leu Gly Pro Glu Ala Gly Cys Glu Pro Gly Leu Cys
485 490 495
Ile Arg Ala Ala Pro Arg Ala Gly Pro Ala Val Ala Pro Pro Gly Pro
500 505 510
Arg Gly Leu Leu Leu Ser Ser Ser Ser Ala Pro Leu Pro Pro Ala Thr
515 520 525
Pro Gln Ala Lys Ala Pro Gly Ser Cys Ser Pro Gly His Ser Pro Gln
530 535 540
Ala Glu Arg Phe Ser Thr Trp Arg Glu Ala Gln Arg Gly His Phe Glu
545 550 555 560
Val Ser Leu Asp Ser Arg Thr Leu Pro Ser Gly Leu Glu Arg Pro Thr
565 570 575
Ser Val Ala Pro Gly Val Cys Pro Arg Asp Asp Gly Arg Ser
580 585 590
<210> 87
<211> 439
<212> PRT
<213> Mesocricetus auratus
<400> 87
Met Ala Arg Leu Gly Phe Gly Leu Val Ser Cys Thr Phe Phe Leu Ala
1 5 10 15
Ala Ser Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro
20 25 30
Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asn Ser Leu Trp Leu Val
35 40 45
Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu
50 55 60
Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala
65 70 75 80
Val Asp Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln
85 90 95
Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Pro Glu
100 105 110
Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu
115 120 125
Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Ser Gly Arg Ser Gly
130 135 140
Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp Ser Ser Ser Lys Lys
145 150 155 160
Asp Val Ile Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp
165 170 175
Ser Asp Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His
180 185 190
Cys Lys Asn Leu Glu Pro Glu Trp Ala Thr Ala Ala Thr Glu Val Lys
195 200 205
Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val
210 215 220
Asn Gln Val Leu Ala Asn Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile
225 230 235 240
Lys Ile Phe Gln Lys Gly Glu Ala Pro Val Asp Tyr Asp Gly Gly Arg
245 250 255
Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn
260 265 270
Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Val Ala Lys
275 280 285
Lys Met Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His
290 295 300
Ile Leu Asp Thr Gly Ala Ala Arg Asn Ser Tyr Leu Glu Ile Leu Leu
305 310 315 320
Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp Thr
325 330 335
Glu Ala Gly Ala Gln Ser Glu Leu Glu Asn Ala Leu Gly Ile Gly Gly
340 345 350
Phe Gly Tyr Pro Ala Met Ala Arg Ile Asn Ala Arg Lys Met Lys Phe
355 360 365
Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe Leu
370 375 380
Arg Glu Leu Ser Phe Gly Arg Ala Ser Thr Ala Pro Val Gly Gly Gly
385 390 395 400
Ser Phe Pro Ala Ile Thr Ala Arg Glu Pro Trp Asp Gly Arg Asp Gly
405 410 415
Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu Asp
420 425 430
Asp Leu Glu Lys Asp Glu Leu
435
<210> 88
<211> 440
<212> PRT
<213> Pongo abelii
<400> 88
Met Ala Leu Leu Val Leu Gly Leu Val Ser Cys Ala Phe Phe Leu Glu
1 5 10 15
Val Asn Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro
20 25 30
Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val
35 40 45
Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu
50 55 60
Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala
65 70 75 80
Val Asp Ala Asp Lys His His Ser Leu Gly Gly Gln Tyr Gly Val Gln
85 90 95
Gly Phe Pro Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg Pro Glu
100 105 110
Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu
115 120 125
Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Gln Ser Gly
130 135 140
Gly Tyr Ser Ser Gly Lys Gln Gly Arg Ser Asp Ser Ser Ser Lys Lys
145 150 155 160
Asp Val Ile Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val Leu Asp
165 170 175
Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His
180 185 190
Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Ser Glu Val Lys
195 200 205
Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val
210 215 220
Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile
225 230 235 240
Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg
245 250 255
Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn
260 265 270
Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Ser Glu Asp Ile Ala Lys
275 280 285
Arg Thr Cys Glu Glu His Gln Leu Cys Val Val Ser Val Leu Pro His
290 295 300
Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu
305 310 315 320
Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp
325 330 335
Thr Glu Ala Gly Ala Gln Ser Glu Leu Glu Thr Ala Leu Gly Ile Gly
340 345 350
Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys
355 360 365
Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe
370 375 380
Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly
385 390 395 400
Gly Ala Phe Pro Thr Ile Val Glu Arg Glu Pro Trp Asp Gly Arg Asp
405 410 415
Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu
420 425 430
Asp Asp Leu Gly Lys Asp Glu Leu
435 440
<210> 89
<211> 454
<212> PRT
<213> Ficedula albicollis
<400> 89
Met Arg Glu Ser His Lys Cys Ser Thr Gly Gln Leu Met Ser Leu Leu
1 5 10 15
Phe Leu Val Gly Thr Val Ser Cys Thr Leu Phe Leu Ala Val Asn Gly
20 25 30
Leu Tyr Ser Ala Ser Asp Asp Val Ile Glu Leu Thr Pro Thr Asn Phe
35 40 45
Asn Lys Glu Val Ile Gln Ser Glu Ser Leu Trp Leu Val Glu Phe Tyr
50 55 60
Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu Trp Lys Lys
65 70 75 80
Ala Ala Thr Ala Leu Lys Gly Val Val Lys Val Gly Ala Val Asp Ala
85 90 95
Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Arg Gly Phe Pro
100 105 110
Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Ala Glu Asp Tyr Gln
115 120 125
Gly Gly Arg Thr Ser Asp Ala Ile Val Asp Ala Ala Leu Ser Ala Leu
130 135 140
Arg Ser Leu Val Lys Glu Arg Leu Ser Gly Arg Ser Gly Gly Tyr Ser
145 150 155 160
Ser Gly Lys Gln Ser Arg Gly Ser Gly Gly Gly Asp Lys Lys Asp Val
165 170 175
Ile Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val Ile Asn Ser Asp
180 185 190
Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys
195 200 205
Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys Glu Gln
210 215 220
Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val Asn Gln
225 230 235 240
Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile Lys Ile
245 250 255
Phe Gln Lys Gly Glu Asp Pro Val Asp Tyr Asp Gly Gly Arg Thr Arg
260 265 270
Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn Ala Pro
275 280 285
Pro Pro Glu Leu Leu Glu Ile Ile Ser Glu Asp Val Leu Lys Ser Thr
290 295 300
Cys Asp Ala His Gln Leu Cys Ile Ile Ser Val Leu Pro His Ile Leu
305 310 315 320
Asp Thr Gly Ala Ser Gly Arg Asn Ser Tyr Leu Asp Val Met Leu Lys
325 330 335
Met Ala Glu Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp Thr Glu
340 345 350
Ala Gly Ala Gln Pro Asp Leu Glu Ser Ser Leu Gly Ile Gly Gly Phe
355 360 365
Gly Tyr Pro Ala Met Ala Ala Val Asn Ala Arg Lys Met Lys Phe Ala
370 375 380
Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe Leu Arg
385 390 395 400
Glu Leu Ser Val Gly Arg Gly Ser Thr Ala Pro Val Gly Gly Gly Ala
405 410 415
Phe Pro Lys Ile His Ser Val Glu Pro Trp Asp Gly Lys Asp Gly Glu
420 425 430
Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Asp Leu Asp Asp
435 440 445
Phe Gly Lys Asp Glu Leu
450
<210> 90
<211> 505
<212> PRT
<213> Homo sapiens
<400> 90
Met His Lys Ala Gln Lys Phe Ala Leu Gly Leu Leu Ala Ala Ala Ala
1 5 10 15
Val Ala Thr Ala Ser Asp Val Val Gln Leu Lys Lys Asp Thr Phe Asp
20 25 30
Asp Phe Ile Lys Thr Asn Asp Leu Val Leu Ala Glu Phe Phe Ala Pro
35 40 45
Trp Cys Gly His Cys Lys Ala Leu Ala Pro Glu Tyr Glu Glu Ala Ala
50 55 60
Thr Thr Leu Lys Glu Lys Asn Ile Lys Leu Ala Lys Val Asp Cys Thr
65 70 75 80
Glu Glu Thr Asp Leu Cys Gln Gln His Gly Val Glu Gly Tyr Pro Thr
85 90 95
Leu Lys Val Phe Arg Gly Leu Asp Asn Val Ser Pro Tyr Lys Gly Gln
100 105 110
Arg Lys Ala Ala Ala Ile Thr Ser Tyr Met Ile Lys Gln Ser Leu Pro
115 120 125
Ala Val Ser Glu Val Thr Lys Asp Asn Leu Glu Glu Phe Lys Lys Ala
130 135 140
Asp Lys Ala Val Leu Val Ala Tyr Val Asp Ala Ser Asp Lys Ala Ser
145 150 155 160
Ser Glu Val Phe Thr Gln Val Ala Glu Lys Leu Arg Asp Asn Tyr Pro
165 170 175
Phe Gly Ser Ser Ser Asp Ala Ala Leu Ala Glu Ala Glu Gly Val Lys
180 185 190
Ala Pro Ala Ile Val Leu Tyr Lys Asp Phe Asp Glu Gly Lys Ala Val
195 200 205
Phe Ser Glu Lys Phe Glu Val Glu Ala Ile Glu Lys Phe Ala Lys Thr
210 215 220
Gly Ala Thr Pro Leu Ile Gly Glu Ile Gly Pro Glu Thr Tyr Ser Asp
225 230 235 240
Tyr Met Ser Ala Gly Ile Pro Leu Ala Tyr Ile Phe Ala Glu Thr Ala
245 250 255
Glu Glu Arg Lys Glu Leu Ser Asp Lys Leu Lys Pro Ile Ala Glu Ala
260 265 270
Gln Arg Gly Val Ile Asn Phe Gly Thr Ile Asp Ala Lys Ala Phe Gly
275 280 285
Ala His Ala Gly Asn Leu Asn Leu Lys Thr Asp Lys Phe Pro Ala Phe
290 295 300
Ala Ile Gln Glu Val Ala Lys Asn Gln Lys Phe Pro Phe Asp Gln Glu
305 310 315 320
Lys Glu Ile Thr Phe Glu Ala Ile Lys Ala Phe Val Asp Asp Phe Val
325 330 335
Ala Gly Lys Ile Glu Pro Ser Ile Lys Ser Glu Pro Ile Pro Glu Lys
340 345 350
Gln Glu Gly Pro Val Thr Val Val Val Ala Lys Asn Tyr Asn Glu Ile
355 360 365
Val Leu Asp Asp Thr Lys Asp Val Leu Ile Glu Phe Tyr Ala Pro Trp
370 375 380
Cys Gly His Cys Lys Ala Leu Ala Pro Lys Tyr Glu Glu Leu Gly Ala
385 390 395 400
Leu Tyr Ala Lys Ser Glu Phe Lys Asp Arg Val Val Ile Ala Lys Val
405 410 415
Asp Ala Thr Ala Asn Asp Val Pro Asp Glu Ile Gln Gly Phe Pro Thr
420 425 430
Ile Lys Leu Tyr Pro Ala Gly Ala Lys Gly Gln Pro Val Thr Tyr Ser
435 440 445
Gly Ser Arg Thr Val Glu Asp Leu Ile Lys Phe Ile Ala Glu Asn Gly
450 455 460
Lys Tyr Lys Ala Ala Ile Ser Glu Asp Ala Glu Glu Thr Ser Ser Ala
465 470 475 480
Thr Glu Thr Thr Thr Glu Thr Ala Thr Lys Ser Glu Glu Ala Ala Lys
485 490 495
Glu Thr Ala Thr Glu His Asp Glu Leu
500 505
<210> 91
<211> 359
<212> PRT
<213> Schizosaccharomyces pombe
<400> 91
Met Arg Leu Pro Leu Leu Ser Phe Val Ile Phe Ala Leu Phe Ala Leu
1 5 10 15
Val Phe Ala Ser Gly Val Val Glu Leu Gln Ser Leu Asn Glu Leu Glu
20 25 30
Asn Thr Ile Arg Ala Ser Lys Lys Gly Ala Leu Ile Glu Phe Tyr Ala
35 40 45
Thr Trp Cys Gly His Cys Lys Ser Leu Ala Pro Val Tyr Glu Glu Leu
50 55 60
Gly Ala Leu Phe Glu Asp His Asn Asp Val Leu Ile Gly Lys Ile Asp
65 70 75 80
Ala Asp Thr His Ser Asp Val Ala Asp Lys Tyr His Ile Thr Gly Phe
85 90 95
Pro Thr Leu Ile Trp Phe Pro Pro Asp Gly Ser Glu Pro Val Gln Tyr
100 105 110
Ser Asn Ala Arg Asp Val Asp Ser Leu Thr Gln Phe Val Ser Glu Lys
115 120 125
Thr Gly Ile Lys Lys Arg Lys Ile Val Leu Pro Ser Asn Val Val Glu
130 135 140
Leu Asp Ser Leu Asn Phe Asp Lys Val Val Met Asp Asp Lys Lys Asp
145 150 155 160
Val Leu Val Glu Phe Tyr Ala Asp Trp Cys Gly Tyr Cys Lys Arg Leu
165 170 175
Ala Pro Thr Tyr Glu Thr Leu Gly Lys Val Phe Lys Asn Glu Pro Asn
180 185 190
Val Glu Ile Val Lys Ile Asn Ala Asp Val Phe Ala Asp Ile Gly Arg
195 200 205
Leu His Glu Val Ala Ser Phe Pro Thr Ile Lys Phe Phe Pro Lys Asp
210 215 220
Asp Lys Asp Lys Pro Glu Leu Tyr Glu Gly Asp Arg Ser Leu Glu Ser
225 230 235 240
Leu Ile Glu Tyr Ile Asn Lys Lys Ser Gly Thr Gln Arg Ser Pro Asp
245 250 255
Gly Thr Leu Leu Ser Thr Ala Gly Arg Ile Pro Thr Phe Asp Glu Phe
260 265 270
Ala Ala Glu Phe Leu Asp Met Ser Asn Ala Ala Lys Glu Val Val Leu
275 280 285
Glu Lys Val Lys Gln Leu Ala Leu Glu Asp Ser Ser Arg Trp Thr Lys
290 295 300
Tyr Tyr Lys Lys Val Phe Glu Lys Ile Leu Asn Asp Glu Asn Trp Val
305 310 315 320
His Lys Glu Ala Lys Arg Leu Ser Lys Leu Leu Arg Gln Lys Ser Ile
325 330 335
Ala Leu Ala Ser Ala Asp Asp Phe Lys Thr Arg Leu Asn Ile Leu Asn
340 345 350
Ser Phe Leu Pro Gly Asn His
355
<210> 92
<211> 435
<212> PRT
<213> Haemaphysalis longicornis
<220>
<221> MOD_RES
<222> (241)..(241)
<223> Any amino acid
<400> 92
Met Ala Thr Ala Leu Leu Ala Val Leu Ala Ala Leu Ser Pro Met Ala
1 5 10 15
Leu Ala Met Tyr Gly Pro His Thr Glu Val Val Asp Leu Ser Pro Ala
20 25 30
Asn Phe Lys Asn Arg Val Val Asp Ser Asp Glu Val Trp Ile Val Glu
35 40 45
Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Ser Phe Ala Pro Glu Tyr
50 55 60
Thr Lys Ala Ala Ala Ala Leu Lys Gly Ile Val Lys Val Gly Ala Val
65 70 75 80
Asp Ala Asp Lys Asp Lys Ser Leu Gly Gly Gln Tyr Gly Val Arg Gly
85 90 95
Phe Pro Thr Val Lys Ile Phe Gly Ala Asn Lys His Asn Pro Thr Asp
100 105 110
Tyr Ser Gly Pro Arg Thr Ala Asp Gly Val Ala Ser Ala Ala Leu Gln
115 120 125
Glu Ala Arg Lys Val Val Asp Gln Arg Leu Gly Arg Lys Thr Ser Gly
130 135 140
Gly Ser Ser Gly Gly Lys Ser Asp Val Val Glu Leu Asp Glu Ser Asn
145 150 155 160
Phe Glu Glu Leu Val Leu Lys Ser Asp Asp Leu Trp Leu Val Glu Phe
165 170 175
Phe Ala Pro Trp Cys Gly His Cys Lys Asn Leu Ala Pro His Trp Ala
180 185 190
Lys Ala Ala Thr Glu Leu Lys Gly Lys Val Lys Leu Gly Ala Val Asp
195 200 205
Ala Thr Val His Gln Gly Leu Ala Ser Gln Phe Asp Val Lys Gly Tyr
210 215 220
Pro Thr Ile Lys Phe Phe Pro Gly Gly Lys Lys Asp Arg His Ser Ala
225 230 235 240
Xaa Glu Tyr Asn Gly Gly Arg Thr Ala Asp Asp Ile Val Gln Trp Gly
245 250 255
Leu Asp Lys Ala Ala Glu Ser Ala Pro Ala Pro Glu Leu His Gln Val
260 265 270
Thr Ser Pro Ser Val Leu Lys Asp Ala Cys Glu Glu Ser Gln Leu Cys
275 280 285
Val Val Ser Val Leu Pro His Ile Tyr Asp Cys Gln Ser Glu Cys Arg
290 295 300
Gln Gly Tyr Leu Asp Val Leu Lys Arg Leu Gly Glu Lys Tyr Lys Arg
305 310 315 320
Asn Arg Trp Gly Trp Leu Trp Ser Glu Ala Leu Ala Gln Pro Lys Leu
325 330 335
Glu Glu Ala Leu Glu Ile Gly Gly Phe Gly Tyr Pro Ala Leu Ala Val
340 345 350
Leu Asn Ser Arg Lys Met Lys Tyr Ser Leu Leu Arg Gly Ser Phe Ser
355 360 365
Tyr Asp Gly Ile Asn Glu Phe Leu Arg Glu Leu Ala Val Gly Arg Gly
370 375 380
Ser Ser Val Pro Val Lys Gly Ala Lys Leu Pro Glu Val Gln Thr Val
385 390 395 400
Glu Pro Trp Asp Gly Lys Asp Ala Lys Leu Glu Glu Pro Glu Asp Ile
405 410 415
Asp Leu Ser Asp Val Glu Leu Glu Pro Glu Glu Pro Gly Lys Lys His
420 425 430
Val Glu Leu
435
<210> 93
<211> 482
<212> PRT
<213> Plasmodium chabaudi
<400> 93
Met Asn Ser Lys Tyr Phe Ser Phe Leu Leu Phe Leu Ile Pro Phe Leu
1 5 10 15
Phe Gln Asn Cys Val Arg Ser His Glu Asp Leu Phe Asn Glu His Val
20 25 30
Thr Ser Ile His Asp Gly Glu Leu Thr Asn Phe Ile Thr Lys Asn Asp
35 40 45
Ile Val Leu Val Met Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Arg
50 55 60
Leu Ile Pro Glu Tyr Asn Asp Ala Ala Ile Met Leu Ala Glu Lys Lys
65 70 75 80
Ser Glu Ile Lys Leu Ala Ser Val Asp Ala Thr Ile Glu Arg Gly Leu
85 90 95
Ser Gln Glu Tyr Gly Ile Thr Gly Tyr Pro Thr Met Ile Leu Phe Asn
100 105 110
Lys Lys Asn Arg Ile Asn Tyr Gly Gly Gly Arg Thr Ala Gln Thr Ile
115 120 125
Val Asp Trp Ile Leu Gln Met Thr Gly Pro Val Ser Thr Glu Ile Thr
130 135 140
Gly Asn Ile Glu Asp Val Leu Lys Glu Lys Asn Ile Asn Val Ala Phe
145 150 155 160
Tyr Ile Glu Tyr Thr Ser Glu Asp His Glu Leu Phe Lys Lys Phe Asn
165 170 175
Glu Val Gly Asp Lys Asn Arg Glu Ile Ala Lys Tyr Phe Met Lys Lys
180 185 190
Asn Asp Lys His Asn Lys Ile Tyr Cys Tyr Arg Lys Asp Glu Lys Thr
195 200 205
Val Glu Tyr Asp Glu Lys Thr Pro Leu Ser Asp Phe Ile Thr Ile Glu
210 215 220
Ser Phe Pro Leu Phe Gly Glu Ile Asn Thr Glu Asn Tyr Arg Phe Tyr
225 230 235 240
Ala Glu Ser Pro Lys Glu Leu Val Trp Val Cys Ala Thr Ile Glu Gln
245 250 255
Tyr Asn Glu Ile Lys Glu Glu Val Arg Leu Ala Ala Ala Glu Leu Arg
260 265 270
Asn Lys Thr His Phe Val Leu Leu Asn Ile Pro Glu Tyr Ala Asp His
275 280 285
Ala Lys Ala Ser Leu Gly Ile Asn Glu Phe Pro Gly Leu Ala Tyr Gln
290 295 300
Ser Ser Glu Gly Arg Tyr Val Leu Thr Asn Pro Lys Gln Ser Leu Lys
305 310 315 320
Asn His Lys Asp Ile Ile Thr Phe Phe Lys Asp Val Glu Ala Gly Lys
325 330 335
Ile Glu Lys Ser Leu Lys Ser Glu Pro Ile Pro Glu Glu Asp Lys Asp
340 345 350
Ala Pro Val Lys Val Val Val Gly Asn Ser Phe Ile Asp Val Val Leu
355 360 365
Lys Ser Gly Lys Asp Val Leu Ile Glu Ile Tyr Ala Pro Trp Cys Gly
370 375 380
His Cys Lys Lys Leu Glu Pro Val Tyr Glu Glu Leu Gly Arg Lys Leu
385 390 395 400
Lys Lys Tyr Asp His Ile Ile Val Ala Lys Met Asp Gly Thr Leu Asn
405 410 415
Glu Thr Ala Leu Lys Glu Phe Glu Trp Ser Gly Phe Pro Thr Ile Phe
420 425 430
Phe Val Lys Ala Gly Ser Lys Ile Pro Leu Pro Tyr Glu Gly Glu Arg
435 440 445
Ser Leu Lys Gly Phe Val Asp Phe Leu Asn Lys His Ser Thr Lys Thr
450 455 460
Pro Ile Thr Ile Asp Gly Val Ser Gln Ser Asp Asp Gly Ala Ser Glu
465 470 475 480
Glu Leu
<210> 94
<211> 514
<212> PRT
<213> Aspergillus steynii
<400> 94
Met Arg Ser Phe Thr Pro Trp Val Leu Gly Leu Leu Gly Ala Ser Ala
1 5 10 15
Val Val Ser Ala Gly Asp Ala Gln Ala Asp Val Pro Ser Asp Val Lys
20 25 30
Ser Leu Thr Gln Asp Thr Phe Asn Asp Phe Ile Lys Glu His Asp Leu
35 40 45
Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys Lys Ala Leu
50 55 60
Ala Pro Lys Tyr Glu Glu Ala Ala Ser Gln Leu Lys Asp Lys Asn Ile
65 70 75 80
Pro Leu Val Lys Ile Asp Cys Thr Glu Glu Glu Glu Leu Cys Arg Asp
85 90 95
Gln Gly Val Glu Gly Tyr Pro Thr Leu Lys Ile Phe Arg Gly Val Asp
100 105 110
Ser Ser Lys Pro Tyr Gln Gly Ala Arg Gln Thr Glu Ser Leu Val Ser
115 120 125
Tyr Met Ile Lys Gln Ser Leu Pro Ala Val Ser Ser Val Asn Glu Glu
130 135 140
Asn Leu Glu Asp Thr Lys Thr Met Asp Lys Ile Val Val Ile Gly Tyr
145 150 155 160
Phe Ser Ser Asp Asp Gln Ala Ala Asn Asp Ala Phe Asn Ala Leu Ala
165 170 175
Glu Ala Gln Arg Asp Asn Tyr Leu Phe Ala Ala Thr Asp Asp Ala Ala
180 185 190
Ile Ala Lys Ala Glu Gly Val Glu Gln Pro Ser Leu Val Leu Tyr Lys
195 200 205
Asp Phe Asp Glu Lys Lys Ala Ile Tyr Thr Gly Glu Ile Glu Gln Asp
210 215 220
Ala Val Leu Thr Trp Val Lys Thr Ala Ser Thr Pro Leu Val Gly Glu
225 230 235 240
Ile Gly Pro Glu Thr Tyr Ser Ser Tyr Ile Thr Ala Gly Ile Pro Leu
245 250 255
Ala Tyr Ile Phe Ala Glu Thr Ser Glu Glu Arg Glu Lys Phe Thr Glu
260 265 270
Asp Phe Lys Pro Ile Ala Glu Lys His Lys Gly Leu Ile Asn Ile Ala
275 280 285
Thr Ile Asp Ala Lys Met Phe Gly Ala His Ala Gly Asn Leu Asn Leu
290 295 300
Asp Pro Gln Thr Phe Pro Ala Phe Ala Ile Gln Asp Pro Glu Lys Lys
305 310 315 320
Ala Lys Tyr Pro Tyr Asp Gln Ser Lys Glu Ile Thr Ala Lys Asp Val
325 330 335
Gly Lys Phe Ile Gln Asp Val Leu Gly Gly Lys Val Glu Pro Ser Ile
340 345 350
Lys Ser Glu Pro Ile Pro Glu Ser Gln Glu Gly Pro Val Thr Val Val
355 360 365
Val Ala His Ser Tyr Lys Glu Leu Val Val Asp Asn Glu Lys Asp Val
370 375 380
Leu Leu Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala
385 390 395 400
Pro Lys Tyr Glu Glu Leu Ala Ser Leu Tyr Ala Asp Val Pro Asp Leu
405 410 415
Ala Ser Lys Val Thr Ile Ala Lys Ile Asp Ala Thr Ala Asn Asp Val
420 425 430
Pro Asp Ser Ile Thr Gly Phe Pro Thr Ile Lys Leu Tyr Pro Ala Gly
435 440 445
Gly Lys Asp Ala Pro Val Glu Tyr Ala Gly Ser Arg Thr Val Glu Asp
450 455 460
Leu Val Asn Phe Val Lys Glu Asn Gly Gln His Lys Val Asp Ala Leu
465 470 475 480
Ala Asn Thr Gln Glu Gly Gly Asp Ala Thr Glu Ser Pro Ser Ala Ser
485 490 495
Ser Glu Thr Glu Ala Pro Ala Ala Thr Asp Asp Lys Ala Asp His Asp
500 505 510
Glu Leu
<210> 95
<211> 530
<212> PRT
<213> Emmonsia crescens
<400> 95
Met Arg Gln Phe Arg Asp Phe Ala Phe Gly Leu Ala Ala Leu Gly Leu
1 5 10 15
Thr Ala Leu Ala Ser Ala Thr Glu Ala Glu Ala Glu Ser Asp Val His
20 25 30
Val Leu Lys Lys Asp Thr Phe Asn Asp Phe Met Asn Ser His Asp Leu
35 40 45
Val Leu Ala Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu
50 55 60
Ala Pro Glu Tyr Glu Val Ala Ala Thr Glu Leu Lys Glu Lys Asn Ile
65 70 75 80
His Leu Ala Lys Ile Asp Cys Thr Glu Glu Ala Asp Leu Cys Gln Glu
85 90 95
His Gly Val Glu Gly Tyr Pro Thr Leu Lys Ile Phe Arg Gly Leu Glu
100 105 110
Asn Val Lys Pro Tyr Thr Gly Pro Arg Lys Ser Gly Pro Ile Ala Ser
115 120 125
Phe Met Val Lys Gln Ser Leu Pro Pro Val Thr Thr Val Thr Ala Asp
130 135 140
Asn Ile Glu Asp Val Lys Thr Leu Asp Lys Ile Val Val Ile Gly Tyr
145 150 155 160
Phe Ala Glu Asp Asp Lys Ala Ser Asn Glu Thr Phe Thr Ala Val Ala
165 170 175
Glu Ala Leu Arg Asp Asp Tyr Leu Phe Ala Gly Thr Asn Asp Ala Lys
180 185 190
Leu Ala Ala Ala Glu Asp Val Lys Gln Pro Ala Ile Val Leu Tyr Lys
195 200 205
Glu Phe Asp Glu Arg Lys Ala Val Phe Lys Asn Lys Phe Val Gln Asp
210 215 220
Asp Ile Ser Lys Phe Val Lys Thr Ala Ser Ile Pro Leu Val Gly Glu
225 230 235 240
Val Gly Pro Asp Thr Tyr Ala Gly Tyr Met Ala Ser Gly Leu Pro Leu
245 250 255
Ala Tyr Val Phe Ala Glu Thr Pro Glu Glu Arg Glu Glu Phe Ala Ala
260 265 270
Met Leu Lys Pro Ile Ala Gln Lys Gln Lys Gly Ser Ile Asn Ile Ala
275 280 285
Thr Ile Asp Ala Lys Ala Phe Gly Ala His Ala Gly Asn Leu Asn Leu
290 295 300
Asp Pro Glu Lys Phe Pro Ala Phe Ala Ile Gln Asp Thr Thr Asn Asn
305 310 315 320
Lys Lys Tyr Pro Phe Asp Gln Thr Lys Lys Ile Thr His Asp Asp Ile
325 330 335
Ala Lys Phe Val Gln Asp Val Leu Asp Gly Lys Val Glu Pro Ser Ile
340 345 350
Lys Ser Glu Pro Ile Pro Glu Ser Gln Asp Ala Ala Val Thr Val Val
355 360 365
Val Ala His Ser Phe Gln Glu Ile Val Ile Asp Asn Asp Lys Asp Val
370 375 380
Leu Val Glu Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala
385 390 395 400
Pro Lys Tyr Glu Gln Leu Gly Gln Leu Tyr Ala Asp Val Pro Glu Phe
405 410 415
Ala Ser Lys Val Thr Ile Ala Lys Ile Asp Ala Thr Ala Asn Asp Val
420 425 430
Pro Glu Asp Ile Gln Gly Phe Pro Thr Ile Lys Leu Tyr Ala Ala Gly
435 440 445
Ser Lys Gly Ser Pro Val Asp Tyr Asp Gly Ser Arg Thr Ile Glu Asp
450 455 460
Leu Ala Lys Phe Val Arg Asp Asn Gly Lys His Gly Val Asp Ala Tyr
465 470 475 480
Val Ala Glu Lys Val Val Glu Asp Gly Gly Asp Val Thr Asn Ser Pro
485 490 495
Ala Ala Ala Ser Pro Ser Ser Thr Ala Ala Asp Lys Glu Ser Glu Thr
500 505 510
Ser Ser Ser Asp Asp Ala Glu Glu Thr Ala Glu Ala Pro Arg His Glu
515 520 525
Glu Leu
530
<210> 96
<400> 96
000
<210> 97
<211> 517
<212> PRT
<213> Aspergillus fumigatus
<400> 97
Met Arg Ser Phe Ala Pro Leu Val Leu Ser Leu Leu Gly Ala Ser Ala
1 5 10 15
Val Ala Ser Ala Asp Ala Thr Ala Asp Thr Thr Ser Asp Val Val Ser
20 25 30
Leu Thr Lys Asp Ser Phe Lys Asp Phe Met Lys Glu His Asp Leu Val
35 40 45
Leu Ala Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala
50 55 60
Pro Lys Tyr Glu Glu Ala Ala Thr Glu Leu Lys Gly Lys Asn Ile Pro
65 70 75 80
Leu Val Lys Val Asp Cys Thr Glu Glu Glu Asp Leu Cys Lys Glu Asn
85 90 95
Gly Val Glu Gly Tyr Pro Thr Leu Lys Ile Phe Arg Gly Pro Asp Ser
100 105 110
Ser Lys Pro Tyr Gln Gly Ala Arg Gln Ala Asp Ser Ile Val Ser Tyr
115 120 125
Met Ile Lys Gln Ser Leu Pro Ala Val Ser Ala Val Thr Glu Glu Asn
130 135 140
Leu Glu Glu Ile Lys Thr Met Asp Lys Ile Val Val Ile Gly Tyr Phe
145 150 155 160
Ala Ser Asp Asp Lys Ala Ala Asn Asp Val Phe Thr Ser Phe Ala Glu
165 170 175
Ser Gln Arg Asp Asn Tyr Leu Phe Ala Ala Thr Ser Asp Ser Ala Ile
180 185 190
Ala Lys Ala Glu Gly Val Lys Gln Pro Ser Ile Val Leu Tyr Lys Asp
195 200 205
Phe Asp Glu Lys Lys Ala Val Tyr Asp Gly Ala Ile Glu Gln Glu Ala
210 215 220
Ile Leu Ser Trp Val Lys Thr Ala Ser Thr Pro Leu Val Gly Glu Ile
225 230 235 240
Gly Pro Glu Thr Tyr Ser Ser Tyr Ile Thr Ala Gly Ile Pro Leu Ala
245 250 255
Tyr Ile Phe Ala Glu Thr Lys Glu Glu Arg Asp Gln Tyr Ala Glu Asp
260 265 270
Phe Lys Pro Val Ala Glu Lys His Lys Gly Ala Ile Asn Ile Ala Thr
275 280 285
Ile Asp Ala Lys Met Phe Gly Ala His Ala Gly Asn Leu Asn Leu Asp
290 295 300
Pro Gln Thr Phe Pro Ala Phe Ala Ile Gln Asp Pro Glu Lys Asn Ala
305 310 315 320
Lys Tyr Pro Tyr Asp Gln Ser Arg Glu Phe Asn Ala Lys Glu Ile Gly
325 330 335
Lys Phe Ile Gln Asp Val Leu Asp Gly Lys Val Glu Pro Ser Ile Lys
340 345 350
Ser Glu Pro Ile Pro Glu Thr Gln Glu Gly Pro Val Thr Val Val Val
355 360 365
Ala His Ser Tyr Gln Asp Ile Val Ile Asn Asn Asp Lys Asp Val Leu
370 375 380
Leu Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro
385 390 395 400
Lys Tyr Glu Glu Leu Ala Ala Leu Tyr Ala Gly Asp Phe Lys Asp Lys
405 410 415
Val Thr Ile Ala Lys Ile Asp Ala Thr Ala Asn Asp Val Pro Asp Ser
420 425 430
Ile Thr Gly Phe Pro Thr Ile Lys Leu Tyr Pro Ala Gly Ala Lys Asp
435 440 445
Ser Pro Val Glu Tyr Ser Gly Ser Arg Thr Val Glu Asp Leu Ala Asn
450 455 460
Phe Ile Lys Glu Asn Gly Lys Tyr Lys Val Asp Ala Leu Val Ala Ala
465 470 475 480
Ser Glu Lys Val Glu Glu Gly Pro Asp Val Thr Ala Ser Pro Ser Ala
485 490 495
Thr Ser Thr Glu Ala Glu Ala Pro Ala Ala Thr Gly Asp Glu Lys Gly
500 505 510
Asp His Asp Glu Leu
515
<210> 98
<211> 217
<212> PRT
<213> Pseudomonas fluorescens
<400> 98
Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro
1 5 10 15
Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu
20 25 30
Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn
35 40 45
Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu
50 55 60
Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile
65 70 75 80
Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln
85 90 95
Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala
100 105 110
Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala
115 120 125
Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile
130 135 140
Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu
145 150 155 160
Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp
165 170 175
Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln
180 185 190
Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile
195 200 205
Arg Gln Ile Ile Asn Glu Ser Lys Ser
210 215
Claims (114)
- 재조합 단백질 발현을 위한 재조합 그람 음성 박테리아 숙주 세포로서,
(a) 숙주 세포가 제1 프로테아제 활성이 결핍되어 있고, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고, 제1 프로테아제 활성의 결핍이 꼬리 특이적 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
(b) 숙주 세포가 제2 프로테아제 활성이 결핍되어 있고, 이때 제2 프로테아제 활성은 뮤레인(murein) DD-엔도펩티다제 활성이고, 제2 프로테아제 활성의 결핍이 뮤레인 DD-엔도펩티다제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되는 것인 재조합 그람 음성 박테리아 숙주 세포. - 제1항에 있어서, 추가로
(c) 숙주 세포가 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 이때 추가 프로테아제 활성의 결핍이 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 상기 추가 프로테아제가 (a) 및 (b)의 프로테아제와 상이하거나;
(d) 숙주 세포가 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 이때 자가용해 인자 활성의 결핍이 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되거나;
(e) 숙주 세포가 하나 이상의 불활성화된 프로테아제를 과발현하거나;
(f) 숙주 세포가 하나 이상의 폴딩 조절인자를 과발현하거나; 또는
(g) (c), (d), (e) 및 (f)의 임의의 조합인 재조합 그람 음성 박테리아 숙주 세포. - 제1항 또는 제2항에 있어서, 꼬리 특이적 프로테아제 활성의 결핍이 (i) 서열번호 33으로 제시된 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제, 서열번호 33의 상동체, 또는 서열번호 33과 적어도 30% 유사한 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제 관련 단백질; (ii) 서열번호 35로 제시된 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제, 서열번호 35의 상동체, 또는 서열번호 35와 적어도 30% 유사한 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제 관련 단백질; 또는 (iii) 서열번호 71로 제시된 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제, 서열번호 71의 상동체, 또는 서열번호 71과 적어도 30% 유사한 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 뮤레인 DD-엔도펩티다제 활성의 결핍이
(i) 서열번호 1로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 1의 상동체, 또는 서열번호 1과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
(ii) 서열번호 63으로 제시된 아미노산 서열을 가진 MepM 뮤레인 DD-엔도펩티다제, 서열번호 63의 상동체, 또는 서열번호 63과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
(iii) 서열번호 65로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 65의 상동체, 또는 서열번호 65와 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; 및
(iv) 서열번호 66으로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 66의 상동체, 또는 서열번호 66과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질
중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포. - 제2항 내지 제4항 중 어느 한 항에 있어서, (c)의 숙주 세포가 1개 내지 10개의 상이한 추가 프로테아제 활성이 결핍되어 있거나; (d)의 숙주 세포가 1개 내지 5개의 상이한 자가용해 인자 활성이 결핍되어 있거나; (e)의 숙주 세포가 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현하고, 이때 각각의 불활성화된 프로테아제가 상이하거나; (f)의 숙주 세포가 1개 내지 10개의 상이한 폴딩 조절인자를 과발현하거나; 또는 이들의 임의의 조합인 재조합 그람 음성 박테리아 숙주 세포.
- 제2항 내지 제5항 중 어느 한 항에 있어서,
(c)의 하나 이상의 추가 프로테아제 활성의 결핍이 세랄라이신(serralysin) 전구체, 막 국소화 프로테아제, 뮤레인 L,D 트랜스펩티다제, 헤모라이신(hemolysin) 전구체, D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 주변세포질 세린 엔도프로테아제, AAA+ 패밀리 단백질용해 기구, 및 (a)의 것과 상이한 뮤레인 DD-엔도펩티다제로부터 독립적으로 선택된 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
(d)의 하나 이상의 자가용해 인자 활성의 결핍이 S형 피오신(pyocin), 선형 그라미시딘(gramicidin) 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신(leukotoxin) 및 포린(porin)으로부터 독립적으로 선택된 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
(e)의 하나 이상의 불활성화된 프로테아제가 돌연변이체 주변세포질 세린 엔도프로테아제이고;
(f)의 하나 이상의 폴딩 조절인자가 디설파이드 이소머라제인 재조합 그람 음성 박테리아 숙주 세포. - 제6항에 있어서, 세랄라이신 전구체가
서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 및 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질
로부터 선택되고;
막 국소화 프로테아제가 서열번호 39로 제시된 아미노산 서열을 가진 HtpX, 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체, 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질이고;
뮤레인 L,D 트랜스펩티다제가 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제, 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체, 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질이고;
헤모라이신 전구체가 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체, 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체, 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질이고;
D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체가 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체, 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질이고;
주변세포질 세린 엔도프로테아제가
서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질;
서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP의 상동체; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질;
서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP의 상동체; 및 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질
로부터 선택되고;
AAA+ 패밀리 단백질용해 기구가 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하고;
뮤레인 DD-엔도펩티다제가
서열번호 3으로 제시된 아미노산 서열을 가진 슈도모나스 플루오레센스(P. fluorescens) MepM2 프로테아제; 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 및 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질
로부터 선택되고;
S형 피오신이 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신, 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체, 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질이고;
선형 그라미시딘 합성효소가 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소, 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체, 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질이고;
류코톡신이 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신, 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체, 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질이고;
ShlB 헤모라이신 수송체가 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체, 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체, 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질이고;
하나 이상의 과발현된 불활성화된 프로테아제 각각이 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이(E. coli) Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 및 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택되고;
하나 이상의 폴딩 조절인자 각각이 서열번호 60, 76, 77, 78, 80 및 81 중 어느 하나로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 하나로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제의 상동체; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 하나로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 결합 이소머라제 관련 단백질; 서열번호 27 및 82 내지 98 중 어느 하나로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제; 서열번호 27 및 82 내지 98 중 어느 하나로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제의 상동체; 및 서열번호 27 및 82 내지 98로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 단백질 디설파이드 이소머라제 관련 단백질로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포. - 제1항 내지 제7항 중 어느 한 항에 있어서, 돌연변이가 상응하는 유전자의 코딩 서열 또는 비코딩 서열에 있고, 돌연변이가 (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제8항에 있어서, (iii)의 미스센스 돌연변이가 보존적 또는 비보존적 아미노산 치환을 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제8항 또는 제9항에 있어서, 비코딩 서열이 조절 서열인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 그람 음성 박테리아 숙주 세포가 기능성 프로테아제 활성을 추가로 포함하고, 상기 기능성 프로테아제 활성은 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 그람 음성 박테리아 숙주 세포가 기능성 프로테아제 활성을 추가로 포함하고, 상기 기능성 프로테아제 활성은 서열번호 7로 제시된 아미노산 서열을 가진 MepS2; 서열번호 7로 제시된 아미노산 서열을 가진 MepS2의 상동체; 또는 서열번호 7로 제시된 슈도모나스 플루오레센스 MepS2 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS2 관련 단백질인 재조합 그람 음성 박테리아 숙주 세포.
- 제11항 또는 제12항에 있어서, 슈도모나드(Pseudomonad)인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 그람 음성 박테리아 숙주 세포가 슈도모나드이고, 제1 프로테아제 활성의 결핍이 슈도모나스 플루오레센스 Prc1을 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이, 및/또는 슈도모나스 플루오레센스 Prc2를 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 제2 프로테아제 활성이 제2 프로테아제 활성을 가진 프로테아제의 활성 부위 아미노산 또는 알로스테릭 부위 아미노산의 보존적 또는 비보존적 치환을 야기하는 돌연변이로 인해 결핍된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 제2 프로테아제 활성의 결핍이 제2 프로테아제 유전자의 적어도 하나의 돌연변이로부터 비롯되고, 이때 돌연변이가 (i) 서열번호 1의 잔기 134 내지 145 중 어느 하나 이상; (ii) 서열번호 1의 잔기 319 내지 411 중 어느 하나 이상; (iii) 서열번호 1의 잔기 361 내지 378 중 어느 하나 이상; (iv) 서열번호 1의 248, 319, 330, 332, 334, 337, 378, 410 및 411로부터 선택된 어느 하나 이상의 잔기; 또는 (i), (ii), (iii) 및 (iv)의 임의의 조합에 상응하는 위치에서 아미노산 서열의 파괴를 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 박테리아 숙주 세포가 슈도모나스 플루오레센스이고, 제2 프로테아제 활성의 결핍이 Y248stop, G332S, D334N, A337T, H411Y, P410L로부터 선택된 서열번호 1의 아미노산 치환, 및 R319, H330, D334, H378 및 H411 중 어느 하나의 임의의 보존적 또는 비보존적 아미노산 치환을 야기하는 유전자 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 배양물에서 고밀도 세포 생장을 할 수 있는 재조합 그람 음성 박테리아 숙주 세포.
- 제18항에 있어서, 배양물에서의 고밀도 세포 생장이 약 80 내지 약 300의 OD575까지의 생장을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제18항 또는 제19항에 있어서, 배양물에서의 고밀도 세포 생장이 대조군 세포에 비해 약 2배 내지 약 15배 증가되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제20항에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
(i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
(ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(c)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(c)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
(iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포. - 제21항에 있어서, 2(c)의 추가 프로테아제 활성이 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 각각 포함하는 적어도 하나의 발현 구축물을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
- 제23항에 있어서, 관심 있는 재조합 단백질이 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 또는 이종인 재조합 그람 음성 박테리아 숙주 세포.
- 제23항에 있어서, 관심 있는 재조합 단백질이 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 항체 기반 약물, 비항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제23항 내지 제25항 중 어느 한 항에 있어서, 관심 있는 재조합 단백질이 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질인 재조합 그람 음성 박테리아 숙주 세포.
- 제25항 또는 제26항에 있어서, 항체, 항체 단편 또는 이의 유도체가 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디(bibody); 트리바디(tribody); 인트라바디; 나노바디; 소형 모듈식 면역약제(SMIP); 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; 및 VHH로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제27항에 있어서, VHH 함유 항체가 VHH 연쇄(concatenated) 항체인 재조합 그람 음성 박테리아 숙주 세포.
- 제25항 내지 제28항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체가 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자, 및 혈액 인자로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제25항 내지 제29항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체가 Fab'인 재조합 그람 음성 박테리아 숙주 세포.
- 제30항에 있어서, Fab'가 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제25항 내지 제31항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄가 전체 길이 또는 중쇄 단편이고, 경쇄가 전체 길이 또는 경쇄 단편인 재조합 그람 음성 박테리아 숙주 세포.
- 제32항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제32항 또는 제33항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 동일한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제32항 또는 제33항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 상이한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제34항 또는 제35항에 있어서, 각각의 중쇄 코딩 핵산 서열 및 각각의 경쇄 코딩 핵산 서열이 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제36항에 있어서, 주변세포질 분비 신호가 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제34항 내지 제37항 중 어느 한 항에 있어서, 발현 구축물이, 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 항체 중쇄를 코딩하는 핵산 서열; 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 경쇄를 코딩하는 핵산 서열; 또는 이들 둘 다를 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제25항 내지 제38항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체가 인간화된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제30항 내지 제39항 중 어느 한 항에 있어서, Fab'가 세르톨리주맙(certolizumab)인 재조합 그람 음성 박테리아 숙주 세포.
- 제40항에 있어서, Fab' 중쇄가 서열번호 21로 제시된 아미노산 서열을 갖고, Fab' 경쇄가 서열번호 23으로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제32항 내지 제41항 중 어느 한 항에 있어서, 중쇄를 코딩하는 핵산 서열이 서열번호 11로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결되고, 경쇄를 코딩하는 핵산 서열이 서열번호 13으로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제42항 중 어느 한 항에 있어서,
(i) 제1 프로테아제 활성;
(ii) 제2 프로테아제 활성;
(iii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체, 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체, 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성;
(iv) 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및
(v) 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질
이 결핍된 재조합 그람 음성 박테리아 숙주 세포. - 제43항에 있어서, 숙주 세포가 외인성 불활성화된 DegP를 추가로 과발현하고, 불활성화된 DegP는 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 및 위치 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 하나 이상의 위치의 보존적 또는 비보존적 아미노산 치환 또는 파괴를 포함하는 서열번호 31로 제시된 아미노산 서열을 가진 각각의 프로테아제로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제43항 또는 제44항에 있어서, 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 또는 73으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 이소머라제; 및 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 및 73으로 제시된 아미노산 서열을 가진 디설파이드 이소머라제의 상동체 중 어느 하나로부터 선택된 외인성 디설파이드 이소머라제를 과발현하는 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 슈도모나드 숙주 세포; 이. 콜라이 숙주 세포; 및 비브리오 숙주 세포로부터 선택된 재조합 그람 음성 박테리아 숙주 세포.
- 제46항에 있어서, 슈도모나스 숙주 세포가 슈도모나스 숙주 세포인 재조합 그람 음성 박테리아 숙주 세포.
- 제47항에 있어서, 슈도모나스 숙주 세포가 슈도모나스 플루오레센스, 슈도모나스 푸티다(P. putid) 또는 슈도모나스 에루기노사(P. aeruginosa)인 재조합 그람 음성 박테리아 숙주 세포.
- 제47항 또는 제48항에 있어서, 세포가
(i) lsc::lacIQ1;
(ii) Prc1-;
(ii) Prc2-;
(iii) HslU-;
(iv) HslV-;
(v) MepM1-;
(vi) PyrF-; 및
(vii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체의 결핍
을 나타내고, 세랄라이신 전구체 결핍이 세랄라이신 전구체를 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포. - 제49항에 있어서, 세포가 슈도모나스 플루오레센스이고, Prc1이 서열번호 33으로 제시된 아미노산 서열을 갖고, Prc2가 서열번호 35로 제시된 아미노산 서열을 갖고, HslU가 서열번호 37로 제시된 아미노산 서열을 갖고, HslV가 서열번호 38로 제시된 아미노산 서열을 갖고, MepM1이 서열번호 1로 제시된 아미노산 서열을 갖고, 세랄라이신 전구체가 서열번호 9로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제50항에 있어서, DegP2 S219A(서열번호 29)를 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
- 제50항 또는 제51항에 있어서, 디설파이드 이소머라제 PDIA6(서열번호 27)을 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
- 제1항 내지 제52항 중 어느 한 항에 있어서, 재조합 단백질을 코딩하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
- 제53항에 있어서, 발현 벡터가 Fab'를 코딩하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제54항에 있어서, DegP2 S219A 또는 디설파이드 이소머라제 PDIA6을 코딩하는 핵산 서열을 포함하는 발현 벡터가 Fab'를 코딩하는 핵산 서열을 추가로 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제54항 또는 제55항에 있어서, Fab' 중쇄가 서열번호 21에 의해 코딩되고, Fab' 경쇄가 서열번호 23에 의해 코딩되는 것인 재조합 그람 음성 박테리아 숙주 세포.
- 제1항에 있어서, 균주 STR94975, STR94976 또는 STR94977의 유전형을 가진 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포.
- 제57항에 있어서, 재조합 항-TNF-알파 Fab'를 생성하는 데 사용하기 위한, STR94975, STR94976 또는 STR94977의 발현 구축물 또는 구축물들을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
- 관심 있는 재조합 단백질의 제조 방법으로서, (a) 적합한 발효 조건 하에서 배양된 제1항 내지 제57항 중 어느 한 항의 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하고, 상기 재조합 그람 음성 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 핵산을 포함하는 플라스미드로 형질전환된 것인 관심 있는 재조합 단백질의 제조 방법.
- 제59항에 있어서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열의 전사가 유도성 프로모터에 의해 조절되는 것인 방법.
- 제60항에 있어서, 유도성 프로모터가 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터 및 아라비노스 프로모터로부터 선택되는 것인 방법.
- 제59항 내지 제61항 중 어느 한 항에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 높은 세포 밀도까지 생장할 수 있는 것인 방법.
- 제62항에 있어서, 높은 세포 밀도가 약 80 내지 약 300의 OD575를 포함하는 것인 방법.
- 제58항 내지 제63항 중 어느 한 항에 있어서, 적합한 발효 조건이 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 33℃의 온도, 유가식, 및 약 0.2 내지 약 5 g/ℓ의 역가 범위에서 유도성 프로모터의 유도를 포함하는 것인 방법.
- 제64항에 있어서, 유도성 프로모터를 IPTG로 유도하고, IPTG를 약 0.08 내지 0.3 mM의 최종 농도로 첨가하는 것인 방법.
- 제65항에 있어서, IPTG를 약 0.2 mM의 최종 농도로 첨가하는 것인 방법.
- 제63항 내지 제66항 중 어느 한 항에 있어서, 유도를 약 6.0 내지 약 6.5의 배양 pH에서 수행하는 것인 방법.
- 제63항 내지 제67항 중 어느 한 항에 있어서, 유도를 약 28℃ 내지 33℃의 온도에서 수행하는 것인 방법.
- 제68항에 있어서, 유도를 약 32℃의 온도에서 수행하는 것인 방법.
- 제59항 내지 제69항 중 어느 한 항에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 동일한 발효 조건 하에서 생장된 대조군 세포에 비해 증가된 세포 밀도로 생장하는 것인 방법.
- 제70항에 있어서, 세포 밀도의 증가가 약 2배 내지 약 15배인 방법.
- 제59항 내지 제71항 중 어느 한 항에 있어서, (b) 재조합 그람 음성 박테리아 숙주 세포로부터 회수된 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
- 제72항에 있어서, 온전한, 가용성 및/또는 활성 재조합 단백질의 측정된 수율이 약 0.1 내지 약 10 g/ℓ인 방법.
- 제72항 또는 제73항에 있어서, (c) 대조군 세포로부터 회수된 온전한, 가용성, 활성 또는 이들의 조합인 관심 있는 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
- 제74항에 있어서, (d) 단계 (b)에서 측정된 수율을 단계 (c)에서 측정된 수율과 비교하는 단계를 추가로 포함하는 방법.
- 제75항에 있어서, 단계 (b)에서 측정된 수율이 단계 (c)에서 측정된 수율보다 약 2배 내지 약 100배 더 높은 것인 방법.
- 제70항 내지 제76항 중 어느 한 항에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
(i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
(ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(a)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(a)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
(iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
로부터 선택되는 것인 방법. - 제1항 내지 제45항 및 제47항 내지 제77항 중 어느 한 항에 있어서, 이. 콜라이가 아닌 재조합 그람 음성 박테리아 숙주 세포.
- 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드로서, 분비 신호 펩티드가 서열번호 11로 제시된 아미노산 서열을 가진 것인 재조합 폴리펩티드.
- 제79항에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 재조합 폴리펩티드.
- 제79항 또는 제80항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머(concatemer); F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 재조합 폴리펩티드.
- 제80항 또는 제81항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 재조합 폴리펩티드.
- 제80항에 있어서, 효소가 치료 효소인 재조합 폴리펩티드.
- 제83항에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제(uricase); 로다나제(rhodanase); 유로키나제(urokinase); 스트렙토키나제(streptokinase); 스타필로키나제(staphylokinase); 페닐라제(phenylase); 사크로시다제(sacrosidase); 라이소자임(lysozyme); 키티나제(chitinase); 리보뉴클레아제(ribonuclease); 글루타미나제(glutaminase); 아르기나제(arginase); 비브릴라제(vibrilase); 콘드로이티나제(chondroitinase); 히알루로니다제(hyaluronidase); 갈락토시다제(galactosidase); 글루쿠로니다제(glucuronidase); 글루코세레브로시다제(glucocerebrosidase); 티미딘 포스포릴라제(phosphorylase); 카보닉 안하이드라제(carbonic anhydrase); 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제(sulfurtransferase); 포스포티오에스터라제(phosphothioesterase); 알코올 산화효소; 알코올 데하이드로게나제(dehydrogenase); 아스파라기나제(asparaginase); 글루타민 합성효소; 아데노신 데아미나제(deaminase); 소 페가데마제(pegademase); 알글루세라제(alglucerase); 도르나제(dornase) 알파; 이미글루세라제(imiglucerase); 사크로시다제(sacrosidase); 라스부리카제(rasburicase); 아갈시다제(agalsidase) 베타; 및 낫토키나제(nattokinase)로부터 선택되는 것인 재조합 폴리펩티드.
- 제80항에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 재조합 폴리펩티드.
- 제79항 내지 제85항 중 어느 한 항에 있어서, 링커를 추가로 포함하는 재조합 폴리펩티드.
- 제79항 내지 제86항 중 어느 한 항에 있어서, 절단 도메인을 추가로 포함하는 재조합 폴리펩티드.
- 제79항 내지 제87항 중 어느 한 항에 있어서, 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도하는 것인 재조합 폴리펩티드.
- 제88항에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 재조합 폴리펩티드.
- 제88항에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 재조합 폴리펩티드.
- 제89항에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스(V. natriegens) 또는 이. 콜라이인 재조합 폴리펩티드.
- 제90항에 있어서, 그람 양성 박테리아가 코리네박테리움(Corynebacterium) 또는 바실러스(Bacillus)인 재조합 폴리펩티드.
- 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법으로서, 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 단계를 포함하고, 상기 원핵 숙주 세포가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 상기 분비 신호 펩티드가 서열번호 11의 아미노산 서열을 포함하고, 상기 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아닌 것인 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법.
- 제93항에 있어서, 생성된 관심 있는 단백질 또는 폴리펩티드를 단리하는 단계를 추가로 포함하는 방법.
- 제94항에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 방법.
- 제95항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 방법.
- 제95항 또는 제96항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 방법.
- 제95항에 있어서, 효소가 치료 효소인 방법.
- 제98항에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택되는 것인 방법.
- 제95항에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 방법.
- 제93항 내지 제100항 중 어느 한 항에 있어서, 핵산이 링커를 코딩하는 것인 방법.
- 제101항에 있어서, 링커가 절단 도메인을 포함하는 것인 방법.
- 제93항 내지 제102항 중 어느 한 항에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 방법.
- 제93항 내지 제102항 중 어느 한 항에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 방법.
- 제93항에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스, 또는 이. 콜라이인 방법.
- 제94항에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 방법.
- 제79항 내지 제92항 중 어느 한 항의 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터.
- 제107항의 발현 벡터를 포함하는 원핵 숙주 세포.
- 제108항에 있어서, 그람 음성 박테리아인 원핵 숙주 세포.
- 제108항에 있어서, 그람 양성 박테리아인 원핵 숙주 세포.
- 제109항에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 원핵 숙주 세포.
- 제110항에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 원핵 숙주 세포.
- 제108항 내지 제112항 중 어느 한 항에 있어서, 재조합 폴리펩티드를 코딩하는 핵산 서열이 원핵 숙주 세포에서 발현되도록 최적화된 것인 원핵 숙주 세포.
- 원핵 숙주 세포의 주변세포질 또는 세포외 공간에서 관심 있는 단백질 또는 폴리펩티드를 발현시키기 위한, 제79항 내지 제92항 중 어느 한 항의 재조합 폴리펩티드, 제107항의 발현 벡터, 또는 제108항 내지 제113항 중 어느 한 항의 원핵 숙주 세포의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163209239P | 2021-06-10 | 2021-06-10 | |
US63/209,239 | 2021-06-10 | ||
PCT/US2022/032911 WO2022261377A1 (en) | 2021-06-10 | 2022-06-09 | Bacterial hosts for recombinant protein expression |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240021234A true KR20240021234A (ko) | 2024-02-16 |
Family
ID=84425490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247000858A KR20240021234A (ko) | 2021-06-10 | 2022-06-09 | 재조합 단백질 발현을 위한 박테리아 숙주 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230100757A1 (ko) |
EP (1) | EP4352219A1 (ko) |
KR (1) | KR20240021234A (ko) |
WO (1) | WO2022261377A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6551795B1 (en) * | 1998-02-18 | 2003-04-22 | Genome Therapeutics Corporation | Nucleic acid and amino acid sequences relating to pseudomonas aeruginosa for diagnostics and therapeutics |
AU2005269527B2 (en) * | 2004-07-26 | 2011-12-01 | Pfenex Inc. | Process for improved protein expression by strain engineering |
DK3227455T3 (da) * | 2014-12-01 | 2023-08-21 | Pfenex Inc | Fusionspartnere til peptidfremstilling |
AU2017260277A1 (en) * | 2016-05-06 | 2018-11-22 | Glaxosmithkline Intellectual Property Development Limited | Method of producing a recombinant protein |
CA3168586A1 (en) * | 2017-09-28 | 2019-04-04 | Lanzatech, Inc. | Genetic knockouts in wood-ljungdahl microorganisms |
-
2022
- 2022-06-09 WO PCT/US2022/032911 patent/WO2022261377A1/en active Application Filing
- 2022-06-09 KR KR1020247000858A patent/KR20240021234A/ko unknown
- 2022-06-09 EP EP22821065.4A patent/EP4352219A1/en active Pending
- 2022-06-09 US US17/836,919 patent/US20230100757A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230100757A1 (en) | 2023-03-30 |
EP4352219A1 (en) | 2024-04-17 |
WO2022261377A1 (en) | 2022-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2553102B1 (en) | High level expression of recombinant toxin proteins | |
KR101530395B1 (ko) | 향상된 수율 및(또는) 품질로 이종 단백질을 발현하는 특정 균주를 동정하기 위해 미생물 숙주를 신속히 스크리닝하는 방법 | |
US11377661B2 (en) | Method for production of recombinant Erwinia asparaginase | |
AU2010201410B2 (en) | High level expression of recombinant CRM197 | |
US11046964B2 (en) | Method for production of recombinant E. coli asparaginase | |
KR20200073280A (ko) | 주변세포질 단백질 발현을 위한 박테리아 리더 서열 | |
KR20240021234A (ko) | 재조합 단백질 발현을 위한 박테리아 숙주 | |
CN111278979B (zh) | 重组大肠杆菌天冬酰胺酶的生产方法 |