CN109863247A - 用于改善的蛋白质的分泌的信号多肽 - Google Patents
用于改善的蛋白质的分泌的信号多肽 Download PDFInfo
- Publication number
- CN109863247A CN109863247A CN201780065537.8A CN201780065537A CN109863247A CN 109863247 A CN109863247 A CN 109863247A CN 201780065537 A CN201780065537 A CN 201780065537A CN 109863247 A CN109863247 A CN 109863247A
- Authority
- CN
- China
- Prior art keywords
- protein
- polypeptide
- cell
- amino acid
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 536
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 517
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 517
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 453
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 400
- 230000028327 secretion Effects 0.000 title claims description 97
- 230000001976 improved effect Effects 0.000 title description 7
- 238000000034 method Methods 0.000 claims abstract description 150
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 111
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 91
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 91
- 230000014509 gene expression Effects 0.000 claims description 115
- 101710092462 Alpha-hemolysin Proteins 0.000 claims description 114
- 101710197219 Alpha-toxin Proteins 0.000 claims description 112
- 101710124951 Phospholipase C Proteins 0.000 claims description 112
- 239000002776 alpha toxin Substances 0.000 claims description 112
- 241000894006 Bacteria Species 0.000 claims description 58
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 54
- 241000588724 Escherichia coli Species 0.000 claims description 53
- 150000001413 amino acids Chemical class 0.000 claims description 53
- 230000006698 induction Effects 0.000 claims description 31
- 238000004113 cell culture Methods 0.000 claims description 26
- 102000004190 Enzymes Human genes 0.000 claims description 23
- 108090000790 Enzymes Proteins 0.000 claims description 23
- 230000001965 increasing effect Effects 0.000 claims description 22
- 239000000203 mixture Substances 0.000 claims description 20
- 241000588722 Escherichia Species 0.000 claims description 18
- -1 antibody Proteins 0.000 claims description 18
- 239000006228 supernatant Substances 0.000 claims description 18
- 101100278567 Lelliottia amnigena dsbL gene Proteins 0.000 claims description 16
- 101150009558 dsbA gene Proteins 0.000 claims description 16
- 239000013612 plasmid Substances 0.000 claims description 16
- 238000004064 recycling Methods 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 14
- 230000003248 secreting effect Effects 0.000 claims description 14
- 239000000427 antigen Substances 0.000 claims description 13
- 108091007433 antigens Proteins 0.000 claims description 13
- 102000036639 antigens Human genes 0.000 claims description 13
- 238000005520 cutting process Methods 0.000 claims description 13
- 238000006467 substitution reaction Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 9
- 241000191967 Staphylococcus aureus Species 0.000 claims description 9
- 238000005119 centrifugation Methods 0.000 claims description 9
- 239000003053 toxin Substances 0.000 claims description 7
- 231100000765 toxin Toxicity 0.000 claims description 7
- 108700012359 toxins Proteins 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 239000007788 liquid Substances 0.000 claims description 6
- 230000010076 replication Effects 0.000 claims description 6
- 108091008146 restriction endonucleases Proteins 0.000 claims description 5
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 239000013603 viral vector Substances 0.000 claims description 3
- FFRBMBIXVSCUFS-UHFFFAOYSA-N 2,4-dinitro-1-naphthol Chemical compound C1=CC=C2C(O)=C([N+]([O-])=O)C=C([N+]([O-])=O)C2=C1 FFRBMBIXVSCUFS-UHFFFAOYSA-N 0.000 claims 1
- 241001478240 Coccus Species 0.000 claims 1
- 235000009754 Vitis X bourquina Nutrition 0.000 claims 1
- 235000012333 Vitis X labruscana Nutrition 0.000 claims 1
- 240000006365 Vitis vinifera Species 0.000 claims 1
- 235000014787 Vitis vinifera Nutrition 0.000 claims 1
- 230000029142 excretion Effects 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 305
- 210000004027 cell Anatomy 0.000 description 219
- 235000001014 amino acid Nutrition 0.000 description 70
- 229940024606 amino acid Drugs 0.000 description 63
- 125000000539 amino acid group Chemical group 0.000 description 51
- 239000001963 growth medium Substances 0.000 description 44
- 101710138767 Non-structural glycoprotein 4 Proteins 0.000 description 36
- 102100031056 Serine protease 57 Human genes 0.000 description 36
- 101710197596 Serine protease 57 Proteins 0.000 description 36
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 33
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 33
- 108020004414 DNA Proteins 0.000 description 26
- 238000011160 research Methods 0.000 description 26
- 230000008859 change Effects 0.000 description 23
- 230000000694 effects Effects 0.000 description 22
- 230000002209 hydrophobic effect Effects 0.000 description 22
- 238000000855 fermentation Methods 0.000 description 21
- 230000004151 fermentation Effects 0.000 description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 description 20
- 229940088598 enzyme Drugs 0.000 description 19
- 230000012010 growth Effects 0.000 description 19
- 230000017105 transposition Effects 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 239000012528 membrane Substances 0.000 description 18
- 230000008569 process Effects 0.000 description 18
- 238000000926 separation method Methods 0.000 description 18
- 108010076504 Protein Sorting Signals Proteins 0.000 description 17
- 238000005259 measurement Methods 0.000 description 17
- 210000001322 periplasm Anatomy 0.000 description 17
- 101710144111 Non-structural protein 3 Proteins 0.000 description 16
- 102100021798 SH2 domain-containing protein 3C Human genes 0.000 description 16
- 239000002253 acid Substances 0.000 description 16
- 239000013604 expression vector Substances 0.000 description 16
- 238000013518 transcription Methods 0.000 description 16
- 230000035897 transcription Effects 0.000 description 16
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 239000000243 solution Substances 0.000 description 15
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 14
- 238000013459 approach Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- 150000001875 compounds Chemical class 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 230000006798 recombination Effects 0.000 description 13
- 238000005215 recombination Methods 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 230000001939 inductive effect Effects 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 239000002773 nucleotide Substances 0.000 description 12
- 239000000126 substance Substances 0.000 description 12
- 230000001580 bacterial effect Effects 0.000 description 11
- 239000000872 buffer Substances 0.000 description 11
- 230000004927 fusion Effects 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 10
- 241000192128 Gammaproteobacteria Species 0.000 description 9
- 235000013601 eggs Nutrition 0.000 description 9
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000001742 protein purification Methods 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 108010087967 type I signal peptidase Proteins 0.000 description 9
- 101710144128 Non-structural protein 2 Proteins 0.000 description 8
- 101710144118 Non-structural protein 6 Proteins 0.000 description 8
- 102100022648 Reticulon-2 Human genes 0.000 description 8
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 8
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 210000000170 cell membrane Anatomy 0.000 description 8
- 239000005482 chemotactic factor Substances 0.000 description 8
- 108091006104 gene-regulatory proteins Proteins 0.000 description 8
- 102000034356 gene-regulatory proteins Human genes 0.000 description 8
- 238000003306 harvesting Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 8
- 210000004885 white matter Anatomy 0.000 description 8
- 102000014914 Carrier Proteins Human genes 0.000 description 7
- 108010078791 Carrier Proteins Proteins 0.000 description 7
- 229910021529 ammonia Inorganic materials 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 7
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 7
- 230000003834 intracellular effect Effects 0.000 description 7
- 108010050934 polyleucine Proteins 0.000 description 7
- 239000002243 precursor Substances 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 241000589516 Pseudomonas Species 0.000 description 6
- 108010051611 Signal Recognition Particle Proteins 0.000 description 6
- 102000013598 Signal recognition particle Human genes 0.000 description 6
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 6
- 238000010923 batch production Methods 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000001962 electrophoresis Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000001502 gel electrophoresis Methods 0.000 description 6
- 230000003204 osmotic effect Effects 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 102000004877 Insulin Human genes 0.000 description 5
- 108090001061 Insulin Proteins 0.000 description 5
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 5
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- 102100031776 SH2 domain-containing protein 3A Human genes 0.000 description 5
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 5
- 235000011130 ammonium sulphate Nutrition 0.000 description 5
- 230000010261 cell growth Effects 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 230000021615 conjugation Effects 0.000 description 5
- 229960001484 edetic acid Drugs 0.000 description 5
- 239000012636 effector Substances 0.000 description 5
- 239000006052 feed supplement Substances 0.000 description 5
- 229940088597 hormone Drugs 0.000 description 5
- 239000005556 hormone Substances 0.000 description 5
- 238000003119 immunoblot Methods 0.000 description 5
- 210000003000 inclusion body Anatomy 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 230000035939 shock Effects 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 4
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 108010051696 Growth Hormone Proteins 0.000 description 4
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- 108010025020 Nerve Growth Factor Proteins 0.000 description 4
- 101710144127 Non-structural protein 1 Proteins 0.000 description 4
- 108010076039 Polyproteins Proteins 0.000 description 4
- 102100038803 Somatotropin Human genes 0.000 description 4
- 239000006180 TBST buffer Substances 0.000 description 4
- 102100040247 Tumor necrosis factor Human genes 0.000 description 4
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 4
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 4
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical class O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 101150109249 lacI gene Proteins 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 229960000274 lysozyme Drugs 0.000 description 4
- 239000004325 lysozyme Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 239000011707 mineral Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 108010054442 polyalanine Proteins 0.000 description 4
- 230000001376 precipitating effect Effects 0.000 description 4
- 230000001737 promoting effect Effects 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 229910021654 trace metal Inorganic materials 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- 238000000108 ultra-filtration Methods 0.000 description 4
- 229960005486 vaccine Drugs 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 3
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 3
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 3
- 102100023701 C-C motif chemokine 18 Human genes 0.000 description 3
- 102100036845 C-C motif chemokine 22 Human genes 0.000 description 3
- 102100038284 Cytospin-B Human genes 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 241000305071 Enterobacterales Species 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 3
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 3
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- 102000005431 Molecular Chaperones Human genes 0.000 description 3
- 108010006519 Molecular Chaperones Proteins 0.000 description 3
- 108010014251 Muramidase Proteins 0.000 description 3
- 102000016943 Muramidase Human genes 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- 102400000108 N-terminal peptide Human genes 0.000 description 3
- 101800000597 N-terminal peptide Proteins 0.000 description 3
- 102000015336 Nerve Growth Factor Human genes 0.000 description 3
- 102100029268 Neurotrophin-3 Human genes 0.000 description 3
- 108090000099 Neurotrophin-4 Proteins 0.000 description 3
- 102100033857 Neurotrophin-4 Human genes 0.000 description 3
- 102000004316 Oxidoreductases Human genes 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 108010013381 Porins Proteins 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108010009583 Transforming Growth Factors Proteins 0.000 description 3
- 102000009618 Transforming Growth Factors Human genes 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 230000006907 apoptotic process Effects 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 239000003114 blood coagulation factor Substances 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000004090 dissolution Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- 239000000122 growth hormone Substances 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 229940125396 insulin Drugs 0.000 description 3
- 235000010335 lysozyme Nutrition 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000035800 maturation Effects 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 210000004896 polypeptide structure Anatomy 0.000 description 3
- 102000007739 porin activity proteins Human genes 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000002940 repellent Effects 0.000 description 3
- 239000005871 repellent Substances 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 239000013049 sediment Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 230000001954 sterilising effect Effects 0.000 description 3
- 238000004659 sterilization and disinfection Methods 0.000 description 3
- 238000010408 sweeping Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 230000035899 viability Effects 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 101100136076 Aspergillus oryzae (strain ATCC 42149 / RIB 40) pel1 gene Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- 102100036846 C-C motif chemokine 21 Human genes 0.000 description 2
- 102100025250 C-X-C motif chemokine 14 Human genes 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 102000004031 Carboxy-Lyases Human genes 0.000 description 2
- 102000005367 Carboxypeptidases Human genes 0.000 description 2
- 108010006303 Carboxypeptidases Proteins 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 2
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 2
- 108010073254 Colicins Proteins 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102000051366 Glycosyltransferases Human genes 0.000 description 2
- 108700023372 Glycosyltransferases Proteins 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 208000007514 Herpes zoster Diseases 0.000 description 2
- 101000978371 Homo sapiens C-C motif chemokine 18 Proteins 0.000 description 2
- 101000713085 Homo sapiens C-C motif chemokine 21 Proteins 0.000 description 2
- 101000713083 Homo sapiens C-C motif chemokine 22 Proteins 0.000 description 2
- 101000858068 Homo sapiens C-X-C motif chemokine 14 Proteins 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090001042 Hydro-Lyases Proteins 0.000 description 2
- 102000004867 Hydro-Lyases Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010002352 Interleukin-1 Proteins 0.000 description 2
- 102000000589 Interleukin-1 Human genes 0.000 description 2
- 102000003814 Interleukin-10 Human genes 0.000 description 2
- 108090000174 Interleukin-10 Proteins 0.000 description 2
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 2
- 108010054278 Lac Repressors Proteins 0.000 description 2
- 102000004083 Lymphotoxin-alpha Human genes 0.000 description 2
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 2
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 108090000742 Neurotrophin 3 Proteins 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 101710144121 Non-structural protein 5 Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 208000000474 Poliomyelitis Diseases 0.000 description 2
- 101710098940 Pro-epidermal growth factor Proteins 0.000 description 2
- 108010076181 Proinsulin Proteins 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 241000192142 Proteobacteria Species 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241001248479 Pseudomonadales Species 0.000 description 2
- 102000009661 Repressor Proteins Human genes 0.000 description 2
- 101100273253 Rhizopus niveus RNAP gene Proteins 0.000 description 2
- 241000702670 Rotavirus Species 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 2
- 102000013275 Somatomedins Human genes 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 102000003978 Tissue Plasminogen Activator Human genes 0.000 description 2
- 108090000373 Tissue Plasminogen Activator Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 102000002070 Transferrins Human genes 0.000 description 2
- 108010015865 Transferrins Proteins 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- 102100024584 Tumor necrosis factor ligand superfamily member 12 Human genes 0.000 description 2
- 102100036922 Tumor necrosis factor ligand superfamily member 13B Human genes 0.000 description 2
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 2
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 2
- 241001314279 Zoopagales Species 0.000 description 2
- 239000002250 absorbent Substances 0.000 description 2
- 230000002745 absorbent Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 229960000583 acetic acid Drugs 0.000 description 2
- 108091006088 activator proteins Proteins 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 238000010364 biochemical engineering Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 2
- 238000005277 cation exchange chromatography Methods 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000013522 chelant Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 239000003398 denaturant Substances 0.000 description 2
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 2
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000004043 dyeing Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000003979 eosinophil Anatomy 0.000 description 2
- 238000012869 ethanol precipitation Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000012847 fine chemical Substances 0.000 description 2
- MURGITYSBWUQTI-UHFFFAOYSA-N fluorescin Chemical compound OC(=O)C1=CC=CC=C1C1C2=CC=C(O)C=C2OC2=CC(O)=CC=C21 MURGITYSBWUQTI-UHFFFAOYSA-N 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- XUWPJKDMEZSVTP-LTYMHZPRSA-N kalafungina Chemical compound O=C1C2=C(O)C=CC=C2C(=O)C2=C1[C@@H](C)O[C@H]1[C@@H]2OC(=O)C1 XUWPJKDMEZSVTP-LTYMHZPRSA-N 0.000 description 2
- 101150011498 lad gene Proteins 0.000 description 2
- 210000002429 large intestine Anatomy 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 108010019677 lymphotactin Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000002107 myocardial effect Effects 0.000 description 2
- 229940053128 nerve growth factor Drugs 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 101150040383 pel2 gene Proteins 0.000 description 2
- 101150050446 pelB gene Proteins 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000008823 permeabilization Effects 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 230000007398 protein translocation Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 229960005356 urokinase Drugs 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 1
- NWUYHJFMYQTDRP-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;1-ethenyl-2-ethylbenzene;styrene Chemical compound C=CC1=CC=CC=C1.CCC1=CC=CC=C1C=C.C=CC1=CC=CC=C1C=C NWUYHJFMYQTDRP-UHFFFAOYSA-N 0.000 description 1
- WNQJZQMIEZWFIN-UHFFFAOYSA-N 1-(benzenesulfonyl)-4-(2-chlorobenzoyl)piperazine Chemical compound ClC1=CC=CC=C1C(=O)N1CCN(S(=O)(=O)C=2C=CC=CC=2)CC1 WNQJZQMIEZWFIN-UHFFFAOYSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 101001058938 Acidaminococcus fermentans (strain ATCC 25085 / DSM 20731 / CCUG 9996 / CIP 106432 / VR4) Glutaconyl-CoA decarboxylase subunit beta Proteins 0.000 description 1
- 241000186046 Actinomyces Species 0.000 description 1
- 108010059616 Activins Proteins 0.000 description 1
- 101000689231 Aeromonas salmonicida S-layer protein Proteins 0.000 description 1
- 101710186708 Agglutinin Proteins 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 108010068307 Alpha-Globulins Proteins 0.000 description 1
- 241000590031 Alteromonas Species 0.000 description 1
- 108090000531 Amidohydrolases Proteins 0.000 description 1
- 102000004092 Amidohydrolases Human genes 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 108010064733 Angiotensins Proteins 0.000 description 1
- 102000015427 Angiotensins Human genes 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 108010024976 Asparaginase Proteins 0.000 description 1
- 102000015790 Asparaginase Human genes 0.000 description 1
- 108700016171 Aspartate ammonia-lyases Proteins 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 102400001282 Atrial natriuretic peptide Human genes 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 108010028006 B-Cell Activating Factor Proteins 0.000 description 1
- PCLCDPVEEFVAAQ-UHFFFAOYSA-N BCA 1 Chemical compound CC(CO)CCCC(C)C1=CCC(C)(O)C1CC2=C(O)C(O)CCC2=O PCLCDPVEEFVAAQ-UHFFFAOYSA-N 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 108010027612 Batroxobin Proteins 0.000 description 1
- 241000604933 Bdellovibrio Species 0.000 description 1
- 108010087504 Beta-Globulins Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010051479 Bombesin Proteins 0.000 description 1
- 102000013585 Bombesin Human genes 0.000 description 1
- 102000007350 Bone Morphogenetic Proteins Human genes 0.000 description 1
- 108010007726 Bone Morphogenetic Proteins Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 102400000967 Bradykinin Human genes 0.000 description 1
- 101800004538 Bradykinin Proteins 0.000 description 1
- 108010004032 Bromelains Proteins 0.000 description 1
- 102100023702 C-C motif chemokine 13 Human genes 0.000 description 1
- 101710112613 C-C motif chemokine 13 Proteins 0.000 description 1
- 102100023705 C-C motif chemokine 14 Human genes 0.000 description 1
- 102100023698 C-C motif chemokine 17 Human genes 0.000 description 1
- 102100036849 C-C motif chemokine 24 Human genes 0.000 description 1
- 102100021933 C-C motif chemokine 25 Human genes 0.000 description 1
- 102100032367 C-C motif chemokine 5 Human genes 0.000 description 1
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 1
- 101710155834 C-C motif chemokine 7 Proteins 0.000 description 1
- 102100028990 C-X-C chemokine receptor type 3 Human genes 0.000 description 1
- 102100025279 C-X-C motif chemokine 11 Human genes 0.000 description 1
- 101710098272 C-X-C motif chemokine 11 Proteins 0.000 description 1
- 102100025277 C-X-C motif chemokine 13 Human genes 0.000 description 1
- 102100039396 C-X-C motif chemokine 16 Human genes 0.000 description 1
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 description 1
- 108010009575 CD55 Antigens Proteins 0.000 description 1
- 102400000113 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 102000013392 Carboxylesterase Human genes 0.000 description 1
- 108010051152 Carboxylesterase Proteins 0.000 description 1
- 208000006029 Cardiomegaly Diseases 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241000186321 Cellulomonas Species 0.000 description 1
- 108010082155 Chemokine CCL18 Proteins 0.000 description 1
- 108010055166 Chemokine CCL5 Proteins 0.000 description 1
- 108010014419 Chemokine CXCL1 Proteins 0.000 description 1
- 102000016950 Chemokine CXCL1 Human genes 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 241000606161 Chlamydia Species 0.000 description 1
- 241000191368 Chlorobi Species 0.000 description 1
- 229920002567 Chondroitin Polymers 0.000 description 1
- 238000007445 Chromatographic isolation Methods 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 241001112695 Clostridiales Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 108010062580 Concanavalin A Proteins 0.000 description 1
- 102100023419 Cystic fibrosis transmembrane conductance regulator Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 101710121366 Disintegrin and metalloproteinase domain-containing protein 11 Proteins 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 102000002045 Endothelin Human genes 0.000 description 1
- 108050009340 Endothelin Proteins 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 101000578492 Escherichia coli Lysis protein Proteins 0.000 description 1
- 101001065501 Escherichia phage MS2 Lysis protein Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 102000009123 Fibrin Human genes 0.000 description 1
- 108010073385 Fibrin Proteins 0.000 description 1
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 108090000378 Fibroblast growth factor 3 Proteins 0.000 description 1
- 102100028043 Fibroblast growth factor 3 Human genes 0.000 description 1
- 102100028072 Fibroblast growth factor 4 Human genes 0.000 description 1
- 108090000381 Fibroblast growth factor 4 Proteins 0.000 description 1
- 108090000380 Fibroblast growth factor 5 Proteins 0.000 description 1
- 102100028073 Fibroblast growth factor 5 Human genes 0.000 description 1
- 108090000382 Fibroblast growth factor 6 Proteins 0.000 description 1
- 102100028075 Fibroblast growth factor 6 Human genes 0.000 description 1
- 102100028071 Fibroblast growth factor 7 Human genes 0.000 description 1
- 108090000385 Fibroblast growth factor 7 Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 1
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 108010015133 Galactose oxidase Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 102400000321 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100034221 Growth-regulated alpha protein Human genes 0.000 description 1
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 102100025255 Haptoglobin Human genes 0.000 description 1
- 108050005077 Haptoglobin Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000978381 Homo sapiens C-C motif chemokine 14 Proteins 0.000 description 1
- 101000978362 Homo sapiens C-C motif chemokine 17 Proteins 0.000 description 1
- 101000713078 Homo sapiens C-C motif chemokine 24 Proteins 0.000 description 1
- 101000897486 Homo sapiens C-C motif chemokine 25 Proteins 0.000 description 1
- 101000916050 Homo sapiens C-X-C chemokine receptor type 3 Proteins 0.000 description 1
- 101000858064 Homo sapiens C-X-C motif chemokine 13 Proteins 0.000 description 1
- 101000889133 Homo sapiens C-X-C motif chemokine 16 Proteins 0.000 description 1
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 description 1
- 101001027128 Homo sapiens Fibronectin Proteins 0.000 description 1
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101000804764 Homo sapiens Lymphotactin Proteins 0.000 description 1
- 101001123332 Homo sapiens Proteoglycan 4 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 description 1
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 description 1
- 101000830598 Homo sapiens Tumor necrosis factor ligand superfamily member 12 Proteins 0.000 description 1
- 101710146024 Horcolin Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100026818 Inhibin beta E chain Human genes 0.000 description 1
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 102000003812 Interleukin-15 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 102000000646 Interleukin-3 Human genes 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 102100039897 Interleukin-5 Human genes 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102100021592 Interleukin-7 Human genes 0.000 description 1
- 108010002586 Interleukin-7 Proteins 0.000 description 1
- 102000004890 Interleukin-8 Human genes 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 101710189395 Lectin Proteins 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 102100035304 Lymphotactin Human genes 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 101710175243 Major antigen Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 229910021380 Manganese Chloride Inorganic materials 0.000 description 1
- GLFNIEUTAYBVOC-UHFFFAOYSA-L Manganese chloride Chemical compound Cl[Mn]Cl GLFNIEUTAYBVOC-UHFFFAOYSA-L 0.000 description 1
- 101710179758 Mannose-specific lectin Proteins 0.000 description 1
- 101710150763 Mannose-specific lectin 1 Proteins 0.000 description 1
- 101710150745 Mannose-specific lectin 2 Proteins 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 229910004619 Na2MoO4 Inorganic materials 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000003729 Neprilysin Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- 108010006232 Neuraminidase Proteins 0.000 description 1
- 102000005348 Neuraminidase Human genes 0.000 description 1
- 101100336468 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gem-1 gene Proteins 0.000 description 1
- 108090000095 Neurotrophin-6 Proteins 0.000 description 1
- 108010024026 Nitrile hydratase Proteins 0.000 description 1
- 208000012868 Overgrowth Diseases 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 206010034038 Parotitis Diseases 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 201000005702 Pertussis Diseases 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- 102100030304 Platelet factor 4 Human genes 0.000 description 1
- 108090000778 Platelet factor 4 Proteins 0.000 description 1
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 1
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 241000947836 Pseudomonadaceae Species 0.000 description 1
- 101100084022 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) lapA gene Proteins 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101150015069 RNAP gene Proteins 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 229920000297 Rayon Polymers 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000018673 SEC Translocation Channels Human genes 0.000 description 1
- 108010091732 SEC Translocation Channels Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 101710127006 Signal peptidase I Proteins 0.000 description 1
- 101710170939 Signal peptidase I P Proteins 0.000 description 1
- 108090000233 Signal peptidase II Proteins 0.000 description 1
- 241000605008 Spirillum Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000122971 Stenotrophomonas Species 0.000 description 1
- 108010023197 Streptokinase Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 241000959851 Thermales Species 0.000 description 1
- 241001291204 Thermobacillus Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 101000748795 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) Cytochrome c oxidase polypeptide I+III Proteins 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000002262 Thromboplastin Human genes 0.000 description 1
- 102000036693 Thrombopoietin Human genes 0.000 description 1
- 108010041111 Thrombopoietin Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108010065158 Tumor Necrosis Factor Ligand Superfamily Member 14 Proteins 0.000 description 1
- 101710097155 Tumor necrosis factor ligand superfamily member 12 Proteins 0.000 description 1
- 102100024586 Tumor necrosis factor ligand superfamily member 14 Human genes 0.000 description 1
- 102400000015 Vasoactive intestinal peptide Human genes 0.000 description 1
- 208000027276 Von Willebrand disease Diseases 0.000 description 1
- 208000000260 Warts Diseases 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 208000003152 Yellow Fever Diseases 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000000488 activin Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000910 agglutinin Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 101150099105 alien gene Proteins 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000002416 angiotensin derivative Substances 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- RWZYAGGXGHYGMB-UHFFFAOYSA-N anthranilic acid Chemical class NC1=CC=CC=C1C(O)=O RWZYAGGXGHYGMB-UHFFFAOYSA-N 0.000 description 1
- 108700003859 araC Genes Proteins 0.000 description 1
- 101150044616 araC gene Proteins 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229960003272 asparaginase Drugs 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 230000002715 bioenergetic effect Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- DNDCVAGJPBKION-DOPDSADYSA-N bombesin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1NC2=CC=CC=C2C=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C(C)C)C1=CN=CN1 DNDCVAGJPBKION-DOPDSADYSA-N 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 229940112869 bone morphogenetic protein Drugs 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 235000019835 bromelain Nutrition 0.000 description 1
- 108091006374 cAMP receptor proteins Proteins 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 239000003729 cation exchange resin Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 229910052927 chalcanthite Inorganic materials 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000003399 chemotactic effect Effects 0.000 description 1
- 238000005660 chlorination reaction Methods 0.000 description 1
- DLGJWSVWTWEWBJ-HGGSSLSASA-N chondroitin Chemical compound CC(O)=N[C@@H]1[C@H](O)O[C@H](CO)[C@H](O)[C@@H]1OC1[C@H](O)[C@H](O)C=C(C(O)=O)O1 DLGJWSVWTWEWBJ-HGGSSLSASA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000002281 colonystimulating effect Effects 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 108700001680 des-(1-3)- insulin-like growth factor 1 Proteins 0.000 description 1
- 230000003009 desulfurizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 102000006795 dihydrofolate reductase activity proteins Human genes 0.000 description 1
- 108040000939 dihydrofolate reductase activity proteins Proteins 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- ZUBDGKVDJUIMQQ-UBFCDGJISA-N endothelin-1 Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)NC(=O)[C@H]1NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](C(C)C)NC(=O)[C@H]2CSSC[C@@H](C(N[C@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N2)=O)NC(=O)[C@@H](CO)NC(=O)[C@H](N)CSSC1)C1=CNC=N1 ZUBDGKVDJUIMQQ-UBFCDGJISA-N 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000003920 environmental process Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 230000006126 farnesylation Effects 0.000 description 1
- 229950003499 fibrin Drugs 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 108700014844 flt3 ligand Proteins 0.000 description 1
- 229940028334 follicle stimulating hormone Drugs 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 108010074605 gamma-Globulins Proteins 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 239000012362 glacial acetic acid Substances 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 229960000789 guanidine hydrochloride Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 230000002949 hemolytic effect Effects 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108091008039 hormone receptors Proteins 0.000 description 1
- 101150023479 hsdS gene Proteins 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000012872 hydroxylapatite chromatography Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 239000002955 immunomodulating agent Substances 0.000 description 1
- 230000002584 immunomodulator Effects 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 231100000608 immunotoxin Toxicity 0.000 description 1
- 229940051026 immunotoxin Drugs 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229960003971 influenza vaccine Drugs 0.000 description 1
- 239000000893 inhibin Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 239000004026 insulin derivative Substances 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 108010031620 mandelonitrile lyase Proteins 0.000 description 1
- 239000011565 manganese chloride Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000005649 metathesis reaction Methods 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 239000003900 neurotrophic factor Substances 0.000 description 1
- 229940032018 neurotrophin 3 Drugs 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000001473 noxious effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- QYSGYZVSCZSLHT-UHFFFAOYSA-N octafluoropropane Chemical compound FC(F)(F)C(F)(F)C(F)(F)F QYSGYZVSCZSLHT-UHFFFAOYSA-N 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 101150093139 ompT gene Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 229960001319 parathyroid hormone Drugs 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 101150009573 phoA gene Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229940080469 phosphocellulose Drugs 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 108010066381 preproinsulin Proteins 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010087851 prorelaxin Proteins 0.000 description 1
- 239000003223 protective agent Substances 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001814 protein method Methods 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000006920 protein precipitation Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000003488 releasing hormone Substances 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 239000012465 retentate Substances 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000011218 seed culture Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 201000010153 skin papilloma Diseases 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000011684 sodium molybdate Substances 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229960005202 streptokinase Drugs 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 230000001646 thyrotropic effect Effects 0.000 description 1
- 229960000187 tissue plasminogen activator Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000007923 virulence factor Effects 0.000 description 1
- 239000000304 virulence factor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000011592 zinc chloride Substances 0.000 description 1
- 150000003952 β-lactams Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/305—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
- C07K14/31—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Toxicology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明涉及用于改善异源多肽排泄产生的信号多肽、包含信号多肽的蛋白质、编码信号多肽的核酸及其使用方法。
Description
序列表
本申请含有已以ASCII格式以电子方式提交且特此以引用的方式整体并入的序列表。所述ASCII副本创建于2017年10月19日,名称为NSP4-100-WO-PCT-SequenceListing并且大小为17,021字节。
技术领域
本发明涉及用于改善异源多肽排泄产生的信号多肽、包含信号多肽的蛋白质、编码信号多肽的核酸及其产生方法。示例性实施例包括附接至α毒素连接的改善的信号多肽,以及产生和分离α毒素的方法。
背景技术
细菌中的表达可以是药物和工业蛋白质的商业生产的选择的方法。将商业上重要的异源重组蛋白质分泌到大肠杆菌的周质或培养基中,在商业上重要的重组蛋白质的生产中提供了若干个优点,包括节省成本和时间、减少内毒素、在廉价碳源上生长、快速生物量积累、适应高细胞密度发酵和简单的工艺规模扩大。(Mergulhao等人,Biotech Advances[生物技术进展]23:177-202(2005);Gottesman等人,Annu.Rev.Genet[遗传学年评]30:465-506(1996))。由于这些原因,已经进行了许多研究,例如信号肽修饰和分子伴侣的共表达,以改善重组蛋白在大肠杆菌表达系统中的分泌效率。(Baneyx等人,NatureBiotech[自然生物技术]22:1399-1408(2004);Choi等人,Appl.MicrobiolBiotechnol[应用微生物学及生物科技]64:625-635(2004);Cornelis等人,Curr Opinion in Biotech[现代生物技术评论]11:450-454(2000);Klatt等人,Microbiol CellFactories[微生物细胞工厂]11:97-106(2012))。
在大肠杆菌分泌途径中,信号多肽在分泌过程期间在重组蛋白的易位和分泌中起关键作用。已经研究了许多信号多肽以改善大肠杆菌系统中重组蛋白的分泌。(Humphreys等人,Protein Expression andPurification[蛋白质表达和纯化]20:252-264(2000);Velaithan等人,Ann Microbiol[微生物学年鉴]64:543-550(2014);Jonet等人,JMolMicrobiol Biotechnol[分子微生物学与生物技术杂志]22:48-58(2012);Ismail等人,Biotech letters[生物技术书信]33:999-1005(2011);Low等人,Bioengineered[生物工程化]3:334-338(2011);Nagano等人,Biochem Biophys Res Commun[生物化学与生物物理研究通讯]447:655-659(2014))。总体上,重组蛋白质通过细胞质膜分泌到周质间隙中,并且信号肽在输出期间被信号肽酶切割。通常,分泌的重组蛋白质通过外膜从周质间隙胞外释放到培养基中。
信号多肽位于重组蛋白前体的n-末端区,当新生多肽链在分泌途径中从核糖体中出现时,其被信号识别颗粒(SPR)识别。信号多肽具有20-30个氨基酸残基的长度和三个可区分的结构特征。这三个区由具有净正电荷的氨基末端区(n-区)、随后是疏水区(h-区)、并且然后是对于相对于切割位点的-3(P3)和-1(P1)位置的小残基具有优先的蛋白酶识别序列(c-区)构成。(Mergulhao等人,Biotechnology Adv[生物技术进展]23:177-202(2005);Paetzel等人,Biochmica et Biophysica Acta[生物化学与生物物理学报生物能学]1843:1497-1508(2014);Paetzel等人,Pharmacology&Therapeutics[药理学和治疗学]87:27-49(2000))。特别是,h-区是分泌过程期间穿过细菌细胞质膜的蛋白质易位的重要区,因为易位效率随着h-区的长度和疏水性而增加,并且功能需要最小的疏水性(Wang等人,J.Biol.Chem[生物化学杂志]275:10154-10159(2000))。许多公开文献已经显示,信号多肽的修饰改善了大肠杆菌表达系统中异源蛋白质的分泌(Humphreys等人,ProteinExpression and Purification[蛋白质表达和纯化]20:252-264(2000);Velaithan等人,Ann Microbiol[微生物学年鉴]64:543-550(2014);Jonet等人,JMolMicrobiolBiotechnol[分子微生物学与生物技术杂志]22:48-58(2012);Ismail等人,Biotechletters[生物技术书信]33:999-1005(2011);Low等人,Bioengineered[生物工程化]3:334-338(2011);Nagano等人,Biochem Biophys Res Commun[生物化学与生物物理研究通讯]447:655-659(2014))。
发明内容
本披露内容涉及信号多肽,该信号多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列。在一些实施例中,该信号多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列。在一些实施例中,该信号多肽包含SEQ ID NO:1的氨基酸序列。
本披露还涉及蛋白质,该蛋白质包含(i)信号多肽,该信号多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列,和(ii)异源多肽。在一些实施例中,该蛋白质包含(i)信号多肽,该信号多肽与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列,和(ii)异源多肽。在一些实施例中,该蛋白质包含(i)信号多肽,该多肽包含SEQ ID NO:1的氨基酸序列,和(ii)异源多肽。
各种异源多肽可用于本发明。在一些实施例中,异源多肽包含大于20个氨基酸。在一些实施例中,异源多肽具有25kDa至50kDa的分子量。在一些实施例中,异源多肽具有30kDa至35kDa的分子量。在一些实施例中,异源多肽选自下组,该组由以下组成:酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。在一些实施例中,异源多肽包含α毒素(AT)。在一些实施例中,异源多肽包含来自金黄色葡萄球菌(Staphylococcus aureus)的α毒素。在一些实施例中,α毒素在对应于H35的氨基酸位置包含取代。在一些实施例中,取代是H35L取代。
在一些实施例中,本披露涉及包含SEQ ID NO:2的氨基酸序列的蛋白质。在一些实施例中,本披露涉及包含如本文所述的信号多肽或蛋白质的组合物。
在一些实施例中,本披露涉及编码如本文所述的信号多肽(例如SEQ ID NO:1)的核酸,或包含如本文所述的信号多肽的蛋白质。在一些实施例中,核酸(1)编码如本文所述的信号多肽,和(2)包含一个或多个限制性内切酶位点。
在一些实施例中,本披露涉及包含如本文所述的核酸的载体。在一些实施例中,载体进一步包含复制起点。在一些实施例中,载体进一步包含与核酸可操作地连接的启动子序列。在一些实施例中,启动子序列在原核生物中是可操作的。在一些实施例中,载体是质粒、转座子或病毒载体。
在一些实施例中,本披露涉及工程化以表达包含信号多肽的本文所述蛋白质的重组细胞。在一些实施例中,重组细胞是原核生物细胞。在一些实施例中,原核生物细胞是埃希氏杆菌属(Escherichia)。在一些实施例中,原核生物细胞是大肠杆菌(Escherichiacoli)。
在一些实施例中,本披露涉及用如本文所述的载体转化的宿主细胞。在一些实施例中,宿主细胞是原核生物细胞。在一些实施例中,原核生物细胞是埃希氏杆菌属(Escherichia)。在一些实施例中,原核生物细胞是大肠杆菌。
在一些实施例中,本披露涉及产生如本文所述的蛋白质的方法,该方法包括在表达蛋白质的条件下,培养工程化以表达蛋白质的重组细胞,或用编码蛋白质的载体转化的宿主细胞。在一些实施例中,本发明的方法包括从细胞培养物中回收蛋白质。在一些实施例中,回收蛋白质包括离心以去除细胞和/或细胞碎片。在一些实施例中,回收蛋白质包括过滤以去除细胞和/或细胞碎片。
在一些实施例中,重组细胞或宿主细胞在细胞培养物中在蛋白质从重组细胞或宿主细胞分泌的条件下培养。在一些实施例中,重组细胞或宿主细胞在细胞培养物中在将信号多肽从蛋白质切割的条件下培养。
在一些实施例中,本披露涉及增加蛋白质从细胞分泌的速率的方法,该方法包括:(a)在细胞培养物中培养宿主细胞,该宿主细胞包含编码蛋白质的如本文所述的核酸或载体,(b)诱导蛋白质的表达,以及(c)回收分泌到细胞培养物的上清液中的蛋白质,其中将蛋白质的分泌速率与具有dsbA信号多肽的蛋白质的蛋白质分泌速率进行比较。在一些实施例中,(c)的回收发生在诱导(b)后8和12小时之间。在一些实施例中,蛋白质分泌速率每小时增加大于20%。
在一些实施例中,本披露涉及增加蛋白质从细胞分泌的量的方法,该方法包括:(a)在细胞培养物中培养宿主细胞,该宿主细胞包含编码如本文所述蛋白质的核酸或载体,(b)诱导蛋白质的表达,以及(c)回收分泌到细胞培养物的上清液中的蛋白质,其中将分泌的蛋白质的量与具有dsbA信号多肽的蛋白质进行比较。在一些实施例中,与具有dsbA信号多肽的蛋白质相比,从细胞分泌的蛋白质的量增加大于20%。在一些实施例中,与具有dsbA信号多肽的蛋白质相比,从细胞分泌的蛋白质的量增加大于100%。
在一些实施例中,本披露涉及制备蛋白质的方法,所述方法包括a)培养包含如本文所述的核酸或载体的宿主细胞,使得表达该核酸,由此当核酸或载体在宿主细胞中表达时,由核酸或载体编码的蛋白质从细胞分泌到上清液中;以及b)从上清液中分离分泌的蛋白质。在一些实施例中,宿主细胞或重组细胞是大肠杆菌。在一些实施例中,宿主细胞在细胞培养物中在信号多肽从蛋白质切割的条件下培养。在一些实施例中,分离分泌的蛋白质包括离心以去除细胞和/或细胞碎片。在一些实施例中,分离分泌的蛋白质包括过滤以去除细胞和/或细胞碎片。
在一些实施例中,本披露涉及通过本文所述的任何方法制备的蛋白质。
附图说明
图1:在Micro24生物反应器补料分批过程中筛选与ATH35L缀合的细菌信号多肽。收获样品并在用0.5mM IPTG诱导后14小时离心。将上清液加载到SDS-PAGE变性凝胶上,并使用针对ATH35L的单克隆抗体通过蛋白质印迹定量。箭头表示培养基中分泌的ATH35L蛋白质,并加载纯化的ATH35L作为参考。
图2.本研究中使用的新颖信号多肽构建的示意图。该图说明了与ATH35L缀合的新颖信号多肽的不同结构组合。与ATH35L缀合的使用的信号多肽描述于每个构建体的左侧。(图2A)通过修饰dsbAss和pelBss产生组I新颖信号多肽NSP1至NSP6。(图2B)通过氨基酸改组或用NSP4的h-区中的亮氨酸或丙氨酸替代氨基酸产生组II新颖信号多肽NSP4a至NSP4c。(图2C)通过NSP3的h-区中氨基酸改组产生组III新颖信号多肽NSP3a至NSP3d。h-区中每个氨基酸旁边的数字表示h-区中氨基酸的位置。(图A、B和C)。D-N、D-H和D-C分别代表dsbAss的n-区、h-区和c-区。P-N、P-H和P-C分别代表pelBss的n-区、h-区和c-区。
图3.通过在1L补料分批培养中组I新颖信号多肽ATH35L的分泌效率。图3A和B.通过在变性条件下电泳评估培养基中分泌的ATH35L。箭头表示分泌的ATH35L蛋白质。图3C.通过定制的Octet测定定量培养基中分泌的ATH35L。NSP2、NSP4和NSP6在其结构中共享同一h-区。有趣的是,NSP 2和NSP4增强了ATH35L的分泌效率,同时通过NSP6降低了ATH35L的分泌效率。
图4.通过在1L补料分批培养中组II新颖信号多肽ATH35L的分泌效率。通过在变性条件下电泳和定制的Octet测定分别进行分泌的ATH35L的评估和定量。在h-区中氨基酸改组影响ATH35L(NSP4a)的分泌效率。尽管NSP4b的h-区仅含有如聚亮氨酸的强疏水性氨基酸,但ATH35L的分泌效率降低。
图5.通过在1L补料分批培养中,在组III新颖信号多肽的h-区中氨基酸改组的ATH35L的分泌效率。通过氨基酸改组改变的疏水性显著影响ATH35L的分泌效率。
图6.优化诱导长度用于1L补料分批培养中胞外ATH35L的生产率。图6A和B.星号表示由于细胞过度生长而从死细胞释放的ATH35L前蛋白质。箭头表示在分泌过程期间适当分泌的成熟ATH35L。图6C.通过定制的Octet测定测量ATH35L的定量。
图7.密码子优化的ATH35L核苷酸序列(SEQ ID NO:5)(图7A)、AT氨基酸序列(SEQID NO:3)(图7B)、ATH35L氨基酸序列(SEQ ID NO:4)(图7C)和NSP4ss+ATH35L(SEQ ID NO:2)(图7D)。
具体实施方式
本发明涉及信号多肽和包含信号多肽和异源多肽的蛋白质,其中该信号多肽提供改善的异源多肽的分泌。
当在权利要求和/或说明书中与词语“包含(comprising)”结合使用时,使用词语“一个(a或an)”可以意指“一个”,但它也与“一个或多个”、“至少一个”和“一个或多于一个”的含义一致。
在整个本申请中,术语“约”用于表示值包括被采用以确定值的方法/装置的误差的固有变化,或者研究受试者之间存在的变化。典型地,该术语意指涵盖大约或小于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%变化,这取决于具体情况。
权利要求中使用术语“或”用于意指“和/或”,除非明确指示仅指替代方案或替代方案是相互排斥的,尽管本披露支持仅是指替代方案和“和/或”的定义。
如在本说明书和一项和多项权利要求中所使用的,词语“包含(comprising)”(和任何形式的包含,例如“包含(comprise和comprises)”),“具有”(和任何形式的具有,例如“具有(have和has)”),“包括(including)”(以及任何形式的包括,例如“包括(includes和include)”)或“含有(containing)”(以及任何形式的含有,例如“含有(contains和contain)”)是包扩性的或开放性的,并且不排除另外的未列举的元素或方法步骤。考虑到本说明书中讨论的任何实施例可以相对于本披露的任何方法或多肽、蛋白质、核酸和载体实施,并且反之亦然。此外,本披露的多肽、蛋白质、核酸和载体可用于实现本披露的方法。
易位系统
提供了新颖信号多肽,其促进可操作地连接的目的多肽靶向周质或进入胞外环境。出于本发明的目的,术语“信号多肽”,“分泌信号”,“分泌信号多肽”,“信号多肽”或“前导序列”旨在包括肽序列,该肽序列可用于将可操作地连接的目的多肽靶向周质或进入胞外空间。
本发明的信号多肽改善了细菌中重组蛋白质的之前的生产方法。本文的信号多肽可以通过增加蛋白质从胞内环境中的分泌来增加蛋白质的产生(收获)。分泌到周质间隙中也具有促进适当的二硫键形成的众所周知的效果(Manoil等人,Methods in Enzymol.[酶学方法]326:35-47(2000))。分泌重组蛋白质的其他益处包括更有效地分离蛋白质;转基因蛋白质的正确折叠和二硫键形成,导致活性形式的蛋白质百分比增加;减少包涵体的形成,并且降低对宿主细胞的毒性;并且可溶性形式的重组蛋白的百分比增加。将目的蛋白质排泄到培养基中的潜力还可能潜在地促进蛋白质生产的连续而非分批培养。
在革兰氏阴性细菌中,从细胞质分泌的蛋白质可以终止于周质间隙、附接至外膜或进入胞外培养液中。本文的信号多肽可通过增加蛋白质从胞内环境分泌到周质间隙、附接至外膜或进入胞外培养液中来增加蛋白质的产生。在一些实施例中,本发明的方法还可以减少和/或消除由聚集的蛋白质组成的包涵体。
原核生物,例如革兰氏阳性细菌和革兰氏阴性细菌,已经进化出许多系统,用于蛋白质穿过其膜的主动输出。革兰氏阴性细菌中的分泌途径包括例如:ABC(I型)途径,Path/Fla(III型)途径和Path%Vir(IV型)途径,用于穿过血浆和外膜两者的一步易位;Sec(II型)、Tat、MscL和Holins途径,用于穿过质膜的易位;以及Sec-加-菌毛引导孔蛋白(FUP)、Sec-加-自转运蛋白(AT)、Sec-加-两配偶体分泌(TPS),Sec-加-主终端分支(MTB)和Tat-加-MTB途径,用于穿过血浆和外膜的两步易位。并非所有细菌都具有所有这些分泌途径。因此,在一些实施例中,本发明涉及使用如本文所述的信号多肽的使用ABC(I型)、Path/Fla(III型)、Path%Vir(IV型);Sec(II型)、Tat、MscL、Holins、Sec-加-菌毛引导孔蛋白(FUP)、Sec-加-自转运蛋白(AT)、Sec-加-两配偶体分泌(TPS),Sec-加-主终端分支(MTB)和Tat-加-MTB途径增加蛋白质穿过膜的易位的方法。
在一些实施例中,如本文所述的信号多肽利用Sec分泌系统。据报道,Sec系统负责输出具有穿过细胞质膜的N-末端信号多肽的蛋白质(参见,Agarraberes和Dice,BiochimBiophys Acta.[生物化学与生物物理学报]1513:1-24(2001);Muller等人,Prog NucleicAcid Res Mol.Biol.[核酸研究前沿分子生物学]66:107-157(2001)),其各自通过引用以其全文并入本文。Sec家族的蛋白质复合物普遍发现于原核生物和真核生物中。细菌Sec系统由转运蛋白质、分子伴侣蛋白质(SecB)或信号识别颗粒(SRP)和信号肽酶(SPase I和SPase II)组成。大肠杆菌中的Sec转运复合物由三个完整的内膜蛋白质(SecY、SecE和SecG)以及细胞质ATP酶(SecA)组成。SecA招募SecY/E/G复合物以形成有活性的易位通道。分子伴侣蛋白SecB与新生多肽链结合以防止其折叠并将其靶向SecA。随后将线性多肽链通过SecYEG通道转运,并且在切割信号多肽后,将蛋白质折叠在周质中。三种辅助蛋白质(SecD、SecF和YajC)形成复合物,该复合物对于分泌不是必需的,但在许多条件下刺激分泌高达十倍,特别是在低温下。
转运到周质中的蛋白质,即通过II型分泌系统,也可以在另外的步骤中输出到胞外培养基中。这些机制通常通过自转运蛋白,两配偶体分泌系统,主要终端分支系统或菌毛引导孔蛋白。在一些实施例中,本发明涉及使用II型分泌系统增加包含本文所述信号多肽的蛋白质穿过膜的易位的方法。
信号多肽与分泌系统的蛋白质相互作用,使细胞正确地将蛋白质引导至其适当的目的地。八种已知的基于信号多肽的分泌系统中的五种是涉及Sec系统的分泌系统。这五种被称为涉及Sec依赖性细胞质膜易位,并且其中可操作的信号多肽可称为Sec依赖性信号多肽。开发合适的分泌信号的一个问题是确保信号被适当地表达并从表达的蛋白质上切割下来。
Sec途径的信号多肽通常由以下三个结构域组成:(i)带正电的n-区,(ii)疏水性的h-区和(iii)不带电但极性的c-区。信号肽酶的切割位点位于c-区。然而,信号多肽保守程度和长度以及切割位点位置在不同蛋白质之间可以变化。
Sec依赖性蛋白质输出的特征是在输出蛋白质中存在短的(约30个氨基酸)、主要是疏水性氨基末端信号多肽。信号多肽有助于蛋白质输出,并在输出的蛋白质到达周质时被周质信号肽酶切割掉。典型的N-末端Sec信号多肽含有具有至少一个精氨酸或赖氨酸残基的N-结构域,随后是含有一段疏水性残基的结构域,和含有用于信号肽酶的切割位点的C-结构域。
信号多肽
在本发明的一些实施例中,提供了信号多肽,其中该信号多肽是新颖分泌信号多肽,其可用于将可操作地连接的目的蛋白质或目的多肽靶向(革兰氏阴性细菌的)周质或到胞外空间中。在一些实施例中,本发明的信号多肽包含DsbAss N-末端结构域和C-末端结构域,以及PelBss H-结构域。在一些实施例中,本发明的信号多肽包含SEQ ID NO:1的氨基酸序列。在一些实施例中,信号多肽是分离的多肽。在优选的实施例中,信号多肽附接在目的异源多肽的N-末端。
本发明的信号多肽证明了信号多肽的疏水性区(h-区),并且h-区氨基酸的位置显著影响大肠杆菌中蛋白质的分泌效率。例如,如本文发现的实例中所证明的,附接至本发明的信号多肽的α毒素(ATH35L蛋白)相对于包含dsbAss或pelBss信号多肽的α毒素具有增加的分泌效率。另外,本发明的信号多肽证明,没有多态性的h-区氨基酸的位置的位移改变了蛋白质的分泌效率。
在一些实施例中,该信号多肽是MKKITAAAGLLLLAAQPAMA(SEQ ID NO:1)。在一些实施例中,该信号多肽包含与SEQ ID NO:1约70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的氨基酸序列。在一些实施例中,该信号多肽包含与SEQ ID NO:1约90%相同的氨基酸序列。在一些实施例中,该信号多肽包含与SEQ ID NO:1约95%相同的氨基酸序列。
在一些实施例中,信号多肽与SEQ ID NO:1基本上同源或基本上相似。“基本上同源的”或“基本上相似的”是指与使用标准参数使用本文所述的比对程序之一的参考序列相比,具有至少约60%或65%的序列同一性、约70%或75%的序列同一性、约80%或85%的序列同一性、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%或更高的序列同一性的氨基酸。
在一些实施例中,信号多肽包含SEQ ID NO:1的片段,其从氨基末端或羧基末端截短1、2、3或4个氨基酸,优选地1或2个氨基酸,但保留生物学活性,即分泌信号活性。在一些实施例中,信号多肽包含缺失自SEQ ID NO:1的氨基酸序列的内部氨基酸,其中缺失1、2、3或4个氨基酸,优选地1或2个氨基酸。在一些实施例中,信号多肽包含插入SEQ ID NO:1的氨基酸序列的内部或外部氨基酸,其中插入了1、2、3或4个氨基酸。
在一些实施例中,信号多肽包含SEQ ID NO:1的片段,其中1、2、3或4个氨基酸,优选地1或2个氨基酸被不同的氨基酸替代,即被取代。在一些实施例中,被替代的氨基酸是保守取代、高度保守的取代或非常高度保守的取代。“保守的氨基酸取代”是其中用具有类似侧链的氨基酸残基替代该氨基酸残基的取代。保守的、高度保守的和非常高度保守的氨基酸取代的实例见于表1。
表1
在一些实施例中,缺失、取代或插入维持信号多肽的类似的疏水性。例如,在一些实施例中,SEQ ID NO:1的信号多肽在信号多肽的H-结构域中具有类似的(或在一些情况下相同的)疏水性。
在一些情况下,SEQ ID NO:1的1、2、3或4个氨基酸彼此改变位置。在一些实施例中,SEQ ID NO:1的信号多肽的缺失、取代或插入保留了原始多肽的所希望的功能,即,信号多肽能够促进附接的蛋白质从胞内环境分泌到周质间隙、附接至外膜上或进入胞外培养液中。
异源多肽
在一些实施例中,本发明涉及蛋白质,其包含(i)信号多肽,该信号多肽包含与SEQID NO:1具有至少90%序列同一性的氨基酸序列,和(ii)异源多肽。在一些实施例中,本发明涉及蛋白质,其包含(i)信号多肽,该信号多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列,和(ii)异源多肽。在一些实施例中,本发明涉及蛋白质,其包含(i)信号多肽,该信号多肽包含SEQ ID NO:1的氨基酸序列,和(ii)异源多肽。
如本文所用,“异源多肽”,“所希望的多肽”,“异源多肽/蛋白质”或“目的多肽”可以是任何多肽或蛋白质,包括天然存在的和非天然存在的多肽或蛋白质。如本文所用,术语“蛋白质”和“多肽”是同义的,然而,为方便起见,在一些情况下,术语“蛋白质”用于指“异源多肽”,其包含未被切割的信号多肽。异源多肽可以指完整或部分蛋白质,以及功能性和非功能性蛋白质两者。“肽”定义为多肽的片段或部分,优选具有至少一种功能活性的片段或部分作为完整的多肽序列。
针对异源多肽如本文所用,“多肽”包括长度为至少三个氨基酸残基的肽。在一些实施例中,多肽具有至少约10个氨基酸残基的长度,例如至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、或100个氨基酸残基,包括任何两个所列值之间的范围。在一些实施例中,异源多肽包含大于20个氨基酸残基、大于30个氨基酸残基、大于40个氨基酸残基、大于50个氨基酸残基、大于60个氨基酸残基、大于70个氨基酸残基、大于80个氨基酸残基、大于90个氨基酸残基、大于100个氨基酸残基、大于120个氨基酸残基、大于150个氨基酸残基、大于200个氨基酸残基、大于250个氨基酸残基、大于300个氨基酸残基。在一些实施例中,异源多肽包含大于20个氨基酸。
在一些实施例中,异源多肽包含少于20个氨基酸残基、少于30个氨基酸残基、少于40个氨基酸残基、少于50个氨基酸残基、少于60个氨基酸残基、少于70个氨基酸残基、少于80个氨基酸残基、少于90个氨基酸残基、少于100个氨基酸残基、少于120个氨基酸残基、少于150个氨基酸残基、少于200个氨基酸残基、少于250个氨基酸残基、少于300个氨基酸残基、少于400个氨基酸残基、或少于500个氨基酸残基。在一些实施例中,异源多肽包含少于50个氨基酸。
在一些实施例中,异源多肽包含10和300个之间的氨基酸残基、10和200个之间的氨基酸残基、10和100个之间的氨基酸残基、10和50个之间的氨基酸残基、15和40个之间的氨基酸残基、20和40个之间的氨基酸、25和50个之间的氨基酸。在一些实施例中,异源多肽包含25和40个之间的氨基酸。
在一些实施例中,异源多肽具有5kDa至200kDa、10kDa至150kDa、15kDa至120kDa、20kDa至100kDa、25kDa至75kDa、25kDa至50kDa、30kDa至40kDa或30kDa至35kDa的分子量。在一些实施例中,异源多肽具有25kDa至50kDa或30kDa至35kDa的分子量。术语“多肽”进一步包括蛋白质。
在一些实施例中,可以分离异源多肽。“分离的”蛋白质或多肽是纯化至超出它们存在于细胞中的状态的蛋白质或多肽。在某些实施例中,它们可以是至少10%纯;在其他实施例中,它们可以基本上纯化至80%或90%纯度或更高。分离的蛋白质或多肽包括基本上纯的蛋白质或多肽,通过化学合成或通过生物和化学方法的组合产生的蛋白质或多肽,以及分离的重组蛋白质或多肽。本文称为“重组”的蛋白质或多肽是通过表达重组核酸产生的蛋白质或多肽。
本发明的异源多肽可以是天然存在的多肽。可替代地,异源多肽可包括最多一定整数数量的氨基酸改变。此类蛋白质或多肽变体保留功能性,并且包括通过添加、缺失或取代一个或多个氨基酸残基而不同的突变体,或包含一个或多个修饰残基的修饰的多肽和突变体。变体可具有一个或多个保守的变化,其中取代的氨基酸具有相似的结构或化学性质(例如,用异亮氨酸替代亮氨酸)。改变可以发生在参考多肽序列的氨基末端位置或羧基末端位置或这些末端位置之间的任何位置,单独地散布在参考序列中的氨基酸之间,或是以一个或多个连续组散布于参考序列内。
在某些实施例中,变体多肽可以与其天然存在的多肽至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的。可以使用计算机程序(例如可从NCBI和其他来源公开获得的BLASTP和TBLASTN程序)或直接序列比较来计算序列同一性百分比。可以使用本领域已知的技术产生多肽变体,这些技术包括直接修饰分离的多肽、直接合成或使用例如重组DNA技术修饰编码多肽的核酸序列。
本文还考虑了修饰的异源多肽,包括具有翻译后修饰的多肽。分离的多肽可以通过例如磷酸化、甲基化、法尼基化、羧甲基化、香叶基香叶基化、糖基化、乙酰化、豆蔻酰化、异戊烯化、棕榈酰化、酰胺化、硫酸化、酰化或其他蛋白质修饰来修饰。它们还可以用能够直接或间接提供可检测信号的标记进行修饰,包括但不限于放射性同位素和荧光化合物。多肽可用作通过标准方法制备抗体的抗原。
根据本披露,这些异源多肽可以与信号多肽融合(使用例如重组技术)以指导异源多肽从宿主细胞的分泌。在一些实施例中,异源多肽可以与信号多肽融合,但在信号多肽和异源多肽之间具有间隔子多肽。信号多肽与异源多肽的融合可以通过本领域技术人员已知的方法(例如使用重组技术)完成。在本上下文中,异源多肽一旦被转运至周质或胞外环境就被称为“分泌的多肽”,并且可包括完整多肽或多肽的功能结构域。希望从宿主细胞分泌的任何异源多肽(例如,酶或药学上有活性的蛋白质等)适合与本文所述的信号多肽一起使用。信号多肽典型地与分泌的多肽的氨基末端融合。融合多肽可以通过培养用融合核酸分子转染的重组细胞来产生,该融合核酸分子编码附接至分泌的多肽或其结构域的氨基末端的信号多肽。在某些实施例中,融合信号多肽除了指导其分泌外,还可以增加分泌的异源多肽的表达。
如本文所用,“分泌的”等是指如下多肽:该多肽由细胞产生,穿过膜或通过膜转运,并由该细胞输出到表达其的细胞的周质、外膜或胞外环境。在一些实施例中,“分泌的”蛋白质包括但不限于从表达它们的细胞中完全分泌的蛋白质(例如,可溶性蛋白质)。在一些实施例中,多肽不稳定地附接至细胞。在一些实施例中,分泌的异源多肽可溶于胞外环境。在一些实施例中,分泌的异源多肽不包括锚。
可通过本领域已知的任何测定来检测分泌的蛋白质的胞外存在以检测目的蛋白。实例包括酶活性测定,用特异性抗体检测(免疫印迹法,ELISA等)和其他合适的检测技术。
在一些实施例中,本发明包含蛋白质,其包含(i)多肽,该多肽包含与SEQ ID NO:1具有至少90%、95%或100%序列同一性的氨基酸,和(ii)异源多肽。在一些实施例中,本发明涵盖的蛋白质具有生物活性,即它们在附接或不附接信号多肽的情况下继续具有异源多肽的所希望的生物活性。“保留活性”是指蛋白质将具有至少约30%、至少约50%、至少约70%、至少约80%、约90%、约95%、约100%、约110%、约125%、约150%、至少约200%或更高活性的异源多肽。
在一些实施例中,异源多肽/蛋白质以活性形式产生。术语“活性”意指存在生物活性,其中生物活性与相应的天然蛋白质或多肽的生物活性可比较的或基本地对应。在蛋白质的上下文中,这典型地意指与使用标准参数的相应天然蛋白质或多肽相比较,多肽包含具有至少约20%,约50%,优选地至少约60%-80%,并且最优选至少约90%-95%活性的生物学功能或效果。可以利用针对特定蛋白质或多肽的相应标准、靶向比较生物学测定来进行蛋白质或多肽活性的确定。目的蛋白质或多肽保持生物活性的一个指示是该多肽与天然多肽在免疫学上交叉反应。
本发明的方法和组合物可用于在细胞表达系统中产生高水平的适当加工的目的异源多肽/蛋白质。目的蛋白质或多肽可以是任何种类和任何大小的蛋白质或多肽。然而,在某些实施例中,异源多肽/蛋白质是治疗上有用的蛋白质或多肽。在一些实施例中,异源多肽/蛋白质可以是哺乳动物蛋白质,例如人类蛋白质,并且可以是例如生长因子、细胞因子、趋化因子或血液蛋白质。可以以与天然蛋白质或多肽类似的方式处理异源多肽/蛋白质。在某些实施例中,异源多肽与信号多肽融合。在一些实施例中,如本文所述的蛋白质包括信号多肽。
本发明的异源多肽可包括有利地易位至周质或胞外环境的任何多肽。在一些实施例中,异源多肽是商业上重要的多肽。在一些实施例中,异源多肽选自下组,该组由以下组成:酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。所希望的异源多肽/蛋白质的另外的实例包括但不限于萤光素酶;荧光蛋白(例如GFP);生长激素(GH)及其变体;胰岛素样生长因子(IGF)及其变体;粒细胞集落刺激因子(G-CSF)及其变体;促红细胞生成素(EPO)及其变体;胰岛素,例如胰岛素原、前胰岛素原、胰岛素、胰岛素类似物等;抗体及其变体,例如杂合抗体、嵌合抗体、人源化抗体、单克隆抗体;抗体的抗原结合片段(Fab片段),抗体的单链可变片段(scFV片段);肌营养不良蛋白及其变体;凝血因子及其变体;囊性纤维化跨膜传导调节子(CFTR)及其变体;和干扰素及其变体等。在一些实施例中,异源多肽是疫苗中使用的抗原。
根据本发明的异源多肽/蛋白质的实例可包括分子,例如肾素,生长激素、包括人类生长激素;牛生长激素;生长激素释放因子;甲状旁腺激素;促甲状腺激素;脂蛋白;α-1-抗胰蛋白酶;胰岛素A-链;胰岛素B-链;胰岛素原;促血小板生成素;促卵泡激素;降钙素;黄体生成素;胰高血糖素;凝血因子,例如因子VIIIC、因子IX、组织因子和血管性假血友病因子(von Willebrands factor);抗凝血因子,例如蛋白质C;心房钠尿因子;肺表面活性物质;纤溶酶原活化剂,例如尿激酶或人尿或组织型纤溶酶原活化剂(t-PA);铃蟾肽;凝血酶;造血生长因子;肿瘤坏死因子-α和肿瘤坏死因子-β;脑啡肽酶;血清白蛋白,例如人血清白蛋白;缪勒管激素(Muellerian)-抑制物质;松弛素A-链;松弛素B-链;松弛素原(prorelaxin);小鼠促性腺激素相关多肽;微生物蛋白质,例如β-内酰胺酶;DNA酶;抑制素;激活素;血管内皮生长因子(VEGF);激素或生长因子的受体;整合素;蛋白质A或D;类风湿因子;神经营养因子例如脑源性神经营养因子(BDNF),神经营养蛋白-3、-4、-5或-6(NT-3、NT-4、NT-5或NT-6),或神经生长因子例如NGF-13;心肌营养因子(心脏肥大因子)例如心肌营养因子-1(CT-1);血小板源性生长因子(PDGF);成纤维细胞生长因子例如aFGF和bFGF;表皮生长因子(EGF);转化生长因子(TGF)例如TGF-α和TGF-β,包括TGF-β1、TGF-β2、TGF-β3、TGF-β4、或TGF-β5;胰岛素样生长因子-I和-II(IGF-I和IGF-II);des(1-3)-IGF-I(脑IGF-I)、胰岛素样生长因子结合蛋白质;CD蛋白质例如CD-3、CD-4、CD-8、和CD-19;促红细胞生成素;骨诱导因子;免疫毒素;骨形态发生蛋白(BMP);干扰素例如干扰素-α、-β、和-γ;集落刺激因子(CSF),例如M-CSF、GM-CSF、和G-CSF;白细胞介素(IL),例如IL-1至IL-10;抗HER-2抗体;超氧化物歧化酶;T-细胞受体;表面膜蛋白;衰变加速因子;病毒抗原例如像AIDS包膜的部分;运输蛋白;归巢受体;地址素;调节蛋白;抗体;和任何以上列出的多肽的片段。
在某些实施例中,异源多肽/蛋白质可选自IL-1、IL-1a、IL-1b、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-12elasti、IL-13、IL-15、IL-16、IL-18、IL-18BPa、IL-23、IL-24、VIP、促红细胞生成素、GM-CSF、G-CSF、M-CSF、血小板源性生长因子(PDGF)、MSF、FLT-3配体、EGF、成纤维细胞生长因子(FGF;例如α-FGF(FGF-1)、β-FGF(FGF-2)、FGF-3、FGF-4、FGF-5、FGF-6、或FGF-7)、胰岛素样生长因子(例如IGF-1,IGF-2);肿瘤坏死因子(例如TNF,淋巴毒素)、神经生长因子(例如NGF)、血管内皮生长因子(VEGF);干扰素(例如IFN-α、IFNβ、IFN-γ);白血病抑制因子(LIF);睫状神经营养因子(CNTF);制癌蛋白M;干细胞因子(SCF);转化生长因子(例如TGF-α、TGF-β1、TGF-β2、TGF-γ);TNF超家族(例如LIGHT/TNFSF14、STALL-1/TNFSF13B(BLy5、BAFF、THANK)、TNFα/TNFSF2和TWEAK/TNFSF12);或趋化因子(BCA-1/BLC-1、BRAK/Kec、CXCL16、CXCR3、ENA-78/LIX、嗜酸性粒细胞趋化因子-1、嗜酸性粒细胞趋化因子-2/MPIF-2、Exodus-2/SLC、不规则趋化因子/神经趋化因子、GROα/MGSA、HCC-1、I-TAC、淋巴细胞趋化因子/ATAC/SCM、MCP-11MCAF、MCP-3、MCP-4、MDC/STCP-1/ABCD-1、MIP-4/PARC/DC-CK1、PF-4、RANTES、SDF1、TARC、或TECK)。
在本发明的一些实施例中,异源多肽/蛋白质可以是多亚基蛋白质或多肽的全部或部分。可以表达的多亚基蛋白质包括同聚蛋白质和异聚蛋白质。多亚基蛋白质可包括两个或更多个亚基,它们可以相同或不同。例如,异源多肽/蛋白质可以是包含2、3、4、5、6、7、8、9、10、11、12或更多个亚单位的同聚蛋白质。异源多肽/蛋白质也可以是包括2、3、4、5、6、7、8、9、10、11、12或更多个亚单位的异聚蛋白质。示例性多亚基蛋白包括:受体(包括离子通道受体);胞外基质蛋白(包括软骨素);胶原;免疫调节剂(包括MHC蛋白质,全链抗体和抗体片段);酶(包括RNA聚合酶和DNA聚合酶);和膜蛋白质。
在另一个实施例中,异源多肽/蛋白质可以是血液蛋白质。在该实施例中表达的血液蛋白质包括但不限于载体蛋白质,例如白蛋白(包括人类和牛白蛋白)、转铁蛋白、重组转铁蛋白半分子、触珠蛋白、纤维蛋白原和其他凝血因子、补体组分、免疫球蛋白、酶抑制剂、物质例如血管紧张素和缓激肽的前体、胰岛素、内皮素、和球蛋白(包括α、β和γ-球蛋白),以及主要在哺乳动物血液中发现的其他类型的蛋白质、多肽和其片段。已经报道了许多血液蛋白质的氨基酸序列(参见,S.S.Baldwin(1993)Comp.Biochem Physiol.[比较生物化学和生理学]106b:203-218),包括人类血清白蛋白的氨基酸序列(Lawn,L.M.等人,NucleicAcids Research[核酸研究]9:6103-6114(1981))和人类血清转铁蛋白(Yang,F.等人,Proc.Natl.Acad.Sci.USA[美国科学院院报]81:2752-2756(1984))。
在另一个实施例中,异源多肽/蛋白质可以是重组酶或辅因子。在该实施例中表达的酶和辅因子包括但不限于醛缩酶、胺氧化酶、氨基酸氧化酶、天冬氨酸酶、B12依赖性酶、羧肽酶、羧基酯酶、羧基裂解酶、胰凝乳蛋白酶、需要酶的辅酶A、氰醇合成酶、胱硫醚合成酶、脱羧酶、脱氢酶、醇脱氢酶、脱水酶、心肌黄酶、双加氧酶、烯酸还原酶、环氧物水合酶、富马酸酶、半乳糖氧化酶、葡糖异构酶、葡萄糖氧化酶、糖基转移酶、甲基转移酶、腈水化酶、核苷磷酸化酶、氧化还原酶、氧腈酶、肽酶、糖基转移酶、过氧化物酶、融合至治疗活性多肽的酶、组织纤溶酶原活化剂;尿激酶、蛇毒凝血酶、链激酶;过氧化氢酶、超氧化物歧化酶;DNA酶、氨基酸水解酶(例如天冬酰胺酶,氨基水解酶);羧肽酶;蛋白酶、胰蛋白酶、胃蛋白酶、胰凝乳蛋白酶、木瓜蛋白酶、菠萝蛋白酶、胶原酶;神经氨酸苷酶;乳糖酶、麦芽糖酶、蔗糖酶和阿拉伯呋喃糖苷酶。
在另一个实施例中,异源多肽/蛋白质可以是单链、Fab片段和/或全链抗体或其片段或部分。单链抗体可以包括在单个稳定折叠的多肽链上抗体的抗原结合区。Fab片段可以是特定抗体的一段。Fab片段可含有抗原结合位点。Fab片段可含有2个链:轻链和重链片段。这些片段可以经由接头或二硫键连接。
在另一个实施例中,异源多肽/蛋白质可以是疫苗中使用的抗原,例如可商购的疫苗。例如,在一些实施例中,异源多肽/蛋白质是在白喉、梭菌、破伤风、百日咳、脊髓灰质炎、乙型肝炎、b型流感嗜血杆菌、甲型肝炎、轮状病毒、肺炎球菌、腮腺炎、麻疹、风疹、水痘、人乳头瘤病毒、脑膜炎球菌、4型腺病毒、7型腺病毒、炭疽、脊髓灰质炎、脑膜炎球菌、狂犬病、轮状病毒、黄热病、带状疱疹和/或流感疫苗中发现的主要抗原。
在一些实施例中,异源多肽/蛋白质是成孔α-溶血素,也称为α-毒素(AT)(Natale等人,Biochimica et Biophysica Acta[生物化学与生物物理学学报]1778:1735-1756(2008))。AT由大多数金黄色葡萄球菌(Staphylococcus aureus)(S.aureus)产生并分泌为水溶性单体。处理AT多肽以产生重大约33kDa的293个氨基酸的成熟胞外蛋白质(Berube等人,Toxins[毒素]5:1140-1166(2013)),这是最充分表征的毒力因子之一。该蛋白质能够在宿主细胞膜上结合并寡聚成七聚体结构,但是它通过用亮氨酸(ATH35L)取代组氨酸35而在体外丧失溶血活性并在腹膜内鼠模型中丧失致死性(Menzies等人,Infect Immun[感染与免疫]62:1843-1847(1994))。由于没有可用于预防金黄色葡萄球菌感染的疫苗,已经研究了部分减弱的α毒素蛋白(ATH35L)作为预防金黄色葡萄球菌感染的疫苗靶标。(Adhikari等人,PLoS ONE[公共科学图书馆·综合]7:e38567(2012);Menzies等人,InfectImmun[感染与免疫]64:1839-1842(1996);Ragle等人,InfectImmun[感染与免疫]77:2712-2718(2009))。在一些实施例中,异源多肽/蛋白质包含来自金黄色葡萄球菌的α毒素,例如SEQID NO:3。在一些实施例中,α毒素在对应于H35的氨基酸位置包含取代。在一些实施例中,α毒素包含H35L取代(ATH35L),例如SEQ ID NO:4。在一些实施例中,异源多肽/蛋白质包含ATH35L和本发明的信号多肽,例如SEQ ID NO:2。
在某些实施例中,异源多肽是天然蛋白质(例如天然哺乳动物或人类蛋白质)或与其基本上同源。在这些实施例中,蛋白质不是以多联体形式发现,而是仅与信号多肽以及任选地标签序列连接以进行纯化和/或识别。
在一些实施例中,本发明涉及包含如本文所述的信号多肽和异源多肽的组合物。在一些实施例中,该组合物是药物或治疗剂。在一些实施例中,该组合物是治疗有效的。在一些实施例中,该组合物是药学上可接受的。
核酸
如本文所用的“核酸”或“多核苷酸”是指任何长度的含有嘌呤和嘧啶的聚合物,多核糖核苷酸或多脱氧核糖核苷酸或混合的多核糖核苷酸-多脱氧核糖核苷酸。这包括单链分子和双链分子(即DNA-DNA、DNA-RNA和RNA-RNA杂合体)。这还包括含有修饰的碱基的核酸。
本文中称为“分离的”的核酸是已从其天然环境中除去或与其起源来源的基因组DNA或细胞RNA的核酸分离的核酸(例如,它存在于细胞或核酸(例如文库)的混合物中),并且可能已经过进一步处理。分离的核酸包括通过本文所述的方法获得的核酸,类似的方法或其他合适的方法,包括基本上纯的核酸,通过化学合成、通过生物和化学方法的组合产生的核酸,以及分离的重组核酸。在一些实施例中,可以分离本文所述的任何核酸。
本文中称为“重组”的核酸是通过重组DNA方法产生的核酸,包括通过依赖人工复制方法(例如聚合酶链反应(PCR)和/或或使用限制性内切酶克隆到载体中)的程序产生的那些核酸。重组核酸还包括由通过细胞的天然机制发生的重组事件产生的那些,但是在引入被设计为允许或可能发生所希望的重组事件的核酸的细胞之后进行选择。在一些实施例中,本文所述的核酸可以是重组核酸。
核酸可以从其天然来源分离或使用重组DNA技术(例如,聚合酶链反应(PCR)扩增,克隆)或化学合成产生。核酸分子可包括,例如,基因、基因的天然等位基因变体、编码区或其部分、以及以某种方式通过核苷酸插入、缺失、取代和/或倒位修饰的编码和/或调节区,使得这些修饰基本上不会干扰核酸分子编码多肽或在严格条件下与天然基因分离株形成稳定杂合体的能力。核酸分子可包括简并性。如本文所用,核苷酸简并性是指一种氨基酸可由不同核苷酸密码子编码的现象。因此,编码蛋白质或多肽的核酸分子的核酸序列可以由于简并性而变化。
不需要核酸分子来编码具有蛋白质活性的多肽或蛋白质。例如,核酸分子可以编码截短的、突变的或无活性的蛋白质。
核酸可以衍生自各种来源,包括DNA、cDNA、合成DNA、合成RNA或其组合。此类序列可包含基因组DNA,其可包括或可不包括天然存在的内含子。序列、基因组DNA或cDNA可以以若干种方式中的任何一种获得。可以通过本领域熟知的方法从合适的细胞中提取和纯化基因组DNA。可替代地,可以将mRNA从细胞中分离并用于通过逆转录或其他方法产生cDNA。
在一些实施例中,本发明还包括具有编码新颖信号多肽的序列的核酸,该述信号多肽可用于将可操作地连接的目的异源多肽靶向(革兰氏阴性细菌的)周质或进入胞外空间。在一些实施例中,核酸编码信号多肽,该信号多肽包含与SEQ ID NO:1具有至少90%、95%或100%序列同一性的氨基酸序列。在另一个实施例中,核酸序列编码信号多肽,该多肽包含与SEQ ID NO:1的序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。
在一些实施例中,本发明包括具有编码本文所述的新颖信号多肽的序列的分离的核酸,该信号多肽可操作地连接至ATH35L(SEQ ID NO:2),其将ATH35L易位至(革兰氏阴性细菌的)周质或进入胞外空间。在一些实施例中,核酸编码多肽,该多肽包含与SEQ ID NO:2具有至少90%、95%或100%序列同一性的氨基酸序列。在另一个实施例中,核酸编码多肽,该多肽包含与SEQ ID NO:2的序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
在一些实施例中,核酸包含本文所述的信号多肽,和一种或多种有助于将核酸克隆到载体中的特征。在一些实施例中,核酸包含一个或多个限制性内切酶位点。
技术人员将理解,可以通过突变将变化引入本发明的核苷酸序列中,而不会导致编码的信号多肽的变化。在一些实施例中,技术人员可以通过突变引入本发明的核苷酸序列,其导致编码的信号多肽的氨基酸序列的改变,而不改变信号多肽的生物学活性。因此,可以通过将一个或多个核苷酸取代、添加或缺失引入本文披露的相应核苷酸序列中来产生变体分离的核酸分子,使得将一个或多个氨基酸取代、添加或缺失引入编码的蛋白质中。突变可通过标准技术、如定点诱变和PCR介导的诱变来引入。这些变体核苷酸序列也涵盖在本发明中。
本发明的“变体”多核苷酸包括天然存在的多核苷酸以及化学上改变的多核苷酸。本发明的天然存在的多核苷酸变体是如下那些,这些(i)在自然界中,例如在相关的病毒和非病毒物种中发现,(ii)通过如本文所述的化学相似性与本发明的多核苷酸相关以及(iii)编码如本文所述的编码的多肽连接的多肽。在一些实施例中,核酸可包含一种或多种变体多核苷酸。
可以基于宿主生物的密码子使用来调整本文披露的核酸。密码子使用或密码子偏倚在本领域中是熟知的。可以通过改变其遗传密码来修饰所选择的编码序列以匹配细菌宿主细胞所采用的编码序列,并且可以增强其密码子序列以更好地近似宿主所采用的密码子序列。遗传密码选择和密码子频率增强可以根据本领域普通技术人员已知的任何各种方法(例如寡核苷酸定点诱变)进行。有助于此方法的有用的在线InterNet资源包括,例如:(1)Kazusa DNA研究所的密码子使用数据库(2-6-7Kazusa-kamatari,木更津,千叶市292-0818日本)并且可在www.kazusa.orjp/codon获得;和(2)遗传密码表可从NCBI分类数据库www.ncbi.nln.nih.gov/-Taxonomy/Utils/wprintgc.cgi?mode=c.获得。应认识到,可以调整信号多肽,本文其他地方所述的目的异源多肽或两者的编码序列以用于密码子使用。
表达载体
本文还披露了载体(包括表达载体),该载体含有本发明的信号多肽和异源多肽。“载体”或“重组载体”是用作用于操作选择的核酸序列或将这种核酸序列引入宿主细胞的工具的核酸分子。重组载体可适用于克隆、测序或以其他方式操纵所选择的核酸序列,例如通过将选择的核酸序列表达或递送到宿主细胞中以形成重组细胞。这种载体典型地含有不与选择的核酸序列邻近的天然存在的异源核酸序列,尽管载体还可含有调节核酸序列(例如,启动子,非翻译区),该调节核酸序列天然存在于邻近所选择的核酸序列或可用于表达核酸分子。
“载体”或“表达载体”是复制子,例如质粒、噬菌体、病毒、转座子、噬菌粒或粘粒,向其上可以附接另一个DNA区段,即“插入片段”,以便产生在细胞中附接的DNA区段的复制。“载体”包括游离型(例如,质粒)和非游离型载体。在本披露的一些实施例中,该载体是游离型载体。在一些实施例中,该载体是质粒。通常,载体可含有在至少一种生物中有功能的复制起点,方便的限制性内切核酸酶位点和宿主细胞的可选择标记。
载体可以是RNA或DNA。载体可以作为染色体外元件(例如质粒)保持,或者可以将它整合到重组宿主细胞的染色体中。整个载体可以保留在宿主细胞内的位置,或者在某些条件下,质粒DNA可以被删除,留下选择的核酸分子。整合的核酸分子可以在染色体启动子控制下、在天然或质粒启动子控制下、或在若干种启动子控制的组合下。核酸分子的单个或多个拷贝可以整合到染色体中。重组载体可含有至少一种可选择标记。
术语“表达载体”是指能够在插入宿主细胞或其他(例如,无细胞)表达系统后指导已克隆到载体中的核酸序列的表达的载体。当核酸序列被转录以产生mRNA序列时,“表达”核酸序列。在本发明的大多数情况下,可以翻译该转录物以产生氨基酸序列,例如本发明的异源多肽/蛋白质。克隆的基因通常置于表达控制序列的控制下(即,可操作地连接)。短语“可操作地连接”是指以某种方式将核酸分子与表达控制序列连接,使得当引入(即,转化、转导、转染、缀合或导入)宿主细胞时可以表达分子。
重组载体和表达载体可含有一种或多种调节序列或表达控制序列。调节序列广泛地涵盖表达控制序列(例如,转录控制序列或翻译控制序列),以及允许载体在宿主细胞中复制的序列。转录控制序列是控制转录的起始、延伸、或终止的序列。合适的调节序列包括可以引入重组核酸分子的宿主细胞或生物中起作用的任何序列,包括控制转录起始的那些,例如启动子、增强子、终止子、操纵子和阻遏子序列。另外的调节序列包括翻译调节序列、复制起点和与重组细胞相容的其他调节序列(参见例如,D.V.Goeddel,MethodsEnzymol.[酶学方法]185:3-7)。
表达载体可含有允许一种或多种目的蛋白质的组成型表达或可诱导表达的元件。如本文所用的,“启动子”,“启动子序列”或“启动子区”是指能够结合RNA聚合酶并涉及起始下游编码或非编码序列的转录的DNA调节区/序列。在本披露的一些实例中,启动子序列包括转录起始位点并向上游延伸以包括以高于背景可检测水平起始转录所必需的最少数量的碱基或元件。在一些实施例中,启动子序列包括转录起始位点,以及负责RNA聚合酶结合的蛋白质结合结构域。各种启动子,包括诱导型启动子,可用于驱动本发明的各种载体。
许多诱导型和组成型表达系统是本领域已知的。例如,表达控制序列如启动子区可选自任何所希望的基因。细菌启动子可包括lacI、lacZ、T3、T7、gpt、λPR、Ptac16、Ptac17、PtacII、PlacUV5、T7lac启动子和trc。在一些实施例中,包含Ptac启动子的载体允许在不存在lad基因的情况下组成型表达,但是当载体还含有lad基因时,可以通过添加异丙基-β-D-硫代半乳糖苷(IPTG)来诱导表达。选择适当的启动子完全在本领域普通技术水平之内。
根据本发明使用的启动子可以是组成型启动子或调节的启动子。在一些实施例中,启动子不衍生自宿主细胞生物。在某些实施例中,启动子衍生自大肠杆菌生物。
可用于根据本发明的表达系统中的非lac型启动子的常见实例是本领域技术人员已知的。参见例如,J.Sanchez-Romero和V.De Lorenzo(1999)Genetic Engineering ofNonpathogenic Pseudomonas strains as Biocatalysts for Industrial andEnvironmental Processes[非致病性假单胞菌菌株的基因工程作为工业和环境方法的生物催化剂],在Manual of Industrial Microbiology and Biotechnology[工业微生物学和生物技术手册]中(A.Demain和J.Davies编辑)第460-74页(ASM出版社,华盛顿哥伦比亚特区);H.Schweizer(2001)Vectors to express foreign genes and techniques tomonitor gene expression for Pseudomonads[用于表达外源基因的载体和监测假单胞菌的基因表达的技术],Current Opinion in Biotechnology[生物技术新见],12:439-445;和R.Slater和R.Williams(2000)The Expression of Foreign DNA in Bacteria[外源DNA在细菌中的表达],(J.Walker和R.Rapley编辑)第125-54页(The Royal Society ofChemistry[皇家化学学会],剑桥,英国)。具有所选择的细菌宿主细胞天然启动子核苷酸序列的启动子也可用于控制编码靶标多肽的转基因的表达,例如,假单胞菌属邻氨基苯甲酸盐或苯甲酸盐操纵子启动子(Pant,Pben)。也可以使用串联启动子,其中一个以上的启动子与另一个启动子共价附接,无论序列相同或不同,例如Pant-Pben串联启动子(启动子间杂合体)或Plac-Plac串联启动子,或者是否衍生自相同或不同的生物。
调节的启动子利用启动子调节蛋白,以便控制启动子作为一部分的基因的转录。在本文使用调节的启动子的情况下,相应的启动子调节蛋白也是根据本发明的表达系统的一部分。启动子调节蛋白的实例包括:激活子蛋白质,例如大肠杆菌分解代谢物激活子蛋白质、MalT蛋白质;AraC家族转录激活子;阻遏子蛋白质,例如大肠杆菌LacI蛋白质;和双功能调节蛋白,例如大肠杆菌NagC蛋白。许多调节的启动子/启动子调节蛋白质是本领域已知的。
启动子调节蛋白与效应子化合物相互作用,即可逆地或不可逆地与调节蛋白结合的化合物,以使蛋白质能够释放或结合至启动子的控制下的基因的至少一个DNA转录调节区,从而允许或阻断转录酶在起始基因转录中的作用。效应子化合物被分类为诱导物或辅阻遏物,并且这些化合物包括天然效应化合物和安慰诱导物化合物。许多调节的启动子/启动子-调节-蛋白质/效应子-化合物三重体是本领域已知的。虽然效应子化合物可以在整个细胞培养或发酵中使用,但在使用调节的启动子的优选的实施例中,在所希望的数量或密度的宿主细胞生物量生长后,将适当的效应子化合物直接地或间接地添加至培养物中导致编码目的蛋白质或多肽的所希望的一个或多个基因的表达。
通过举例的方式,在利用lac家族启动子的情况下,lacI基因也可以存在于系统中。lacI基因(通常地)是组成型表达的基因,编码Lac阻遏子蛋白质(LacD蛋白质),该Lac阻遏子蛋白质与这些启动子的lac操纵子结合。因此,在利用lac家族启动子的情况下,lacI基因也可以包括在表达系统中并在表达系统中表达。在lac启动子家族成员例如tac启动子的情况下,效应子化合物是诱导物,优选地安慰诱导物例如IPTG(异丙基-D-1-硫代半乳糖苷,也称为“异丙基硫代半乳糖苷”)。
在一些实施例中,使用pET表达系统。pET表达系统提供高水平的蛋白质产生。从强T7lac启动子诱导表达。该系统利用噬菌体T7RNA聚合酶的高活性和特异性用于高水平转录目的基因。位于启动子区的lac操纵子提供比传统的基于T7的载体更严格的调节,改善质粒稳定性和细胞活力(Studier和Moffatt,J Molecular Biology[分子生物学杂志]189(1):113-30(1986);Rosenberg等人,Gene[基因]56(1):125-35(1987))。T7表达系统使用T7启动子和T7 RNA聚合酶(T7 RNAP)用于目的基因的高水平转录。在T7表达系统中实现高水平表达,因为T7RNAP比天然大肠杆菌RNAP更持续并且致力于目的基因的转录。通过在宿主细胞中提供T7RNAP的源来诱导所鉴定基因的表达。这通过使用含有T7RNAP基因的染色体拷贝的BL21大肠杆菌宿主来实现。T7 RNAP基因在lacUV5启动子的控制下,这可以通过IPTG诱导。T7RNAP在诱导后表达并转录目的基因。
在一些实施例中,使用pBAD表达系统。pBAD表达系统通过特定碳源例如葡萄糖、甘油和阿拉伯糖的存在允许目的蛋白质或多肽的严格控制的,可滴定的表达(Guzman等人,JBacteriology[细菌学杂志]177(14):4121-30(1995))。pBAD载体经过独特设计以精确控制表达水平。来自pBAD载体的异源基因表达在araBAD启动子处起始。启动子受araC基因产物的正调节和负调节。AraC是一种转录调节子,与L-阿拉伯糖形成复合物。在没有L-阿拉伯糖的情况下,AraC二聚体阻断转录。为了最大转录激活,需要两个事件:(i.)L-阿拉伯糖与AraC结合,允许转录开始。(ii.)cAMP激活子蛋白质(CAP)-cAMP复合物与DNA结合并刺激AraC与启动子区的正确位置的结合。
在一些实施例中,使用trc表达系统。trc表达系统允许来自trc启动子的大肠杆菌中的高水平、调节的表达。已经优化了trc表达载体以在大肠杆菌中表达真核基因。trc启动子是衍生自色氨酸(trp)和乳糖(lac)启动子的强杂合启动子。它通过lacO操纵子和lacIQ基因产物的调节(Brosius,J.,Gene[基因]27:161-72(1984))。
在一些实施例中,使用pJ411表达系统(DNA2.0门洛帕克公司(Inc.,Menlo Park),加利福尼亚州,美国)。表达包括T7启动子和卡那霉素抗性标记。
在另一个实施例中,表达载体进一步包含与信号多肽的编码序列邻近的标签序列或与目的异源多肽/蛋白质的编码序列邻近的标签序列。在一些实施例中,该标签序列允许蛋白质的鉴定、分开、纯化和/或分离。标签序列可以是亲和标签,例如六聚组氨酸亲和标签。在另一个实施例中,亲和标签可以是谷胱甘肽-S-转移酶分子。标签也可以是荧光分子,例如YFP或GFP,或这种荧光蛋白质的类似物。标签也可以是抗体分子的一部分,或用于已知的用于纯化的结合配偶体的已知抗原或配体。因此,在一些实施例中,载体可包含编码包含信号多肽、异源多肽和标签序列的蛋白质的核酸序列。
其他调节元件可以包括在载体中(也称为“表达构建体”)。这些元件包括但不限于,例如,转录增强子序列、翻译增强子序列、其他启动子、激活子、翻译起始和终止信号、转录终止子、顺反子调节子和多顺反子调节子。
典型地,载体包括与一种或多种表达控制序列(例如转录控制序列或翻译控制序列)可操作地连接的至少一种编码信号多肽和异源多肽的核酸分子。在一个方面,表达载体可包含如下核酸,该核酸编码信号多肽,如本文所述,与编码待表达的异源多肽/蛋白质的核酸融合,并且可操作地连接至至少一种调节序列。示例性的实施例包括表达载体,这些表达载体包含编码与ATH35L(SEQ ID NO:2)融合的如本文所述的信号多肽的核酸。应当理解的是,表达载体的设计可以取决于这样的因素,如将要转化的宿主细胞的选择和/或待表达的多肽的类型。
通常,载体将包括复制起点和可选择标记,其允许鉴定和分离转化的宿主细胞,例如大肠杆菌的氨苄青霉素抗性基因,和衍生的启动子以指导下游结构序列的转录。异源结构序列在适当的阶段与翻译起始和终止序列组装,并且可以包括如本文所述的能够指导翻译的蛋白质分泌到周质间隙或胞外介质中的信号多肽。通过将编码信号多肽和异源多肽的结构DNA序列与具有功能性启动子的可操作的阅读状态中的合适的翻译起始和终止信号一起插入,构建用于细菌用途的有用表达载体。载体可包含一种或多种表型可选择标记和复制起点,以确保载体的维持,并且如果希望,可在宿主内提供扩增。
除蛋白质编码序列外,根据本发明的载体可包括核糖体结合位点(RBS)、转录终止子、翻译起始和终止信号。有用的RBS可以从在根据本发明的表达系统中用作宿主细胞的任何物种中获得,优选地从选择的宿主细胞中获得。已知许多特定和各种共有RBS,例如D.Frishman等人描述和引用的那些,Starts of bacterial genes:estimating thereliability of computer predictions[细菌基因的开始:估计计算机预测的可靠性],Gene[基因]234(2):257-65(1999年7月8日);和B.E.Suzek等人,A probabilistic methodfor identifying start codons in bacterial genomes[一种用于鉴定细菌基因组中起始密码子的概率方法],Bioinformatics[生物信息学]17(12):1123-30(2001年12月)。另外,可以使用天然或合成的RBS,例如,在EP 0207459(合成RBS)中描述的那些;O.Ikehata等人,Eur.J.Biochem.[欧洲生物化学杂志]181(3):563-70(1989)(AAGGAAG的天然RBS序列)。方法、载体、翻译和转录元件以及本发明中有用的其他元件的另外实例描述于例如:Gilroy的美国专利号5,055,294和Gilroy等人的美国专利号5,128,130;Rammler等人的美国专利号5,281,532;Barnes等人的美国专利号4,695,455和4,861,595;Gray等人的美国专利号4,755,465;以及Wilcox的美国专利号5,169,760。
通过将增强子序列插入载体或质粒中来增加编码如本文所述的蛋白质和异源多肽的DNA的转录。典型的增强子是DNA的顺式作用元件,通常大小约为从10至300bp,其作用于启动子以增加其转录。实例包括各种大肠杆菌增强子。
通常,载体将包括复制起点和允许转化宿主细胞的可选择标记和衍生自高表达基因的启动子以指导下游结构序列的转录。这些启动子可以衍生自编码酶(例如3-磷酸甘油酸激酶(PGK)、酸性磷酸酶或热休克蛋白质等)的操纵子。异源结构序列在适当的阶段与翻译起始和终止序列组装,并且优选地,信号多肽能够指导翻译的多肽的分泌。任选地,异源序列可以编码融合多肽,包括赋予所希望的特征的N-末端识别多肽,例如表达的重组产物的稳定化或简化的纯化。
载体可含有可选择标记,编码用载体转化的宿主细胞存活或生长所必需的蛋白质的基因。当在适当的选择性培养基中生长时,该基因的存在仅允许表达载体的那些宿主细胞生长。典型的选择基因编码赋予抗生素或其他有毒物质抗性,补充营养缺陷型缺陷,或提供从特定培养基无法获得的关键营养物的蛋白质。标记可以是诱导型或非诱导型基因,并且通常允许阳性选择。可选择标记的非限制性实例包括氨苄青霉素抗性标记(即β-内酰胺酶)、四环素抗性标记、新霉素/卡那霉素抗性标记(即新霉素磷酸转移酶)、二氢叶酸还原酶、谷氨酰胺合成酶等。在一些实施例中,可选择标记基因是例如原养型恢复基因,其中载体用于对相应性状(例如生物催化性状,例如氨基酸生物合成或核苷酸生物合成性状,或碳源利用性状)是营养缺陷型的宿主细胞。如本领域技术人员所理解的,适当可选择标记的选择将取决于宿主细胞和不同宿主的适当标记。
大量合适的载体(其中许多包括内源调节DNA元件)是本领域技术人员已知的并且是可商购的或可以衍生自可商购的载体。作为代表性但非限制性的实例,用于细菌的有用载体可包含可选择标记和细菌复制起点,该起点衍生自包含众所周知的克隆载体pBR322(ATCC 37017)的遗传元件的可商购的质粒。这些商业载体包括,例如,pKK223-3(玛法西亚精细化学品公司(Pharmacia Fine Chemicals),乌普萨拉(Uppsala),瑞典)和GEM 1(普罗米加生物技术公司(Promega Biotech),麦迪逊(Madison),威斯康星州,美国)。这些pBR322“骨架”部分与适当的启动子和待表达的结构序列组合。其他示例性的细菌载体包括,例如,pBs、phagescript、PsiX174、pBluescript SK、pBs KS、pNH8a、pNH16a、pNH18a、pNH46a(斯特拉塔根公司(Stratagene));pTrc99A、pKK223-3、pKK233-3、pDR540和pRIT5(法玛西亚(Pharmacia))。在将合适的宿主菌株转化并使宿主菌株生长至合适的细胞密度后,通过适当的方法(例如温度转换或化学诱导)诱导或去阻遏选择的启动子,并将细胞再培养一段时间。
有用的质粒载体的其他实例包括但不限于由如下描述的载体,例如:N.Hayase,在Appl.Envir.Microbiol.[应用与环境微生物学]60(9):3336-42(1994年9月)中;A.A.Lushnikov等人,在Basic Life Sci.[基础生命科学]30:657-62(1985)中;S.Graupner和W.Wackemagel,在Biomolec.Eng.[生物分子工程]17(1):11-16.(2000年10月)中;H.P.Schweizer,在Curr.Opin.Biotech.[生物技术的最新观点]12(5):439-45(2001年10月)中;M.Bagdasarian和K.N.Timmis,在Curr.Topics Microbiol.Immunol.[微生物学与免疫学的当前课题]96:47-67(1982)中;T.Ishii等人,在FEMS Microbiol.Lett.[欧洲微生物学通讯]116(3):307-13(1994年3月1日)中;I.N.Olekhnovich和Y.K.Fomichev,在Gene[基因]140(1):63-65(1994年3月11日)中;M.Tsuda和T.Nakazawa,在Gene[基因]136(1-2):257-62(1993年12月22日)中;C.Nieto等人,在Gene[基因]87(1):145-49(1990年3月1日)中;J.D.Jones和N.Gutterson,在Gene[基因]61(3):299-306(1987)中;M.Bagdasarian等人,在Gene[基因]16(1-3):237-47(1981年12月)中;H.P.Schweizer等人,在Genet.Eng.[基因工程](纽约州)23:69-81(2001)中;P.Mukhopadhyay等人,在J.Bact.[细菌学杂志]172(1):477-80(1990年1月)中;D.O.Wood等人,在J.Bact.[细菌学杂志]145(3):1448-51(1981年3月)中;以及R.Holtwick等人,在Microbiology[微生物学]147(Pt 2):337-44(2001年2月)中。
宿主细胞
本发明提供基因工程化以表达如本文所述的信号多肽和异源多肽蛋白质的宿主细胞,其中编码信号多肽和异源多肽蛋白的核酸包含与信号多肽和/或异源多肽/蛋白可操作地连接的启动子,该启动子驱动细胞中多核苷酸的表达。宿主细胞可以是原核宿主细胞,例如革兰氏阳性或革兰氏阴性细菌细胞。在一些实施例中,启动子序列在原核生物中是可操作的。
在一些实施例中,本发明涉及工程化以表达本文所述的蛋白质、异源多肽和/或信号多肽的重组细胞。术语“重组细胞”是指包含如本文所述的核酸序列的宿主细胞,其中核酸编码如本文所述的信号多肽。在一些实施例中,编码信号多肽的核酸在一种或多种载体上。在一些实施例中,编码信号多肽的核酸可以掺入宿主细胞的基因组中。在一些实施例中,重组细胞是原核生物细胞。在一些实施例中,重组细胞属于埃希氏菌属。在一些实施例中,重组原核生物细胞是大肠杆菌。
在一些实施例中,本发明涉及用可操作地编码如本文所述的信号多肽的任何载体转化的宿主细胞。用本文披露的一个或多个载体转化宿主细胞可以使用本领域已知的任何转化方法进行,并且细菌宿主细胞可以作为完整细胞或原生质体(即包括胞质体)转化。示例性的转化方法包括穿孔方法(例如电穿孔)、原生质体融合、细菌缀合、和二价阳离子处理(例如氯化钙处理或CaCl/Mg2+处理)或本领域其他熟知的方法。参见例如,Morrison,J.Bact.[细菌学杂志],132:349-351(1977);Clark-Curtiss和Curtiss,Methods inEnzymology[酶学方法],101:347-362(Wu等人,编辑,1983),Sambrook等人,MolecularCloning,A Laboratory Manual[分子克隆:实验室手册](第2版1989);Kriegler,GeneTransfer and Expression:A Laboratory Manual[基因转移和表达:实验室手册](1990);和Current Protocols in Molecular Biology[当前分子生物学方法](Ausubel等人,编辑,1994)。
例如,这种宿主细胞可以含有使用已知的转化,转染或感染方法引入宿主细胞的本发明的核酸。术语“转化”是指将DNA引入合适的宿主细胞中,使得DNA可作为染色体外元件或通过染色体整合而可复制。如本文所用的术语“转染”是指表达载体由合适的宿主细胞摄取,无论是否实际表达任何编码序列。术语“感染”是指通过使用病毒或病毒载体将核酸引入合适的宿主细胞中。将重组构建体引入宿主细胞可以通过磷酸钙转染、DEAE葡聚糖介导的转染或电穿孔来实现(Davis,L.等人,Basic Methods in Molecular Biology[分子生物学基本方法](1986))。
宿主细胞可以通过任何合适的方法(包括电穿孔,氯化钙-、氯化锂-、醋酸锂/聚乙二醇-、磷酸钙-、DEAE-葡聚糖-、脂质体-介导的DNA摄取,原生质球,注射,显微注射,微粒轰击,噬菌体感染,病毒感染或其他建立的方法)进行转化、转染或适当的感染。示例性的实施例包括表达一种或多种本文所述的核酸分子或表达载体的宿主细胞或细胞群(例如,基因修饰的微生物)。已经如上所述引入核酸的细胞还包括这些细胞的后代。
携带如本文所述的载体的宿主细胞(即转化体或克隆)可以使用标记进行选择,这些标记取决于载体构建的模式。标记可以在相同或不同的DNA分子上。在原核宿主中,可以例如通过对氨苄青霉素、四环素或其他抗生素的抗性来选择转化体。基于温度敏感性的特定产物的生产也可以用作适当的标记。
宿主细胞可以在适当的培养基中培养。适当的或有效的培养基是指培养时宿主细胞(包括基因修饰的微生物)能够生长和/或表达本发明的异源多肽/蛋白质的任何培养基。这种介质典型地是包含碳、氮和磷酸盐源的含水介质,但也可包括适当的盐、矿物质、金属和其他营养物。微生物和其他细胞可以在常规生物反应器中和通过任何方法培养,包括分批、补料分批、细胞再循环和连续发酵。将培养基的pH调节至适于特定生物的生长和蛋白质产生的pH。可以对生长室进行通气,以便提供用于生长所需的氧气并且避免二氧化碳的过度积累。用于各种宿主细胞的培养基和条件是本领域已知的。
在一些实施例中,宿主细胞是原核生物细胞。在一些实施例中,原核生物是革兰氏阴性细菌,例如埃希氏菌属、假单胞菌属、奈瑟氏菌属、耶尔森菌属、沙门氏菌属、志贺氏菌属、莫拉菌属、螺杆菌属、寡养单胞菌属、芽胞杆菌属、葡萄球菌属、链霉菌属、蛭弧菌属、军团杆菌属、蓝细菌、螺旋体、绿色硫细菌、克雷白氏杆菌属或沙雷氏菌属的细菌。在一些实施例中,革兰氏阴性细菌属于埃希氏菌属,例如大肠杆菌。
在一些实施例中,宿主细胞可以是能够产生目的蛋白质或多肽的任何细胞,包括如上所述的任何一种革兰氏阴性原核生物。产生目的蛋白质或多肽的最常用系统包括某些细菌细胞,特别是大肠杆菌,因为它们相对便宜的生长要求和在大批量培养物中产生蛋白质的潜在能力。这些系统被充分表征,提供通常可接受的总蛋白质表达水平,并且相对快速且便宜。典型的细菌细胞描述于例如“Biological Diversity:Bacteria and Archaeans[生物多样性:细菌和古生菌]”,在线生物学书的一章,由美国亚利桑那州埃斯特雷亚山社区学院的M J Farabee博士在www.emc.maricotpa.edu/faculty/farabee/BIOBK/BioBookDiversity网站上提供。在某些实施例中,宿主细胞可以是埃希氏菌属细胞,并且典型地可以是大肠杆菌细胞。
在一些实施例中,宿主细胞可以是任何细菌分类单元的成员。例如,细胞可以是任何真细物种的成员。宿主可以是任何一个分类的成员:酸杆菌门、放线菌门、产水菌门、拟杆菌门、绿菌门、衣原体门、绿弯菌门、产金菌门、蓝藻门、脱铁杆菌门、异常球菌门、网团菌门、纤维杆菌门、厚壁菌门、梭杆菌门、芽单胞菌门、黏胶球形菌门、硝化螺旋菌门、浮霉菌门、变形菌门、螺旋体门、热脱硫杆菌门、热微菌门、热袍菌门、栖热菌门(栖热菌目)、或疣微菌门。在真细菌宿主细胞的实施例中,细胞可以是任何真细物种的成员。
细菌宿主也可以是任何变形菌门的成员。变形菌门宿主细胞可以是如下任何一个分类的成员:α-变形菌纲、β-变形菌纲、γ-变形菌纲、δ-变形菌纲、或ε-变形菌纲。此外,宿主可以是如下任何一个分类的成员:α-变形菌纲、β-变形菌纲、或γ-变形菌纲,和γ-变形菌纲的任何物种的成员。
在γ变形杆菌宿主的一些实施例中,宿主将是如下任何一个分类的成员:气单胞菌目、交替单胞菌目、肠杆菌目、假单胞菌目、或黄色单胞菌目;或肠杆菌目或假单胞菌目的任何物种的成员。在一些实施例中,宿主细胞可以是肠杆菌目,宿主细胞将是肠杆菌科的成员,或者可以是欧文菌属、埃希氏菌属或沙雷氏菌属中的任何一个的成员;或埃希氏菌属的成员。在宿主细胞是假单胞菌目的情况下,宿主细胞可以是假单胞菌科的成员,包括假单胞菌属。γ变形杆菌宿主包括物种大肠杆菌的成员和物种荧光假单胞菌(Pseudomonasfluorescens)的成员。
产生分泌的异源蛋白质的方法
本发明的方法提供了包含如本文所述的信号多肽的融合蛋白的表达。在一些实施例中,该方法包括表达与本发明的信号多肽连接的目的异源多肽的宿主细胞。该方法包括提供宿主细胞,例如大肠杆菌宿主细胞,其包含编码重组蛋白的载体,该重组蛋白包含与本文披露的信号多肽可操作地连接的目的蛋白质或多肽,并且在导致蛋白质或多肽表达的条件下培养细胞。可替代地,使用鉴定的信号多肽表达蛋白质或多肽的方法可用于任何给定的宿主系统,包括其他原核起源的宿主细胞。载体可以具有上述任何特征。在一些实施例中,宿主细胞包含载体,该载体包含编码本文披露为SEQ ID NO:1的信号多肽的核苷酸序列,或其变体和片段。在另一个实施例中,载体包含编码SEQ ID NO:2的蛋白质的核苷酸序列,或其变体和片段。
在一些实施例中,本发明涉及产生蛋白质(例如本发明的异源多肽)的方法,该方法包括培养工程化以表达蛋白质的重组细胞,或在表达蛋白质的条件下用编码该蛋白质的载体转化宿主细胞。在一些实施例中,重组细胞或宿主细胞在细胞培养物中在蛋白质从重组细胞或宿主细胞分泌的条件下培养。在一些实施例中,重组细胞或宿主细胞在细胞培养物中在将信号多肽从蛋白质切割的条件下培养。
在另一个实施例中,宿主细胞具有周质,并且信号多肽的表达导致基本上所有目的异源多肽靶向细胞周质。已经认识到在周质中表达的一小部分蛋白质可能实际上可以通过细胞膜泄漏到胞外空间中;然而,大多数靶向多肽将保留在周质间隙内。
本文所述的用于宿主细胞的细胞生长条件可包括促进目的蛋白质表达的细胞生长条件,和/或促进表达的目的蛋白质发酵的细胞生长条件。如本文所用,术语“发酵”包括采用直接发酵(literal fermentation)的实施例和采用其他非发酵培养模式的实施例。在一些实施例中,发酵培养基可选自丰富培养基、基本培养基和矿物盐培养基;可以使用丰富培养基,但优选地避免使用。在另一个实施例中,选择基本培养基或矿物盐培养基。在仍另一个实施例中,选择基本培养基。在又另一个实施例中,选择无机盐培养基。矿物盐培养基是特别优选的。
根据本发明的表达系统可以是以任何发酵形式培养。例如,本文可采用分批、补料分批、半连续和连续发酵模式。其中蛋白质被排泄到胞外培养基中,优选连续发酵。
发酵可以任何规模进行。因此,例如,可以使用微升规模、厘升规模和分升规模的发酵体积;并且可以使用1升规模和更大的发酵体积。在一些实施例中,发酵体积将为1升或高于1升。在另一个实施例中,发酵体积将为或高于5升、10升、15升、20升、25升、50升、75升、100升、200升、500升、1,000升、2,000升、5,000升、10,000升、或50,000升。
在本发明中,转化的宿主细胞的生长、培养、和/或发酵在允许宿主细胞存活的温度范围内进行,优选地温度在约4℃至约55℃的范围内,包括端值。因此,例如,术语“生长(growth)”(和“生长(grow,growing)”),“培养(culturing)”(和“培养(culture)”),和“发酵(fermentation)”(和“发酵(ferment,fermenting)”),如本文所用,关于本发明的宿主细胞,本质上意指“生长”、“培养”和“发酵”,在约4℃至约55℃的温度范围内,包括端值。此外,“生长”用于指示活性细胞分裂和/或扩大的生物学状态,以及非分裂和/或非扩大细胞正在代谢持续的生物状态两者,后者使用术语“生长”与术语“维持”同义。
信号多肽可以以与异源多肽连接的方式表达,并且信号连接的多肽可以从细胞中纯化。因此,在一些实施例中,该分离的异源多肽是信号多肽和目的异源多肽的融合蛋白。然而,当异源多肽靶向周质时,信号多肽也可以从异源多肽上切割下来。在一些实施例中,修饰信号多肽和异源蛋白质或多肽之间的连接以增加信号多肽的切割。
该表达可导致胞外异源多肽的产生。该方法还可包括从周质或从胞外培养基中纯化目的异源多肽的步骤。在一些实施例中,本发明包括产生蛋白质,例如异源多肽,并且然后从细胞培养物中回收蛋白质。在一些实施例中,回收蛋白质包括离心以去除细胞和/或细胞碎片。在一些实施例中,回收蛋白质包括过滤以去除细胞和/或细胞碎片。
短语“回收蛋白质”是指收集含有蛋白质的完整培养基,并且不需要暗示额外的分离或纯化步骤。蛋白质可使用各种标准蛋白质纯化技术纯化,这些纯化技术例如亲和色谱、离子交换色谱、过滤、电泳、疏水相互作用色谱、凝胶过滤色谱、反相色谱、伴刀豆球蛋白A色谱、聚焦色谱、差别溶解度、制备型圆盘-凝胶电泳、等电聚焦、HPLC、反相HPLC或逆流分布。多肽可含有促进检测或纯化的额外的蛋白质或表位标签,例如c-myc、血细胞凝集素(HA)、聚组氨酸、GLU-GLU、FLAG-标签、谷胱甘肽-S-转移酶(GST)、绿色荧光蛋白(GFP)、或麦芽糖结合蛋白(MBP)。在回收多肽后可以除去这些标签。
本发明的方法还可以导致宿主细胞内目的蛋白质或多肽的产生增加。增加的产量可替代地可以是每克产生的蛋白质或每克宿主蛋白质的适当加工的蛋白质或多肽的水平增加。增加的产量还可以是每克重组体或每克宿主细胞蛋白质产生的可回收蛋白质或多肽的水平增加。增加的产量还可以是总蛋白质水平增加、适当加工的蛋白质水平增加或活性或可溶性蛋白质水平增加的任何组合。在该实施例中,术语“增加的”是相对于当在没有本发明的信号多肽的细胞中表达目的蛋白质或多肽时产生的,适当加工的,可溶性和/或可回收的蛋白质或多肽的水平,或当用dsbA信号多肽表达目的蛋白质或多肽时产生的,适当加工的,可溶性和/或可回收的蛋白质或多肽水平。
异源目的多肽的改善的表达也可以是指多肽溶解度的增加。可以从宿主细胞的细胞质、周质或胞外培养基中产生的和回收的目的异源多肽。异源多肽可以是不溶性的或可溶性的。如上所讨论的,异源多肽可包括一个或多个序列以辅助纯化。
本文所用的术语“可溶性”意指当在生理条件下在缓冲液中旋转10-30分钟时,异源多肽不会在大约5,000X和20,000X重力之间通过离心沉淀。可溶性蛋白质不是包涵体或其他沉淀物质的部分。类似地,“不溶性”意指当在生理条件下在缓冲液中旋转10-30分钟时,可以通过在5,000X和20,000X重力之间离心来沉淀蛋白质或多肽。不溶性蛋白质或多肽可以是包涵体或其他沉淀物质的部分。术语“包涵体”意指包括胞内含有的任何胞内体,其中蛋白质或多肽的聚集体已被螯合。
本发明的方法可以产生定位于宿主细胞周质的异源多肽。在一些实施例中,该方法在细胞中产生适当加工的目的异源多肽。在另一个实施例中,信号多肽的表达可以在细胞中产生目的活性异源多肽。与异源多肽在没有本发明的信号多肽的情况下表达时相比,或与异源多肽用dsbA信号多肽表达时相比,本发明的方法还可以导致目的异源多肽的产量增加。
在一些实施例中,该方法在周质区室中产生至少0.1g/L蛋白质。在另一个实施例中,该方法在细胞中产生0.1至10g/L的周质蛋白质,或至少约0.2、约0.3、约0.4、约0.5、约0.6、约0.7、约0.8、约0.9或至少约1.0g/L周质蛋白质。在一些实施例中,产生的总目的蛋白质或多肽是至少1.0g/L、至少约2g/L、至少约3g/L、约4g/L、约5g/L、约6g/L、约7g/L、约8g/L、约10g/L、约15g/L、约20g/L、至少约25g/L或更高。在一些实施例中,产生的周质蛋白质的量为产生的总目的异源多肽的至少约5%、约10%、约15%、约20%、约25%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%、约96%、约97%、约98%、约99%或更多。
在一些实施例中,该方法产生至少0.1g/L正确加工的异源多肽。正确加工的异源多肽具有天然蛋白质的氨基末端。在一些实施例中,至少50%的目的异源多肽包含天然氨基末端。在另一个实施例中,异源多肽的至少60%、至少70%、至少80%、至少90%或更多具有天然蛋白质的氨基末端。在各种实施例中,该方法在细胞中产生0.1至10g/L正确加工的异源多肽,包括至少约0.2、约0.3、约0.4、约0.5、约0.6、约0.7、约0.8、约0.9或至少约1.0g/L正确加工的蛋白质。在另一个实施例中,产生的总正确加工的目的异源多肽为至少1.0g/L、至少约2g/L、至少约3g/L、约4g/L、约5g/L、约6g/L、约7g/L、约8g/L、约10g/L、约15g/L、约20g/L、约25g/L、约30g/L、约35g/l、约40g/l、约45g/l、至少约50g/L、或更高。在一些实施例中,产生的正确加工的异源多肽的量为正确加工形式的总重组蛋白的至少约5%、约10%、约15%、约20%、约25%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%、约96%、约97%、约98%、至少约99%、或更高。
本发明的方法还可以导致目的异源多肽的产量增加。在一些实施例中,该方法产生目的异源多肽,该异源多肽为总细胞蛋白质(tcp)的至少约5%、至少约10%、约15%、约20%、约25%、约30%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%或更高。“总细胞蛋白质百分比”是宿主细胞中异源多肽的量占聚集细胞蛋白质的百分比。总细胞蛋白质百分比的确定是本领域熟知的。
在一个具体的实施例中,当生长时(即在约4℃至约55℃的温度范围内,包括约10℃、约15℃、约20℃、约25℃、约30℃、约35℃、约40℃、约45℃和约50℃),宿主细胞可具有至少1%tcp的表达水平和至少40g/L的细胞密度的异源多肽或其片段。
在一些实施例中,本发明涉及增加从宿主细胞分泌异源多肽的速率。在一些情况下,分泌速率可有利地减少生产时间,从而降低成本并提高效率。在一些实施例中,本发明涉及增加蛋白质从细胞分泌的速率的方法,该方法包括:(a)在细胞培养物中培养宿主细胞,该宿主细胞包含如本文所述的编码包含信号多肽的蛋白质的核酸或载体,(b)诱导蛋白质的表达,和(c)回收蛋白质,该蛋白质包含分泌到细胞培养物的上清液中的信号多肽,其中将蛋白质分泌速率与具有dsbA信号多肽的蛋白质的蛋白质分泌速率进行比较。蛋白质分泌速率可以通过测量随时间分泌到胞外环境(即细胞培养物的上清液)中蛋白质的量来测量。
在一些实施例中,蛋白质分泌速率减少了产生所希望的量的蛋白质所需的时间量。例如,在一些实施例中,包含分泌到细胞培养物的上清液中的信号多肽的蛋白质的回收发生在诱导蛋白质表达后6和15小时之间、7和12小时之间、或8和10小时之间。在一些实施例中,当将蛋白质分泌速率与具有dsbA信号多肽的蛋白质的蛋白质分泌速率进行比较时,蛋白质分泌速率每小时增加大于10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。
在一些实施例中,本发明涉及增加蛋白质从细胞分泌的量的方法,该方法包括:(a)在细胞培养物中培养宿主细胞,该宿主细胞包含编码如本文所述的信号多肽的核酸或载体,(b)诱导蛋白质的表达,以及(c)回收分泌到细胞培养物的上清液中的蛋白质,其中将分泌的蛋白质的量与具有dsbA信号多肽的蛋白质进行比较。在一些实施例中,与具有dsbA信号多肽的蛋白质相比,从细胞分泌的蛋白质的量增加大于20%。在一些实施例中,与具有dsbA信号多肽的蛋白质相比,从细胞分泌的蛋白质的量增加大于100%。
在一些实施例中,本发明涉及制备蛋白质的方法,所述方法包括:(a)培养包含编码本披露的信号多肽的如本文所述的核酸或载体的宿主细胞,使得表达该核酸或载体,由此当核酸或载体在宿主细胞中表达时,由核酸或载体编码的蛋白质从细胞分泌到上清液中;以及(b)从上清液中分离分泌的蛋白质。在一些实施例中,宿主细胞或重组细胞是大肠杆菌。在一些实施例中,宿主细胞在细胞培养物中在信号多肽从蛋白质切割的条件下培养。在一些实施例中,本发明的方法包括分离分泌的蛋白质,包括离心以去除细胞和/或细胞碎片。在一些实施例中,本发明的方法包括分离分泌的蛋白质,包括过滤以去除细胞和/或细胞碎片。本发明可以涉及通过如本文所述方法制备的任何蛋白质。
在实践中,通常在胞外环境中发现靶向周质的异源蛋白质,可能是因为外细胞膜的损伤或流动性增加。通过使用透化外细胞膜的各种机制,可以增加这种“被动”分泌的速度:大肠杆菌素(Miksch等人(1997)Arch.Microbiol.[微生物学文献集]167:143-150);生长速率(Shokri等人(2002)App Miocrobiol Biotechnol[应用微生物学及生物科技]58:386-392);TolIII过表达(Wan和Baneyx(1998)Protein Expression Purif.[蛋白表达纯化]14:13-22);细菌素释放蛋白质(Hsiung等人(1989)Bio/Technology[生物/科技]7:267-71),大肠杆菌素A裂解蛋白质(Lloubes等人(1993)Biochimie[生物化学]75:451-8)突变体泄漏周质蛋白质(Furlong和Sundstrom(1989)Developments in Indus.Microbio.[工业微生物学进展]30:141-8);融合配偶体(Jeong和Lee(2002)Appl.Environ.Microbio.[应用与环境微生物学]68:4979-4985);通过渗透压休克回收(Taguchi等人(1990)BiochimicaBiophysica Acta[生物化学与生物物理学学报]1049:278-85)。将工程化蛋白质运输到周质间隙并随后在培养液中定位已被用于在大肠杆菌中产生适当折叠的和活性的蛋白质(Wan和Baneyx,Protein Expression Purif.[蛋白表达纯化]14:13-22(1998);Simmons等人,J.Immun.Meth.[免疫法杂志]263:133-147(2002);Lundell等人,J.Indust.Microbio.[工业微生物学杂志]5:215-27(1990))。
本发明还可以改善“活性”异源多肽/蛋白质的回收。活性蛋白质的比活性可以是序列衍生的天然蛋白质或多肽的比活性的至少约20%、至少约30%、至少约40%、约50%、约60%、至少约70%、约80%、约90%、或至少约95%。此外,底物特异性(kcat/Km)任选地基本上类似于天然蛋白质或多肽。典型地,kcat/Km为至少约30%、约40%、约50%、约60%、约70%、约80%、至少约90%、至少约95%或更高。测定和定量蛋白质和多肽活性和底物特异性(kcat/Km)的测量的方法是本领域技术人员熟知的。
还可以将异源多肽/蛋白质的活性与之前建立的天然蛋白质或多肽标准活性进行比较。可替代地,异源多肽/蛋白质的活性可以在与天然蛋白质或多肽的同时、或基本上同时的比较测定中确定。例如,体外测定可用于确定目的蛋白质或多肽与靶标之间的任何可检测的相互作用,例如,表达的酶和底物之间、表达的激素和激素受体之间、表达的抗体和抗原之间等。这种检测可包括比色变化、增殖变化、细胞死亡、细胞排斥、放射活性变化、溶解度变化、通过凝胶电泳和/或凝胶排阻方法测量的分子量变化、磷酸化能力的测量,抗体特异性测定例如ELISA测定等。通常,任何体外或体内测定可用于确定目的蛋白质或多肽的活性性质,其允许对天然蛋白质或多肽进行比较分析,只要这种活性是可测定的。可替代地,可以测定本发明中产生的异源多肽/蛋白质刺激或抑制蛋白质或多肽与分子之间相互作用的能力,该分子通常与蛋白质或多肽相互作用,例如天然蛋白质通常相互作用的底物或信号途径的组分。此类测定典型地可包括在允许蛋白质或多肽与靶标分子相互作用的条件下将蛋白质与底物分子组合的步骤,以及检测与蛋白质和靶标分子相互作用的生物化学结果。
为了测量目的蛋白质的产量、溶解度、构象和/或活性,可能希望从宿主细胞和/或胞外培养基中分离蛋白质。分离可以是粗分离,半-粗分离或纯分离,这取决于用于进行适当测量的测定的要求。为了从周质释放靶标蛋白质,已经使用了涉及化学制剂例如氯仿(Ames等人(1984)J.Bacteriol.[细菌学杂志],160:1181-1183)、盐酸胍、和Triton X-100(Naglak和Wang(1990)Enzyme Microb.Technol.[酶与微生物技术],12:603-611)的处理。然而,这些化学物质不是惰性的并且可能对许多重组蛋白质产物或随后的纯化程序具有有害效果。已经报道,大肠杆菌细胞的甘氨酸处理导致外膜透化,以释放周质内容物(Ariga等人(1989)J.Ferm.Bioeng.[发酵与生物工程杂志],68:243-246)。最广泛使用的重组蛋白质的周质释放的方法是渗透压休克(Nosal和Heppel(1966)J.Biol.Chem.[生物化学杂志],241:3055-3062;Neu和Heppel(1965)J.Biol.Chem.[生物化学杂志],240:3685-3692),鸡蛋清(HEW)-溶菌酶/乙二胺四乙酸(EDTA)处理(Neu和Heppel(1964)J.Biol.Chem.[生物化学杂志],239:3893-3900;Witholt等人(1976)Biochim.Biophys.Acta[生物化学与生物物理学学报],443:534-544;Pierce等人(1995)ICheme Research.Event[ICheme研究事件],2:995-997),和组合的HEW-溶菌酶/渗透压休克处理(French等人(1996)EnzymeandMicrob.Tech.[酶与微生物技术],19:332-338)。法国方法涉及将细胞重新悬浮在分级缓冲液中,随然后回收周质级分,其中渗透压休克在溶菌酶处理后立即进行。
典型地,这些程序包括在渗透稳定培养基中的初始破坏,随后在非稳定培养基中选择性释放。这些培养基的组成(pH,保护剂)和所用的破坏方法(氯仿、HEW-溶菌酶、EDTA、超声处理)在报道的具体方法中有所不同。Stabel等人(1994)Veterinary Microbiol.[兽医微生物学],38:307-314讨论了使用偶极离子洗涤剂代替EDTA的HEW-溶菌酶/EDTA处理的变化。关于使用胞内裂解酶系统破坏大肠杆菌的一般综述,参见,Dabora和Cooney(1990)在Advances in Biochemical Engineering/Biotechnology[生物化学工程/生物技术进展],第43卷,A.Fiechter编辑(施普林格出版社(Springer-Verlag):柏林,第11-30页中。
美国专利号4,595,658披露了一种用于促进运输到大肠杆菌周质间隙的蛋白质外化的方法。该方法允许选择性分离位于周质中的蛋白质,而不需要细胞的溶菌酶处理、机械研磨或渗透压休克处理。美国专利号4,637,980披露了通过用直接地或间接地编码产物的DNA分子转化温度敏感性溶源体,在允许条件下培养转化体以在胞内表达基因产物,并且通过升高温度使产物外化以诱导噬菌体编码的功能。Asami等人(1997)J.Ferment.andBioeng.[发酵与生物工程杂志],83:511-516披露了通过T4噬菌体感染同步破坏大肠杆菌细胞,以及Tanji等人(1998)J.Ferment.and Bioeng.[发酵与生物工程杂志],85:74-78披露了T4噬菌体中编码的裂解基因的受控制的表达,用于温和破坏大肠杆菌细胞。
可以通过本领域熟知的标准技术分离和纯化本发明的蛋白质至基本纯度,这些标准技术包括但不限于硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和色谱、镍色谱、羟基磷灰石色谱、反相色谱、凝集素色谱、制备型电泳、洗涤剂溶解、用柱色谱等物质选择性沉淀、免疫纯化方法等。例如,具有建立的分子粘附特性的蛋白质可以与配体可逆地融合。使用适当的配体,可以将蛋白质选择性地吸附到纯化柱上,并且然后以相对纯的形式从柱除去。然后通过酶活性除去融合蛋白。此外,可以使用免疫亲和柱或Ni-NTA柱纯化蛋白质。通用技术进一步描述于例如,R.Scopes,ProteinPurification:Principles and Practice[蛋白质纯化:原理与实践],施普林格出版社(Springer-Verlag):纽约州(1982);Deutscher,Guide to Protein Purification[蛋白质纯化指南],Academic Press[学术出版社](1990);美国专利号4,511,503;S.Roe,ProteinPurification Techniques:A Practical Approach(Practical Approach Series)[蛋白质纯化技术:实用方法(实用方法系列)],牛津大学出版社(Oxford Press)(2001);D.Bollag等人,Protein Methods[蛋白质方法],Wiley-Lisa公司(Wiley-Lisa,Inc.)(1996);A KPatra等人,Protein ExprPurif[蛋白质表达与纯化],18(2):第182-92页(2000);以及R.Mukhija等人,Gene[基因]165(2):第303-6页(1995)。还参见,例如Ausubel等人(1987和周期性的增刊);Deutscher(1990)“Guide to Protein Purification[蛋白质纯化指南],”Methods in Enzymology[酶学方法]第182卷,和本系列的其他卷;Coligan等人(1996和周期性的增刊)Current Protocols in Protein Science[蛋白质科学现代方案]威利/格林(Wiley/Greene),纽约州;和关于蛋白质纯化产物使用的制造商的文献例如,法玛西亚公司(Pharmacia),皮斯卡塔韦,新泽西州,或伯乐公司(Bio-Rad),列治文,加利福尼亚州。与重组技术的组合允许融合至适当的区段,例如融合至FLAG序列或可经由蛋白酶可去除序列融合的等效物。还参见,例如Hochuli(1989)Chemische Industrie[化学工业]12:69-70;Hochuli(1990)“Purification ofRecombinant Proteins with Metal ChelateAbsorbent[用金属螯合物吸收剂纯化重组蛋白质]”在Setlow(编辑)Genetic Engineering[基因工程],Principle and Methods[原理和方法]12:87-98,Plenum出版社,纽约州中;以及Crowe等人(1992)QIAexpress:The High Level Expression&Protein PurificationSystem[高水平表达和蛋白质纯化系统]凯杰公司(QUIAGEN,Inc.),查茨沃思,加利福尼亚州。
通过本领域已知的方法实现表达的蛋白质的检测,并且包括例如放射免疫测定、蛋白印迹法技术或免疫沉淀。
存在于上清液中的异源多肽可通过本领域技术人员熟知的标准分离技术从宿主蛋白质分离。例如,初始盐分级可以将许多不想要的宿主细胞蛋白质(或衍生自细胞培养基的蛋白质)从目的异源多肽分离。一个这样的实例可以是硫酸铵。硫酸铵通过有效减少蛋白质混合物中水的量来沉淀蛋白质。然后蛋白质基于其溶解度沉淀。蛋白质越疏水,在较低硫酸铵浓度下沉淀的可能性越大。典型的方案包括将饱和硫酸铵添加至蛋白质溶液中,使得所得硫酸铵浓度为20%-30%之间。该浓度将使最疏水的蛋白质沉淀。然后弃去沉淀物(除非目的蛋白质是疏水的)并将硫酸铵添加至上清液中至已知沉淀目的蛋白质的浓度。然后将沉淀物溶解在缓冲液中,并且如果需要,通过透析或渗滤除去过量的盐。依赖于蛋白质溶解度的其他方法,例如冷乙醇沉淀,是本领域技术人员熟知的,并且可用于分级复杂的蛋白质混合物。
目的异源多肽的分子量可用于通过不同孔径的膜(例如,Amicon或密理博(Millipore)膜)使用超滤,从较大和较小尺寸的蛋白质中分离。作为第一步骤,蛋白质混合物可以通过膜进行超滤,该膜的孔径具有比目的蛋白质的分子量更低的分子量截留。然后可以将超滤的滞留物对着膜进行超滤,该膜的分子截留大于目的蛋白质的分子量。目的异源多肽将通过膜进入滤液。然后可以如下所述对滤液进行色谱分离。
分泌的目的异源多肽也可以基于其大小,净表面电荷,疏水性和对配体的亲和力与其他蛋白质分离。另外,针对蛋白质产生的抗体可以与柱基质和免疫纯化的蛋白质缀合。所有这些方法都是本领域熟知的。对于技术人员将是明显的是,色谱技术可以以任何规模并使用来自许多不同制造商(例如玛法西亚生物技术公司(Pharmacia Biotech))的设备进行。
在本发明的一些实施例中,包含所产生的信号多肽的超过50%的表达的异源多肽或蛋白质可以在宿主细胞中以可复性的形式产生。在另一个实施例中,约60%、70%、75%、80%、85%、90%、95%的表达蛋白质以活性形式获得或可以复性成活性形式。
实例1
试图改善培养基中胞外ATH35L的水平,设计了一系列通过修饰dsbA和pelB信号多肽的新颖信号多肽。在BL21Star(DE3)中筛选与ATH35L的n-末端连接的合成的新颖信号多肽,并且使用Octet测定法定量培养基中的胞外ATH35L,并通过凝胶电泳分析。
材料和方法
大肠杆菌菌株和生长条件
选择大肠杆菌BL21(DE3)[fhuA2[lon]ompT gal(λsBamHIoΔEcoRI-B int::(lacI::PlacUV5::T7gene1)i21Δnin5)[dcm]ΔhsdS]和BL21StarTM(DE3)[F-ompT hsdSB(rB -,mB -)galdcmrne131(DE3)]作为用于表达在本研究中构建的质粒的宿主。在种子培养基(20g/L酵母提取物)中培养重组细胞用于接种细胞并且丰富的生长培养基(20.3g/L酵母提取物,10.1g/L无水硫酸钠和7g/L K2HPO4)补充有50μg/mL卡那霉素用于在30℃下表达重组ATH35L蛋白质。
表达质粒的构建
由DNA 2.0公司(门洛帕克公司(Menlo Park),加利福尼亚州,美国)提供的pJ411表达载体用作T7启动子驱动的表达载体-表达与ATH35L基因连接的信号多肽。卡那霉素基因用作表达质粒中的选择标记。通过DNA 2.0公司进行含有与ATH35L连接的信号多肽的所有表达质粒的基因合成和用于确认合成的质粒的DNA测序分析。用于该研究的信号多肽和重组质粒的概述列于表2中。
表2.使用的细菌的和新颖信号多肽的氨基酸序列。
*数字指示在h-区中氨基酸的位置。
切割位点在c-区中加下划线。
微补料分批培养方法
在具有3mL工作体积的Micro 24生物反应器(Applikon biotechnology公司,福斯特市,加利福尼亚州)中进行小体积补料分批培养。补料培养基和其他补充剂通过高压灭菌或用0.22-μm孔径过滤器过滤灭菌,而分别地将丰富的生长培养基(20.3g/L酵母提取物,10.1g/L无水硫酸钠和7g/L K2HPO4)高压灭菌,并且之后在无菌条件下添加。将具有2.8%的培养物体积的培养物接种到含有50μg/mL的卡那霉素、7.6g/L的痕量金属混合物溶液(Trace metal cocktail solution)(55g/L柠檬酸钠脱水物、27g/L FeCl3·6H2O、0.5g/LCoCl2·6H2O、0.5g/L Na2MoO4·2H2O、0.95g/L CuSO4·5H2O、1.6g/L MnCl2·4H2O、1.3g/LZnCl2和2g/L CaCl2)和15.8g/L的甘油PSA的丰富的生长培养基中。在补料分批培养期间,叶轮速度初始设定为800rpm,并且之后控制以使溶解的氧水平(DO)保持在60%饱和。在补料分批操作模式中,使用55%v/v的甘油和33%w/v的酵母提取物溶液作为补料培养基溶液。当细胞达到光学细胞密度(OD)600的10时,通过添加0.5mM异丙基-β-D1-硫代半乳糖苷(IPTG)诱导重组ATH35L基因表达,并且在30℃的补料分批模式条件下进一步孵育14h。在诱导后14h收集培养的细胞,并且通过以14,000rpm离心5min从收获样品中收集培养基的上清液,用于胞外ATH35L的分析和定量。使用PeriPrepsTMPeriplasting试剂盒从收获样品的细胞裂解物制备周质和细胞质样品(恩皮森特公司(Epicentre),麦迪逊(Madison),威斯康辛州,美国)。
发酵罐补料分批培养方法
在具有1L工作体积的DasGip发酵罐(萨尼苏尔公司(SaniSure Inc),穆尔帕克,加利福尼亚州,美国)中进行大体积补料分批培养。如之前在小体积补料分批培养方法中所述制备补料/培养基和其他补充物。将具有2.8%的培养物体积的培养物接种到含有50μg/ml的卡那霉素、7.6g/L的痕量金属混合物溶液(Trace metal cocktail solution)、15.8g/L的甘油PSA和1%v/v的P2000消泡溶液的制备的培养基中。气室速度为1vvm,并且温度维持在30℃。使用氢氧化铵(23.5%v/v)和冰乙酸(50%v/v)溶液维持pH。在批量实验期间,叶轮速度初始设定为1,200rpm,并且之后控制以使溶解的氧水平(DO)保持在60%饱和。在补料分批操作模式中,使用55%v/v的甘油和33%w/v的酵母提取物溶液作为补料培养基溶液。在补料期间,叶轮速度维持恒定在1200rpm,而DO饱和度自动保持在60%。当细胞达到OD600的80时,通过添加0.5mM IPTG诱导重组ATH35L基因表达,并且在30℃的补料分批模式条件下进一步孵育12h。在诱导后的不同时间点收集培养的细胞,以确定分泌的ATH35L蛋白质生产率、渗透压以及培养基中甘油和乙酸盐浓度的特性。
分析
SDS-PAGE变性凝胶电泳
使用10%预制Bis-Tris NuPAGE SDS凝胶(生命技术公司(Life Technology),弗雷德里克,马里兰州,美国)在迷你凝胶罐上进行SDS-PAGE变性凝胶电泳。在MOPS运行缓冲液中,电泳的运行条件为恒定的200V,持续45分钟(生命技术公司(Life Technology),弗雷德里克,马里兰州,美国)。通过用简单蓝安全染色(Simple blue safe stain)溶液(生命技术公司(Life Technology),弗雷德里克,马里兰州,美国)染色使分离的蛋白质条带可视化。
通过蛋白质印迹法检测ATH35L蛋白质
在变性的条件下在SDS-PAGE上分离收获的样品,并使用iblot转移试剂盒(生命技术公司(Life Technology),弗雷德里克,马里兰州,美国)转移到硝酸纤维素膜上。将膜在封闭缓冲液(在0.1%TTBS缓冲液中的5%脱脂奶)中在室温下封闭1h–1h 30min。然后将膜与在0.1%TTBS缓冲液中的1μg/mL的小鼠抗葡萄球菌α溶血素毒素mAb(LC10)(米迪缪尼公司(MedImmune),马里兰州,美国)在室温下孵育1h或在4℃下孵育过夜。在室温下用0.1%TTBS三次洗涤膜10min后,在室温下将它们用在0.1%TTBS中的1μg/mL的HRP缀合的山羊抗小鼠Ab(贝瑟尔实验室(Bethyl laboratories),蒙哥马利(Montgomery),德克萨斯州,美国)孵育1h。用SuperSignal West Pico化学发光底物(皮尔斯公司(Pierce),罗克福德,伊利诺伊州,美国)可视化所有膜,并在ChemiDoc XRSTM系统(伯乐公司(Biorad),武仙座(Hercules),加利福尼亚州,美国)上扫描。
胞外ATH35L蛋白质的定量
通过定制的Octet测定法确定培养基中的胞外ATH35L浓度。该测定在Octet QKe(ForteBio公司,门洛帕克(MenloPark),加利福尼亚州,美国)上进行,并且LC10mAb(米迪缪尼公司(MedImmune),马里兰州,美国)用于在培养基中捕获ATH35L蛋白质。所有样品用动力学缓冲液(ForteBio公司,门洛帕克(MenloPark),加利福尼亚州,美国)在96孔板(康宁公司(Corning),图克斯伯里(Tewksbury),马萨诸塞州,美国,)中以1:10和1:20的比例稀释。对于Octet测定的方法,LC10mAb以300rpm结合至蛋白质A生物传感器(ForteBio公司,门洛帕克(MenloPark),加利福尼亚州,美国)300秒,随后在动力学缓冲液中以300rpm进行基线步骤60秒,样品结合步骤在300rpm下持续150秒,并且在基本动力学模式中动力学缓冲液中的解离步骤在300rpm下持续60秒。记录个体的样品的实验曲线,并使用Octet数据分析软件7.0(FortéBio)处理和分析数据。最后,通过与亲和-纯化的ATH35L蛋白质的连续稀释产生的标准曲线比对来定量样品。在1:10和1:20稀释的样品之间的标准偏差值低于10%。
从培养基中纯化ATH35L
对于N-末端肽序列分析,使用硫酸铵沉淀和Poros XS阳离子交换色谱(生命科技公司(Life Technologies),格兰德岛,美国)的组合纯化培养基中的胞外ATH35L。简言之,通过在850g离心30min收获ATH35L培养物以收集培养基。用1M乙酸将收获的ATH35L培养基调节至pH 5.2,并以9,500g离心15min以除去沉淀物。然后使用硫酸铵沉淀纯化上清液,随后使用Poros XS阳离子交换树脂用于进一步的纯化。
N-末端多肽测序
通过SDS-PAGE分级纯化的ATH35L,并且然后使用iblot转移试剂盒(生命科技公司(Life Technologies),弗雷德里克,马里兰州,美国)转移到硝酸纤维素膜上。使用自动蛋白质/肽测序系统,通过Covance(格林菲尔德,印第安纳州,美国)进行分离的ATH35L样品的N-末端氨基酸测序分析。
结果
筛选同源和异源信号肽用于大肠杆菌中增强的ATH35L分泌
由于信号肽的选择对在大肠杆菌系统中的重组蛋白质分泌具有主要影响(Sjostrom等人1987),因此筛选各种大肠杆菌信号肽以鉴定用于有效ATH35L分泌的信号肽。已选择用于Sec途径的大肠杆菌信号多肽的DsbA信号序列(dsbAss)、pelB信号序列(pelBss)和phoA信号序列(phoAss)来筛选ATH35L分泌。此外,尽管来自胞外蛋白质的信号肽的结构元件在金黄色葡萄球菌和大肠杆菌之间作为革兰氏阳性细菌和革兰氏阴性细菌不同,但我们还评估了AT的天然信号肽(NTss),因为一些蛋白质是在异源表达系统中使用其天然信号肽成功分泌的(Shahhoseini等人2003)。筛选的信号肽的概述示于表2中。使用micro24生物反应器系统在补料分批培养中评价含有不同信号肽-ATH35L融合构建体的重组细胞菌株。处理信号多肽连接的ATH35L以在大肠杆菌表达系统中产生大约33kDa的分泌蛋白质。由于信号多肽由20-26个氨基酸组成,可以通过大小差异在变性凝胶上分离成熟的ATH35L和ATH35L前蛋白。证实培养基中的胞外分泌的ATH35L,并使用蛋白质印迹法进行相对地定量(图1)。蛋白质印迹法分析证实ATH35L在从细胞质空间输出ATH35L后分泌到胞外环境(培养基)(图1)以及周质间隙(数据未示出)中。此外,通过蛋白质印迹法对胞外的ATH35L相对定量显示dsbAss在其他信号多肽中显示出胞外ATH35L产物的最高效率,而NTss显示胞外ATH35L产物的最低效率。大肠杆菌信号多肽和NTss之间的氨基酸序列相似性非常低(数据未示出),并且该观察结果暗示AT的天然信号多肽可能不能有效地引导大肠杆菌中ATH35L的易位。与dsbAss相比,PelBss连接的ATH35L显示出更低的胞外ATH35L生产率(图1)。数据表明各种大肠杆菌信号多肽不同地影响ATH35L的分泌效率,尽管dsbAss、pelBss和phoAss具有氨基酸序列的高度相似性并且使用SEC途径在大肠杆菌中分泌重组蛋白质(Natale等人,Biochimica et Biophysica Acta[生物化学与生物物理学学报]1778:1735-1756(2008))。具体地,dsbAss和pelBss之间的氨基酸序列的同一性是45%。本数据表明,信号多肽的选择对于大肠杆菌中ATH35L的分泌是至关重要的,尽管信号多肽具有氨基酸序列比对的非常高的相似性。此外,与金黄色葡萄球菌不同,ATH35L分泌不能通过其天然信号多肽在大肠杆菌中有效地进行。
筛选关于ATH35L分泌的选择的细菌信号多肽显示ATH35L的分泌在dsbAss和pelBss之间具有不同的影响(图1),尽管它们展示出氨基酸序列的高度相似性(45%同一性)。结果表明,个体信号多肽影响ATH35L的分泌过程,并且可能与信号多肽中各区的功能相关。大多数信号多肽享有一些共同的结构特征;它们由N-末端极性区(n-区)和随后的疏水核心区(h-区)和极性切割区(c-区)组成。碱性n-区是2-5个氨基酸长,并且具有净正电荷。h-区通常含有6和15个之间的氨基酸残基,并且已经发现它是信号多肽用于易位和靶向跨膜的最至关重要的部分(Sjostrom等人1987;Choi等人2004)。数据表明,通过两个不同信号多肽之间的轻扫区(swiping region),信号多肽的结构变化可以影响分泌效率。通过结构上轻扫两个信号多肽的结构域来研究ATH35L的分泌效率,这导致胞外ATH35L的产量提高。用于该研究的新颖信号多肽和新颖信号多肽构建体的示意图分别在表2和图2中表示。
通过新颖信号多肽提高胞外ATH35L的产量
通过轻扫dsbAss和pelBss的n-区、h-区和c-区产生组I新颖信号多肽(表2和图2A)。关于组I新颖信号多肽,通过轻扫dsbAss和pelBss(NSP1至NSP6)和NSP1至NSP6的每个区并将所得信号多肽与ATH35L连接,产生六种新颖信号多肽(质粒149153至149158)(图2)。含有新颖信号多肽连接的ATH35L的重组质粒在1L规模的补料分批条件下培养用于筛选。
当细胞密度达到OD600为80时,通过添加0.5mM IPTG诱导重组ATH35L基因表达,随后在30℃以补料分批模式孵育另外12h。在补料分批过程结束时OD600的值达到120-140,其中活力≥90%(数据未示出)。为了分析胞外ATH35L,通过在诱导后10h离心从收获的培养物样品中收集培养基的上清液。通过Octet测定确定胞外ATH35L的浓度,并通过SDS-PAGE验证培养基中加工的成熟ATH35L的大小(图3)。数据显示,与dsbAss(0.15g/L)相比,NSP2和NSP4分别使培养基中分泌的ATH35L的产量增加2.5倍(0.4g/L)和5倍(0.8g/L)。有趣的是,这两种新颖信号肽在其结构中共享dsbAss的n-区和pelBss的h-区,仅有c-区不同(表1)。NSP2和NSP4的c-区尚未通过氨基酸的添加或截短而突变,因此信号肽酶(SP)切割位点未被修饰,并且因此不影响通过SP的切割过程。观察到的分泌改善表明疏水区之后的氨基酸可能影响信号肽中h-区的结构形成和ATH35L跨细胞质膜的易位。
此外,与dsbAss(0.15g/L)相比,分泌的ATH35L的生产率在NSP6(0.02g/L)中降低。除了n-区结构域之外,NSP2和NSP6在它们的结构中共享相同的h-区和c-区结构域。本数据表明dsbAss的n-区是ATH35L易位至易于进入细胞质膜的有利区(图3)。此外,NSP3不能提高分泌ATH35L的产量(0.15g/L),而NSP4使得ATH35L分泌生产率最高(0.8g/L),尽管它们在除了h-区之外的信号多肽结构中共享dsbAss的n-区结构域和pelBss的c-区结构域。
基于该结果,数据表明h-区后的氨基酸显著影响信号多肽结构的构象,以使得ATH35L进入细胞质膜可行。此外,dsbAss的n-区和pelBss的h-区的缀合结构域是对在分泌过程中ATH35L易位的有利结构结构域。
改变在h-区结构域中氨基酸的位置
组I新颖信号多肽筛选的结果显示,对NSP3和NSP4之间的ATH35L分泌效率有不同的影响,它们具有不同的疏水区(图3)。由于h-区在重组蛋白质易位至细胞质膜中起重要作用(Hikita等人,J Biol Chem[生物化学杂志]267:4882-4888(1992);Chou等人,J Biol Chem[生物化学杂志]265:2873-2880(1990);MacFarlane等人,Eur J Biochem[欧洲生物化学杂志]233:766-771(1995);Phoenix等人,J Biol Chem[生物化学杂志]268:17069-18073(1993);Fekkes等人,Microbiol and Molec Biol Review[微生物学与分子生物学评论]63:161-173(1999)),通过修饰NSP3和NSP4的h-区中氨基酸的位置,产生了几组新颖信号多肽,并且研究了在h-区中氨基酸位置的修饰是否影响了ATH35L蛋白质的分泌效率。在NSP3和NSP4结构中,NSP3的h-区结构域由亮氨酸和缬氨酸组成,亮氨酸和缬氨酸为强疏水性氨基酸,而NSP4的h-区结构域主要由聚亮氨酸和聚丙氨酸组成。在除NSP4b和NSP4c之外的NSP3和NSP4突变体的产生中,由于仅氨基酸位置被改变,h-区中的总疏水性和残基长度没有改变。
关于NSP4的工程化,创建了三个突变体以改变h-区的疏水性(组II信号多肽):i)在h-区(NSP4a)中聚亮氨酸段的位置和聚丙氨酸段的位置轻扫,ii)在h-区中的所有残基被聚亮氨酸残基替代,以产生一段强疏水性氨基酸(NSP4b),iii)在h-区中的所有残基被聚丙氨酸残基替代,以产生一段弱疏水性氨基酸(NSP4c)(图2b)。图4表明NSP4突变体信号多肽降低了整体ATH35L分泌水平。NSP4在培养基中产生0.9g/L的分泌ATH35L,但当NSP4a与ATH35L缀合时,分泌ATH35L的产量减少0.28g/L。NSP4a在NSP4的h-区结构域中具有聚亮氨酸和聚丙氨酸的可替代的位置。注意的是在h-区中没有总疏水性或残基长度变化。在h-区结构域中疏水性氨基酸的位置改变显著影响ATH35L蛋白质的易位。此外,在NSP4b ATH35L和NSP4c ATH35L两者中分泌ATH35L的产量显着降低0.04g/L。尽管NSP4b的h-区仅由通过聚亮氨酸替代的强疏水性氨基酸组成,但强疏水区在分泌过程中显示出较低的ATH35L易位效率(0.04g/L)。不出意料的是,由于NSP4c的h-区结构域仅由作为较弱的疏水性氨基酸聚丙氨酸构成,因此通过蛋白质印迹法没有检测到在NSP4c中的分泌ATH35L。尽管通过定量测定检测到0.04g/L的ATH35L,但是该量的ATH35L代表由于细胞死亡而从胞内空间释放的ATH35L前体。在补料分批培养期间,NSP4突变体改变了细胞生长的特征。具体地,NSP4c ATH35L的细胞生长速率低于其他突变体构建体。由于细胞凋亡的起始,诱导后10h在OD600下NSP4c ATH35L的细胞生长速率降低(数据未示出)。此外,未检测到在诱导后12h或较早诱导时间点的NSP4c中的分泌ATH35L。诱导后在ATH35L表达期间在NSP4c ATH35L的培养中细胞凋亡迅速发生,这导致在培养基中分泌ATH35L的减少。
基于组I信号多肽筛选的结果,即使NSP3含有与NSP4相同的n-区和c-区结构域,NSP3也不能改善ATH35L的分泌(图2a和3)。此外,当NSP4a与具有聚亮氨酸和丙氨酸残基的改变的位置的ATH35L连接时,分泌ATH35L的产量已经显著改变(图2b和4)。因此,数据表明在h-区中的疏水性区域(plot)具有ATH35L的易位的重要因素。通过改变在h-区结构域中氨基酸残基的位置来产生4个NSP3突变体,以产生h-区的各种疏水性区域(图2c)。在h-区结构域中氨基酸的位置变化显著影响ATH35L的分泌效率(图5)。与NSP3(0.18g/L)相比,NSP3b使分泌ATH35L的产量提高2倍(0.48g/L)。相反,NSP3a和NSP3d分别将分泌的ATH35L产量降低0.1g/L和0.14g/L(图5)。在NSP3b的h-区中,通过改变残基的位置,强的疏水性氨基酸残基例如亮氨酸和缬氨酸位于h-区的中心。在其他的NSP3突变体信号多肽中,强疏水性残基的位置位于接近n-区或c-区,这与NSP3b不同。之前的若干研究示出,总疏水性和疏水结构域长度是重组蛋白质易位以及在通过参与分泌机制的一个或多个因子的识别中的底物特异性的重要因素(Bankaitis等人Cell[细胞]37:243-252(1984);Emr等人,Nature[自然]285:82-85(1980);Hikita等人,J Biol Chem[生物化学杂志]267:4882-4888(1992))。然而,结果表明疏水性氨基酸残基的定位也是蛋白质易位的重要因素。尽管总疏水性和疏水结构域的长度没有变化,但在h-区结构域中氨基酸残基的可替代的位置对ATH35L易位产生影响。在细胞生长的特征中,所有突变构建体的细胞生长速率在补料分批培养过程期间是不同的。目前的工作表明,h-区结构域的疏水性区域显著影响ATH35L蛋白质的易位过程和在大肠杆菌中ATH35L表达和分泌期间的细胞生长。(图4和5)。此外,h-区的总疏水性对于ATH35L蛋白质的分泌是必不可少的(图4),如之前的研究示出的(Emr等人1980;Hikita等人1992)。
NSP4对ATH35L分泌的进一步表征本研究证明,与诱导后10h的dsbAss相比,NSP4使培养基中分泌ATH35L的产量提高≥5倍(图3)。在补料分批培养期间,示出了诱导后含有NSP4ATH35L的细胞的表特征已经改变。为了优化NSP4 ATH35L的诱导时间长度,我们比较了在各种诱导时间点NSP4和dsbAss之间分泌ATH35L的产量,并通过凝胶电泳验证了ATH35L前体污染。
在1L发酵罐中在30℃,pH 7和0.5mM IPTG下进行补料分批培养的生长,用于ATH35L基因诱导。在该研究中描述了重组ATH35L基因表达的补料分批培养条件的细节。诱导后每2h收集dsbAss_ATH35L和NSP4_ATH35L两者的培养样品,并通过离心从培养样品中分离含有分泌ATH35L的培养基以定量分泌ATH35L。通过凝胶电泳和蛋白质印迹法进行分泌ATH35L和ATH35L前体的验证(图6a,b)。当诱导后8h收获样品时,NSP4_ATH35L和dsbAss_ATH35L分别产生0.7g/L和0.12g/L的分泌ATH35L。在诱导后12h,在NSP4情况下,分泌ATH35L产量增加至1g/L,并且在dsbAss情况下,分泌ATH35L产量增加至0.2g/L(图6a,b)。定量数据显示在诱导后长达12h在dsbAss_ATH35L和NSP4_ATH35L两者中,在培养基中分泌ATH35L的产量增加。然而,通过电泳的分析数据揭示,由于细胞凋亡,NSP4_ATH35L的ATH35L前体从诱导后12h从胞内空间泄漏到培养基中。诱导后12h dsbAss_ATH35L的细胞活力≥90%,而NSP4_ATH35L的细胞活力起始下降至≤90%(数据未示出)。细胞活力结果与凝胶电泳分析相关(图6a,b)。这些数据表明NSP4对ATH35L的易位非常有效,并且与诱导后6h的dsbAss相比,分泌ATH35L的生产率提高了6倍(图6)。此外,NSP4在缩短诱导时间内释放成熟的ATH35L。减少重组蛋白质生产的培养加工时间对于节省加工时间的商业活动将是非常有益的。
在重组蛋白质的分泌过程中,通过信号肽酶对信号多肽的切割是跨膜的蛋白质易位的重要且有用的标准,以将成熟蛋白质适当地释放到周质间隙和胞外环境中。通常,大肠杆菌信号多肽具有Ala-X-Ala特异性基序(A-X-A结构域)作为c-区中的切割识别位点,并且该研究中的所有新颖信号多肽在其c-区中含有A-X-A结构域。为了验证ATH35L从信号多肽的切割,如本研究中所述纯化在培养基中的分泌ATH35L,并纯化的ATH35L蛋白质通过适当的剪接方法使用N-末端肽测序分析证实成熟ATH35L的分泌。我们使用N-末端肽测序分析证实,该研究中的新颖信号多肽从ATH35L前体中正确切割而不中断切割过程(表3)。
表3.培养基中分泌的ATH35L的N-末端肽测序分析。
讨论
信号多肽连接的ATH35L在大肠杆菌表达系统中作为可溶性蛋白质表达并分泌(Menzies等人,InfectImmun[感染与免疫]64:1839-1841(1994))。在本研究中,我们筛选了在ATH35L蛋白质分泌到培养基中时的AT(NTss)、DsbAss、pelBss和phoAss的天然信号多肽。DsbAss、pelBss和phoAss大肠杆菌信号多肽通常用于在大肠杆菌的SEC系统中分泌重组蛋白质。在筛选中,与ATH35L连接的信号多肽从周质间隙胞外地分泌到培养基中。尽管一些可溶性ATH35L仍然作为可溶性蛋白质留在细胞质空间中(数据未示出),但30%表达的ATH35L蛋白质分泌到周质间隙和培养基中。具体地,dsbAss连接的ATH35L在所选择的信号多肽中具有最佳分泌效率,并且pelBss连接的ATH35L在大肠杆菌信号多肽中显示出最低的ATH35L分泌效率(图2)。尽管大肠杆菌信号多肽之间的氨基酸序列具有高度相似性,但由于信号多肽在分泌过程期间各个区域的各种功能,它们对ATH35L蛋白质的分泌显示出不同的效率(Hikita等人(1992),Ismail等人,Biotech Lett[生物技术通讯]33:999-1005(2011),Velaithan等人,Ann Microbiol[微生物学年鉴]64:543-550(2014))。有趣的是,pelBss和dsbAss之间的氨基酸序列比对显示出具有45%同一性的高度相似性,但与dsbAss不同,pelBss连接的ATH35L无法有效地将分泌ATH35L分泌到培养基中(图2)。
研究了使用新的新颖信号多肽改善胞外ATH35L分泌产物,特别是观察了个体信号多肽区对胞外ATH35L分泌的影响。在研究期间,发现在ATH35L分泌时新产生的新颖信号多肽,NSP1、NSP5和NSP6在诱导后10h与dsbAss相比降低了分泌ATH35L的产量,而NSP2和NSP4使分泌ATH35L的产量分别增加3倍和5倍(图3)。在组I信号多肽的结构中,这些信号多肽之间的巨大差异是NSP2和NSP4含有dsbAss的n-区,而NSP1、NSP5和NSP6含有pelBss的n-区。结果暗示,在ATH35L蛋白质翻译后,dsbAss的n-区在通过新生信号多肽识别粒子(SRP)识别n-区方面比pelBss的n-区域具有更好的效率。许多研究显示信号多肽通过定点诱变突变,以增加h-区的总疏水性或改变信号多肽的段长度以改善重组蛋白质的分泌(Chou等人,J BiolChem[生物化学杂志]265:2873-2880(1990),Hikita等人1992,Jonet等人2012,Klatt等人,Microbial.Cell Factories[微生物细胞工厂]11:97-106(2012))。该研究调查了由具有高相似性的两种不同大肠杆菌信号多肽的交叉跃迁产生的新颖信号多肽,并且这些新颖信号多肽有助于提高分泌ATH35L的产量。
在分泌途径中,许多组分参与分泌过程。在分泌过程起始时,具有信号多肽的碱性氨基酸的n-区被SRP识别以进入细胞质膜。NSP4结构由dsbAss的n区构成,其与pelBss的n-区相比含有更多碱性氨基酸残基,例如聚赖氨酸。它使NSP4更容易进入细胞质膜。h-区也是易位重组蛋白质的重要因子,并且该研究证明重组蛋白质的分泌效率取决于h-区中疏水性氨基酸残基的定位而改变,而不管总疏水性。NSP2和NSP4两者都增加了分泌ATH35L的产量,并且这两种信号多肽含有dsbAss的n-区和pelBss的h-区。然而,在相同量的细胞中,NSP4比NSP2产生更好量的分泌ATH35L。两种信号多肽都具有Ala-X-Ala特异性位点作为剪接过程的切割识别位点。尽管如此,pelBss的h-区和c-区在ATH35L的易位和释放上显示出比dsbAss的h-区和c-区更好的效率。数据表明,pelBss的c-区在切割过程中可能比dsbAss的c-区更有效,因为两个信号多肽之间的总ATH35L蛋白质表达没有差异。可替代地,c-区中的一些氨基酸可能影响h-区结构域的结构构象,这导致影响ATH35L的易位效率。
有趣的是,NSP3连接的ATH35L没有显著提高ATH35L的分泌,尽管NSP3除了h-区之外含有相同的NSP4的n-区和c-区(图2和3)。因此,数据表明pelBss的h-区在ATH35L的易位和分泌中起关键作用。当重组蛋白质进入细胞质膜进行易位时,h-区结构域的总疏水性是一个重要因素。出于这个原因,已经通过添加或截短氨基酸来研究信号多肽的h-区以改变总疏水性,用于改善大肠杆菌中的重组蛋白质分泌。(Jonet等人(2012);Low等人,Bioengineered[生物工程化]3:334-338(2011);Phoenix等人1993;Sjostrom等人1987;Velaithan等人2014)。在目前的研究中,NSP3和NSP4的突变体是通过改变这两种信号多肽的h-区中的氨基酸位置而产生的,因为这两种信号多肽具有不同的疏水区但具有相同的n-区和c-区(图2b和c)。
通常,h区由弱和强疏水性氨基酸残基组成。因此,研究了仅具有强疏水性残基的h-区如何影响ATH35L分泌(NSP4b)。为了比较NSP4b,仅用聚丙氨酸产生另一种突变体以破坏信号多肽结构(NSP4c)中的疏水性。有趣的是,NSP4b和NSP4c也已经显著降低了ATH35L的分泌效率(图4)。许多研究已示出,增加信号多肽的疏水性可增强重组蛋白质的分泌效率(Bankaitis等人,Cell[细胞]37:243-252(1984);Emr等人(1980);Hikita等人(1992))。然而,仅强疏水性残基的组成不能增强ATH35L的易位。本数据表明,h-区需要强和弱疏水性氨基酸残基的适当组合,用于疏水性的平衡。
尽管NSP3和NSP4突变体中的总疏水性或一段h-区没有改变,但ATH35L分泌的效率通过氨基酸位置的改变在这些突变体中显示出明显的差异(图4和5)。在h-区中氨基酸的位置显著影响重组ATH35L蛋白质在分泌过程中的易位。本研究是一项新发现,即通过改变在h-区结构域中的氨基酸位置可以提高重组蛋白质的分泌效率。
信号多肽突变体也在诱导ATH35L基因表达后影响细胞生长的特征。在补料分批培养期间,数据表明对NSP4的优化的培养过程时间是在诱导后10h,用于控制ATH35L产物质量。相比之下,对于dsbAss的优化的培养过程时间是诱导后12h,以达到最大分泌ATH35L产量。实现了来自NSP4比dsbAss高出5倍的分泌ATH35L的产量图6)。数据表明NSP4在缩短培养处理时间对ATH35L分泌的改善具有主要影响,表明该信号多肽对于大肠杆菌表达系统中分泌ATH35L产物的商业水平非常有用。
总之,数据显示与未修饰的信号多肽相比,一些合成信号多肽改善了ATH35L的分泌效率。具体地,NSP4在补料分批发酵过程中将分泌的ATH35L的产量提高了4倍。在该工作中,本发现表明通过修饰信号多肽的h-区显着提高了ATH35L的分泌效率,并且在h-区中残基的位置也影响分泌效率。这些新的新颖信号多肽可用于提高异源蛋白质在大肠杆菌中的分泌效率。
总之,这里的数据证明,i)与pelBss的n-区相比,包括额外的碱性氨基酸残基的dsbAss的n-区是有利的结构域,ii)h-区的疏水性对于重组蛋白质易位到细胞质膜是至关重要的,iii)h-区适当地需要弱和强氨基酸残基两者用于有效易位重组蛋白质,iv)在h-区中的疏水氨基酸残基的改组显着影响重组蛋白质的易位,v)特别地,NSP4在缩短培养过程中显著影响ATH35L分泌的改善。我们相信本研究中设计的新颖信号肽可用于提高重组蛋白在大肠杆菌表达平台中的分泌效率。
除非另外定义,否则本文使用的所有技术和科学术语以及任何首字母缩略词具有与本发明领域的普通技术人员通常理解的相同的含义。用于传递与本文描述的那些类似或等效的信息的任何多肽或核酸序列、蛋白质、载体、组合物、细胞、方法和手段可用于实践本发明。
本文引用的所有参考文献在法律允许的全范围内通过引用并入本文。对这些参考文献的讨论旨在仅是为了概述其作者所作的断言。不承认任何参考(或任何参考文献的一部分)是相关的现有技术。申请人保留质疑任何引用的参考文献的准确性和针对性的权利。
Claims (59)
1.一种信号多肽,其包含与SEQ ID NO:1或10至21中的任一个具有至少90%序列同一性的氨基酸序列。
2.如权利要求1所述的信号多肽,其包含与SEQ ID NO:1或10至21中的任一个具有至少95%序列同一性的氨基酸序列。
3.如权利要求1所述的信号多肽,其包含SEQ ID NO:1或10至21中的任一个的氨基酸序列。
4.一种蛋白质,其包含(i)信号多肽,该信号多肽包含与SEQ ID NO:1或10至21中的任一个具有至少90%序列同一性的氨基酸序列,和(ii)异源多肽。
5.如权利要求4所述的蛋白质,其中该蛋白质包含(i)信号多肽,该信号多肽包含与SEQID NO:1或10至21中的任一个具有至少95%序列同一性的氨基酸序列,和(ii)异源多肽。
6.如权利要求4所述的蛋白质,其中该蛋白质包含(i)信号多肽,该信号多肽包含SEQID NO:1或10至21中的任一个的氨基酸序列,和(ii)异源多肽。
7.如权利要求4至6中任一项所述的蛋白质,其中该异源多肽包含大于20个氨基酸。
8.如权利要求4至7中任一项所述的蛋白质,其中该异源多肽具有25kDa至50kDa的分子量。
9.如权利要求4至8中任一项所述的蛋白质,其中该异源多肽具有30kDa至35kDa的分子量。
10.如权利要求4至9中任一项所述的蛋白质,其中该异源多肽选自下组,该组由以下组成:酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。
11.一种信号多肽,其包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列。
12.如权利要求11所述的信号多肽,其包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列。
13.如权利要求11所述的信号多肽,其包含SEQ ID NO:1的氨基酸序列。
14.一种蛋白质,其包含(i)信号多肽,该信号多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列,和(ii)异源多肽。
15.如权利要求14所述的蛋白质,其中该蛋白质包含(i)信号多肽,该信号多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列,和(ii)异源多肽。
16.如权利要求14所述的蛋白质,其中该蛋白质包含(i)信号多肽,该信号多肽包含SEQID NO:1的氨基酸序列,和(ii)异源多肽。
17.如权利要求14至16中任一项所述的蛋白质,其中该异源多肽包含大于20个氨基酸。
18.如权利要求14至17中任一项所述的蛋白质,其中该异源多肽具有25kDa至50kDa的分子量。
19.如权利要求14至18中任一项所述的蛋白质,其中该异源多肽具有30kDa至35kDa的分子量。
20.如权利要求14至19中任一项所述的蛋白质,其中该异源多肽选自下组,该组由以下组成:酶、毒素、抗体、抗体片段、抗原、治疗性蛋白质及其组合。
21.如权利要求14至20中任一项所述的蛋白质,其中该异源多肽包含α毒素(AT)。
22.如权利要求14至21中任一项所述的蛋白质,其中该异源多肽包含来自金黄色葡萄球菌(Staphylococcus aureus)的α毒素。
23.如权利要求21至22中任一项所述的蛋白质,其中该α毒素在对应于H35的氨基酸位置包含取代。
24.如权利要求23所述的蛋白质,其中该取代是H35L取代。
25.一种蛋白质,其包含SEQ ID NO:2的氨基酸序列。
26.一种组合物,其包含根据权利要求1至3或11至13中任一项所述的信号多肽,或根据权利要求4至10或14至25所述的蛋白质。
27.一种核酸,其编码如权利要求1至3或11至13中任一项所述的信号多肽,或如权利要求4至10或14至25中所述的蛋白质。
28.一种核酸,其(1)编码如权利要求1至3或11至13中任一项所述的信号多肽,以及(2)包含一个或多个限制性内切酶位点。
29.一种载体,其包含如权利要求27或权利要求28所述的核酸。
30.如权利要求29所述的载体,其进一步包含复制起点。
31.如权利要求29或30所述的载体,其进一步包含与该核酸可操作地连接的启动子序列。
32.如权利要求29至31中任一项所述的载体,其中该启动子序列在原核生物中是可操作的。
33.如权利要求29至32中任一项所述的载体,其中该载体是质粒、转座子或病毒载体。
34.一种重组细胞,其被工程化以表达如权利要求4至10或14至25中任一项所述的蛋白质。
35.如权利要求34所述的重组细胞,其是原核生物细胞。
36.如权利要求34至35中任一项所述的重组细胞,其中该原核生物细胞是埃希氏杆菌属(Escherichia)。
37.如权利要求34至36中任一项所述的重组细胞,其中该原核生物细胞是大肠杆菌(Escherichia coli)。
38.一种宿主细胞,其用如权利要求29至33中任一项所述的载体转化。
39.如权利要求38所述的宿主细胞,其中该细胞是原核生物细胞。
40.如权利要求38或权利要求39所述的宿主细胞,其中该原核生物细胞是埃希氏杆菌属。
41.如权利要求38至40中任一项所述的宿主细胞,其中该原核生物细胞是大肠杆菌。
42.一种产生如权利要求4至10或14至25中任一项所述的蛋白质的方法,该方法包括在表达该蛋白质的条件下,培养工程化以表达该蛋白质的重组细胞,或用编码该蛋白质的载体转化的宿主细胞。
43.如权利要求42所述的方法,其中该重组细胞或宿主细胞在细胞培养物中在该蛋白质从该重组细胞或宿主细胞分泌的条件下培养。
44.如权利要求42或权利要求43所述的方法,其中该重组细胞或宿主细胞在细胞培养物中在将该信号多肽从该蛋白质切割的条件下培养。
45.如权利要求42至44中任一项所述的方法,该方法进一步包括从该细胞培养物中回收该蛋白质。
46.如权利要求45所述的方法,其中回收该蛋白质包括离心以去除细胞和/或细胞碎片。
47.如权利要求45或权利要求46所述的方法,其中回收该蛋白质包括过滤以去除细胞和/或细胞碎片。
48.一种增加蛋白质从细胞分泌的速率的方法,该方法包括:(a)在细胞培养物中培养宿主细胞,该宿主细胞包含如权利要求27所述的核酸或如权利要求29至33中任一项所述的载体,该载体编码该蛋白质,(b)诱导该蛋白质的表达,以及(c)回收分泌到该细胞培养物的上清液中的该蛋白质,其中将该蛋白质的分泌速率与具有dsbA信号多肽的该蛋白质的蛋白质分泌速率进行比较。
49.如权利要求48所述的方法,其中(c)的回收发生在诱导(b)后8和12小时之间。
50.如权利要求48或权利要求49所述的方法,其中该蛋白质分泌的速率每小时增加大于20%。
51.一种增加蛋白质从细胞分泌的量的方法,该方法包括:(a)在细胞培养物中培养宿主细胞,该宿主细胞包含如权利要求27所述的核酸或如权利要求29至33中任一项所述的载体,该载体编码该蛋白质,(b)诱导该蛋白质的表达,以及(c)回收分泌到该细胞培养物的上清液中的该蛋白质,其中将分泌的蛋白质的量与具有dsbA信号多肽的蛋白质进行比较。
52.如权利要求51所述的方法,其中与具有dsbA信号多肽的蛋白质相比,从该细胞分泌的该蛋白质的量增加大于20%。
53.如权利要求51所述的方法,其中与具有dsbA信号多肽的蛋白质相比,从该细胞分泌的该蛋白质的量增加大于100%。
54.一种制备蛋白质的方法,所述方法包括:
a.培养宿主细胞,该宿主细胞包含如权利要求27所述的核酸或如权利要求29至33中任一项所述的载体,使得表达该核酸,由此当该核酸或载体在该宿主细胞中表达时,由该核酸或载体编码的蛋白质从该细胞分泌到上该清液中;以及
b.从该上清液中分离该分泌的蛋白质。
55.如权利要求41至54中任一项所述的方法,其中该宿主细胞或重组细胞是大肠杆菌。
56.如权利要求54或权利要求55所述的方法,其中该宿主细胞在细胞培养物中在将该信号多肽从该蛋白质切割的条件下培养。
57.如权利要求54至56中任一项所述的方法,其中分离该分泌的蛋白质包括离心以去除细胞和/或细胞碎片。
58.如权利要求54至56中任一项所述的方法,其中分离该分泌的蛋白质包括过滤以去除细胞和/或细胞碎片。
59.一种蛋白质,其通过如权利要求42至58中任一项所述的方法制备。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662413607P | 2016-10-27 | 2016-10-27 | |
US62/413,607 | 2016-10-27 | ||
PCT/US2017/058413 WO2018081350A1 (en) | 2016-10-27 | 2017-10-26 | Signal polypeptide for improved secretion of protein |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109863247A true CN109863247A (zh) | 2019-06-07 |
Family
ID=62024108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780065537.8A Pending CN109863247A (zh) | 2016-10-27 | 2017-10-26 | 用于改善的蛋白质的分泌的信号多肽 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20190271022A1 (zh) |
EP (1) | EP3532618A4 (zh) |
JP (1) | JP2019532656A (zh) |
CN (1) | CN109863247A (zh) |
WO (1) | WO2018081350A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113584058B (zh) * | 2018-08-07 | 2023-02-10 | 康码(上海)生物科技有限公司 | 信号肽相关序列及其在蛋白质合成中的应用 |
KR102584139B1 (ko) * | 2021-03-02 | 2023-10-04 | 경북대학교 산학협력단 | 리조박터 구미필러스로부터 유래한 신규한 PETase 및 이의 변이체 |
WO2022191223A1 (ja) * | 2021-03-10 | 2022-09-15 | 株式会社カネカ | 原核生物細胞から標的タンパク質を抽出する方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110033890A1 (en) * | 2009-01-23 | 2011-02-10 | Korea Institute Of Science And Technology | Method for the secretory production of heterologous protein in escherichia coli |
US20140079709A1 (en) * | 2011-02-08 | 2014-03-20 | Integrated Bio Therapeutics Inc. | Immunogenic Composition Comprising Alpha-Hemolysin Oligopeptides |
CA2916231A1 (en) * | 2013-06-19 | 2014-12-24 | Integrated Biotherapeutics, Inc. | Toxoid peptides derived from phenol soluble modulin, delta toxin, superantigens, and fusions thereof |
JP2015116185A (ja) * | 2013-05-28 | 2015-06-25 | 東ソー株式会社 | シグナルペプチドおよびそれを用いたタンパク質の製造方法 |
WO2015139046A1 (en) * | 2014-03-14 | 2015-09-17 | Genentech, Inc. | Methods and compositions for secretion of heterologous polypeptides |
WO2015144691A1 (en) * | 2014-03-26 | 2015-10-01 | Glaxosmithkline Biologicals Sa | Compositions for immunising against staphylococcus aureus |
-
2017
- 2017-10-26 WO PCT/US2017/058413 patent/WO2018081350A1/en unknown
- 2017-10-26 US US16/344,993 patent/US20190271022A1/en not_active Abandoned
- 2017-10-26 EP EP17865332.5A patent/EP3532618A4/en not_active Withdrawn
- 2017-10-26 CN CN201780065537.8A patent/CN109863247A/zh active Pending
- 2017-10-26 JP JP2019522506A patent/JP2019532656A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110033890A1 (en) * | 2009-01-23 | 2011-02-10 | Korea Institute Of Science And Technology | Method for the secretory production of heterologous protein in escherichia coli |
US20140079709A1 (en) * | 2011-02-08 | 2014-03-20 | Integrated Bio Therapeutics Inc. | Immunogenic Composition Comprising Alpha-Hemolysin Oligopeptides |
JP2015116185A (ja) * | 2013-05-28 | 2015-06-25 | 東ソー株式会社 | シグナルペプチドおよびそれを用いたタンパク質の製造方法 |
CA2916231A1 (en) * | 2013-06-19 | 2014-12-24 | Integrated Biotherapeutics, Inc. | Toxoid peptides derived from phenol soluble modulin, delta toxin, superantigens, and fusions thereof |
WO2015139046A1 (en) * | 2014-03-14 | 2015-09-17 | Genentech, Inc. | Methods and compositions for secretion of heterologous polypeptides |
WO2015144691A1 (en) * | 2014-03-26 | 2015-10-01 | Glaxosmithkline Biologicals Sa | Compositions for immunising against staphylococcus aureus |
Non-Patent Citations (6)
Title |
---|
CHOI JH等: ""Secretory and extracellular production of recombinant proteins using Escherichia coli"", 《APPL MICROBIOL BIOTECHNOL》 * |
HAN S: ""Novel signal peptides improve the secretion of recombinant Staphylococcus aureus Alpha toxinH35L in Escherichia coli"", 《AMB EXPRESS》 * |
RAGLE BE等: ""Anti-alpha-hemolysin monoclonal antibodies mediate protection against Staphylococcus aureus pneumonia"", 《INFECT IMMUN》 * |
SALAHI,Z.等: ""Ch-DTP, partial [synthetic construct]"", 《GENBANK》 * |
YOON SH等: ""Secretory production of recombinant proteins in Escherichia coli"", 《RECENT PAT BIOTECHNOL》 * |
范鑫: ""外源木聚糖酶在枯草芽孢杆菌中信号肽筛选"", 《中国优秀硕士学位论文全文数据库 农业科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
EP3532618A1 (en) | 2019-09-04 |
US20190271022A1 (en) | 2019-09-05 |
WO2018081350A1 (en) | 2018-05-03 |
JP2019532656A (ja) | 2019-11-14 |
WO2018081350A8 (en) | 2019-03-21 |
EP3532618A4 (en) | 2020-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6495690B2 (ja) | 発現上昇のための細菌リーダー配列 | |
KR101265343B1 (ko) | Sec-시스템 분비에 의한 개선된 발현 시스템 | |
ES2707786T3 (es) | Expresión de proteínas de mamífero en Pseudomonas fluorescens | |
CN109863247A (zh) | 用于改善的蛋白质的分泌的信号多肽 | |
US20070238153A1 (en) | Processes for improved disulfide bond formation in recombinant systems | |
KR20200073280A (ko) | 주변세포질 단백질 발현을 위한 박테리아 리더 서열 | |
Freudl | Staphylococcus carnosus and other Gram-positive bacteria | |
MXPA06008061A (en) | Expression of mammalian proteins in pseudomonas fluorescens |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40009188 Country of ref document: HK |
|
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190607 |
|
WD01 | Invention patent application deemed withdrawn after publication |