EP1315822A2 - Modified construct downstream of the initiation codon for recombinant protein overexpression - Google Patents
Modified construct downstream of the initiation codon for recombinant protein overexpressionInfo
- Publication number
- EP1315822A2 EP1315822A2 EP01947565A EP01947565A EP1315822A2 EP 1315822 A2 EP1315822 A2 EP 1315822A2 EP 01947565 A EP01947565 A EP 01947565A EP 01947565 A EP01947565 A EP 01947565A EP 1315822 A2 EP1315822 A2 EP 1315822A2
- Authority
- EP
- European Patent Office
- Prior art keywords
- recombinant protein
- sequence
- interest
- mutated
- sequence seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title claims abstract description 54
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title claims abstract description 54
- 108091081024 Start codon Proteins 0.000 title claims abstract description 40
- 230000002018 overexpression Effects 0.000 title claims abstract description 16
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 64
- 239000013598 vector Substances 0.000 claims abstract description 59
- 210000004027 cell Anatomy 0.000 claims abstract description 26
- 238000010367 cloning Methods 0.000 claims abstract description 20
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims abstract description 11
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims abstract description 10
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 10
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 9
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 9
- 238000004519 manufacturing process Methods 0.000 claims abstract description 8
- 210000001236 prokaryotic cell Anatomy 0.000 claims abstract description 3
- 230000014509 gene expression Effects 0.000 claims description 44
- 239000002773 nucleotide Substances 0.000 claims description 43
- 125000003729 nucleotide group Chemical group 0.000 claims description 43
- 108020004705 Codon Proteins 0.000 claims description 19
- 238000010276 construction Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 19
- 241000588724 Escherichia coli Species 0.000 claims description 18
- 238000011144 upstream manufacturing Methods 0.000 claims description 15
- 241000894006 Bacteria Species 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 5
- 239000001963 growth medium Substances 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 102000004169 proteins and genes Human genes 0.000 description 31
- 235000018102 proteins Nutrition 0.000 description 27
- 230000000977 initiatory effect Effects 0.000 description 13
- 108010005774 beta-Galactosidase Proteins 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 102000005936 beta-Galactosidase Human genes 0.000 description 10
- 238000013519 translation Methods 0.000 description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 9
- 229960005091 chloramphenicol Drugs 0.000 description 9
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 239000000725 suspension Substances 0.000 description 7
- 108020004465 16S ribosomal RNA Proteins 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 239000006142 Luria-Bertani Agar Substances 0.000 description 4
- 108700008625 Reporter Genes Proteins 0.000 description 4
- ZXQYGBMAQZUVMI-QQDHXZELSA-N [cyano-(3-phenoxyphenyl)methyl] (1r,3r)-3-[(z)-2-chloro-3,3,3-trifluoroprop-1-enyl]-2,2-dimethylcyclopropane-1-carboxylate Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)OC(C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-QQDHXZELSA-N 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007850 degeneration Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 101150066555 lacZ gene Proteins 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108090000204 Dipeptidase 1 Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 239000001974 tryptic soy broth Substances 0.000 description 2
- 108010050327 trypticase-soy broth Proteins 0.000 description 2
- QDZOEBFLNHCSSF-PFFBOGFISA-N (2S)-2-[[(2R)-2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-1-[(2R)-2-amino-5-carbamimidamidopentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-N-[(2R)-1-[[(2S)-1-[[(2R)-1-[[(2S)-1-[[(2S)-1-amino-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]pentanediamide Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CCCNC(N)=N)C1=CC=CC=C1 QDZOEBFLNHCSSF-PFFBOGFISA-N 0.000 description 1
- PLVPPLCLBIEYEA-WAYWQWQTSA-N (z)-3-(1h-indol-3-yl)prop-2-enoic acid Chemical compound C1=CC=C2C(\C=C/C(=O)O)=CNC2=C1 PLVPPLCLBIEYEA-WAYWQWQTSA-N 0.000 description 1
- KUWPCJHYPSUOFW-YBXAARCKSA-N 2-nitrophenyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CC=CC=C1[N+]([O-])=O KUWPCJHYPSUOFW-YBXAARCKSA-N 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 1
- 108090000935 Antithrombin III Proteins 0.000 description 1
- 102100022977 Antithrombin-III Human genes 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 238000008157 ELISA kit Methods 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 101710191360 Eosinophil cationic protein Proteins 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 108010007267 Hirudins Proteins 0.000 description 1
- 102000007625 Hirudins Human genes 0.000 description 1
- 101000976075 Homo sapiens Insulin Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 241000711920 Human orthopneumovirus Species 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 102000003797 Neuropeptides Human genes 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108010079246 OMPA outer membrane proteins Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000096 Substance P Human genes 0.000 description 1
- 101800003906 Substance P Proteins 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 1
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 229960005348 antithrombin iii Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 231100000481 chemical toxicant Toxicity 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 238000007398 colorimetric assay Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 239000013530 defoamer Substances 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- -1 for example Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 229940006607 hirudin Drugs 0.000 description 1
- WQPDUTSPKFMPDP-OUMQNGNKSA-N hirudin Chemical compound C([C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(OS(O)(=O)=O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]1NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N2)=O)CSSC1)C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)C(C)C)[C@@H](C)O)CSSC1)C(C)C)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 WQPDUTSPKFMPDP-OUMQNGNKSA-N 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- PLVPPLCLBIEYEA-UHFFFAOYSA-N indoleacrylic acid Natural products C1=CC=C2C(C=CC(=O)O)=CNC2=C1 PLVPPLCLBIEYEA-UHFFFAOYSA-N 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000012933 kinetic analysis Methods 0.000 description 1
- 101150056134 lacL gene Proteins 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 231100000636 lethal dose Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 108010064037 prorennin Proteins 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 102200071172 rs1554197721 Human genes 0.000 description 1
- 102200130232 rs387906982 Human genes 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150108727 trpl gene Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 108010047303 von Willebrand Factor Proteins 0.000 description 1
- 102100036537 von Willebrand factor Human genes 0.000 description 1
- 229960001134 von willebrand factor Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
- C12N15/71—Expression systems using regulatory sequences derived from the trp-operon
Definitions
- the invention relates to a construct for the expression of a gene coding for a recombinant protein of interest placed under the control of the tryptophan Ptrp operon in a prokaryotic host cell, which comprises directly downstream of the initiation codon a sequence nucleic acid with sequence SEQ ID No. 1 and downstream of this sequence a multiple cloning cassette intended to receive the gene coding for said recombinant protein of interest, at least one of the nucleotides of the sequence SEQ ID No. 1 being mutated or deleted so as to allow an overexpression of said recombinant protein.
- the subject of the invention is also a vector containing such a construct, a prokaryotic host cell transformed by said vector, as is a method for producing a recombinant protein of interest using a construct according to the invention.
- Bacterial cells are privileged hosts for the expression of recombinant proteins because they have limited nutritional requirements while being able to reach high growth densities, but also because they have been the subject of in the past. numerous investigations which have led to the generation of mutants of interest and various plasmid expression systems.
- Escherichia coli E. coli
- E. coli is the most used and best characterized organism if we judge by the abundant literature relating to the expression of proteins of prokaryotic or eukaryotic origin.
- a messenger RNA must contain a sequence specifying the binding of the bacterial ribosome and allowing the initiation of translation. This sequence, called the Ribosome Binding Site (RBS), is located in an area covering the initiator codon.
- RBS Ribosome Binding Site
- Adenine-rich motifs immediately downstream of the initiation codon are favorable for the initiation of translation (Scherer, GFE, et al., Nucleic Acids Research, 8, 3895-3907, 1980; Chen, H., et al ., Journal of Molecular Biology, 240, 20-27, 1994b).
- the AAA and GCU codons which are most frequent in the position of second codons Gold, L., 1988
- GUIG or UUG sub-optimal
- the present invention demonstrates the advantage in terms of translational efficiency of new nucleotide sequences carried by an expression vector, in the region of the "Ribosome Binding Site" (RBS), downstream of the tryptophan promoter (Ptrp).
- RBS Ribosome Binding Site
- Ptrp tryptophan promoter
- CAT chloramphemcol acetyl transferase
- a subject of the present invention is thus a construction for the expression of a gene coding for a recombinant protein of interest placed under the control of the promoter of the tryptophan Ptrp operon in a prokaryotic host cell comprising directly downstream of the codon of initiation of a nucleic sequence of sequence SEQ ID No. 1, and downstream of this sequence a multiple cloning cassette intended to receive the gene coding for said recombinant protein of interest, characterized in that at least one of the nucleotides of the sequence SEQ ID No. 1 is mutated or deleted so as to allow an overexpression of said recombinant protein.
- recombinant protein of interest is intended to denote any protein, polypeptide or peptide obtained by genetic recombination, and capable of being used in fields such as that of human or animal health, cosmetology, animal nutrition, agro-industry or the chemical industry.
- proteins of interest there may be mentioned in particular, but not limited to: - a cytokine and in particular an interleukin, an interferon, a tissue necrosis factor and a growth factor and in particular hematopoietic (G-CSF, GM - CSF), a human growth hormone or insulin, a neuropeptide;
- a factor or cofactor involved in coagulation and in particular the NUI factor, von Willebrand factor, antithrombin III, protein C, thrombin and hirudin; - an enzyme and in particular trypsin, a ribonuclease and ⁇ -galactosidase;
- an enzyme inhibitor such as ⁇ 1 antitrypsin and viral protease inhibitors
- - a protein capable of inhibiting the initiation or progression of cancers, such as the expression products of tumor suppressor genes, for example the P53 gene; - a protein capable of stimulating an immune response or an antigen, such as for example the proteins, or their active fragments, of the membrane of bacteria Gram negative, in particular OmpA proteins from Klebsellia or protein G from human respiratory syncytial virus;
- a protein capable of inhibiting a viral infection or its development for example the antigenic epitopes of the virus in question or altered variants of viral proteins capable of entering into competition with the native viral proteins;
- - a protein capable of being contained in a cosmetic composition such as substance P or a superoxide dismutase; - a food protein and in particular a food;
- nucleic sequence of sequence SEQ ID ⁇ ° 1 in which at least one of the nucleic acids is mutated or deleted so as to allow an overexpression of said recombinant protein is meant any sequence which comprises a deletion or a mutation of at least one nucleotide of the sequence SEQ ID N ° 1 which allows an overexpression of the recombinant protein, compared to the expression of said recombinant protein obtained using the sequence SEQ ID N ° 1 unmodified.
- deletion is meant the elimination of one or more nucleotides at one or more nucleotide sites of the sequence SEQ ID No. 1.
- the resulting sequence is shortened compared to that of origin.
- mutation is meant the replacement of one nucleotide by another (A by C, G or T; C by A, G or T; G by A, C or T; T by A, C or G).
- the resulting sequence is the same size as the original.
- the overexpression that is to say the fact of obtaining an expression greater than that obtained without the modification downstream of the initiation codon can be determined in particular by using one of the following methods: i) migration by SDS-PAGE of the total proteins of the bacterium and revelation of the recombinant protein by staining with Comassie Blue or by Western blot; ii) assaying the recombinant protein by a method involving a specific antibody (Elisa); iii) enzymatic assay if the recombinant protein has a catalytic activity.
- method ii) is used, detailed in Example III.
- multiple cloning cassette is meant a nucleotide sequence containing one or more restriction sites, which sites can be used during steps of cloning the gene of interest downstream of the start codon.
- said at least nucleotide of the sequence SEQ ID No. 1 is deleted so as to allow overexpression of said recombinant protein.
- the invention also relates to a construction according to the invention in which said at least mutated or deleted nucleotide, preferably deleted, is located on the fragment of sequence SEQ ID No. 2 of the sequence SEQ ID No. 1. Another object of the invention The invention relates to the constructions in which said at least mutated or deleted nucleotide, preferably mutated, is located on the codon GTA and / or on the codon GCA and / or on the codon CTG of the sequence SEQ ID No. 1.
- said sequence SEQ ID No. 1 of which at least one of the nucleotides is mutated or deleted has at least in position 1, 2 and 3, the nucleotide A.
- At least one of the nucleotides, and preferably all the nucleotides, located between the nucleic sequence of sequence SEQ ID No 1 and the multiple cloning cassette intended to receive the gene coding for said protein recombinant of interest are deleted.
- said sequence SEQ ID No. 1 of which at least one of the nucleic acids is mutated or deleted and all the nucleotides located between the nucleic sequence of sequence SEQ ID No. 1 and the multiple cloning cassette are completely deleted, so that the initiation codon is directly upstream of the multiple cloning cassette.
- the constructs contain a nucleic sequence directly upstream of the chosen initiation codon among the sequences of sequence SEQ ID N ° 3, SEQ ID N ° 4, SEQ ID N ° 5, SEQ ID N ° 6, SEQ ID N ° 7, SEQ ID N ° 8, SEQ ID N ° 9 and SEQ ID N ° 10.
- the invention comprises a construction according to the invention, characterized in that the prokaryotic host cell is a gram negative bacterium, preferably belonging to the species E. coli.
- Another object of the invention relates to a vector containing a construct as defined above, just like a prokaryotic host cell, preferably belonging to the species E. coli, transformed by such a vector.
- the present invention also relates to a process for the production of a recombinant protein of interest in a host cell using a construct as defined above.
- the present invention also relates to a process for the production of a recombinant protein of interest according to the invention, in which said construct is introduced into a prokaryotic host cell, preferably by a vector as defined above.
- a process for the production of a recombinant protein of interest according to the invention is preferred, characterized in that it comprises the following steps: a) cloning of a gene of interest in a vector according to the invention; b) transformation of a prokaryotic cell with a vector containing a gene coding for said recombinant protein of interest; c) culturing said transformed cell in a culture medium allowing expression of the recombinant protein; and d) recovering the recombinant protein from the culture medium or said transformed cell.
- the invention further comprises a use of a prokaryotic construct, vector or host cell according to the present invention, for the production of a recombinant protein.
- the invention relates to a use of a recombinant protein for the preparation of a medicament intended for administration to a patient in need of such treatment, characterized in that said recombinant protein is produced by a process for the production of a protein recombinant of interest according to the invention.
- Figure 1 Map of the plasmid vector pTEXmpl ⁇ and sequence SEQ ID N ° 39 of the region 1-450 comprising the promoter / operator Ptrp, the region of the leader TrpL, the multiple cloning site mpl8 and the terminator of transcription.
- Figure 2 Restriction map of the RBS region (Ribosome Binding Site) on the vector pTEXmpl 8 (SEQ ID No. 40).
- Figure 3 Estimation on SDS-PAGE gel of CAT expression in bacteria transformed by the pTEXCAT or pTEXCAT4 vectors.
- Figure 4 Comparative study of the expression of ⁇ -galactosidase from the vectors pTEX- ⁇ GAL and pTEX4- ⁇ GAL (kinetics in fermenter).
- This example illustrates one of the aspects which led to the invention, and in particular the way in which the library of plasmid vectors carrying the tryptophan Ptrp promoter and randomly mutated upstream of the initiation codon is constructed.
- the original vector is described in FIG. 1. It is a plasmid derived from pBR322 (Bolivar, F., et al., Gene, 2, 95-113, 1977) in which the promoter / operator Ptrp (1-298), followed by the sequence coding for the first 7 amino acids of the leader TrpL from E.
- the reporter gene for chloramphenicol acetyl transferase is cloned at the ⁇ coRI and PstI sites of pTEXmpl 8.
- the coding sequence of the cat gene is amplified by PCR at 1 using CATfor and CATrev oligonucleotides whose sequences are: CATfor: 5 '-CCGGAATTCATGGAGAAAAAAATCACTGG-3' (SEQ ID N ° 11)
- SK (Stratagene, La Jolla, CA, USA).
- the amplification product is deposited on agarose gel and purified according to the GeneClean method (BiolOl, La Jolla, CA).
- the cloning of the insert in pTEXmpl 8 is verified after transformation in E. coli by the appearance of colonies developing on boxes of LB agar medium (Sambrook J., et al., Molecular cloning. A laboratory manual, 2 nd edition Plainview, NY: Cold Spring Harbor Laboratory Press, 1989) in the presence of 30 ⁇ g / ml of chloramphenicol.
- the sequence of the insert is confirmed by automatic sequencing using the “Dye Terminator” kit and the DNA sequencer 373A (Perkin ⁇ lmer Applied Biosystems, Foster City, CA).
- the vector obtained is named pT ⁇ XCAT.
- the insertion of RBS having a degenerate sequence upstream of the initiation codon is carried out by ligation of synthetic oligonucleotides at the Spel and ⁇ coRI sites of the vector pT ⁇ XCAT.
- the region going from the Spel site to the ⁇ coRI site respectively in positions - 49 and + 28 (see FIG. 2) is deleted by enzymatic digestion and replaced by a heteroduplex formed by two partially degenerate synthetic oligonucleotides, hybrids between them.
- oligonucleotides RanSDl / RanSD2 and RanSD3 / RanSD4 Two pairs of oligonucleotides are used, involving respectively the oligonucleotides RanSDl / RanSD2 and RanSD3 / RanSD4 whose sequences are: RanSDl: 5'CTAGTTAACTAGTACGCAAGTTCACGTAAANNNNNNNNNNNNNÎWNNNATG AAAGCAATTTTCGTACTGAATGCGG-3 '(S ⁇ Q ID NO: 13) RanSD2:
- the four oligonucleotides were synthesized by MWG Biotech (Ebersberg, D) under conditions ensuring an equimolar distribution of the bases for each degeneration.
- the number of combinations (4 16 or approximately 4.3 10 9 ) allows the screening of RBS which are optimized both from the point of view of their Shine-Dalgarno (SD) sequence, of the sequence located between the SD region and the d codon. initiation as well as in SD-ATG spacing. This library will be named (N 16 ) in the remainder of the text.
- the RanSD3 / RanSD4 pair provides complete degeneration on 6 nucleotides preceding PATG and partial degeneration on the 7 nucleotides upstream.
- This second library is named (RN 6 ).
- the linearization of the vector pTEXCAT and its purification on gel, the hybridization of the oligonucleotides in pairs, the ligation of the heteroduplexes to the linearized pTEXCAT vector and the transformation in E. coli of the library thus constituted are carried out according to the conditions described by Sambrook J., et al. (1989). Conventionally, 100 fmol of vector and 1000 fmol of insert are used in a ligation reaction in the presence of T4 ligase in a final volume of 15 ⁇ l. The reaction is carried out overnight at 16 ° C.
- Electrocompetent TOP 10 bacteria (50 ⁇ l) are then transformed by electroporation with 3 ⁇ l of the ligation mixture under the conditions recommended by the supplier (Invitrogen, CarIsbad, CA).
- the transformation mixture is spread on LB agar dishes containing 200 ⁇ g / ml of ampicillin, giving rise after 16 hours of incubation at 37 ° C. to the appearance of transformed colonies.
- Example II
- the figures (upper row) indicate the number of colonies counted after 18 h of incubation at 37 ° C., each medium having been seeded with approximately 100 cells.
- CA transformed by the vector pTEXCAT and spread on dishes containing different concentrations of chloramphenicol have, between 300 and 600 ⁇ g / ml of chloramphenicol, a stronger development in the presence of 3- ⁇ indole acrylic acid (LAA), an analogue of tryptophan acting as an inducer by a Ptrp derepressure effect (Marmorstein, RQ and Sigler, PB, The Journal of Biological Chemistry, 264, 9149-9154, 1989).
- LAA 3- ⁇ indole acrylic acid
- Ptrp derepressure effect Marmorstein, RQ and Sigler, PB, The Journal of Biological Chemistry, 264, 9149-9154, 1989.
- This example illustrates the selection of clones from the libraries constructed according to the description of Example 1.
- the libraries obtained in the form of colony mats on boxes of LB agar + ampicillin are taken up in sterile water so as to reconstitute a suspension whose Optical Density (OD) at 580 nm is close to 1.
- this suspension is spread on LB agar dishes containing lethal doses of chloramphenicol (600, 700, 800 and 900 ⁇ g / ml) at a rate of 100 ⁇ l of suspension per Petri dish. The dishes are incubated at 37 ° C.
- the clones selected at this stage are then subjected to a series of analyzes: (i) extraction of the plasmid (Qiagen kit, Hilden, D) and sequencing of the region covering the RBS, (ii) culture in Erlenmeyers with induction by 1TAA then estimation of the level of expression of CAT by ELISA assay, (iii) SDS-PAGE electrophoresis of the total proteins extracted from the previous cultures and staining with Coomassie blue making it possible to visualize the total intracellular proteins.
- the sequencing of the clones is carried out using the Dye Terminator kit on an ABI 373A sequencer (Perkin Elmer Applied Biosystems, Foster City, CA).
- Erlenmeyer cultures are produced by inoculating 25 ml of TSBY medium (Tryptic Soy Broth (DIFCO) 30 g / 1 + Yeast Extract (Difco) 5 g / 1) + tetracycline 8 mg / 1 by a colony on a dish or by a suspension bacterial stored at - 80 ° C. Each preculture is incubated on a plate stirred at 200 rpm and 37 ° C overnight. A fraction is transferred into 50 ml of the same medium so as to reach an initial optical density equal to 1. For the induction of the CAT protein, the medium is added with 25 mg / 1 of IAA and then stirred in the same conditions for 5 hours.
- TSBY medium Traptic Soy Broth (DIFCO) 30 g / 1 + Yeast Extract (Difco) 5 g / 1) + tetracycline 8 mg / 1 by a colony on a dish or by a suspension bacterial stored at - 80
- a fraction of the suspension (3 x 1 ml diluted to OD 0.1) is centrifuged and the cells stored at ⁇ 20 ° C. for the CAT assay by ELISA (CAT ELISA kit, Roche Diagnostics, Basel, CH). The rest of the biomass is recovered by centrifugation at 10,000 g, 4 ° C for 15 minutes. The biomass is taken up in a TEL buffer (25 mM Tris, 1 mM EDTA, Lysozyme 500 ⁇ g / ml, pH 8) at a rate of 5 ml per 1 g of wet biomass.
- TEL buffer 25 mM Tris, 1 mM EDTA, Lysozyme 500 ⁇ g / ml, pH 8
- the cells are lysed by sonication (NibraCell sonicator equipped with a micro-probe, Sonics & Materials, Danbury, CT).
- sonication NebraCell sonicator equipped with a micro-probe, Sonics & Materials, Danbury, CT.
- One ml of the resulting suspension is centrifuged for 5 min at 12,000 rpm.
- the pellet is taken up in 200 ⁇ l of TEL to give the insoluble fraction (I).
- the supernatant is noted “S”.
- the total proteins contained in fractions I and S are analyzed by electrophoresis under denaturing conditions (SDS-PAGE) and staining with Coomassie blue.
- Table 2 below indicates the different RBS sequences obtained after screening the two libraries (N 16 ) and (R 7 N 6 ). Following alignment in the GenBank and EMBL nucleotide databases, we can conclude that none of the sequences of 16 nucleotides (strategy (N 16 )) or 13 nucleotides (strategy (R 7 N 6 )) located immediately upstream of the AUG codon in the various isolated clones has not been described to date.
- Each nucleotide sequence (messenger RNA) comprises the mutated region downstream of the initiation codon.
- the reference sequence of the pTEXCAT vector is shown in the first line of the table.
- Nucleic sequences upstream and downstream of the codon initiation vectors are shown in this table after transcription as RNA. At the 3 'end of these sequences, only the first two codons of the multiple cloning site are represented, namely GAAUUC.
- the clones described in Table 2 have mutations in the region of RBS situated immediately downstream of the codon AUG.
- the clones pTEXCAT4, pTEXCATl 'and pTEXCAT3' carry a point mutation affecting an amino acid of the N-terminal part of the encoded protein (respectively Leu7Pro, Ala3Pro and Val ⁇ Ala).
- the other clones carry larger rearrangements: pTEXCAT2 ', pTEXCAT5' and pTEXCAT9 'have deletions inducing the loss of the regions Ala3Leu7, Ile4Leu7 and Ile4Asn8 respectively.
- the vector pTEXCAT4 was reconstructed in vitro from pTEXCAT by Spel-EcoRI digestion and ligation of a duplex formed by the two.
- the resulting vector noted pTEXCAT-SD4 was then transformed into E. coli TOP 10 and compared to pT ⁇ XCAT4 in terms of potential for expression of the CAT enzyme.
- the results obtained indicate that the expression levels of pT ⁇ XCAT4 and pT ⁇ XCAT-SD4 are comparable to each other and significantly higher than pT ⁇ XCAT. This supports the hypothesis that the improvement in expression observed with the clones claimed in this patent application is indeed caused specifically by the sequences located between the Spel and ⁇ coRI sites.
- the two vectors were transformed into the E. coli ICONE 200 strain (French patent application FR 2 777 292 published on October 15, 1999) with a view to culturing in a fermenter with kinetic monitoring of the expression of ⁇ -galactosidase .
- the recombinant bacteria ICONE 200 x pTEX- ⁇ GAL and ICONE 200 x pTEX4- ⁇ GAL were cultured in 200 ml of complete medium (Tryptic Soy Broth (DIFCO) 30 g / 1, Yeast Extract (DIFCO) 5 g / 1) for overnight at 37 ° C.
- the cell suspension obtained was transferred sterile to a fermenter (CF3000 model from Chemap, capacity 3.5 1) containing 1.8 liters of the following medium (concentrations for 2 liters of final culture): glycerol 90 g / 1, (NH_ ⁇ ) 2S04 5 g / 1, KH2PO4 6 g / 1, K2HPO4 4 g / 1, Na3-citrate 2H2O 9 g / 1, MgS 4 7H2O 2 g / 1, yeast extract 1 g / 1, trace elements, defoamer 0.06% , tetracycline 8 mg / 1, tryptophan 200 mg / 1.
- the pH is adjusted to 7.0 by adding ammonia.
- the dissolved oxygen rate is maintained at 30% of saturation by slaving the stirring speed and then the aeration rate to measure dissolved PO2.
- the induction is carried out by adding 25 mg / 1 of IAA (Sigma, St Louis, MO).
- Kinetic analysis of the optical density of the culture (OD to 580 nm) and intracellular ⁇ -galactosidase activity was performed.
- the level of ⁇ -galactosidase activity is estimated by a colorimetric assay by mixing 30 ⁇ l of sample (fraction “S”, see example 3), 204 ⁇ l of buffer (Tris-HCl 50 mM pH 7.5 - MgCl 2 1 mM) and 66 ⁇ l of ONPG (4 mg / ml in 50 mM Tris-HCl pH 7.5). The reaction mixture is incubated at 37 ° C. The reaction is stopped by the addition of 500 ⁇ l of Na 2 CO 3 1 M. The OD at 420 nm relative to the incubation time is proportional to the ⁇ -galactosidase activity present in the sample. Knowing that E.
- coli ICONE 200 has a complete deletion of Lac Popon, the ⁇ -galactosidase activity measured is only due to the expression of the lacZ plasmid gene.
- the results of this comparative study indicate that in two independent experiments, the vector pTEX4- ⁇ GAL gives a level of ⁇ -galactosidase activity approximately 50 times higher than pTEX- ⁇ GAL ( Figure 4).
- Figure 4 We deduce that the original sequence isolated in the RBS area of the vector pTEXCAT4 potentiates the expression, not only of the CAT protein, but also of other proteins such as, for example, ⁇ -galactosidase.
- the vectors pTEXIO ', pTEXl P and pTEX12' originate from the vector pTEX9 but also include additional mutations, as indicated in table 4 below: Table 4. Comparison between the expression levels given by the vectors pTEXwt, pTEX9 *, pTEXIO ', pTEXl P and pTEX12'.
- Each nucleotide sequence (messenger RNA) comprises the mutated region downstream of the initiation codon.
- the reference sequence of the pTEXCAT vector is shown in the first line of the table.
- the nucleic acid sequences upstream and downstream of the vector initiation codon are represented in this table after transcription in the form of RNA. At the 3 'end of these sequences, only the first two codons of the multiple cloning site are represented, namely GAAUUC.
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
The invention concerns a construct for expressing a gene coding for a recombinant protein of interest placed under the control of a tryptophan operon (Ptrp) in a prokaryotic cell, comprising directly downstream of the initiation codon a nucleic sequence SEQ ID N<o> 1 and downstream of said sequence a multiple cloning cassette designed to receive the gene coding for said recombinant protein of interest, at least nucleic acids of the nucleic sequence SEQ ID N<o> 1 being mutated or deleted so as to enable overexpression of said recombinant protein. The invention also concerns a vector containing such a construct, a prokaryotic host cell transformed by said vector, as well as a method for producing a recombinant protein of interest using the inventive construct.
Description
CONSTRUCTION MODIFIEE EN AVAL DU CODON D'INITIATION POUR LA SUREXPRESSION DE PROTEINES RECOMBINANTES.MODIFIED CONSTRUCTION DOWNSTREAM OF THE INITIATION CODON FOR OVEREXPRESSION OF RECOMBINANT PROTEINS.
L'invention concerne une construction pour l'expression d'un gène codant pour une protéine recombinante d'intérêt placé sous le contrôle de l'opéron tryptophane Ptrp dans une cellule hôte procaryote, qui comprend directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID N° 1 et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, au moins un des nucléotides de la séquence SEQ ID N° 1 étant muté ou délété de façon à permettre une surexpression de ladite protéine recombinante. L'invention a encore pour objet un vecteur contenant une telle construction, une cellule hôte procaryote transformée par ledit vecteur, tout comme un procédé de production d'une protéine recombinante d'intérêt utilisant une construction selon l'invention.The invention relates to a construct for the expression of a gene coding for a recombinant protein of interest placed under the control of the tryptophan Ptrp operon in a prokaryotic host cell, which comprises directly downstream of the initiation codon a sequence nucleic acid with sequence SEQ ID No. 1 and downstream of this sequence a multiple cloning cassette intended to receive the gene coding for said recombinant protein of interest, at least one of the nucleotides of the sequence SEQ ID No. 1 being mutated or deleted so as to allow an overexpression of said recombinant protein. The subject of the invention is also a vector containing such a construct, a prokaryotic host cell transformed by said vector, as is a method for producing a recombinant protein of interest using a construct according to the invention.
La capacité des biotechnologistes à cloner un gène dans des délais réduits, à l'exprimer sous la forme d'une protéine biologiquement active puis à en créer des variants pour établir des relations séquence/fonction a permis de proposer un large éventail de protéines recombinantes à usage médical ou de recherche. De nombreuses maladies humaines sont désormais traitées ou évitées grâce à la disponibilité de molécules issues des biotechnologies sous forme pure et à un coût acceptable (Koths K., Current Opinion in Biotechnology, 6, 681-687, 1995).The ability of biotechnologists to clone a gene in a short time, to express it as a biologically active protein and then to create variants to establish sequence / function relationships has made it possible to offer a wide range of recombinant proteins to medical or research use. Many human diseases are now treated or avoided thanks to the availability of molecules from biotechnology in pure form and at an acceptable cost (Koths K., Current Opinion in Biotechnology, 6, 681-687, 1995).
Les cellules bactériennes sont des hôtes privilégiés pour l'expression de protéines recombinantes car elles ont des exigences nutritives limitées tout en étant capables d'atteindre des densités de croissance élevées, mais aussi parce qu'elles ont fait l'objet dans le passé d'investigations nombreuses qui ont conduit à la génération de mutants d'intérêt et de systèmes d'expression plasmidiques variés. Parmi les bactéries, Escherichia coli (E. colî) est l'organisme le plus utilisé et le mieux caractérisé si l'on en juge par l'abondante littérature y relatant l'expression de protéines d'origine procaryote ou eucaryote. Cependant, toutes les protéines n'y sont pas exprimées avec la même efficacité en raison de difficultés pouvant intervenir à différents niveaux : transcription du gène d'intérêt, traduction, événements post-traductionnels affectant le devenir de la
molécule dans l'environnement cytoplasmique ou périplasmique de la bactérie (Makrides, S.C., Microbiological Reviews, 60, 512-538, 1996).Bacterial cells are privileged hosts for the expression of recombinant proteins because they have limited nutritional requirements while being able to reach high growth densities, but also because they have been the subject of in the past. numerous investigations which have led to the generation of mutants of interest and various plasmid expression systems. Among the bacteria, Escherichia coli (E. coli) is the most used and best characterized organism if we judge by the abundant literature relating to the expression of proteins of prokaryotic or eukaryotic origin. However, all the proteins are not expressed there with the same efficiency due to difficulties which may occur at different levels: transcription of the gene of interest, translation, post-translational events affecting the fate of the molecule in the cytoplasmic or periplasmic environment of the bacteria (Makrides, SC, Microbiological Reviews, 60, 512-538, 1996).
Pour être traduit efficacement, un ARN messager doit contenir une séquence spécifiant la fixation du ribosome bactérien et permettant l'initiation de la traduction. Cette séquence, appelée site de fixation au ribosome « Ribosome Binding Site » (RBS) est située dans une zone recouvrant le codon initiateur. L'analyse statistique des domaines d'initiation des ARNm bactériens révèle l'existence d'une fenêtre de 34 nucléotides dont la séquence diffère d'une distribution aléatoire (Gold, L., Annual Revue of Biochemistry, 57, 199-233, 1988). Cette séquence, allant de la position - 20 à la position + 13 de l'ARNm si l'on affecte la position + 1 au premier nucléotide du codon initiateur, joue le rôle de RBS en aidant le ribosome à distinguer les vrais domaines d'initiation parmi l'ensemble des séquences « RBS-li e ». De nombreuses investigations ont permis d'affiner la connaissance du RBS pour en définir quelques éléments caractéristiques : i) La séquence Shine-Dalgarno (SD) :To be efficiently translated, a messenger RNA must contain a sequence specifying the binding of the bacterial ribosome and allowing the initiation of translation. This sequence, called the Ribosome Binding Site (RBS), is located in an area covering the initiator codon. Statistical analysis of the initiation domains of bacterial mRNA reveals the existence of a window of 34 nucleotides whose sequence differs from a random distribution (Gold, L., Annual Revue of Biochemistry, 57, 199-233, 1988 ). This sequence, going from position - 20 to position + 13 of the mRNA if the position + 1 is assigned to the first nucleotide of the initiator codon, plays the role of RBS by helping the ribosome to distinguish the real domains of initiation among all the “RBS-li e” sequences. Numerous investigations made it possible to refine the knowledge of RBS to define some characteristic elements: i) The Shine-Dalgarno sequence (SD):
Depuis le séquençage de l'extrémité 3' de l'AR ribosomal 16S (Shine, J. et Dalgarno, L., Proc. Natl. Acad. Sci. U.S.A., 71, 1342-1346, 1974), la séquence dite de Shine-Dalgarno a été définie comme la région des ARNm en 5' du codon d'initiation possédant une complémentarité avec la séquence 5'-CCUCCUUA-3' de l'extrémité 3' de l'ARNr 16S. L'existence d'une interaction entre l'ARNr 16S et le RBS médiée par la séquence de Shine-Dalgarno est confirmée par la forte représentation des bases puriques A et G dans la région [-12 ; -7] des RBS naturels d'ARNm d'E. coll. Ce biais est retrouvé dans une collection de 158 RBS randomisés et sélectionnés pour leur capacité à promouvoir l'expression d'un gène rapporteur (Barrick, D., et al., Nucleic. Acids. Res., 22, 1287-1295, 1994). ii) Le codon d'initiation :Since the sequencing of the 3 'end of the 16S ribosomal AR (Shine, J. and Dalgarno, L., Proc. Natl. Acad. Sci. USA, 71, 1342-1346, 1974), the so-called Shine sequence -Dalgarno was defined as the region of the mRNAs 5 ′ of the initiation codon having a complementarity with the sequence 5 ′-CCUCCUUA-3 ′ of the 3 ′ end of the 16S rRNA. The existence of an interaction between the 16S rRNA and the RBS mediated by the Shine-Dalgarno sequence is confirmed by the strong representation of the purine bases A and G in the region [-12; -7] of natural RBS of mRNA of E. al. This bias is found in a collection of 158 RBS randomized and selected for their capacity to promote the expression of a reporter gene (Barrick, D., et al., Nucleic. Acids. Res., 22, 1287-1295, 1994 ). ii) The initiation codon:
C'est le codon AUG qui est utilisé préférentiellement comme codon d'initiation, même si GUG et dans une moindre mesure UUG peuvent être trouvés occasionnellement (Ringquist, S., et al., Molecular Microbiology, 6, 1219-1229, 1992). iii) La distance entre la séquence SD et le codon d'initiation :
Une étude exhaustive de Chen H., et al. (Nucleic Acids Research, 22, 4953-4957, 1994a) a montré l'existence d'une distance optimale séparant l'extrémité 3' de la séquence Shine-Dalgarno et le codon d'initiation. En prenant la séquence consensus 5'- UAAGGAGGU-3' comme séquence SD de référence, l'espacement donnant le niveau d'expression maximal est de 5 nucléotides. Un espacement compris entre 1 et 9 nucléotides demeure favorable en assurant un niveau d'expression au moins égal à 50 % du niveau maximal. iv) Autres séquences primaires :It is the AUG codon which is preferably used as the initiation codon, although GUG and to a lesser extent UUG can be found occasionally (Ringquist, S., et al., Molecular Microbiology, 6, 1219-1229, 1992) . iii) The distance between the SD sequence and the initiation codon: A comprehensive study by Chen H., et al. (Nucleic Acids Research, 22, 4953-4957, 1994a) has shown the existence of an optimal distance separating the 3 'end of the Shine-Dalgarno sequence and the initiation codon. By taking the consensus sequence 5'-UAAGGAGGU-3 'as the reference SD sequence, the spacing giving the maximum level of expression is 5 nucleotides. A spacing of between 1 and 9 nucleotides remains favorable while ensuring a level of expression at least equal to 50% of the maximum level. iv) Other primary sequences:
Deux appariements sont connus pour intervenir dans l'initiation de la traduction : Pappariement entre codon d'initiation de l'ARNm et ARNt-fMet d'une part et Pappariement entre séquence SD et extrémité 3' de l'ARNr 16S d'autre part. Des études de mutagénèse et l'analyse d'ARNm atypiques (notamment des ARNm dépourvus de séquence leader) ont permis d'identifier de nouveaux éléments de séquences dans l'environnement du codon AUG pouvant contribuer à l'efficacité globale du domaine d'initiation. Des motifs riches en adénines immédiatement en aval du codon d'initiation sont favorables à l'initiation de la traduction (Scherer, G.F.E., et al., Nucleic Acids Research, 8, 3895-3907, 1980 ; Chen, H., et al., Journal ofMolecular Biology, 240, 20-27, 1994b). De même, les codons AAA et GCU qui sont les plus fréquents en position de seconds codons (Gold, L., 1988) ont un effet positif sur la traduction, surtout lorsque le codon d'initiation est sub-optimal (GUG ou UUG) (Ringquist, S., et al., 1992). Une séquence identifiée sur l'ARNm du gène 0.3 du phage T7 et nommée « Downstream Box » (DB) en raison de sa position avale par rapport au codon d'initiation est un autre élément favorisant la traduction (Sprengart, M ., et al., Nucleic Acids Research, 18, 1719-1723, 1990). Cette séquence de 12 nucléotides possède une complémentarité avec les nucléotides 1469-1483 de l'ARNr 16S et elle est retrouvée sous des formes semblables sur des domaines d'initiation de la traduction de plusieurs gènes d'E. coli et de bactériophages fortement exprimés (Sprengart, M.L., et al., 1990). Cette «Downstream Box » permet l'initiation de la traduction même en l'absence de séquence SD (Sprengart, M.L., et al., The EMBO Journal, 15, 665-674, 1996). Des résultats récents indiquent que, contrairement à l'hypothèse initialement émise, la séquence DB agirait par un mécanisme autre qu'un appariement avec la région
1469-1483 de l'ARNr 16S (O'Connor, M., et al., Proc. Natl. Acad. Sci. U.S.A., 96, 8973-8978, 1999). v) Les structures secondaires :Two pairings are known to intervene in the initiation of translation: the pairing between initiation codon of the mRNA and t-fMet RNA on the one hand and the pairing between SD sequence and 3 'end of the 16S rRNA on the other hand . Mutagenesis studies and analysis of atypical mRNAs (in particular mRNAs lacking a leader sequence) have made it possible to identify new sequence elements in the environment of the AUG codon which may contribute to the overall efficiency of the initiation domain. . Adenine-rich motifs immediately downstream of the initiation codon are favorable for the initiation of translation (Scherer, GFE, et al., Nucleic Acids Research, 8, 3895-3907, 1980; Chen, H., et al ., Journal of Molecular Biology, 240, 20-27, 1994b). Similarly, the AAA and GCU codons which are most frequent in the position of second codons (Gold, L., 1988) have a positive effect on translation, especially when the initiation codon is sub-optimal (GUG or UUG) (Ringquist, S., et al., 1992). Another sequence promoting translation (Sprengart, M., Et al.) Is a sequence identified on the 0.3 mRNA of phage T7 and named “Downstream Box” (DB) because of its downstream position relative to the initiation codon. ., Nucleic Acids Research, 18, 1719-1723, 1990). This sequence of 12 nucleotides has a complementarity with nucleotides 1469-1483 of the 16S rRNA and it is found in similar forms on domains of initiation of the translation of several genes of E. coli and highly expressed bacteriophages (Sprengart, ML, et al., 1990). This “Downstream Box” allows the initiation of translation even in the absence of an SD sequence (Sprengart, ML, et al., The EMBO Journal, 15, 665-674, 1996). Recent results indicate that, contrary to the hypothesis initially put forward, the DB sequence would act by a mechanism other than a pairing with the region 1469-1483 of the 16S rRNA (O'Connor, M., et al., Proc. Natl. Acad. Sci. USA, 96, 8973-8978, 1999). v) Secondary structures:
La séquence de l'ARNm à proximité de la région SD peut influencer l'efficacité traductionnelle par le biais de la formation de structures secondaires. De Smit, M.H., et van Duin, J. (Journal of Molecular Biology, 235, 173-184, 1994) montrent que des appariements intramoléculaires sur l'ARNm peuvent nuire à une bonne traduction en entrant en compétition avec Pappariement ARNm / ARNr, et ce d'autant plus que la complémentarité de la région SD avec l'ARNr 16S est faible. De la même manière, il a été montré que l'expression de prochymosine dans E. coli était dépendante de la composition de la région reliant SD au codon d'initiation : une séquence limitant les structures secondaires favorise l'accessibilité du RBS au ribosome et entraîne une efficacité traductionnelle forte (Wang, G., et al., Protein Expression and Purification, 6, 284-290, 1995). Etant donné l'importance de l'étape d'initiation de la traduction sur le rendement d'expression des protéines recombinantes, de nombreuses études ont été menées dans le but d'optimiser la région RBS de vecteurs d'expression bactériens. Une approche intuitive a d'abord consisté à placer la région SD consensus complète (UAAGGAGGU) en amont de gènes d'intérêt (Jay, G., et al., Proc. Natl. Acad. Sci. U.S.A., 78, 5543-5548, 1981). De manière plus systématique, Marquis D.M., et al. (Gène, 42, 175-183, 1986) ont placé cette séquence en aval de différents promoteurs et à une distance variable (5 à 9 nucléotides) du codon d'initiation. Avec le gène de PIL-2 comme modèle, les résultats indiquent qu'un espacement SD / AUG de 6 nucléotides est optimal pour presque tous les promoteurs testés. Dans une étude comparative entre la séquence SD consensus et la séquence SD du gène lacZ, Mandecki, W., et al. (Gène, 43, 131-13, 1986) ont cependant noté que la séquence SD consensus donnait une expression supérieure in vitro mais 2 à 2,5 fois plus faible que celle de lacL in vivo. Des régions RBS entières issues de gènes de phages avec leur propre séquence SD se sont révélées elles aussi supérieures à la séquence SD consensus pour l'expression de protéines de différentes origines (plantes, cellules de mammifères, bactéries) (Olins, P.O., et al., Gène, 73, 227-235, 1988). Utilisant le promoteur tryptophane, Curry, K. et Tomich, C.S.C. (DNA, 1, 173-179,
1988) ont comparé l'efficacité de la séquence SD consensus avec celle présente naturellement dans Ptrp. Leurs résultats indiquent une dépendance très forte vis-à-vis du gène d'intérêt étudié, pour conclure à une impossibilité de construire un vecteur optimal fonctionnant pour tous les gènes hétérologues. Travaillant eux aussi à partir du promoteur tryptophane et de la séquence SD consensus, Olsen M.K., et al. (Journal of Biotechnology, 9, 179-190, 1989) ont obtenu des niveaux d'expression très élevés (20 à 30 % des protéines totales) pour différentes protéines hétérologues (hormones de croissance, TNF) en enrichissant les séquences flanquantes de la région SD en nucléotides A et T. Des résultats similaires avaient été décrits auparavant par De Boer H.A., et al. (DNA, 2, 231-235, 1983) qui notaient l'effet positif des bases A et T placées en aval de la région SD dans le contexte du promoteur hybride Ptrp / PlacUN5 exprimant Pinterféron α.The sequence of mRNA near the SD region can influence translational efficiency through the formation of secondary structures. De Smit, MH, and van Duin, J. (Journal of Molecular Biology, 235, 173-184, 1994) show that intramolecular pairings on mRNA can hinder good translation by competing with mRNA / rRNA pairing, all the more so since the complementarity of the SD region with the 16S rRNA is low. Similarly, it has been shown that the expression of prochymosin in E. coli is dependent on the composition of the region connecting SD to the initiation codon: a sequence limiting the secondary structures promotes the accessibility of RBS to the ribosome and results in strong translational efficiency (Wang, G., et al., Protein Expression and Purification, 6, 284-290, 1995). Given the importance of the translation initiation step on the expression yield of the recombinant proteins, numerous studies have been carried out with the aim of optimizing the RBS region of bacterial expression vectors. An intuitive approach first consisted in placing the complete consensus SD region (UAAGGAGGU) upstream of genes of interest (Jay, G., et al., Proc. Natl. Acad. Sci. USA, 78, 5543-5548 , nineteen eighty one). More systematically, Marquis DM, et al. (Gene, 42, 175-183, 1986) placed this sequence downstream of different promoters and at a variable distance (5 to 9 nucleotides) from the initiation codon. With the PIL-2 gene as a model, the results indicate that an SD / AUG spacing of 6 nucleotides is optimal for almost all of the promoters tested. In a comparative study between the consensus SD sequence and the SD sequence of the lacZ gene, Mandecki, W., et al. (Gene, 43, 131-13, 1986) noted however that the consensus SD sequence gave a higher expression in vitro but 2 to 2.5 times weaker than that of lacL in vivo. Whole RBS regions derived from phage genes with their own SD sequence have also been shown to be superior to the consensus SD sequence for the expression of proteins of different origins (plants, mammalian cells, bacteria) (Olins, PO, et al. ., Gene, 73, 227-235, 1988). Using the tryptophan promoter, Curry, K. and Tomich, CSC (DNA, 1, 173-179, 1988) compared the efficiency of the consensus SD sequence with that naturally present in Ptrp. Their results indicate a very strong dependence on the gene of interest studied, to conclude that it is impossible to construct an optimal vector working for all heterologous genes. Also working from the tryptophan promoter and the consensus SD sequence, Olsen MK, et al. (Journal of Biotechnology, 9, 179-190, 1989) obtained very high expression levels (20 to 30% of total proteins) for different heterologous proteins (growth hormones, TNF) by enriching the flanking sequences of the region SD in nucleotides A and T. Similar results had been described previously by De Boer HA, et al. (DNA, 2, 231-235, 1983) which noted the positive effect of the bases A and T placed downstream of the SD region in the context of the hybrid promoter Ptrp / PlacUN5 expressing α interferon.
Tous ces résultats ont été obtenus dans le cadre d'expériences où un nombre limité de paramètres étaient pris en compte. Conscients du nombre important des facteurs, connus ou non, influents dans l'initiation de la traduction, et surtout du rôle a priori non négligeable des interactions entre facteurs qui ne sont pas prises en compte lors d'approches itératives, des auteurs ont par la suite essayé de sélectionner in vivo des RBS synthétiques optimaux à partir de librairies aléatoires de grande taille. Wilson B.S., et al. (BioTechniques, 17, 944-952, 1994) ont ainsi criblé un répertoire de séquences dégénérées sur 16 positions en amont du codon d'initiation, au sein d'une cassette d'expression contenant le gène de la β-lactamase sous le contrôle du promoteur/opérateur lac. Une telle approche a permis d'identifier des séquences originales exprimant la β-lactamase avec une efficacité 3 fois supérieure. Avec un autre gène codant pour un scFv, le niveau de surexpression par rapport au RBS d'origine est d'environ 2 fois.All these results were obtained in the context of experiments where a limited number of parameters were taken into account. Aware of the large number of factors, known or not, influencing the initiation of translation, and above all of the a priori non-negligible role of interactions between factors which are not taken into account during iterative approaches, some authors have subsequently tried to select in vivo optimal synthetic RBS from large random libraries. Wilson B.S., et al. (BioTechniques, 17, 944-952, 1994) thus screened a repertoire of degenerate sequences at 16 positions upstream of the initiation codon, within an expression cassette containing the β-lactamase gene under control from the promoter / operator lake. Such an approach made it possible to identify original sequences expressing β-lactamase with an efficiency 3 times greater. With another gene coding for an scFv, the level of overexpression compared to the original RBS is approximately 2 times.
Il est établi au vu de ces résultats que des régions RBS décrites comme optimales le sont toujours dans un contexte particulier où interviennent à la fois la séquence du gène d'intérêt et la séquence de la région leader de l'AR m qui dépend elle-même du type de promoteur utilisé. Le promoteur tryptophane (Nichols, B.P. et Yanofsky, C. Methods in Enzymology, 101, 155-164, 1983) est un des systèmes majeurs utilisés en expression de protéines recombinantes (Yansura, D.G. and Henner, D.J., Methods in
Enzymology (Anonymous Académie Press, Inc., San Diego, CA.) 54-60, 1990 ; Yansura, D.G. and Bass, S.H. Methods in Molecular Biology, 62, 55-62, 1997) mais son RBS n'a jamais fait l'objet d'une optimisation systématique par une approche basée sur le criblage de séquences aléatoires. L'intérêt du biotechnologiste désireux de développer des procédés à échelle industrielle est de disposer d'outils garantissant une expression maximale, quelle que soit la protéine d'intérêt. Il existe dès lors un fort intérêt pour toute amélioration permettant d'optimiser l'expression de protéines recombinantes, que les améliorations soient apportées par la souche hôte, par le vecteur d'expression, par le procédé de culture et d'expression ou par toute combinaison entre ces facteurs.It is established in the light of these results that RBS regions described as optimal are always so in a particular context in which both the sequence of the gene of interest and the sequence of the leader region of the AR m, which depends, intervene. even the type of promoter used. The tryptophan promoter (Nichols, BP and Yanofsky, C. Methods in Enzymology, 101, 155-164, 1983) is one of the major systems used in the expression of recombinant proteins (Yansura, DG and Henner, DJ, Methods in Enzymology (Anonymous Academy Press, Inc., San Diego, CA.) 54-60, 1990; Yansura, DG and Bass, SH Methods in Molecular Biology, 62, 55-62, 1997) but its RBS has never been systematically optimized by an approach based on the screening of random sequences. The interest of the biotechnologist wishing to develop processes on an industrial scale is to have tools guaranteeing maximum expression, whatever the protein of interest. There is therefore a strong interest in any improvement making it possible to optimize the expression of recombinant proteins, whether the improvements are made by the host strain, by the expression vector, by the culture and expression process or by any combination of these factors.
Plus particulièrement, la présente invention démontre l'avantage en termes d'efficacité traductionnelle de nouvelles séquences nucléotidiques portées par un vecteur d'expression, dans la région du « Ribosome Binding Site » (RBS), en aval du promoteur tryptophane (Ptrp). Par l'utilisation d'oligonucléotides dégénérés introduits en amont du codon d'initiation puis par sélection de clones surexprimant le gène rapporteur de la chloramphémcol acétyl-transférase (CAT), la demanderesse a recherché de nouvelles séquences RBS optimisées. En recherchant des séquences optimisées en amont du codon d'initiation, il a été découvert de manière tout à fait surprenante que la séquence nucléique située directement en aval du codon d'initiation pouvait être mutée ou délétée de façon à surexprimer des protéines recombinantes. Les séquences ainsi obtenues présentent un caractère d'amélioration vis-à-vis de l'expression de différents gènes d'intérêt de diverses origines.More particularly, the present invention demonstrates the advantage in terms of translational efficiency of new nucleotide sequences carried by an expression vector, in the region of the "Ribosome Binding Site" (RBS), downstream of the tryptophan promoter (Ptrp). By the use of degenerate oligonucleotides introduced upstream of the initiation codon and then by selection of clones overexpressing the reporter gene for chloramphemcol acetyl transferase (CAT), the applicant sought new optimized RBS sequences. By searching for optimized sequences upstream of the initiation codon, it was discovered quite surprisingly that the nucleic sequence located directly downstream of the initiation codon could be mutated or deleted so as to overexpress recombinant proteins. The sequences thus obtained exhibit an improvement character with regard to the expression of different genes of interest from various origins.
De plus, un problème actuel majeur au regard des contraintes actuelles de qualité est d'obtenir une protéine recombinante la plus pure possible, c'est-à-dire avec un minimum d'acides aminés greffés en amont ou en aval de la protéine recombinante, acides aminés provenant de la construction utilisée. Lorsque la séquence nucléique située entre le codon d'initiation et le premier site de clonage présente des délétions de façon à surexprimer des protéines recombinantes, ce problème est aussi résolu par la présente invention.
La présente invention a ainsi pour objet une construction pour l'expression d'un gène codant pour une protéine recombinante d'intérêt placé sous le contrôle du promoteur de l'opéron tryptophane Ptrp dans une cellule hôte procaryote comprenant directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID N° 1, et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID N° 1 est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.In addition, a major current problem with regard to current quality constraints is to obtain the purest recombinant protein possible, that is to say with a minimum of amino acids grafted upstream or downstream of the recombinant protein. , amino acids from the construction used. When the nucleic sequence located between the initiation codon and the first cloning site has deletions so as to overexpress recombinant proteins, this problem is also solved by the present invention. A subject of the present invention is thus a construction for the expression of a gene coding for a recombinant protein of interest placed under the control of the promoter of the tryptophan Ptrp operon in a prokaryotic host cell comprising directly downstream of the codon of initiation of a nucleic sequence of sequence SEQ ID No. 1, and downstream of this sequence a multiple cloning cassette intended to receive the gene coding for said recombinant protein of interest, characterized in that at least one of the nucleotides of the sequence SEQ ID No. 1 is mutated or deleted so as to allow an overexpression of said recombinant protein.
Il est d'autant plus surprenant d'obtenir une surexpression grâce à l'objet de l'invention, alors que l'art antérieur enseigne d'utiliser cette séquence SEQ ID N° 1 telle qu'elle. On peut notamment citer à cet effet les brevets US 5,714,589, US 5,468,845, US 5,418,135, US 4,891,310, US 4,789,702, WO 88/09344, US 4,738,921 et EP 0 212 532 qui enseignent l'utilisation de la séquence SEQ ID N° 1 en aval du codon d'initiation pour l'expression de protéines d'intérêt. Par protéine recombinante d'intérêt, on entend désigner toutes protéines, polypeptides ou peptides obtenus par recombinaison génétique, et susceptibles d'être utilisés dans des domaines tels que celui de la santé humaine ou animale, de la cosmétologie, de la nutrition animale, de l'agro-industrie ou de l'industrie chimique. Parmi ces protéines d'intérêt, on peut citer en particulier, mais sans s'y limiter : - une cytokine et notamment une interleukine, un interféron, un facteur de nécrose tissulaire et un facteur de croissance et notamment hématopoïétique (G-CSF, GM- CSF), une hormone de croissance humaine ou l'insuline, un neuropeptide ;It is all the more surprising to obtain an overexpression thanks to the object of the invention, whereas the prior art teaches to use this sequence SEQ ID N ° 1 as it is. Mention may in particular be made for this purpose of the patents US 5,714,589, US 5,468,845, US 5,418,135, US 4,891,310, US 4,789,702, WO 88/09344, US 4,738,921 and EP 0 212 532 which teach the use of the sequence SEQ ID N ° 1 in downstream of the initiation codon for the expression of proteins of interest. The term “recombinant protein of interest” is intended to denote any protein, polypeptide or peptide obtained by genetic recombination, and capable of being used in fields such as that of human or animal health, cosmetology, animal nutrition, agro-industry or the chemical industry. Among these proteins of interest, there may be mentioned in particular, but not limited to: - a cytokine and in particular an interleukin, an interferon, a tissue necrosis factor and a growth factor and in particular hematopoietic (G-CSF, GM - CSF), a human growth hormone or insulin, a neuropeptide;
- un facteur ou cofacteur impliqué dans la coagulation et notamment le facteur NUI, le facteur von Willebrand, l'antithrombine III, la protéine C, la thrombine etl'hirudine ; - une enzyme et notamment la trypsine, une ribonucléase et la β-galactosidase ;- a factor or cofactor involved in coagulation and in particular the NUI factor, von Willebrand factor, antithrombin III, protein C, thrombin and hirudin; - an enzyme and in particular trypsin, a ribonuclease and β-galactosidase;
- un inhibiteur d'enzyme tel que l'αl antitrypsine et les inhibiteurs de protéases virales ;- an enzyme inhibitor such as α1 antitrypsin and viral protease inhibitors;
- une protéine capable d'inhiber l'initiation ou la progression de cancers, telle que les produits d'expression de gènes supresseurs de tumeurs, par exemple le gène P53 ; - une protéine capable de stimuler une réponse immunitaire ou un antigène, telle que par exemple les protéines, ou leurs fragments actifs, de la membrane de bactérie
Gram négatif, en particulier les protéines OmpA de Klebsellia ou la protéine G du virus respiratoire syncytial humain ;- a protein capable of inhibiting the initiation or progression of cancers, such as the expression products of tumor suppressor genes, for example the P53 gene; - a protein capable of stimulating an immune response or an antigen, such as for example the proteins, or their active fragments, of the membrane of bacteria Gram negative, in particular OmpA proteins from Klebsellia or protein G from human respiratory syncytial virus;
- un anticorps monoclonal humanisé ou non ou un fragment d'anticorps tel qu'un scFv ;- a monoclonal antibody humanized or not or an antibody fragment such as a scFv;
- une protéine capable d'inhiber une infection virale ou son développement, par exemple les épitopes antigéniques du virus en cause ou des variants altérés de protéines virales susceptibles d'entrer en compétition avec les protéines virales natives ;a protein capable of inhibiting a viral infection or its development, for example the antigenic epitopes of the virus in question or altered variants of viral proteins capable of entering into competition with the native viral proteins;
- une protéine susceptible d'être contenue dans une composition cosmétique telle que la substance P ou une superoxyde dismutase ; - une protéine alimentaire et notamment un alicament ;- a protein capable of being contained in a cosmetic composition such as substance P or a superoxide dismutase; - a food protein and in particular a food;
- une enzyme capable de diriger la synthèse de composés chimiques ou biologiques, ou capable de dégrader certains composés chimiques toxiques ; ou encore- an enzyme capable of directing the synthesis of chemical or biological compounds, or capable of degrading certain toxic chemical compounds; or
- toute protéine ayant une toxicité vis-à-vis du micro-organisme qui la produit, en particulier si ce micro-organisme est la bactérie E. coli, comme par exemple la protéase du virus NIH-1, la protéine ECP "Eosinophil Cationic Protein" ou les protéines 2B et 3 A du poliovirus.- any protein having a toxicity vis-à-vis the micro-organism which produces it, in particular if this micro-organism is the E. coli bacterium, such as for example the protease of the NIH-1 virus, the ECP protein "Eosinophil Cationic Protein "or the 2B and 3A proteins of the poliovirus.
Par séquence nucléique de séquence SEQ ID Ν° 1 dont au moins un des acides nucléiques est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante, on entend toute séquence qui comporte une délétion ou une mutation d'au moins un nucléotide de la séquence SEQ ID N° 1 qui permet une surexpression de la protéine recombinante, par rapport à l'expression de ladite protéine recombinante obtenue en utilisant la séquence SEQ ID N° 1 non modifiée.By nucleic sequence of sequence SEQ ID Ν ° 1 in which at least one of the nucleic acids is mutated or deleted so as to allow an overexpression of said recombinant protein, is meant any sequence which comprises a deletion or a mutation of at least one nucleotide of the sequence SEQ ID N ° 1 which allows an overexpression of the recombinant protein, compared to the expression of said recombinant protein obtained using the sequence SEQ ID N ° 1 unmodified.
Par délétion, on entend l'élimination d'un ou plusieurs nucléotides à un ou différents sites nucléotidiques de la séquence SEQ ID N° 1. La séquence résultante se trouve raccourcie par rapport à celle d'origine.By deletion is meant the elimination of one or more nucleotides at one or more nucleotide sites of the sequence SEQ ID No. 1. The resulting sequence is shortened compared to that of origin.
Par mutation, on entend le remplacement d'un nucléotide par un autre (A par C, G ou T ; C par A, G ou T ; G par A, C ou T ; T par A, C ou G). La séquence résultante a la même taille que celle d'origine.By mutation is meant the replacement of one nucleotide by another (A by C, G or T; C by A, G or T; G by A, C or T; T by A, C or G). The resulting sequence is the same size as the original.
La surexpression, c'est-à-dire le fait d'obtenir une expression supérieure à celle obtenue sans la modification en aval du codon d'initiation peut être déterminée notamment en utilisant une des méthodes suivantes :
i) migration par SDS-PAGE des protéines totales de la bactérie et révélation de la protéine recombinante par coloration au Bleu de Comassie ou par Western-blot ; ii) dosage de la protéine recombinante par une méthode mettant en jeu un anticorps spécifique (Elisa) ; iii) dosage enzymatique si la protéine recombinante est dotée d'une activité catalytique. Préférentiellement, on utilise la méthode ii), détaillée dans l'exemple III. Par cassette de clonage multiple, on entend une séquence nucléotidique contenant un ou plusieurs sites de restriction, lesquels sites peuvent être utilisés lors d'étapes de clonage du gène d'intérêt en aval du codon d'initiation. Préférentiellement, ledit au moins nucléotide de la séquence SEQ ID N° 1 est délété de façon à permettre une surexpression de ladite protéine recombinante.The overexpression, that is to say the fact of obtaining an expression greater than that obtained without the modification downstream of the initiation codon can be determined in particular by using one of the following methods: i) migration by SDS-PAGE of the total proteins of the bacterium and revelation of the recombinant protein by staining with Comassie Blue or by Western blot; ii) assaying the recombinant protein by a method involving a specific antibody (Elisa); iii) enzymatic assay if the recombinant protein has a catalytic activity. Preferably, method ii) is used, detailed in Example III. By multiple cloning cassette is meant a nucleotide sequence containing one or more restriction sites, which sites can be used during steps of cloning the gene of interest downstream of the start codon. Preferably, said at least nucleotide of the sequence SEQ ID No. 1 is deleted so as to allow overexpression of said recombinant protein.
L'invention concerne également une construction selon l'invention dans laquelle ledit au moins nucléotide muté ou délété, préférentiellement délété, est situé sur le fragment de séquence SEQ ID N° 2 de la séquence SEQ ID N° 1. Un autre objet de l'invention concerne les constructions dans lesquelles ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GTA et/ou sur le codon GCA et/ou sur le codon CTG de la séquence SEQ ID N° 1.The invention also relates to a construction according to the invention in which said at least mutated or deleted nucleotide, preferably deleted, is located on the fragment of sequence SEQ ID No. 2 of the sequence SEQ ID No. 1. Another object of the invention The invention relates to the constructions in which said at least mutated or deleted nucleotide, preferably mutated, is located on the codon GTA and / or on the codon GCA and / or on the codon CTG of the sequence SEQ ID No. 1.
Dans un mode de réalisation préféré de l'invention, ladite séquence SEQ ID N° 1 dont au moins un des nucléotides est muté ou délété, présente au moins en position 1, 2 et 3, le nucléotide A.In a preferred embodiment of the invention, said sequence SEQ ID No. 1 of which at least one of the nucleotides is mutated or deleted, has at least in position 1, 2 and 3, the nucleotide A.
Dans un mode de réalisation préféré de l'invention, au moins un des nucléotides, et préférentiellement tous les nucléotides, situés entre la séquence nucléique de séquence SEQ ID N° 1 et la cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, sont délétés. Dans un autre mode de réalisation encore plus préféré de l'invention, ladite séquence SEQ ID N° 1 dont au moins un des acides nucléiques est muté ou délété et tous les nucléotides situés entre la séquence nucléique de séquence SEQ ID N° 1 et la cassette de clonage multiple sont totalement délétés, de façon à ce que le codon d'initiation se trouve directement en amont de la cassette de clonage multiple. Dans une forme de réalisation préférée de l'invention, les constructions contiennent une séquence nucléique directement en amont du codon d'initiation choisie
parmi les séquences de séquence SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9 et SEQ ID N° 10.In a preferred embodiment of the invention, at least one of the nucleotides, and preferably all the nucleotides, located between the nucleic sequence of sequence SEQ ID No 1 and the multiple cloning cassette intended to receive the gene coding for said protein recombinant of interest, are deleted. In another even more preferred embodiment of the invention, said sequence SEQ ID No. 1 of which at least one of the nucleic acids is mutated or deleted and all the nucleotides located between the nucleic sequence of sequence SEQ ID No. 1 and the multiple cloning cassette are completely deleted, so that the initiation codon is directly upstream of the multiple cloning cassette. In a preferred embodiment of the invention, the constructs contain a nucleic sequence directly upstream of the chosen initiation codon among the sequences of sequence SEQ ID N ° 3, SEQ ID N ° 4, SEQ ID N ° 5, SEQ ID N ° 6, SEQ ID N ° 7, SEQ ID N ° 8, SEQ ID N ° 9 and SEQ ID N ° 10.
L'invention comprend une construction selon l'invention, caractérisée en ce que la cellule hôte procaryote est une bactérie gram négative, de préférence appartenant à l'espèce E. coli.The invention comprises a construction according to the invention, characterized in that the prokaryotic host cell is a gram negative bacterium, preferably belonging to the species E. coli.
Un autre objet de l'invention concerne un vecteur contenant une construction telle que définie ci-avant, tout comme une cellule hôte procaryote, de préférence appartenant à l'espèce E. coli, transformée par un tel vecteur.Another object of the invention relates to a vector containing a construct as defined above, just like a prokaryotic host cell, preferably belonging to the species E. coli, transformed by such a vector.
La présente invention a aussi pour objet un procédé de production d'une protéine recombinante d'intérêt dans une cellule hôte utilisant une construction telle que définie ci-avant.The present invention also relates to a process for the production of a recombinant protein of interest in a host cell using a construct as defined above.
La présente invention a encore pour objet un procédé de production d'une protéine recombinante d'intérêt selon l'invention, dans lequel ladite construction est introduite dans une cellule hôte procaryote, préférentiellement par un vecteur tel que défini ci-avant.The present invention also relates to a process for the production of a recombinant protein of interest according to the invention, in which said construct is introduced into a prokaryotic host cell, preferably by a vector as defined above.
On préfère un procédé de production d'une protéine recombinante d'intérêt selon l'invention, caractérisé en ce qu'il comprend les étapes suivantes : a) le clonage d'un gène d'intérêt dans un vecteur selon l'invention ; b) la transformation d'une cellule procaryote par un vecteur contenant un gène codant pour ladite protéine recombinante d'intérêt ; c) la culture de ladite cellule transformée dans un milieu de culture permettant l'expression de la protéine recombinante ; et d) la récupération de la protéine recombinante à partir du milieu de culture ou de ladite cellule transformée. L'invention comprend en outre une utilisation d'une construction, d'un vecteur ou d'une cellule hôte procaryote selon la présente invention, pour la production d'une protéine recombinante.A process for the production of a recombinant protein of interest according to the invention is preferred, characterized in that it comprises the following steps: a) cloning of a gene of interest in a vector according to the invention; b) transformation of a prokaryotic cell with a vector containing a gene coding for said recombinant protein of interest; c) culturing said transformed cell in a culture medium allowing expression of the recombinant protein; and d) recovering the recombinant protein from the culture medium or said transformed cell. The invention further comprises a use of a prokaryotic construct, vector or host cell according to the present invention, for the production of a recombinant protein.
Enfin, l'invention concerne une utilisation d'une protéine recombinante pour la préparation d'un médicament destiné à être administré à un patient nécessitant un tel traitement, caractérisée en ce que ladite protéine recombinante est produite par un procédé de production d'une protéine recombinante d'intérêt selon l'invention.
Les exemples et figures qui suivent sont destinés à illustrer l'invention sans aucunement en limiter la portée.Finally, the invention relates to a use of a recombinant protein for the preparation of a medicament intended for administration to a patient in need of such treatment, characterized in that said recombinant protein is produced by a process for the production of a protein recombinant of interest according to the invention. The examples and figures which follow are intended to illustrate the invention without in any way limiting its scope.
Légende des figures et des tableaux : Figure 1 : Carte du vecteur plasmidique pTEXmplδ et séquence SEQ ID N° 39 de la région 1-450 comprenant le promoteur/opérateur Ptrp, la région du leader TrpL, le site de clonage multiple mpl8 et le terminateur de transcription.Legend of the figures and the tables: Figure 1: Map of the plasmid vector pTEXmplδ and sequence SEQ ID N ° 39 of the region 1-450 comprising the promoter / operator Ptrp, the region of the leader TrpL, the multiple cloning site mpl8 and the terminator of transcription.
Figure 2 : Carte de restriction de la région du RBS (Ribosome Binding Site) sur le vecteur pTEXmpl 8 (SEQ ID N° 40). Figure 3 : Estimation sur gel SDS-PAGE de l'expression de CAT dans des bactéries transformées par les vecteurs pTEXCAT ou pTEXCAT4.Figure 2: Restriction map of the RBS region (Ribosome Binding Site) on the vector pTEXmpl 8 (SEQ ID No. 40). Figure 3: Estimation on SDS-PAGE gel of CAT expression in bacteria transformed by the pTEXCAT or pTEXCAT4 vectors.
Figure 4 : Etude comparative de l'expression de la β-galactosidase à partir des vecteurs pTEX-βGAL et pTEX4-βGAL (cinétiques en fermenteur).Figure 4: Comparative study of the expression of β-galactosidase from the vectors pTEX-βGAL and pTEX4-βGAL (kinetics in fermenter).
Exemple IExample I
Cet exemple illustre un des aspects ayant conduit à l'invention, et notamment la manière dont est construite la librairie de vecteurs plasmidiques porteurs du promoteur tryptophane Ptrp et mutés de manière aléatoire en amont du codon d'initiation. Le vecteur d'origine est décrit en figure 1. Il s'agit d'un plasmide dérivé de pBR322 (Bolivar, F., et al., Gène, 2, 95-113, 1977) dans lequel a été clone le promoteur/opérateur Ptrp (1-298), suivi de la séquence codant pour les 7 premiers acides aminés du leader TrpL d'E. coli (Yanofsky, C, et al., Nucleic Acids Research, 9, 6647-6668, 1981), d'un site de clonage multiple et du terminateur de transcription trpt d'E. coli (Yanofsky, C, et al., 1981). La partie 3' de Ptrp dans pTΕXmplδ diffère de la séquence naturelle par la présence d'un site de clonage Xbal en amont du codon d'initiation ATG (voir figure 2) et par un espacement plus grand entre SD et codon d'initiation.This example illustrates one of the aspects which led to the invention, and in particular the way in which the library of plasmid vectors carrying the tryptophan Ptrp promoter and randomly mutated upstream of the initiation codon is constructed. The original vector is described in FIG. 1. It is a plasmid derived from pBR322 (Bolivar, F., et al., Gene, 2, 95-113, 1977) in which the promoter / operator Ptrp (1-298), followed by the sequence coding for the first 7 amino acids of the leader TrpL from E. coli (Yanofsky, C, et al., Nucleic Acids Research, 9, 6647-6668, 1981), a multiple cloning site and the trpt transcription terminator of E. coli (Yanofsky, C, et al., 1981). The 3 ′ part of Ptrp in pTΕXmplδ differs from the natural sequence by the presence of an Xbal cloning site upstream from the ATG initiation codon (see FIG. 2) and by a greater spacing between SD and initiation codon.
Pour permettre la sélection de vecteurs modifiés dans leur partie RBS, le gène rapporteur de la chloramphénicol acétyl-transférase (CAT) est clone aux sites ΕcoRI et PstI de pTEXmpl 8. Pour cela, la séquence codante du gène cat est amplifiée par PCR à l'aide des oligonucléotides CATfor et CATrev dont les séquences sont :
CATfor : 5 '-CCGGAATTCATGGAGAAAAAAATCACTGG-3 ' (SEQ ID N° 11)To allow the selection of modified vectors in their RBS part, the reporter gene for chloramphenicol acetyl transferase (CAT) is cloned at the ΕcoRI and PstI sites of pTEXmpl 8. For this, the coding sequence of the cat gene is amplified by PCR at 1 using CATfor and CATrev oligonucleotides whose sequences are: CATfor: 5 '-CCGGAATTCATGGAGAAAAAAATCACTGG-3' (SEQ ID N ° 11)
EcoRI CATrev : 5 '-AAACTGCAGTTACGCCCCGCCCTG-3 ' (SEQ ID N° 12) PstI La réaction de PCR est effectuée en utilisant comme matrice le phagemide pBC-EcoRI CATrev: 5 '-AAACTGCAGTTACGCCCCGCCCTG-3' (SEQ ID No. 12) PstI The PCR reaction is carried out using the phagemid pBC as a template-
SK (Stratagene, La Jolla, CA, USA). Le produit d'amplification est déposé sur gel d'agarose et purifié selon la méthode GeneClean (BiolOl, La Jolla, CA). Le clonage de l'insert dans pTEXmpl 8 est vérifié après transformation dans E. coli par l'apparition de colonies se développant sur boîtes de milieu LB agar (Sambrook J., et al., Molecular cloning. A laboratory manual, 2nd édition. Plainview, NY: Cold Spring Harbor Laboratory Press, 1989) en présence de 30 μg/ml de chloramphénicol. La séquence de l'insert est confirmée par séquençage automatique à l'aide du kit « Dye Terminator » et du séquenceur d'ADN 373A (Perkin Εlmer Applied Biosystems, Foster City, CA). Le vecteur obtenu est nommé pTΕXCAT. L'insertion de RBS ayant une séquence dégénérée en amont du codon d'initiation est effectuée par ligation d'oligonucléotides de synthèse aux sites Spel et ΕcoRI du vecteur pTΕXCAT. La région allant du site Spel au site ΕcoRI respectivement en positions - 49 et + 28 (voir figure 2) est délétée par digestion enzymatique et remplacée par un hétéroduplex formé par deux oligonucléotides de synthèse partiellement dégénérés, hybrides entre eux. Deux couples d'oligonucléotides sont utilisés, mettant en jeu respectivement les oligonucléotides RanSDl/RanSD2 et RanSD3/RanSD4 dont les séquences sont : RanSDl : 5'CTAGTTAACTAGTACGCAAGTTCACGTAAANNNNNNNNNNNÎWNNNATG AAAGCAATTTTCGTACTGAATGCGG-3 ' (SΕQ ID N° 13) RanSD2 :SK (Stratagene, La Jolla, CA, USA). The amplification product is deposited on agarose gel and purified according to the GeneClean method (BiolOl, La Jolla, CA). The cloning of the insert in pTEXmpl 8 is verified after transformation in E. coli by the appearance of colonies developing on boxes of LB agar medium (Sambrook J., et al., Molecular cloning. A laboratory manual, 2 nd edition Plainview, NY: Cold Spring Harbor Laboratory Press, 1989) in the presence of 30 μg / ml of chloramphenicol. The sequence of the insert is confirmed by automatic sequencing using the “Dye Terminator” kit and the DNA sequencer 373A (Perkin Εlmer Applied Biosystems, Foster City, CA). The vector obtained is named pTΕXCAT. The insertion of RBS having a degenerate sequence upstream of the initiation codon is carried out by ligation of synthetic oligonucleotides at the Spel and ΕcoRI sites of the vector pTΕXCAT. The region going from the Spel site to the ΕcoRI site respectively in positions - 49 and + 28 (see FIG. 2) is deleted by enzymatic digestion and replaced by a heteroduplex formed by two partially degenerate synthetic oligonucleotides, hybrids between them. Two pairs of oligonucleotides are used, involving respectively the oligonucleotides RanSDl / RanSD2 and RanSD3 / RanSD4 whose sequences are: RanSDl: 5'CTAGTTAACTAGTACGCAAGTTCACGTAAANNNNNNNNNNNÎWNNNATG AAAGCAATTTTCGTACTGAATGCGG-3 '(SΕQ ID NO: 13) RanSD2:
5 ' AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNN NNNNNNNNNNNTT TACGTGAACTTGCGTACTAGTTAA-3' (SΕQ ID N° 14) RanSD3 : 5 'CTAGTTAACTAGTACGCAAGTTCACGTAAATRRRRRRRNNNNNNATGAAA GCAATTTTCGTACTGAATGCGG-3' (SΕQ ID N° 15)
RanSD4 :5 'AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNN NNNNNNNNNNNTT TACGTGAACTTGCGTACTAGTTAA-3' (SΕQ ID NO: 14) RanSD3: 5 'CTAGTTAACTAGTACGCAAGTTCACGTAAATRRRRRRRNNNNNNATGAAA GCAATTTTCGTACTGAATGCGG-3' (SΕQ ID NO: 15) RanSD4:
5'AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNNNNYYYYYYYATTTA CGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 16).5'AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNNNNYYYYYYYATTTA CGTGAACTTGCGTACTAGTTAA-3 '(SEQ ID N ° 16).
Les quatre oligonucléotides ont été synthétisés par MWG Biotech (Ebersberg, D) dans des conditions assurant une répartition équimolaire des bases pour chaque dégénérescence. Le couple RanSDl / RanSD2 apporte une dégénérescence complète (N = mélange des 4 nucléotides A, C, T, G) sur les 16 nucléotides précédant le codon ATG. Le nombre de combinaisons (416 soit environ 4,3 109) autorise le criblage de RBS qui soient optimisés tant du point de vue de leur séquence Shine-Dalgarno (SD), de la séquence située entre la région SD et le codon d'initiation ainsi que dans l'espacement SD-ATG. Cette librairie sera nommée (N16) dans la suite du texte. Le couple RanSD3 / RanSD4 apporte une dégénérescence complète sur 6 nucléotides précédant PATG et une dégénérescence partielle sur les 7 nucléotides en amont. L'utilisation exclusive des purines (R = A ou G) sur le brin positif et de pyrimidines sur le brin complémentaire (Y = C ou T) favorise la représentation de séquences de type Shine-Dalgarno à une distance optimale (6 nucléotides) du codon ATG. Cette seconde librairie est nommée (R N6).The four oligonucleotides were synthesized by MWG Biotech (Ebersberg, D) under conditions ensuring an equimolar distribution of the bases for each degeneration. The RanSDl / RanSD2 pair brings complete degeneration (N = mixture of the 4 nucleotides A, C, T, G) on the 16 nucleotides preceding the ATG codon. The number of combinations (4 16 or approximately 4.3 10 9 ) allows the screening of RBS which are optimized both from the point of view of their Shine-Dalgarno (SD) sequence, of the sequence located between the SD region and the d codon. initiation as well as in SD-ATG spacing. This library will be named (N 16 ) in the remainder of the text. The RanSD3 / RanSD4 pair provides complete degeneration on 6 nucleotides preceding PATG and partial degeneration on the 7 nucleotides upstream. The exclusive use of purines (R = A or G) on the positive strand and of pyrimidines on the complementary strand (Y = C or T) promotes the representation of Shine-Dalgarno type sequences at an optimal distance (6 nucleotides) from the ATG codon. This second library is named (RN 6 ).
La linéarisation du vecteur pTEXCAT et sa purification sur gel, l'hybridation des oligonucléotides par paires, la ligation des hétéroduplex au vecteur pTEXCAT linéarisé et la transformation dans E. coli de la librairie ainsi constituée sont réalisées selon les conditions décrites par Sambrook J., et al. (1989). Classiquement, 100 fmol de vecteur et 1000 fmol d 'insert sont engagés dans une réaction de ligation en présence de T4 ligase dans un volume final de 15 μl. La réaction est conduite pendant une nuit à 16°C. Des bactéries TOP 10 électrocompétentes (50 μl) sont ensuite transformées par électroporation avec 3 μl du mélange de ligation dans les conditions recommandées par le fournisseur (Invitrogen, CarIsbad, CA). Le mélange de transformation est étalé sur boîtes de LB agar contenant 200 μg/ml d'ampicilline, donnant lieu après 16 heures d'incubation à 37°C à l'apparition de colonies transformées. Exemple IIThe linearization of the vector pTEXCAT and its purification on gel, the hybridization of the oligonucleotides in pairs, the ligation of the heteroduplexes to the linearized pTEXCAT vector and the transformation in E. coli of the library thus constituted are carried out according to the conditions described by Sambrook J., et al. (1989). Conventionally, 100 fmol of vector and 1000 fmol of insert are used in a ligation reaction in the presence of T4 ligase in a final volume of 15 μl. The reaction is carried out overnight at 16 ° C. Electrocompetent TOP 10 bacteria (50 μl) are then transformed by electroporation with 3 μl of the ligation mixture under the conditions recommended by the supplier (Invitrogen, CarIsbad, CA). The transformation mixture is spread on LB agar dishes containing 200 μg / ml of ampicillin, giving rise after 16 hours of incubation at 37 ° C. to the appearance of transformed colonies. Example II
Le criblage des librairies est effectué en partant de l'hypothèse que les clones surexprimant l'enzyme CAT auront une résistance accrue au chloramphénicol. Ceci est validé par l'expérience dont les résultats sont présentés dans le tableau 1 ci-dessous.
Tableau 1. Résistance au chloramphénicol de bactéries TOP 10 x pTEXCAT en présence ou absence d'IAA.Screening of libraries is carried out on the assumption that the clones overexpressing the CAT enzyme will have an increased resistance to chloramphenicol. This is validated by experience, the results of which are presented in Table 1 below. Table 1. Resistance to chloramphenicol in TOP 10 x pTEXCAT bacteria in the presence or absence of IAA.
Les chiffres (rangée supérieure) indiquent le nombre de colonies comptées après 18 h d'incubation à 37°C, chaque milieu ayant été ensemencé avec environ 100 cellules.The figures (upper row) indicate the number of colonies counted after 18 h of incubation at 37 ° C., each medium having been seeded with approximately 100 cells.
L'index de la rangée inférieure est un critère qualitatif de croissance des colonies (- = absence de croissance à -H-+ = croissance maximale).The index in the lower row is a qualitative criterion for colony growth (- = no growth at -H- + = maximum growth).
Ces résultats montrent que des bactéries E. coli TOP 10 (Invitrogen, CarIsbad,These results show that E. coli TOP 10 bacteria (Invitrogen, CarIsbad,
CA) transformées par le vecteur pTEXCAT et étalées sur boîtes contenant différentes concentrations de chloramphénicol ont, entre 300 et 600 μg/ml de chloramphénicol, un développement plus fort en présence d'acide 3-β indole acrylique (LAA), un analogue du tryptophane agissant comme inducteur par un effet de dérépression de Ptrp (Marmorstein, R.Q. et Sigler, P.B., The Journal of Biological Chemistry, 264, 9149- 9154, 1989). Ceci laisse supposer que des clones surproducteurs de CAT du fait d'une région RBS optimisée pourront soit se développer plus rapidement que la population sauvage à une concentration en chloramphénicol inférieure à la CMI (concentration minimale inhibitrice), soit se développer en présence de concentrations en chloramphénicol létales pour la population sauvage. Exemple IIICA) transformed by the vector pTEXCAT and spread on dishes containing different concentrations of chloramphenicol have, between 300 and 600 μg / ml of chloramphenicol, a stronger development in the presence of 3-β indole acrylic acid (LAA), an analogue of tryptophan acting as an inducer by a Ptrp derepressure effect (Marmorstein, RQ and Sigler, PB, The Journal of Biological Chemistry, 264, 9149-9154, 1989). This suggests that clones overproducing CAT due to an optimized RBS region may either develop faster than the wild population at a chloramphenicol concentration below the MIC (minimum inhibitory concentration), or develop in the presence of concentrations of chloramphenicol lethal to the wild population. Example III
Cet exemple illustre la sélection de clones parmi les librairies construites selon la description de l'exemple 1. Les librairies obtenues sous forme de tapis de colonies sur boîtes de LB agar + ampicilline sont reprises dans de Peau stérile de manière à
reconstituer une suspension dont la Densité Optique (DO) à 580 nm est voisine de 1. Conformément aux résultats de l'exemple 2, cette suspension est étalée sur boîtes de LB agar contenant des doses létales de chloramphénicol (600, 700, 800 et 900 μg/ml) à raison de 100 μl de suspension par boîte de Pétri. Les boîtes sont mises en incubation à 37°C et l'on observe l'apparition de colonies résistantes en vérifiant dans le même temps que des boîtes ensemencées à partir d'une suspension de bactéries TOP 10 transformées par le vecteur sauvage pTEXCAT ne donnent lieu à aucune croissance. Les colonies résistantes sont isolées et repiquées plusieurs fois sur le milieu de sélection pour confirmer leur phénotype de résistance. Les clones retenus à cette étape sont ensuite soumis à une série d'analyses : (i) extraction du plasmide (kit Qiagen, Hilden, D) et séquençage de la région recouvrant le RBS, (ii) culture en Erlenmeyers avec induction par 1TAA puis estimation du niveau d'expression de CAT par dosage ELISA, (iii) électrophorèse par SDS-PAGE des protéines totales extraites des cultures précédentes et coloration au bleu de Coomassie permettant de visualiser les protéines totales intracellulaires. Le séquençage des clones est réalisé à l'aide du kit Dye Terminator sur séquenceur ABI 373A (Perkin Elmer Applied Biosystems, Foster City, CA). Les cultures en erlens sont réalisées en ensemençant 25 ml de milieu TSBY (Tryptic Soy Broth (DIFCO) 30 g/1 + Yeast Extract (Difco) 5 g/1) + tetracycline 8 mg/1 par une colonie sur boîte ou par une suspension bactérienne conservée à - 80 °C. Chaque préculture est mise en incubation sur un plateau agité à 200 rpm et 37°C pendant une nuit. Une fraction est transférée dans 50 ml du même milieu de manière à atteindre une densité optique initiale égale à 1. Pour l'induction de la protéine CAT, le milieu est additionné par 25 mg/1 d'IAA puis placé en agitation dans les mêmes conditions pendant 5 heures. Une fraction de la suspension (3 x 1 ml dilués à DO = 0,1) est centrifugée et les cellules conservées à - 20°C pour le dosage de la CAT par ELISA (kit CAT ELISA, Roche Diagnostics, Bâle, CH). Le reste de la biomasse est récupéré par centrifugation à 10000 g, 4°C pendant 15 minutes. La biomasse est reprise dans un tampon TEL (Tris 25 mM, EDTA 1 mM, Lysozyme 500 μg/ml, pH 8) à raison de 5 ml pour 1 g de biomasse humide. Les cellules sont lysées par sonication (sonicateur NibraCell muni d'une micro-sonde, Sonics & Materials, Danbury, CT). Un ml de la suspension résultante est centrifugé 5 min à 12 000 rpm. Le culot est repris par 200 μl
de TEL pour donner la fraction insoluble (I). Le surnageant est noté « S ». Les protéines totales contenues dans les fractions I et S sont analysées par électrophorèse en conditions dénaturantes (SDS-PAGE) et coloration au bleu de Coomassie.This example illustrates the selection of clones from the libraries constructed according to the description of Example 1. The libraries obtained in the form of colony mats on boxes of LB agar + ampicillin are taken up in sterile water so as to reconstitute a suspension whose Optical Density (OD) at 580 nm is close to 1. In accordance with the results of Example 2, this suspension is spread on LB agar dishes containing lethal doses of chloramphenicol (600, 700, 800 and 900 μg / ml) at a rate of 100 μl of suspension per Petri dish. The dishes are incubated at 37 ° C. and the appearance of resistant colonies is observed by checking at the same time that dishes seeded with a suspension of TOP 10 bacteria transformed by the wild vector pTEXCAT do not give rise to to no growth. Resistant colonies are isolated and subcultured several times on the selection medium to confirm their resistance phenotype. The clones selected at this stage are then subjected to a series of analyzes: (i) extraction of the plasmid (Qiagen kit, Hilden, D) and sequencing of the region covering the RBS, (ii) culture in Erlenmeyers with induction by 1TAA then estimation of the level of expression of CAT by ELISA assay, (iii) SDS-PAGE electrophoresis of the total proteins extracted from the previous cultures and staining with Coomassie blue making it possible to visualize the total intracellular proteins. The sequencing of the clones is carried out using the Dye Terminator kit on an ABI 373A sequencer (Perkin Elmer Applied Biosystems, Foster City, CA). Erlenmeyer cultures are produced by inoculating 25 ml of TSBY medium (Tryptic Soy Broth (DIFCO) 30 g / 1 + Yeast Extract (Difco) 5 g / 1) + tetracycline 8 mg / 1 by a colony on a dish or by a suspension bacterial stored at - 80 ° C. Each preculture is incubated on a plate stirred at 200 rpm and 37 ° C overnight. A fraction is transferred into 50 ml of the same medium so as to reach an initial optical density equal to 1. For the induction of the CAT protein, the medium is added with 25 mg / 1 of IAA and then stirred in the same conditions for 5 hours. A fraction of the suspension (3 x 1 ml diluted to OD = 0.1) is centrifuged and the cells stored at −20 ° C. for the CAT assay by ELISA (CAT ELISA kit, Roche Diagnostics, Basel, CH). The rest of the biomass is recovered by centrifugation at 10,000 g, 4 ° C for 15 minutes. The biomass is taken up in a TEL buffer (25 mM Tris, 1 mM EDTA, Lysozyme 500 μg / ml, pH 8) at a rate of 5 ml per 1 g of wet biomass. The cells are lysed by sonication (NibraCell sonicator equipped with a micro-probe, Sonics & Materials, Danbury, CT). One ml of the resulting suspension is centrifuged for 5 min at 12,000 rpm. The pellet is taken up in 200 μl of TEL to give the insoluble fraction (I). The supernatant is noted “S”. The total proteins contained in fractions I and S are analyzed by electrophoresis under denaturing conditions (SDS-PAGE) and staining with Coomassie blue.
Le tableau 2 ci-après indique les différentes séquences RBS obtenues après criblage des deux librairies (N16) et (R7N6). A la suite de l'alignement dans les bases de données nucléotidiques GenBank et EMBL, nous pouvons conclure qu'aucune des séquences de 16 nucléotides (stratégie (N16)) ou de 13 nucléotides (stratégie (R7N6)) situées immédiatement en amont du codon AUG dans les différents clones isolés n'a été décrite à ce jour.
Table 2 below indicates the different RBS sequences obtained after screening the two libraries (N 16 ) and (R 7 N 6 ). Following alignment in the GenBank and EMBL nucleotide databases, we can conclude that none of the sequences of 16 nucleotides (strategy (N 16 )) or 13 nucleotides (strategy (R 7 N 6 )) located immediately upstream of the AUG codon in the various isolated clones has not been described to date.
Tableau 2. Nouvelles séquences RBS isolées par l'une des stratégies (N16) ou (R7N6).Table 2. New RBS sequences isolated by one of the strategies (N 16 ) or (R 7 N 6 ).
(*) Chaque séquence nucléotidique (ARN messager) comprend la région mutée en aval du codon d'initiation. La séquence de référence du vecteur pTEXCAT figure en première ligne du tableau. Les séquences nucléiques en amont et en aval du codon
d'initiation des vecteurs sont représentées dans ce tableau après transcription sous forme d'ARN. A l'extrémité 3' de ces séquences, seuls les deux premiers codons du site de clonage multiple sont représentés, à savoir GAAUUC.(*) Each nucleotide sequence (messenger RNA) comprises the mutated region downstream of the initiation codon. The reference sequence of the pTEXCAT vector is shown in the first line of the table. Nucleic sequences upstream and downstream of the codon initiation vectors are shown in this table after transcription as RNA. At the 3 'end of these sequences, only the first two codons of the multiple cloning site are represented, namely GAAUUC.
C'est ainsi qu'il a été observé de manière tout à fait surprenante que les clones décrits dans le tableau 2 possèdent des mutations dans la région du RBS située immédiatement en aval du codon AUG. Les clones pTEXCAT4, pTEXCATl' et pTEXCAT3' sont porteurs d'une mutation ponctuelle affectant un acide aminé de la partie N-terminale de la protéine codée (respectivement Leu7Pro, Ala3Pro et ValόAla). Les autres clones sont porteurs de réarrangements plus importants : pTEXCAT2', pTEXCAT5' et pTEXCAT9' ont des délétions induisant respectivement la perte des régions Ala3Leu7, Ile4Leu7 et Ile4Asn8. Etant donné que l'analyse au hasard de 10 clones de la librairie (N16) sélectionnés sur ampicilline (c'est-à-dire sans pression de sélection au chloramphénicol) ne montre aucune modification dans la région codant pour le peptide TrpL (données non présentées), il en est déduit que les mutations dans TrpL observées sur les clones sélectionnés pour leur capacité d'expression de CAT jouent un rôle dans l'expression. Ainsi, nous démontrons la propriété originale suivante : P expression de protéines recombinantes est affectée positivement par des mutations en aval du codon d'initiation. La figure 3 présente une analyse par SDS-PAGE des protéines totales de bactéries transformées par pTEXCAT ou pTEXCAT4. On y voit la confirmation du caractère surproducteur du vecteur pTEXCAT4 puisqu'une protéine majoritaire migrant à la position attendue pour CAT (28 kDa) est nettement mise en évidence dans des extraits induits par 1TAA tandis que les extraits du vecteur pTEXCAT obtenus dans les mêmes conditions d'induction ne font apparaître qu'une bande de faible intensité.Thus it has been observed, quite surprisingly, that the clones described in Table 2 have mutations in the region of RBS situated immediately downstream of the codon AUG. The clones pTEXCAT4, pTEXCATl 'and pTEXCAT3' carry a point mutation affecting an amino acid of the N-terminal part of the encoded protein (respectively Leu7Pro, Ala3Pro and ValόAla). The other clones carry larger rearrangements: pTEXCAT2 ', pTEXCAT5' and pTEXCAT9 'have deletions inducing the loss of the regions Ala3Leu7, Ile4Leu7 and Ile4Asn8 respectively. Since the random analysis of 10 clones from the library (N 16 ) selected on ampicillin (that is to say without selection pressure with chloramphenicol) does not show any modification in the region coding for the peptide TrpL (data not presented), it is deduced therefrom that the mutations in TrpL observed on the clones selected for their capacity for expression of CAT play a role in expression. Thus, we demonstrate the following original property: P expression of recombinant proteins is positively affected by mutations downstream of the initiation codon. Figure 3 shows an SDS-PAGE analysis of the total proteins of bacteria transformed by pTEXCAT or pTEXCAT4. We see confirmation of the overproductive nature of the vector pTEXCAT4 since a major protein migrating to the expected position for CAT (28 kDa) is clearly demonstrated in extracts induced by 1TAA while the extracts of the vector pTEXCAT obtained under the same conditions induction only show a low intensity band.
Pour écarter la possibilité que la surproduction soit causée par des modifications du vecteur en dehors de la partie Spel-EcoRI, le vecteur pTEXCAT4 a été reconstruit in vitro à partir de pTEXCAT par digestion Spel-EcoRI et ligation d'un duplex formé par les deux oligonucléotides phosphorylés suivants :
SDopt4-f :To rule out the possibility that overproduction is caused by modifications of the vector outside the Spel-EcoRI part, the vector pTEXCAT4 was reconstructed in vitro from pTEXCAT by Spel-EcoRI digestion and ligation of a duplex formed by the two. The following phosphorylated oligonucleotides: SDopt4-f:
5'CTAGTTAACTAGTACGCAAGTTCACGTAAAACGGAGAAACCCCCCAATGA AAGCAATTTTCGTACCGAATGCGG-3' (SEQ ID N° 17) SDopt4-r :5'CTAGTTAACTAGTACGCAAGTTCACGTAAAACGGAGAAACCCCCCAATGA AAGCAATTTTCGTACCGAATGCGG-3 '(SEQ ID N ° 17) SDopt4-r:
5'AATTCCGCATTCGGTACGAAAATTGCTTTCATTGGGGGGTTTCTCCGTTTT ACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 18).5'AATTCCGCATTCGGTACGAAAATTGCTTTCATTGGGGGGTTTCTCCGTTTT ACGTGAACTTGCGTACTAGTTAA-3 '(SEQ ID N ° 18).
Le vecteur résultant noté pTEXCAT-SD4 a ensuite été transformé dans E. coli TOP 10 et comparé à pTΕXCAT4 en termes de potentiel d'expression de l'enzyme CAT. Les résultats obtenus indiquent que les niveaux d'expression de pTΕXCAT4 et pTΕXCAT-SD4 sont comparables entre eux et significativement supérieurs à pTΕXCAT. Ceci accrédite l'hypothèse que l'amélioration de l'expression observée avec les clones revendiqués dans cette demande de brevet est bien causée spécifiquement par les séquences situées entre les sites Spel et ΕcoRI.The resulting vector noted pTEXCAT-SD4 was then transformed into E. coli TOP 10 and compared to pTΕXCAT4 in terms of potential for expression of the CAT enzyme. The results obtained indicate that the expression levels of pTΕXCAT4 and pTΕXCAT-SD4 are comparable to each other and significantly higher than pTΕXCAT. This supports the hypothesis that the improvement in expression observed with the clones claimed in this patent application is indeed caused specifically by the sequences located between the Spel and ΕcoRI sites.
Afin de démontrer la spécificité des séquences mutées ou délétées situées directement en aval du codon d'initiation, la leucine CTG en septième position du vecteur sauvage pTΕXCAT a été remplacée par une proline CCG pour donner le vecteur pTΕXCAT-L7P. La proline CCG en septième position du vecteur pTΕXCAT4 a été remplacée par une leucine CTG pour donner le vecteur pTΕXCAT4-P7L. Les résultats de cette expérience figurent dans le tableau 3 ci-dessous.In order to demonstrate the specificity of the mutated or deleted sequences located directly downstream of the initiation codon, the leucine CTG in seventh position of the wild-type vector pTΕXCAT was replaced by a proline CCG to give the vector pTΕXCAT-L7P. The proline CCG in the seventh position of the vector pTΕXCAT4 was replaced by a leucine CTG to give the vector pTΕXCAT4-P7L. The results of this experiment are shown in Table 3 below.
Tableau 3. Comparaison entre les niveaux d'expression donnés par les vecteurs pTΕXCAT, pTΕXCAT4, pTΕXCAT-L7P et pTΕXCAT4-P7L.Table 3. Comparison between the expression levels given by the vectors pTΕXCAT, pTΕXCAT4, pTΕXCAT-L7P and pTΕXCAT4-P7L.
Les résultats (moyenne ± écart-type) ont été obtenus sur deux expériences indépendantes. Le niveau 1 est affecté arbitrairement au vecteur pTEXCAT. The results (mean ± standard deviation) were obtained on two independent experiments. Level 1 is arbitrarily assigned to the vector pTEXCAT.
Ces résultats démontrent que la mutation en aval du codon d'initiation est responsable à elle seule de la surexpression, puisque cette mutation réintroduite dans le vecteur sauvage permet d'obtenir la même surexpression. Exemple IVThese results demonstrate that the mutation downstream of the initiation codon alone is responsible for overexpression, since this mutation reintroduced into the wild vector makes it possible to obtain the same overexpression. Example IV
Cet exemple montre que l'effet de surexpression des nouvelles séquences décrites n'est pas limité au gène rapporteur utilisé pour les sélectionner mais se transpose à d'autres gènes dès lors que ces gènes leur sont liés fonctionnellement sur le même vecteur. A cet effet, le gène CAT des vecteurs pTEXCAT et pTEXCAT4 a été remplacé par la séquence du gène lacZ codant pour la β-galactosidase d'E. coli. Le clonage a été réalisé en amplifiant la séquence lacZ par PCR à partir du vecteur pβGAL- basic (Clontech, Palo Alto, CA) puis en insérant cette séquence en aval de trpL aux sites uniques Bsml et HindIII, pour donner respectivement les vecteurs pTΕX-βGAL et pTΕX4-bGAL.This example shows that the overexpression effect of the new sequences described is not limited to the reporter gene used to select them but is transposed to other genes as soon as these genes are linked to them functionally on the same vector. To this end, the CAT gene of the vectors pTEXCAT and pTEXCAT4 has been replaced by the sequence of the lacZ gene coding for the β-galactosidase of E. coli. Cloning was carried out by amplifying the lacZ sequence by PCR from the vector pβGAL-basic (Clontech, Palo Alto, CA) then by inserting this sequence downstream of trpL at the unique Bsml and HindIII sites, to give the vectors pTΕX-, respectively. βGAL and pTΕX4-bGAL.
Les deux vecteurs ont été transformés dans la souche E. coli ICONE 200 (demande de brevet français FR 2 777 292 publiée le 15 Octobre 1999) en vue d'une culture en fermenteur avec suivi en cinétique de l'expression de la β-galactosidase. Classiquement, les bactéries recombinantes ICONE 200 x pTEX-βGAL et ICONE 200 x pTEX4-βGAL ont été cultivées dans 200 ml de milieu complet (Tryptic Soy Broth (DIFCO) 30 g/1, Yeast Extract (DIFCO) 5 g/1) pendant une nuit à 37°C. La suspension cellulaire obtenue a été transférée stérilement dans un fermenteur (modèle CF3000 de Chemap, capacité 3,5 1) contenant 1,8 litres du milieu suivant (concentrations pour 2 litres de culture finale) : glycérol 90 g/1, (NH_ι)2S04 5 g/1, KH2PO4 6 g/1, K2HPO4 4 g/1, Na3-citrate 2H2O 9 g/1, MgS 4 7H2O 2 g/1, extrait de levure 1 g/1, oligoéléments, antimousse 0,06 %, tétracycline 8 mg/1, tryptophane 200 mg/1. Le pH est régulé à 7,0 par ajout d'ammoniaque. Le taux d'oxygène dissous est maintenu à 30 % de la saturation par asservissement de la vitesse d'agitation puis du débit d'aération à la mesure de PO2 dissous. Lorsque la Densité Optique de la culture atteint une valeur comprise entre 30 et 40, on procède à l'induction par l'ajout de 25 mg/1 d'IAA (Sigma, St Louis, MO). Une analyse en cinétique de la densité optique de la culture (DO à
580 nm) et de l'activité β-galactosidase intracellulaire a été effectuée. Le niveau d'activité β-galactosidase est estimé par un dosage colorimétrique en mélangeant 30 μl d'échantillon (fraction « S », voir exemple 3), 204 μl de tampon (Tris-HCl 50 mM pH 7,5 - MgCl2 1 mM) et 66 μl d'ONPG (4 mg/ml dans Tris-HCl 50 mM pH 7,5). Le mélange réactionnel est placé en incubation à 37°C. La réaction est stoppée par l'ajout de 500 μl de Na2CO3 1 M. La DO à 420 nm rapportée au temps d'incubation est proportionnelle à l'activité β-galactosidase présente dans l'échantillon. Sachant que E. coli ICONE 200 a une délétion complète de Popéron lac, l'activité β-galactosidase mesurée est uniquement due à l'expression du gène lacZ plasmidique. Les résultats de cette étude comparative indiquent que dans deux expériences indépendantes, le vecteur pTEX4-βGAL donne un niveau d'activité β-galactosidase environ 50 fois supérieur à pTEX-βGAL (figure 4). Nous en déduisons que la séquence originale isolée dans la zone RBS du vecteur pTEXCAT4 potentialise l'expression, non seulement de la protéine CAT, mais aussi d'autres protéines telles que, à titre d'exemple, la β-galactosidase. A partir de cet exemple, nous pouvons conclure que d'autres protéines d'intérêt biotechnologique pourront être avantageusement exprimées à partir d'un des vecteurs selon l'invention en introduisant leur séquence codante en aval des séquences mutées ou délétées selon l'invention. Exemple V Comparaison entre les niveaux d'expression donnés par les vecteurs pTEXwt (ne fait pas partie de l'invention) et les vecteurs pTEX9*, pTEXIO', pTEXl P et pTEX12'.The two vectors were transformed into the E. coli ICONE 200 strain (French patent application FR 2 777 292 published on October 15, 1999) with a view to culturing in a fermenter with kinetic monitoring of the expression of β-galactosidase . Conventionally, the recombinant bacteria ICONE 200 x pTEX-βGAL and ICONE 200 x pTEX4-βGAL were cultured in 200 ml of complete medium (Tryptic Soy Broth (DIFCO) 30 g / 1, Yeast Extract (DIFCO) 5 g / 1) for overnight at 37 ° C. The cell suspension obtained was transferred sterile to a fermenter (CF3000 model from Chemap, capacity 3.5 1) containing 1.8 liters of the following medium (concentrations for 2 liters of final culture): glycerol 90 g / 1, (NH_ι) 2S04 5 g / 1, KH2PO4 6 g / 1, K2HPO4 4 g / 1, Na3-citrate 2H2O 9 g / 1, MgS 4 7H2O 2 g / 1, yeast extract 1 g / 1, trace elements, defoamer 0.06% , tetracycline 8 mg / 1, tryptophan 200 mg / 1. The pH is adjusted to 7.0 by adding ammonia. The dissolved oxygen rate is maintained at 30% of saturation by slaving the stirring speed and then the aeration rate to measure dissolved PO2. When the optical density of the culture reaches a value between 30 and 40, the induction is carried out by adding 25 mg / 1 of IAA (Sigma, St Louis, MO). Kinetic analysis of the optical density of the culture (OD to 580 nm) and intracellular β-galactosidase activity was performed. The level of β-galactosidase activity is estimated by a colorimetric assay by mixing 30 μl of sample (fraction “S”, see example 3), 204 μl of buffer (Tris-HCl 50 mM pH 7.5 - MgCl 2 1 mM) and 66 μl of ONPG (4 mg / ml in 50 mM Tris-HCl pH 7.5). The reaction mixture is incubated at 37 ° C. The reaction is stopped by the addition of 500 μl of Na 2 CO 3 1 M. The OD at 420 nm relative to the incubation time is proportional to the β-galactosidase activity present in the sample. Knowing that E. coli ICONE 200 has a complete deletion of Lac Popon, the β-galactosidase activity measured is only due to the expression of the lacZ plasmid gene. The results of this comparative study indicate that in two independent experiments, the vector pTEX4-βGAL gives a level of β-galactosidase activity approximately 50 times higher than pTEX-βGAL (Figure 4). We deduce that the original sequence isolated in the RBS area of the vector pTEXCAT4 potentiates the expression, not only of the CAT protein, but also of other proteins such as, for example, β-galactosidase. From this example, we can conclude that other proteins of biotechnological interest could be advantageously expressed from one of the vectors according to the invention by introducing their coding sequence downstream of the mutated or deleted sequences according to the invention. Example V Comparison between the expression levels given by the vectors pTEXwt (not part of the invention) and the vectors pTEX9 *, pTEXIO ', pTEXl P and pTEX12'.
Les vecteurs pTEXIO', pTEXl P et pTEX12' sont issus du vecteur pTEX9 mais comprennent en outre des mutations supplémentaires, telles qu'indiquées dans le tableau 4 ci-dessous :
Tableau 4. Comparaison entre les niveaux d'expression donnés par les vecteur pTEXwt, pTEX9*, pTEXIO', pTEXl P et pTEX12'.The vectors pTEXIO ', pTEXl P and pTEX12' originate from the vector pTEX9 but also include additional mutations, as indicated in table 4 below: Table 4. Comparison between the expression levels given by the vectors pTEXwt, pTEX9 *, pTEXIO ', pTEXl P and pTEX12'.
(*) : Chaque séquence nucléotidique (ARN messager) comprend la région mutée en aval du codon d'initiation. La séquence de référence du vecteur pTEXCAT figure en première ligne du tableau. Les séquences nucléiques en amont et en aval du codon d'initiation des vecteurs sont représentées dans ce tableau après transcription sous forme d'ARN. A l'extrémité 3' de ces séquences, seuls les deux premiers codons du site de clonage multiple sont représentés, à savoir GAAUUC.(*): Each nucleotide sequence (messenger RNA) comprises the mutated region downstream of the initiation codon. The reference sequence of the pTEXCAT vector is shown in the first line of the table. The nucleic acid sequences upstream and downstream of the vector initiation codon are represented in this table after transcription in the form of RNA. At the 3 'end of these sequences, only the first two codons of the multiple cloning site are represented, namely GAAUUC.
Les méthodes de détermination de l'expression sont celles utilisées dans les exemples ci-dessus.The methods for determining the expression are those used in the examples above.
Ces résultats démontrent que les délétions en aval du codon d'initiation permettent d'obtenir une surexpression jusqu'à plus de 250 fois supérieure à l'expression observée en utilisant le vecteur sauvage.
These results demonstrate that the deletions downstream of the initiation codon make it possible to obtain an overexpression up to more than 250 times greater than the expression observed using the wild-type vector.
Claims
1. Construction pour l'expression d'un gène codant pour une protéine recombinante d'intérêt placé sous le contrôle de l'opéron tryptophane Ptrp dans une cellule hôte procaryote comprenant directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID N° 1 et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID N° 1 est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.1. Construction for the expression of a gene coding for a recombinant protein of interest placed under the control of the tryptophan Ptrp operon in a prokaryotic host cell comprising directly downstream of the initiation codon a nucleic sequence of sequence SEQ ID No. 1 and downstream of this sequence a multiple cloning cassette intended to receive the gene coding for said recombinant protein of interest, characterized in that at least one of the nucleotides of the sequence SEQ ID No. 1 is mutated or deleted so as to allow an overexpression of said recombinant protein.
2. Construction selon la revendication 1, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID N° 1 est délété.2. Construction according to claim 1, characterized in that at least one of the nucleotides of the sequence SEQ ID No. 1 is deleted.
3. Construction selon la revendication 1, caractérisée en ce que ledit au moins nucléotide muté ou délété est situé sur le fragment de séquence S>EQ ID N° 2 de la séquence SEQ ID N° 1.3. Construction according to claim 1, characterized in that said at least mutated or deleted nucleotide is located on the fragment of sequence S> EQ ID No. 2 of the sequence SEQ ID No. 1.
4. Construction selon la revendication 1, caractérisée en ce que ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GTA de la séquence SEQ ID N° 1.4. Construction according to claim 1, characterized in that said at least mutated or deleted nucleotide, preferably mutated, is located on the GTA codon of the sequence SEQ ID No. 1.
5. Construction selon la revendication 1, caractérisée en ce ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GCA de la séquence SEQ ID N° 1.5. Construction according to claim 1, characterized in that said at least mutated or deleted nucleotide, preferably mutated, is located on the codon GCA of the sequence SEQ ID No. 1.
6. Construction selon la revendication 1, caractérisée en ce ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon CTG de la séquence SEQ ID N° 1. 6. Construction according to claim 1, characterized in that said at least mutated or deleted nucleotide, preferably mutated, is located on the CTG codon of the sequence SEQ ID No. 1.
7. Construction selon la revendication 1, caractérisée en ce que ladite séquence SEQ ID N° 1 dont au moins un des acides nucléiques est muté ou délété, présente au moins en position 1, 2 et 3 le nucléotide A.7. Construction according to claim 1, characterized in that said sequence SEQ ID No. 1 of which at least one of the nucleic acids is mutated or deleted, has at least in position 1, 2 and 3 the nucleotide A.
8. Construction selon la revendication 1, caractérisée en ce que ladite séquence SEQ ID N° 1 est totalement délétée. 8. Construction according to claim 1, characterized in that said sequence SEQ ID No. 1 is completely deleted.
9. Construction selon l'une des revendications 1 à 8, caractérisée en ce qu'au moins un des nucléotides, et préférentiellement tous les nucléotides, situés entre la séquence nucléique de séquence SEQ ID N° 1 et la cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, sont délétés.9. Construction according to one of claims 1 to 8, characterized in that at least one of the nucleotides, and preferably all the nucleotides, located between the nucleic sequence of sequence SEQ ID No. 1 and the multiple cloning cassette intended to receive the gene coding for said recombinant protein of interest, are deleted.
10. Construction selon l'une quelconque des revendications 1 à 9, caractérisée en ce que la séquence nucléique directement en amont du codon d'initiation est choisie parmi les séquences SEQ ID N° 3 à SEQ ID N° 10.10. Construction according to any one of claims 1 to 9, characterized in that the nucleic sequence directly upstream of the initiation codon is chosen from the sequences SEQ ID No. 3 to SEQ ID No. 10.
11. Construction selon l'une quelconque des revendications 1 à 10, caractérisée en ce que la cellule hôte procaryote est une bactérie gram négative.11. Construction according to any one of claims 1 to 10, characterized in that the prokaryotic host cell is a gram negative bacterium.
12. Construction selon l'une quelconque des revendications 1 à 11, caractérisée en ce que la cellule hôte procaryote est E. coli. 12. Construction according to any one of claims 1 to 11, characterized in that the prokaryotic host cell is E. coli.
13. Vecteur contenant une construction selon l'une quelconque des revendications 1 à 12.13. Vector containing a construction according to any one of claims 1 to 12.
14. Cellule hôte procaryote transformée par un vecteur selon la revendication 13.14. A prokaryotic host cell transformed by a vector according to claim 13.
15. Cellule hôte procaryote selon la revendication 14, caractérisée en ce qu'il s'agit d' E. coli.15. Prokaryotic host cell according to claim 14, characterized in that it is E. coli.
16. Procédé de production d'une protéine recombinante d'intérêt dans une cellule hôte utilisant une construction selon l'une quelconque des revendications 1 à 12.16. A method of producing a recombinant protein of interest in a host cell using a construct according to any one of claims 1 to 12.
17. Procédé de production d'une protéine recombinante d'intérêt selon la revendication 16, dans lequel ladite construction est introduite dans une cellule hôte procaryote.17. A method of producing a recombinant protein of interest according to claim 16, wherein said construct is introduced into a prokaryotic host cell.
18. Procédé de production d'une protéine recombinante d'intérêt selon la revendication 16 ou 17, dans lequel ladite construction est introduite dans une cellule hôte procaryote par un vecteur selon la revendication 13.18. A method of producing a recombinant protein of interest according to claim 16 or 17, wherein said construct is introduced into a prokaryotic host cell by a vector according to claim 13.
19. Procédé de production d'une protéine recombinante d'intérêt selon l'une des revendications 16 à 18, caractérisé en ce qu'il comprend les étapes suivantes : a) le clonage d'un gène d'intérêt dans un vecteur selon la revendication 13 ; b) la transformation d'une cellule procaryote par un vecteur contenant un gène codant pour ladite protéine recombinante d'intérêt ; c) la culture de ladite cellule transformée dans un milieu de culture permettant l'expression de la protéine recombinante ; et d) la récupération de la protéine recombinante à partir du milieu de culture ou de ladite cellule transformée.19. A method of producing a recombinant protein of interest according to one of claims 16 to 18, characterized in that it comprises the following steps: a) cloning of a gene of interest in a vector according to the claim 13; b) transformation of a prokaryotic cell with a vector containing a gene coding for said recombinant protein of interest; c) culturing said transformed cell in a culture medium allowing expression of the recombinant protein; and d) recovering the recombinant protein from the culture medium or from said transformed cell.
20. Utilisation d'une construction selon l'une des revendications 1 à 12, d'un vecteur selon la revendication 13 ou d'une cellule selon la revendication 14 ou 15, pour la production d'une protéine recombinante.20. Use of a construct according to one of claims 1 to 12, of a vector according to claim 13 or of a cell according to claim 14 or 15, for the production of a recombinant protein.
21. Utilisation d'une protéine recombinante pour la préparation d'un médicament destiné à être administré à un patient nécessitant un tel traitement, caractérisée en ce que ladite protéine recombinante est produite par un procédé selon l'une des revendications 16 à 19. 21. Use of a recombinant protein for the preparation of a medicament intended for administration to a patient in need of such treatment, characterized in that said recombinant protein is produced by a process according to one of claims 16 to 19.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0008002A FR2810675B1 (en) | 2000-06-22 | 2000-06-22 | MODIFIED CONSTRUCTION DOWNSTREAM OF THE INITIATION CODON FOR OVEREXPRESSION OF RECOMBINANT PROTEINS |
FR0008002 | 2000-06-22 | ||
PCT/FR2001/001952 WO2001098453A2 (en) | 2000-06-22 | 2001-06-21 | Modified construct downstream of the initiation codon for recombinant protein overexpression |
Publications (1)
Publication Number | Publication Date |
---|---|
EP1315822A2 true EP1315822A2 (en) | 2003-06-04 |
Family
ID=8851556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP01947565A Withdrawn EP1315822A2 (en) | 2000-06-22 | 2001-06-21 | Modified construct downstream of the initiation codon for recombinant protein overexpression |
Country Status (10)
Country | Link |
---|---|
US (1) | US20040260060A1 (en) |
EP (1) | EP1315822A2 (en) |
JP (1) | JP2004500875A (en) |
CN (1) | CN1443242A (en) |
AU (1) | AU6922401A (en) |
BR (1) | BR0111907A (en) |
CA (1) | CA2413612A1 (en) |
FR (1) | FR2810675B1 (en) |
MX (1) | MXPA02012880A (en) |
WO (1) | WO2001098453A2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ588430A (en) | 2004-12-22 | 2012-10-26 | Genentech Inc | Methods for producing soluble multi-membrane-spanning proteins |
EP2185704A1 (en) * | 2007-08-03 | 2010-05-19 | Pfenex, Inc. | Translation initiation region sequences for the optimal expression of heterologous proteins |
KR100961565B1 (en) * | 2008-03-10 | 2010-06-07 | 충남대학교산학협력단 | Methods for screening initial codons providing desired expression levels of proteins, and methods for tuning expression and production of recombinant proteins |
WO2009135056A2 (en) * | 2008-04-30 | 2009-11-05 | Monsanto Technology Llc | Recombinant dna vectors for expression of human prolactin antagonists |
US20110111977A1 (en) * | 2008-07-03 | 2011-05-12 | Pfenex, Inc. | High throughput screening method and use thereof to identify a production platform for a multifunctional binding protein |
CN110491447B (en) * | 2019-08-05 | 2021-08-17 | 浙江省农业科学院 | Codon optimization method for heterologous gene in vitro expression and application |
CN115960934A (en) * | 2022-08-24 | 2023-04-14 | 深圳柏垠生物科技有限公司 | Escherichia coli expression exogenous gene optimization method and sequence thereof |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4738921A (en) * | 1984-09-27 | 1988-04-19 | Eli Lilly And Company | Derivative of the tryptophan operon for expression of fused gene products |
US4772555A (en) * | 1985-03-27 | 1988-09-20 | Genentech, Inc. | Dedicated ribosomes and their use |
US5149792A (en) * | 1989-12-19 | 1992-09-22 | Amgen Inc. | Platelet-derived growth factor B chain analogs |
US6121416A (en) * | 1997-04-04 | 2000-09-19 | Genentech, Inc. | Insulin-like growth factor agonist molecules |
GB9716790D0 (en) * | 1997-08-07 | 1997-10-15 | Creative Peptides Sweden Ab | Recombinant DNA molecules comprising multimeric copies of a gene sequence and expression thereof |
-
2000
- 2000-06-22 FR FR0008002A patent/FR2810675B1/en not_active Expired - Fee Related
-
2001
- 2001-06-21 CN CN01812988.9A patent/CN1443242A/en active Pending
- 2001-06-21 AU AU69224/01A patent/AU6922401A/en not_active Abandoned
- 2001-06-21 BR BR0111907-9A patent/BR0111907A/en not_active IP Right Cessation
- 2001-06-21 EP EP01947565A patent/EP1315822A2/en not_active Withdrawn
- 2001-06-21 WO PCT/FR2001/001952 patent/WO2001098453A2/en not_active Application Discontinuation
- 2001-06-21 US US10/311,976 patent/US20040260060A1/en not_active Abandoned
- 2001-06-21 MX MXPA02012880A patent/MXPA02012880A/en unknown
- 2001-06-21 CA CA002413612A patent/CA2413612A1/en not_active Abandoned
- 2001-06-21 JP JP2002504602A patent/JP2004500875A/en active Pending
Non-Patent Citations (1)
Title |
---|
See references of WO0198453A3 * |
Also Published As
Publication number | Publication date |
---|---|
MXPA02012880A (en) | 2003-05-14 |
FR2810675B1 (en) | 2002-09-27 |
CA2413612A1 (en) | 2001-12-27 |
WO2001098453A2 (en) | 2001-12-27 |
US20040260060A1 (en) | 2004-12-23 |
BR0111907A (en) | 2003-12-30 |
WO2001098453A3 (en) | 2002-08-01 |
JP2004500875A (en) | 2004-01-15 |
CN1443242A (en) | 2003-09-17 |
FR2810675A1 (en) | 2001-12-28 |
AU6922401A (en) | 2002-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107278227B (en) | Compositions and methods for in vitro viral genome engineering | |
JP6125493B2 (en) | Transcription termination sequence | |
JP2021523739A (en) | How to edit single nucleotide polymorphisms using a programmable base editor system | |
KR20210149686A (en) | Polypeptides useful for gene editing and methods of use | |
WO2002072846A9 (en) | Synthetic genes and bacterial plasmids devoid of cpg | |
US20230416710A1 (en) | Engineered and chimeric nucleases | |
JP2009523428A (en) | Linear vectors, host cells and cloning methods | |
FR2920158A1 (en) | PLASMID PRODUCTION AND EXPRESSION OF RECOMBINANT PROTEINS IN CULTIVATED CELLS WITHOUT ANTIBIOTICS | |
CN103732751A (en) | Gene expression and eradication system in helicobacter pylori | |
EP1315822A2 (en) | Modified construct downstream of the initiation codon for recombinant protein overexpression | |
US20220162648A1 (en) | Compositions and methods for improved gene editing | |
AU2022284808A1 (en) | Class ii, type v crispr systems | |
KR102358538B1 (en) | Method for gene editing in microalgae using particle bombardment | |
JPH08507218A (en) | Overexpression of single-chain molecules | |
KR20070007288A (en) | Reduction of spontaneous mutation rates in cells | |
EP0594776A1 (en) | Plasmid replication origin increasing the number of copies of the plasmid containing said origin | |
CN116675751B (en) | Application of SWEET1g protein and encoding gene thereof in resisting potato viruses | |
EP1071798B1 (en) | Constructs for controlled expression of recombinant proteins in prokaryotic cells | |
JP3910248B2 (en) | Method for producing DNA nested deletion by in vitro reaction using transposase | |
FR2810674A1 (en) | Construct for expressing foreign proteins in prokaryotes, has modified ribosome binding sequence upstream of the initiation codon to provide overexpression | |
KR20230040348A (en) | Humanized Mouse Model for SARS-COV-2 Infection | |
ZA200300550B (en) | Construct modified downstream of the initiation codon for recombinant protein overexpression. | |
JPH05502590A (en) | Cloning cartridges and expression vectors in Gram-negative bacteria | |
JPS6398388A (en) | Production of herbicide-resistant gene |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20030324 |
|
AK | Designated contracting states |
Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR |
|
17Q | First examination report despatched |
Effective date: 20060908 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN |
|
18D | Application deemed to be withdrawn |
Effective date: 20070103 |