CA2413612A1 - Vecteurs d'expression comprenant un fragment modifie de l'operon tryptophane - Google Patents
Vecteurs d'expression comprenant un fragment modifie de l'operon tryptophane Download PDFInfo
- Publication number
- CA2413612A1 CA2413612A1 CA002413612A CA2413612A CA2413612A1 CA 2413612 A1 CA2413612 A1 CA 2413612A1 CA 002413612 A CA002413612 A CA 002413612A CA 2413612 A CA2413612 A CA 2413612A CA 2413612 A1 CA2413612 A1 CA 2413612A1
- Authority
- CA
- Canada
- Prior art keywords
- sequence
- recombinant protein
- interest
- seq
- mutated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 title claims abstract description 48
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 title claims abstract description 48
- 108091081024 Start codon Proteins 0.000 title claims abstract description 32
- 230000002018 overexpression Effects 0.000 title claims abstract description 17
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 69
- 239000013598 vector Substances 0.000 claims abstract description 60
- 210000004027 cell Anatomy 0.000 claims abstract description 27
- 238000010367 cloning Methods 0.000 claims abstract description 20
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 15
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims abstract description 11
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims abstract description 11
- 238000004519 manufacturing process Methods 0.000 claims abstract description 10
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 9
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 9
- 210000001236 prokaryotic cell Anatomy 0.000 claims abstract description 3
- 230000014509 gene expression Effects 0.000 claims description 44
- 239000002773 nucleotide Substances 0.000 claims description 43
- 125000003729 nucleotide group Chemical group 0.000 claims description 43
- 102000004169 proteins and genes Human genes 0.000 claims description 37
- 108020004705 Codon Proteins 0.000 claims description 28
- 241000588724 Escherichia coli Species 0.000 claims description 26
- 238000010276 construction Methods 0.000 claims description 26
- 230000000977 initiatory effect Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 17
- 241000894006 Bacteria Species 0.000 claims description 15
- 238000011144 upstream manufacturing Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 239000001963 growth medium Substances 0.000 claims description 4
- 239000012634 fragment Substances 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 229940126601 medicinal product Drugs 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 30
- 230000001580 bacterial effect Effects 0.000 description 25
- 108020004414 DNA Proteins 0.000 description 23
- 210000003705 ribosome Anatomy 0.000 description 20
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 15
- 108091034117 Oligonucleotide Proteins 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 14
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 238000013519 translation Methods 0.000 description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 9
- 229960005091 chloramphenicol Drugs 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- PLVPPLCLBIEYEA-AATRIKPKSA-N (E)-3-(indol-3-yl)acrylic acid Chemical compound C1=CC=C2C(/C=C/C(=O)O)=CNC2=C1 PLVPPLCLBIEYEA-AATRIKPKSA-N 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- PLVPPLCLBIEYEA-UHFFFAOYSA-N indoleacrylic acid Natural products C1=CC=C2C(C=CC(=O)O)=CNC2=C1 PLVPPLCLBIEYEA-UHFFFAOYSA-N 0.000 description 8
- 239000000725 suspension Substances 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 108020004465 16S ribosomal RNA Proteins 0.000 description 6
- 101000596741 Homo sapiens Testis-specific protein TEX28 Proteins 0.000 description 6
- 102100035104 Testis-specific protein TEX28 Human genes 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 229920000785 ultra high molecular weight polyethylene Polymers 0.000 description 6
- 108700008625 Reporter Genes Proteins 0.000 description 5
- 101150066555 lacZ gene Proteins 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- ZXQYGBMAQZUVMI-QQDHXZELSA-N [cyano-(3-phenoxyphenyl)methyl] (1r,3r)-3-[(z)-2-chloro-3,3,3-trifluoroprop-1-enyl]-2,2-dimethylcyclopropane-1-carboxylate Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)OC(C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-QQDHXZELSA-N 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007850 degeneration Effects 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 239000013600 plasmid vector Substances 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 239000006142 Luria-Bertani Agar Substances 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 2
- 102000014150 Interferons Human genes 0.000 description 2
- 108010050904 Interferons Proteins 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108020002494 acetyltransferase Proteins 0.000 description 2
- 102000005421 acetyltransferase Human genes 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 239000001974 tryptic soy broth Substances 0.000 description 2
- 108010050327 trypticase-soy broth Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- QDZOEBFLNHCSSF-PFFBOGFISA-N (2S)-2-[[(2R)-2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-1-[(2R)-2-amino-5-carbamimidamidopentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-N-[(2R)-1-[[(2S)-1-[[(2R)-1-[[(2S)-1-[[(2S)-1-amino-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]pentanediamide Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CCCNC(N)=N)C1=CC=CC=C1 QDZOEBFLNHCSSF-PFFBOGFISA-N 0.000 description 1
- 101150035225 0.3 gene Proteins 0.000 description 1
- KUWPCJHYPSUOFW-YBXAARCKSA-N 2-nitrophenyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CC=CC=C1[N+]([O-])=O KUWPCJHYPSUOFW-YBXAARCKSA-N 0.000 description 1
- NKDFYOWSKOHCCO-YPVLXUMRSA-N 20-hydroxyecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@](C)(O)[C@H](O)CCC(C)(O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 NKDFYOWSKOHCCO-YPVLXUMRSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- 101710081722 Antitrypsin Proteins 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 101710191360 Eosinophil cationic protein Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 108010016183 Human immunodeficiency virus 1 p16 protease Proteins 0.000 description 1
- 241000711920 Human orthopneumovirus Species 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102100023915 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102220616953 Melanoma inhibitory activity protein 2_V6A_mutation Human genes 0.000 description 1
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 102000003797 Neuropeptides Human genes 0.000 description 1
- 108010079246 OMPA outer membrane proteins Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000096 Substance P Human genes 0.000 description 1
- 101800003906 Substance P Proteins 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 230000001475 anti-trypsic effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 231100000481 chemical toxicant Toxicity 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 238000007398 colorimetric assay Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000021245 dietary protein Nutrition 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- -1 fantithrombin III Proteins 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000012933 kinetic analysis Methods 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 231100000636 lethal dose Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L magnesium chloride Substances [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 108010064037 prorennin Proteins 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102200071172 rs1554197721 Human genes 0.000 description 1
- 102200130232 rs387906982 Human genes 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 101150108727 trpl gene Proteins 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 108010047303 von Willebrand Factor Proteins 0.000 description 1
- 102100036537 von Willebrand factor Human genes 0.000 description 1
- 229960001134 von willebrand factor Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
- C12N15/71—Expression systems using regulatory sequences derived from the trp-operon
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
L'invention concerne une construction pour l'expression d'un gène codant pou r une protéine recombinante d'intérêt placé sous le contrôle de l'opéron tryptophane Ptrp dans une cellule hôte procaryote, qui comprend directement en aval du codon d'initiation une séquence nucléique SEQ ID N~1 et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, au moins un des acides nucléiques de la séquence nucléique SEQ ID N~1 étant muté ou délété de façon à permettre une surexpression de ladite protéine recombinante. L'invention a encore pour objet un vecteur contenant une telle construction, une cellule hôte procaryote transformée par ledit vecteur, tout comme un procédé de production d'une protéine recombinante d'intérêt utilisant une construction selon l'invention.
Description
CONSTRUCTION MODIFIEE EN AVAL DU CODON D'INITIATION POUR
LA SUREXPRESSION DE PROTEINES RECOMBINANTES.
L'invention concerne une construction pour l'expression d'un gène codant pour s une protéine recombinante d'intérêt placé sous Ie conirôle de fopéron tryptophane Ptrp dans une cellule hôte procaryote, qui comprend directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID N° 1 et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour Iadite protéine recombinante d'intérêt, au moins un des nucléotides de la séquence SEQ ID
N° 1 étant 1o muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.
L'invention a encore pour objet un vecteur contenant une telle construction, une cellule hôte procaryote transformée par ledit vecteur, tout comme un procédé de production d'une protéine recombinante d'intérêt utilisant une construction selon l'invention.
La capacité des biotechnologistes à cloner un gène dans des délais réduits, à
15 l'exprimer sous la forme d'une protéine biologiquement active puis à en créer des variants pour établir des relations séquence/fonction a permis de proposer un large éventail de protéines recombinantes à usage médical ou de recherche. De nombreuses maladies humaines sont désormais traitées ou évitées grâce à la disponibilité
de molécules issues des biotechnologies sous forme pure et à un coût acceptable (Koths K., 20 Curent Opinion in Biotechnolog~, 6, 681-687, 1995).
Les cellules bactériennes sont des hôtes privilégiés pour l'expression de protéines recombinantes car elles ont des exigences nutritives limitées tout en étant capables d'atteindre des densitës de croissance élevées, mais aussi parce qu'elles ont fait l'objet dans le passé d'investigations nombreuses qui ont conduit à la génération de mutants 25 d'intérêt et de systèmes d'expression plasmidiques variés. Parmi les bactéries, Escherichia coli (E. coli) est l'organisme le plus utilisé et le mieux caractérisé si l'on en juge par l'abondante littérature y relatant l'expression de protéines d'origine procaryote ou eucaryote. Cependant, toutes les protéines n'y sont pas exprimées avec la même efficacité en raison de difficultés pouvant intervenir à différents niveaux :
transcription 3o du gène d'intérêt, traduction, événements post-traductionnels affectant le devenir de la
LA SUREXPRESSION DE PROTEINES RECOMBINANTES.
L'invention concerne une construction pour l'expression d'un gène codant pour s une protéine recombinante d'intérêt placé sous Ie conirôle de fopéron tryptophane Ptrp dans une cellule hôte procaryote, qui comprend directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID N° 1 et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour Iadite protéine recombinante d'intérêt, au moins un des nucléotides de la séquence SEQ ID
N° 1 étant 1o muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.
L'invention a encore pour objet un vecteur contenant une telle construction, une cellule hôte procaryote transformée par ledit vecteur, tout comme un procédé de production d'une protéine recombinante d'intérêt utilisant une construction selon l'invention.
La capacité des biotechnologistes à cloner un gène dans des délais réduits, à
15 l'exprimer sous la forme d'une protéine biologiquement active puis à en créer des variants pour établir des relations séquence/fonction a permis de proposer un large éventail de protéines recombinantes à usage médical ou de recherche. De nombreuses maladies humaines sont désormais traitées ou évitées grâce à la disponibilité
de molécules issues des biotechnologies sous forme pure et à un coût acceptable (Koths K., 20 Curent Opinion in Biotechnolog~, 6, 681-687, 1995).
Les cellules bactériennes sont des hôtes privilégiés pour l'expression de protéines recombinantes car elles ont des exigences nutritives limitées tout en étant capables d'atteindre des densitës de croissance élevées, mais aussi parce qu'elles ont fait l'objet dans le passé d'investigations nombreuses qui ont conduit à la génération de mutants 25 d'intérêt et de systèmes d'expression plasmidiques variés. Parmi les bactéries, Escherichia coli (E. coli) est l'organisme le plus utilisé et le mieux caractérisé si l'on en juge par l'abondante littérature y relatant l'expression de protéines d'origine procaryote ou eucaryote. Cependant, toutes les protéines n'y sont pas exprimées avec la même efficacité en raison de difficultés pouvant intervenir à différents niveaux :
transcription 3o du gène d'intérêt, traduction, événements post-traductionnels affectant le devenir de la
2 molécule dans l'environnement cytoplasmique ou périplasmique de Ia bactérie (Makrides, S.C., Microbiological Reviews, 60, 512-538, 1996).
Pour être traduit efficacement, un ARN messager doit contenir une séquence spécifiant la fixation du ribosome bactérien et permettant l'initiation de la traduction.
Cette séquence, appelée site de fixation au ribosome « Ribosome Binding Site »
(RBS) est située dans une zone recouvrant le codon initiateur. L'analyse statistique des domaines d'initiation des ARNm bactériens révèle l'existence d'une fenêtre de nucléotides dont la séquence diffère d'une distribution aléatoire (Gold, L., Annual Revue of Biochemist~y, 57, 199-233, 1988). Cette séquence, allant de la position -20 à la 1o position + 13 de l'ARNm si l'on affecte la position + 1 au premier nucléotide du codon initiateur, joue le rôle de RBS en aidant le ribosome à distinguer les vrais domaines d'initiation parmi l'ensemble des séquences « RBS-like ». De nombreuses investigations ont permis d'affiner la connaissance du RBS pour en définir quelques éléments caractéristiques i) La séquence Shine-Dalgarno (SD) Depuis le séquençage de l'extrémité 3' de l'ARN ribosomal 16S (Shine, J. et Dalgarno, L., Proc. Natl. Acad. Sci. U.S.A., 71, 1342-1346, 1974), la séquence dite de Shine-Dalgarno a été définie comme la région des ARNm en 5' du codon d'initiation possédant une complëmentarité avec la séquence 5'-CCUCCUUA-3' de l'extrémité
Pour être traduit efficacement, un ARN messager doit contenir une séquence spécifiant la fixation du ribosome bactérien et permettant l'initiation de la traduction.
Cette séquence, appelée site de fixation au ribosome « Ribosome Binding Site »
(RBS) est située dans une zone recouvrant le codon initiateur. L'analyse statistique des domaines d'initiation des ARNm bactériens révèle l'existence d'une fenêtre de nucléotides dont la séquence diffère d'une distribution aléatoire (Gold, L., Annual Revue of Biochemist~y, 57, 199-233, 1988). Cette séquence, allant de la position -20 à la 1o position + 13 de l'ARNm si l'on affecte la position + 1 au premier nucléotide du codon initiateur, joue le rôle de RBS en aidant le ribosome à distinguer les vrais domaines d'initiation parmi l'ensemble des séquences « RBS-like ». De nombreuses investigations ont permis d'affiner la connaissance du RBS pour en définir quelques éléments caractéristiques i) La séquence Shine-Dalgarno (SD) Depuis le séquençage de l'extrémité 3' de l'ARN ribosomal 16S (Shine, J. et Dalgarno, L., Proc. Natl. Acad. Sci. U.S.A., 71, 1342-1346, 1974), la séquence dite de Shine-Dalgarno a été définie comme la région des ARNm en 5' du codon d'initiation possédant une complëmentarité avec la séquence 5'-CCUCCUUA-3' de l'extrémité
3' de l'ARNr 165. L'existence d'une interaction entre l'ARNr 16S et le RBS médiée par la séquence de Shine-Dalgarno est confirmée par la forte représentation des bases puriques A et G dans la région [-12 ; -7] des RBS naturels d'ARNm d'E. coli. Ce biais est retrouvé dans une collection de 158 RBS randomisés et sélectionnés pour leur capacité à
promouvoir l'expression d'un gène rapporteur (Barrick, D., et al., Nucleic.
Acids. Res., 22, 1287-1295, 1994).
ü) Le codon d'initiation C'est le codon AUG qui est utilisé préférentiellement comme codon d'initiation, même si GUG et dans une moindre mesure UUG peuvent être trouvés occasionnellement (Ringquist, S., et al., Molecular Micr°obiology, 6, 1219-1229, 1992).
iii) La distance entre la séquence SD et le codon d'initiation Une étude exhaustive de Chen H., et al. (Nucleic Acids Research, 22, 4953-4957, 1994a) a montré l'existence d'une distance optimale séparant l'extrémité 3' de la séquence Shine-Dalgarno et le codon d'initiation. En prenant la séquence consensus 5'-UAAGGAGGU-3' comme séquence SD de référence, l'espacement donnant le niveau d'expression maximal est de 5 nucléotides. Un espacement compris entre 1 et 9 nucléotides demeure favorable en assurant un niveau d'expression au moins égal à 50 du niveau maximal.
iv) Autres séquences primaires Deux appariements sont connus pour intervenir dans l'initiation de la 1o traduction : l'appariement entre codon d'initiation de I'ARNm et ARNt-fMet d'une part et l'appariement entre séquence SD et extrémité 3' de l'ARNr 16S d'autre part.
Des études de mutagénèse et l'analyse d'ARNm atypiques (notamment des ARNm dépourvus de séquence leader) ont permis d'identifier de nouveaux éléments de séquences dans l'environnement du codon AUG pouvant contribuer à l'efficacité
globale du domaine d'initiation. Des motifs riches en adénines immédiatement en aval du codon d'initiation sont favorables à l'initiation de la traduction (Scherer, G.F.E., et al., Nucleic Acids Research, 8, 3895-3907, 1980 ; Chen, H., et al., Journal of Molecular Biology, 240, 20-27, 1994b). De même, les codons AAA et GCU qui sont les plus fréquents en position de seconds codons (Gold, L., 1988) ont un effet positif sur la 2o traduction, surtout lorsque Ie codon d'initiation est sub-optimal (GUG ou UUG) (Ringquist, S., et al., 1992). Une séquence identifiée sur l'ARNm du gène 0.3 du phage T7 et nommée « Downstream Box » (DB) en raison de sa position avale par rapport au codon d'initiation est un autre élément favorisant la traduction (Sprengart, M.L., et al., Nucleic Acids Research, 18, 1719-1723, 1990). Cette séquence de 12 nucléotides possède une complémentarité avec les nucléotides 1469-1483 de l'ARNr 16S et elle est retrouvée sous des formes semblables sur des domaines d'initiation de la traduction de plusieurs gènes d'E. coli et de bactériophages fortement exprimés (Sprengart, M.L., et al., 1990). Cette « Downstream Box » permet l'initiation de la traduction même en l'absence de séquence SD (Sprengart, M.L., et al., Tlae EMBO Journal, 15, 665-674, 1996). Des résultats récents indiquent que, contrairement à l'hypothèse initialement émise, la séquence DB agirait par un mécanisme autre qu'un appariement avec Ia région
promouvoir l'expression d'un gène rapporteur (Barrick, D., et al., Nucleic.
Acids. Res., 22, 1287-1295, 1994).
ü) Le codon d'initiation C'est le codon AUG qui est utilisé préférentiellement comme codon d'initiation, même si GUG et dans une moindre mesure UUG peuvent être trouvés occasionnellement (Ringquist, S., et al., Molecular Micr°obiology, 6, 1219-1229, 1992).
iii) La distance entre la séquence SD et le codon d'initiation Une étude exhaustive de Chen H., et al. (Nucleic Acids Research, 22, 4953-4957, 1994a) a montré l'existence d'une distance optimale séparant l'extrémité 3' de la séquence Shine-Dalgarno et le codon d'initiation. En prenant la séquence consensus 5'-UAAGGAGGU-3' comme séquence SD de référence, l'espacement donnant le niveau d'expression maximal est de 5 nucléotides. Un espacement compris entre 1 et 9 nucléotides demeure favorable en assurant un niveau d'expression au moins égal à 50 du niveau maximal.
iv) Autres séquences primaires Deux appariements sont connus pour intervenir dans l'initiation de la 1o traduction : l'appariement entre codon d'initiation de I'ARNm et ARNt-fMet d'une part et l'appariement entre séquence SD et extrémité 3' de l'ARNr 16S d'autre part.
Des études de mutagénèse et l'analyse d'ARNm atypiques (notamment des ARNm dépourvus de séquence leader) ont permis d'identifier de nouveaux éléments de séquences dans l'environnement du codon AUG pouvant contribuer à l'efficacité
globale du domaine d'initiation. Des motifs riches en adénines immédiatement en aval du codon d'initiation sont favorables à l'initiation de la traduction (Scherer, G.F.E., et al., Nucleic Acids Research, 8, 3895-3907, 1980 ; Chen, H., et al., Journal of Molecular Biology, 240, 20-27, 1994b). De même, les codons AAA et GCU qui sont les plus fréquents en position de seconds codons (Gold, L., 1988) ont un effet positif sur la 2o traduction, surtout lorsque Ie codon d'initiation est sub-optimal (GUG ou UUG) (Ringquist, S., et al., 1992). Une séquence identifiée sur l'ARNm du gène 0.3 du phage T7 et nommée « Downstream Box » (DB) en raison de sa position avale par rapport au codon d'initiation est un autre élément favorisant la traduction (Sprengart, M.L., et al., Nucleic Acids Research, 18, 1719-1723, 1990). Cette séquence de 12 nucléotides possède une complémentarité avec les nucléotides 1469-1483 de l'ARNr 16S et elle est retrouvée sous des formes semblables sur des domaines d'initiation de la traduction de plusieurs gènes d'E. coli et de bactériophages fortement exprimés (Sprengart, M.L., et al., 1990). Cette « Downstream Box » permet l'initiation de la traduction même en l'absence de séquence SD (Sprengart, M.L., et al., Tlae EMBO Journal, 15, 665-674, 1996). Des résultats récents indiquent que, contrairement à l'hypothèse initialement émise, la séquence DB agirait par un mécanisme autre qu'un appariement avec Ia région
4 1469-1483 de l'ARNr 16S (O'Connor, M., et al., Proc. Natl. Acad. Sci. U.S.A., 96, 8973-8978, 1999).
v) Les structures secondaires La séquence~de l'ARNm à proximité de la région SD peut influencer l'efficacité
traductionnelle par le biais de la formation de structures secondaires. De Smit, M.H., et van Duin, J. (.Iournal of Molecular Biology, 235, 173-184, 1994) montrent que des appariements intramoléculaires sur l'ARNm peuvent nuire à une bonne traduction en entrant en compétition avec l'appariement ARNm / ARNr, et ce d'autant plus que la complémentarité de la région SD avec l'ARNr 16S est faible. De la même manière, il a l0 ëté montré que l'expression de prochymosine dans E. coli était dépendante de la composition de la région reliant SD au codon d'initiation : une séquence limitant les structures secondaires favorise l'accessibilité du RBS au ribosome et entraîne une efficacité traductionnelle forte (Wang, G., et al., Protein Expression and Purification, 6, 284-290, 1995).
Etant donné l'importance de l'étape d'initiation de la traduction sur le rendement d'expression des protéines recombinantes, de nombreuses études ont été menées dans le but d'optimiser la région RBS de vecteurs d'expression bactériens. Une approche intuitive a d'abord consisté à placer 1a région SD consensus complète (UAAGGAGGU) en amont de gènes d'intérêt (Jay, G., et al., Proc. Natl. Acad. Sci. U.S.A., 78, 5543-5548, 1981). De manière plus systématique, Marquis D.M., et al. (Gene, 42, 175-183, 1986) ont placé cette séquence en aval de différents promoteurs et à une distance variable (5 à
9 nucléotides) du codon d'initiation. Avec Ie gène de l'IL-2 comme modèle, les résultats indiquent qu'un espacement SD / AUG de 6 nucléotides est optimal pour presque tous les promoteurs testés. Dans une étude comparative entre la séquence SD
consensus et la séquence SD du gène lacZ, Mandecki, W., et al. (Gene, 43, 131-13, 1986) ont cependant noté que la séquence SD consensus donnait une expression supérieure iya vitro mais 2 à
2,5 fois plus faible que celle de lacZ in vivo. Des régions RBS entières issues de gènes de phages avec leur propre séquence SD se sont révélées elles aussi supérieures à la séquence SD consensus pour l'expression de protéines de différentes origines (plantes, cellules de mammifères, bactéries) (Olins, P.O., et al., Gene, 73, 227-235, 1988).
Utilisant le promoteur tryptophane, Curry, K. et Tomich, C.S.C. (DNA, 7, 173-179, 1988) ont comparé l'efficacité de la séquence SD consensus avec celle présente naturellement dans Ptrp. Leurs résultats indiquent une dépendance très forte vis-à-vis du gène d'intérêt étudié, pour conclure à une impossibilité de construire un vecteur optimal fonctionnant pour tous les gènes hétérologues. Travaillant eux aussi à partir du
v) Les structures secondaires La séquence~de l'ARNm à proximité de la région SD peut influencer l'efficacité
traductionnelle par le biais de la formation de structures secondaires. De Smit, M.H., et van Duin, J. (.Iournal of Molecular Biology, 235, 173-184, 1994) montrent que des appariements intramoléculaires sur l'ARNm peuvent nuire à une bonne traduction en entrant en compétition avec l'appariement ARNm / ARNr, et ce d'autant plus que la complémentarité de la région SD avec l'ARNr 16S est faible. De la même manière, il a l0 ëté montré que l'expression de prochymosine dans E. coli était dépendante de la composition de la région reliant SD au codon d'initiation : une séquence limitant les structures secondaires favorise l'accessibilité du RBS au ribosome et entraîne une efficacité traductionnelle forte (Wang, G., et al., Protein Expression and Purification, 6, 284-290, 1995).
Etant donné l'importance de l'étape d'initiation de la traduction sur le rendement d'expression des protéines recombinantes, de nombreuses études ont été menées dans le but d'optimiser la région RBS de vecteurs d'expression bactériens. Une approche intuitive a d'abord consisté à placer 1a région SD consensus complète (UAAGGAGGU) en amont de gènes d'intérêt (Jay, G., et al., Proc. Natl. Acad. Sci. U.S.A., 78, 5543-5548, 1981). De manière plus systématique, Marquis D.M., et al. (Gene, 42, 175-183, 1986) ont placé cette séquence en aval de différents promoteurs et à une distance variable (5 à
9 nucléotides) du codon d'initiation. Avec Ie gène de l'IL-2 comme modèle, les résultats indiquent qu'un espacement SD / AUG de 6 nucléotides est optimal pour presque tous les promoteurs testés. Dans une étude comparative entre la séquence SD
consensus et la séquence SD du gène lacZ, Mandecki, W., et al. (Gene, 43, 131-13, 1986) ont cependant noté que la séquence SD consensus donnait une expression supérieure iya vitro mais 2 à
2,5 fois plus faible que celle de lacZ in vivo. Des régions RBS entières issues de gènes de phages avec leur propre séquence SD se sont révélées elles aussi supérieures à la séquence SD consensus pour l'expression de protéines de différentes origines (plantes, cellules de mammifères, bactéries) (Olins, P.O., et al., Gene, 73, 227-235, 1988).
Utilisant le promoteur tryptophane, Curry, K. et Tomich, C.S.C. (DNA, 7, 173-179, 1988) ont comparé l'efficacité de la séquence SD consensus avec celle présente naturellement dans Ptrp. Leurs résultats indiquent une dépendance très forte vis-à-vis du gène d'intérêt étudié, pour conclure à une impossibilité de construire un vecteur optimal fonctionnant pour tous les gènes hétérologues. Travaillant eux aussi à partir du
5 promoteur tryptophane et de la séquence SD consensus, Olsen M.K., et al.
(Journal of Biotechnology, 9, 179-190, 1989) ont obtenu des niveaux d'expression très élevés (20 à
30 % des protéines totales) pour différentes protéines hétérologues (hormones de croissance, TNF) en enrichissant les séquences flanquantes de la région SD en nucléotides A et T. Des résultats similaires avaient été décrits auparavant par De Boer 1o H.A., et al. (DNA, 2, 231-235, 1983) qui notaient l'effet positif des bases A et T placées en aval de la région SD dans le contexte du promoteur hybride Ptrp / PIacUVS
exprimant l'interféron a.
Tous ces résultats ont été obtenus dans le cadre d'expériences où un nombre limité de paramètres étaient pris en compte. Conscients du nombre important des facteurs, connus ou non, influents dans l'initiation de la traduction, et surtout du rôle a priori non négligeable des interactions entre facteurs qui ne sont pas prises en compte lors d'approches itératives, des auteurs ont par la suite essayé de sélectionner in vivo des RBS synthétiques optimaux à partir de librairies aléatoires de grande taille.
Wilson B.S., et al. (BioTechniques, 17, 944-952, 1994) ont ainsi criblé un répertoire de séquences 2o dégénérées sur 16 positions en amont du codon d'initiation, au sein d'une cassette d'expression contenant le gène de la (3-lactamase sous le contrôle du promoteur/opérateur lac. Une telle approche a permis d'identifier des séquences originales exprimant la (3-lactamase avec une efficacité 3 fois supérieure.
Avec un autre gène codant pour un scFv, le niveau de surexpression par rapport au RBS
d'origine est d'environ 2 fois.
Il est établi au vu de ces résultats que des régions RBS décrites comme optimales le sont toujours dans un contexte particulier où interviennent à la fois la séquence du gène d'intérêt et la séquence de la région leader de l'ARNm qui dépend elle-même du type de promoteur utilisé. Le promoteur tryptophane (Nichols, B.P. et Yanofsky, C.
Methods in Enzynaology, 101, 155-164, 1983) est un des systèmes majeurs utilisés en expression de protéines recombinantes (Yansura, D.G. and Henner, D.J., Methods in
(Journal of Biotechnology, 9, 179-190, 1989) ont obtenu des niveaux d'expression très élevés (20 à
30 % des protéines totales) pour différentes protéines hétérologues (hormones de croissance, TNF) en enrichissant les séquences flanquantes de la région SD en nucléotides A et T. Des résultats similaires avaient été décrits auparavant par De Boer 1o H.A., et al. (DNA, 2, 231-235, 1983) qui notaient l'effet positif des bases A et T placées en aval de la région SD dans le contexte du promoteur hybride Ptrp / PIacUVS
exprimant l'interféron a.
Tous ces résultats ont été obtenus dans le cadre d'expériences où un nombre limité de paramètres étaient pris en compte. Conscients du nombre important des facteurs, connus ou non, influents dans l'initiation de la traduction, et surtout du rôle a priori non négligeable des interactions entre facteurs qui ne sont pas prises en compte lors d'approches itératives, des auteurs ont par la suite essayé de sélectionner in vivo des RBS synthétiques optimaux à partir de librairies aléatoires de grande taille.
Wilson B.S., et al. (BioTechniques, 17, 944-952, 1994) ont ainsi criblé un répertoire de séquences 2o dégénérées sur 16 positions en amont du codon d'initiation, au sein d'une cassette d'expression contenant le gène de la (3-lactamase sous le contrôle du promoteur/opérateur lac. Une telle approche a permis d'identifier des séquences originales exprimant la (3-lactamase avec une efficacité 3 fois supérieure.
Avec un autre gène codant pour un scFv, le niveau de surexpression par rapport au RBS
d'origine est d'environ 2 fois.
Il est établi au vu de ces résultats que des régions RBS décrites comme optimales le sont toujours dans un contexte particulier où interviennent à la fois la séquence du gène d'intérêt et la séquence de la région leader de l'ARNm qui dépend elle-même du type de promoteur utilisé. Le promoteur tryptophane (Nichols, B.P. et Yanofsky, C.
Methods in Enzynaology, 101, 155-164, 1983) est un des systèmes majeurs utilisés en expression de protéines recombinantes (Yansura, D.G. and Henner, D.J., Methods in
6 Enzymology (Anonymous Academic Press, Inc., San Diego, CA.) 54-60, 1990 ;
Yansura, D.G. and Bass, S.H. Methods ira Molecular Biology, 62, 55-62, 1997) mais son RBS n'a jamais fait l'objet d'une optimisation systématique par une approche basée sur le criblage de séquences aléatoires.
L'intérêt du biotechnologiste désireux de développer des procédés à échelle industrielle est de disposer d'outils garantissant une expression maximale, quelle que soit la protéine d'intérêt. Il existe dès lors un fort intérêt pour toute amélioration permettant d'optimiser l'expression de protéines recombinantes, que les améliorations soient apportées par la souche hôte, par le vecteur d'expression, par le procédé de 1o culture et d'expression ou par toute combinaison entre ces facteurs.
Plus particulièrement, la présente invention démontre l'avantage en termes d'efficacité traductionnelle de nouvelles séquences nucléotidiques portëes par un vecteur d'expression, dans la région du « Ribosome Binding Site » (RBS), en aval du promoteur tryptophane (Ptrp).
Par l'utilisation d'oligonucléotides dégénérés introduits en amont du codon d'initiation puis par sélection de clones surexprimant le gène rapporteur de la chloramphénicol acétyl-transférase (CAT), la demanderesse a recherché de nouvelles séquences RBS optimisées. En recherchant des séquences optimisées en amont du codon d'initiation, il a été découvert de manière tout à fait surprenante que la séquence nucléique située directement en aval du codon d'initiation pouvait être mutée ou délétée de façon à surexprimer des protéines recombinantes. Les séquences ainsi obtenues présentent un caractère d'amélioration vis-à-vis de l'expression de différents gènes d'intérêt de diverses origines.
De plus, un problème actuel majeur au regard des contraintes actuelles de qualité
est d'obtenir une protéine recombinante la plus pure possible, c'est-à-dire avec un minimum d'acides aminés greffés en amont ou en aval de la protéine recombinante, acides aminés provenant de la construction utilisée. Lorsque la séquence nucléique située entre le codon d'initiation et le premier site de clonage présente des délétions de façon à surexprimer des protéines recombinantes, ce problème est aussi résolu par la 3o présente invention.
Yansura, D.G. and Bass, S.H. Methods ira Molecular Biology, 62, 55-62, 1997) mais son RBS n'a jamais fait l'objet d'une optimisation systématique par une approche basée sur le criblage de séquences aléatoires.
L'intérêt du biotechnologiste désireux de développer des procédés à échelle industrielle est de disposer d'outils garantissant une expression maximale, quelle que soit la protéine d'intérêt. Il existe dès lors un fort intérêt pour toute amélioration permettant d'optimiser l'expression de protéines recombinantes, que les améliorations soient apportées par la souche hôte, par le vecteur d'expression, par le procédé de 1o culture et d'expression ou par toute combinaison entre ces facteurs.
Plus particulièrement, la présente invention démontre l'avantage en termes d'efficacité traductionnelle de nouvelles séquences nucléotidiques portëes par un vecteur d'expression, dans la région du « Ribosome Binding Site » (RBS), en aval du promoteur tryptophane (Ptrp).
Par l'utilisation d'oligonucléotides dégénérés introduits en amont du codon d'initiation puis par sélection de clones surexprimant le gène rapporteur de la chloramphénicol acétyl-transférase (CAT), la demanderesse a recherché de nouvelles séquences RBS optimisées. En recherchant des séquences optimisées en amont du codon d'initiation, il a été découvert de manière tout à fait surprenante que la séquence nucléique située directement en aval du codon d'initiation pouvait être mutée ou délétée de façon à surexprimer des protéines recombinantes. Les séquences ainsi obtenues présentent un caractère d'amélioration vis-à-vis de l'expression de différents gènes d'intérêt de diverses origines.
De plus, un problème actuel majeur au regard des contraintes actuelles de qualité
est d'obtenir une protéine recombinante la plus pure possible, c'est-à-dire avec un minimum d'acides aminés greffés en amont ou en aval de la protéine recombinante, acides aminés provenant de la construction utilisée. Lorsque la séquence nucléique située entre le codon d'initiation et le premier site de clonage présente des délétions de façon à surexprimer des protéines recombinantes, ce problème est aussi résolu par la 3o présente invention.
7 La présente invention a ainsi pour objet une construction pour (expression d'un gène codant pour une protéine recombinante d'intérêt placé sous le contrôle du promoteur de fopéron tryptophane Ptrp dans une cellule hôte procaryote comprenant directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID
N° 1, et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID N° 1 est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.
Il est d'autant plus surprenant d'obtenir une surexpression grâce à (objet de 1o (invention, alors que l'art antérieur enseigne d'utiliser cette séquence SEQ ID N° 1 telle qu'elle. On peut notamment citer à cet effet les brevets US 5,714,589, US
5,468,845, US
5,418,135, US 4,891,310, US 4,789,702, WO 88/09344, US 4,738,921 et EP 0 212 qui enseignent l'utilisation de la séquence SEQ ID N° 1 en aval du codon d'initiation pour (expression de protéines d'intérêt.
Par protéine recombinante d'intérêt, on entend désigner toutes protéines, polypeptides ou peptides obtenus par recombinaison génétique, et susceptibles d'être utilisés dans des domaines tels que celui de la santé humaine ou animale, de la cosmétologie, de la nutrition animale, de fagro-industrie ou de (industrie chimique.
Parmi ces protéines d'intérêt, on peut citer en particulier, mais sans s'y limiter - une cytokine et notamment une interleukine, un interféron, un facteur de nécrose tissulaire et un facteur de croissance et notamment hématopoïétique (G-CSF, GM-CSF), une hormone de croissance humaine ou (insuline, un neuropeptide ;
- un facteur ou cofacteur impliqué dans la coagulation et notamment le facteur VIII, le facteur von Willebrand, fantithrombine III, la protéine C, la thrombine et fhirudine ;
- une enzyme et notamment la trypsine, une ribonucléase et la (3-galactosidase ;
un inhibiteur d'enzyme tel que (a,1 antitrypsine et les inhibiteurs de protéases virales ;
- une protéine capable d'inhiber l'initiation ou la progression de cancers, telle que les produits d'expression de gènes supresseurs de tumeurs, par exemple le gène P53 ;
- une protéine capable de stimuler une réponse immunitaire ou un antigène, telle que par exemple les protéines, ou leurs fragments actifs, de la membrane de bactérie
N° 1, et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID N° 1 est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.
Il est d'autant plus surprenant d'obtenir une surexpression grâce à (objet de 1o (invention, alors que l'art antérieur enseigne d'utiliser cette séquence SEQ ID N° 1 telle qu'elle. On peut notamment citer à cet effet les brevets US 5,714,589, US
5,468,845, US
5,418,135, US 4,891,310, US 4,789,702, WO 88/09344, US 4,738,921 et EP 0 212 qui enseignent l'utilisation de la séquence SEQ ID N° 1 en aval du codon d'initiation pour (expression de protéines d'intérêt.
Par protéine recombinante d'intérêt, on entend désigner toutes protéines, polypeptides ou peptides obtenus par recombinaison génétique, et susceptibles d'être utilisés dans des domaines tels que celui de la santé humaine ou animale, de la cosmétologie, de la nutrition animale, de fagro-industrie ou de (industrie chimique.
Parmi ces protéines d'intérêt, on peut citer en particulier, mais sans s'y limiter - une cytokine et notamment une interleukine, un interféron, un facteur de nécrose tissulaire et un facteur de croissance et notamment hématopoïétique (G-CSF, GM-CSF), une hormone de croissance humaine ou (insuline, un neuropeptide ;
- un facteur ou cofacteur impliqué dans la coagulation et notamment le facteur VIII, le facteur von Willebrand, fantithrombine III, la protéine C, la thrombine et fhirudine ;
- une enzyme et notamment la trypsine, une ribonucléase et la (3-galactosidase ;
un inhibiteur d'enzyme tel que (a,1 antitrypsine et les inhibiteurs de protéases virales ;
- une protéine capable d'inhiber l'initiation ou la progression de cancers, telle que les produits d'expression de gènes supresseurs de tumeurs, par exemple le gène P53 ;
- une protéine capable de stimuler une réponse immunitaire ou un antigène, telle que par exemple les protéines, ou leurs fragments actifs, de la membrane de bactérie
8 Gram négatif, en particulier les protéines OmpA de I~lebsellia ou la protéine G du virus respiratoire syncytial humain ;
- un anticorps monoclonal humanisé ou non ou un fragment d'anticorps tel qu'un scFv ;
- une protéine capable d'inhiber une infection virale ou son développement, par exemple les épitoges antigéniques du virus en cause ou des variants altérés de protéines virales susceptibles d'entrer en compétition avec les protéines virales natives ;
- une protéine susceptible d'être contenue dans une composition cosmétique telle que la substance P ou une superoxyde dismutase ;
l0 - une protéine alimentaire et notamment un alicament ;
- une enzyme capable de diriger la synthèse de composés chimiques ou biologiques, ou capable de dégrader certains composés chimiques toxiques ; ou encore - toute protéine ayant une toxicité vis-à-vis du micro-organisme qui la produit, en particulier si ce micro-organisme est la bactérie E. coli, comme par exemple la protéase du virus VIH-1, la protéine ECP "Eosinophil Cationic Protein" ou les protéines 2B et 3A du poliovirus.
Par séquence nucléique de séquence SEQ ID N° 1 dont au moins un des acides nucléiques est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante, on entend toute séquence qui comporte une délétion ou une mutation d'au moins un nucléotide de la séquence SEQ ID N° 1 qui permet une surexpression de la protéine recombinante, par rapport à l'expression de ladite protéine recombinante obtenue en utilisant la séquence SEQ ID N° 1 non modifiée.
Par délétion, on entend l'élimination d'un ou plusieurs nucléotides à un ou différents sites nucléotidiques de la séquence SEQ ID N° 1. La séquence résultante se trouve raccourcie par rapport à celle d'origine.
Par mutation, on entend le remplacement d'un nucléotide par un autre (A par C, G ou T ; C par A, G ou T ; G par A, C ou T ; T par A, C ou G). La séquence résultante a la même taille que celle d'origine.
La surexpression, c'est-à-dire le fait d'obtenir une expression supérieure à
celle obtenue sans la modification en aval du codon d'initiation peut être déterminée notamment en utilisant une des méthodes suivantes
- un anticorps monoclonal humanisé ou non ou un fragment d'anticorps tel qu'un scFv ;
- une protéine capable d'inhiber une infection virale ou son développement, par exemple les épitoges antigéniques du virus en cause ou des variants altérés de protéines virales susceptibles d'entrer en compétition avec les protéines virales natives ;
- une protéine susceptible d'être contenue dans une composition cosmétique telle que la substance P ou une superoxyde dismutase ;
l0 - une protéine alimentaire et notamment un alicament ;
- une enzyme capable de diriger la synthèse de composés chimiques ou biologiques, ou capable de dégrader certains composés chimiques toxiques ; ou encore - toute protéine ayant une toxicité vis-à-vis du micro-organisme qui la produit, en particulier si ce micro-organisme est la bactérie E. coli, comme par exemple la protéase du virus VIH-1, la protéine ECP "Eosinophil Cationic Protein" ou les protéines 2B et 3A du poliovirus.
Par séquence nucléique de séquence SEQ ID N° 1 dont au moins un des acides nucléiques est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante, on entend toute séquence qui comporte une délétion ou une mutation d'au moins un nucléotide de la séquence SEQ ID N° 1 qui permet une surexpression de la protéine recombinante, par rapport à l'expression de ladite protéine recombinante obtenue en utilisant la séquence SEQ ID N° 1 non modifiée.
Par délétion, on entend l'élimination d'un ou plusieurs nucléotides à un ou différents sites nucléotidiques de la séquence SEQ ID N° 1. La séquence résultante se trouve raccourcie par rapport à celle d'origine.
Par mutation, on entend le remplacement d'un nucléotide par un autre (A par C, G ou T ; C par A, G ou T ; G par A, C ou T ; T par A, C ou G). La séquence résultante a la même taille que celle d'origine.
La surexpression, c'est-à-dire le fait d'obtenir une expression supérieure à
celle obtenue sans la modification en aval du codon d'initiation peut être déterminée notamment en utilisant une des méthodes suivantes
9 i) migration par SDS-PAGE des protéines totales de la bactérie et révélation de la protéine recombinante par coloration au Bleu de Comassie ou par Western-blot ;
ü) dosage de la protéine recombinante par une méthode mettant en jeu un anticorps spécifique (Elisa) ;
iii) dosage enzymatique si la protéine recombinante est dotée d'une activité
catalytique.
Préférentiellement, on utilise la méthode ü), détaillée dans (exemple III.
Par cassette de clonage multiple, on entend une séquence nucléotidique contenant un ou plusieurs sites de restriction, lesquels sites peuvent être utilisés lors d'étapes de clonage du gène d'intérêt en aval du codon d'initiation.
1o Préférentiellement, ledit au moins nucléotide de la séquence SEQ ID
N° 1 est délété de façon à permettre une surexpression de ladite protéine recombinante.
L'invention concerne également une construction selon l'invention dans laquelle ledit au moins nucléotide muté ou délété, préférentiellement délété, est situé
sur le fragment de séquence SEQ ID N° 2 de la séquence SEQ ID N° 1.
Un autre objet de (invention concerne les constructions dans lesquelles ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GTA
et/ou sur le codon GCA et/ou sur le codon CTG de la séquence SEQ ID N°
1.
Dans un mode de réalisation préféré de (invention, ladite séquence SEQ ID
N° 1 dont au moins un des nucléotides est muté ou délété, présente au moins en position 1, 2 2o et 3, le nucléotide A.
Dans un mode de réalisation préféré de (invention, au moins un des nucléotides, et préférentiellement tous les nucléotides, situés entre la séquence nucléique de séquence SEQ ID N° 1 et la cassette de clonage multiple destinée à
recevoir le gène codant pour ladite protéine recornbinante d'intérêt, sont délétés.
Dans un autre mode de réalisation encore plus préféré de l'invention, ladite séquence SEQ ID N° 1 dont au moins un des acides nucléiques est muté ou délété et tous les nucléotides situés entre la séquence nucléique de séquence SEQ ID
N° 1 et la cassette de clonage multiple sont totalement délétës, de façon à ce que le codon d'initiation se trouve directement en amont de la cassette de clonage multiple.
3o Dans une forme de réalisation préférée de (invention, les constructions contiennent une séquence nucléique directement en amont du codon d'initiation choisie parmi les séquences de séquence SEQ ID N° 3, SEQ ID N° 4, SEQ ID
N° 5, SEQ ID
N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9 et SEQ ID N° 10.
L'invention comprend une construction selon (invention, caractérisée en ce que la cellule hôte procaryote est une bactérie gram négative, de préférence appartenant à
5 l'espèce E. coli.
Un autre objet de l'invention concerne un vecteur contenant une construction telle que définie ci-avant, tout comme une cellule hôte procaryote, de préférence appartenant à (espèce E. coli, transformée par un tel vecteur.
La présente invention a aussi pour objet un procédé de production d'une protéine 1o recombinante d'intérêt dans une cellule hôte utilisant une construction telle que définie ci-avant.
La présente invention a encore pour objet un procédé de production d'une protéine recombinante d'intérêt selon l'invention, dans lequel ladite construction est introduite dans une cellule hôte procaryote, préférentiellement par un vecteur tel que défini ci-avant.
On préfère un procédé de production d'une protéine recombinante d'intérêt selon (invention, caractérisé en ce qu'il comprend les étapes suivantes a) le clonage d'un gène d'intérêt dans un vecteur selon (invention ;
b) la transformation d'une cellule procaryote par un vecteur contenant un gène codant 2o pour ladite protéine recombinante d'intérêt ;
c) la culture de ladite cellule transformée dans un milieu de culture permettant (expression de la protéine recombinante ; et d) la récupération de la protéine recombinante à partir du milieu de culture ou de ladite cellule transformée.
L'invention comprend en outre une utilisation d'une construction, d'un vecteur ou d'une cellule hôte procaryote selon la présente invention, pour la production d'une protéine recombinante.
Enfin, (invention concerne une utilisation d'une protéine recombinante pour la préparation d'un médicament destiné à être administré à un patient nécessitant un tel traitement, caractérisée en ce que ladite protéine recombinante est produite par un procédé de production d'une protéine recombinante d'intérêt selon l'invention.
Les exemples et figures qui suivent sont destinés à illustrer (invention sans aucunement en limiter la portée.
Légende des figures et des tableaux Figure 1 : Carte du vecteur plasmidique pTEXmpl8 et séquence SEQ ID N°
39 de la région 1-450 comprenant le promoteur/opérateur Ptrp, la région du leader TrpL;
le site de clonage multiple mp 18 et Ie terminateur de transcription.
Figure 2 : Carte de restriction de la région du RBS (Ribosome Binding Site) sur le vecteur pTEXmpl8 (SEQ ID N° 40).
1o Figure 3 : Estimation sur gel SDS-PAGE de l'expression de CAT dans des bactéries transformées par les vecteurs pTEXCAT ou pTEXCAT4.
Fi-u~re-4 : Etude comparative de l'expression de la (3-galactosidase à partir des vecteurs pTEX-(3GAL et pTEX4-(3GAL (cinétiques en fermenteur).
Exemple I .
Cet exemple illustre un des aspects ayant conduit à l'invention, et notamment la manière dont est construite la librairie de vecteurs plasmidiques porteurs du promoteur tryptophane Ptrp et mutés de manière aléatoire en amont du codon d'initiation.
Le vecteur d'origine est décrit en figure 1. Il s'agit d'un plasmide dérivé de pBR322 (Bolivar, F., et al., Gene, 2, 95-113, 1977) dans lequel a été cloné le promoteur/opérateur Ptrp (1-298), suivi de la séquence codant pour les 7 premiers acides aminés du leader TrpL d'E. coli (Yanofsky, C., et al., Nucleic Acids Research, 9, 6647-6668, 1981), d'un site de clonage multiple et du terminateur de transcription trpt d'E. coli (Yanofsky, C., et al., 1981). La partie 3' de Ptrp dans pTEXmpl8 diffère de la séquence naturelle par la présence d'un site de clonage XbaI en amont du codon d'initiation ATG (voir figure 2) et par un espacement plus grand entre SD et codon d' initiation.
Pour permettre la sélection de vecteurs modifiés dans leur partie RBS, le gène rapporteur de la chloramphénicol acétyl-transférase (CAT) est cloné aux sites EcoRI et PstI de pTEXmpl8. Pour cela, la séquence codante du gène cat est amplifiée par PCR à
l'aide des oligonucléotides CATfor et CATrev dont les séquences sont CATfor : 5'-CCGGAATTCATGGAGAAAAAAATCACTGG-3' (SEQ ID N° 11) EcoRI
CATrev : 5'-AAACTGCAGTTACGCCCCGCCCTG-3' (SEQ ID N° 12) PstI
La réaction de PCR est effectuée en utilisant comme matrice le phagemide pBC-SK (Stratagene, La Jolla, CA, USA). Le produit d'amplification est déposé sur gel d'agarose et purifié selon la méthode GeneClean (Bio101, La Jolla, CA). Le clonage de l'insert dans pTEXmpl8 est vérifié après transformation dans E. coli par l'apparition de colonies se développant sur boîtes de milieu LB agar (Sambrook J., et al., Molecular cloning. A laboratory manual, 2"d edition. Plainview, NY: Cold Spring Harbor Laboratory Press, 1989) en présence de 30 ~.g/ml de chloramphénicol. La séquence de l'insert est confirmée par séquençage automatique à l'aide du kit « Dye Terminator » et du séquenceur d'ADN 373A (Perkin Elmer Applied Biosystems, Foster City, CA).
Le vecteur obtenu est nommé pTEXCAT.
L'insertion de RBS ayant une séquence dégénérée en amont du codon d'initiation est effectuée par ligation d'oligonucléotides de synthèse aux sites SpeI et EcoRI du vecteur pTEXCAT. La région allant du site SpeI au site EcoRI
respectivement en positions - 49 et + 28 (voir figure 2) est délétée par digestion enzymatique et remplacée par un hétéroduplex formé par deux oligonucléotides de synthèse 2o partiellement dégénérés, hybridés entre eux. Deux couples d'oligonucléotides sont utilisés, mettant en jeu respectivement les oligonucléotides RanSDl/RanSD2 et RanSD3/RanSD4 dont les séquences sont RanSD 1 5'CTAGTTAACTAGTACGCAAGTTCACGTAAANNNN~ ATG
AAAGCAATTTTCGTACTGAATGCGG-3' (SEQ ID N° 13) RanSD2 5'AATTCCGCATTCAGTACGAAAATTGCTTTCA TT
TACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 14) RanSD3 5'CTAGTTAACTAGTACGCAAGTTCACGTAAATRRRRRRRNNNNNNATGAAA
GCAATTTTCGTACTGAATGCGG-3' (SEQ ID N° 15) RanSD4 5'AATTCCGCATTCAGTACGAAAATTGCTTTCA YYATTTA
CGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 16).
Les quatre oligonucléotides ont été synthétisés par MWG Biotech (Ebersberg, D) dans des conditions assurant une répartition équimolaire des bases pour chaque dégénérescence. Le couple RanSD 1 / RanSD2 apporte une dégénérescence complète (N
= mélange des 4 nucléotides A, C, T, G) sur les 16 nucléotides précédant le codon ATG.
Le nombre de combinaisons (416 soit environ 4,3 109) autorise le criblage de RBS qui soient optimisés tant du point de vue de leur séquence Shine-Dalgarno (SD), de la 1o séquence située entre la région SD et le codon d'initiation ainsi que dans l'espacement SD-ATG. Cette librairie sera nommée (N16) dans la suite du texte. Le couple RanSD3 /
RanSD4 apporte une dégénérescence complète sur 6 nucléotides précédant l'ATG
et une dégénérescence partielle sur les 7 nucléotides en amont. L'utilisation exclusive des purines (R = A ou G) sur le brin positif et de pyrimidines sur le brin complémentaire (Y
= C ou T) favorise la représentation de séquences de type Shine-Dalgarno à une distance optimale (6 nucléotides) du codon ATG. Cette seconde librairie est nommée (R~N6).
La linéarisation du vecteur pTEXCAT et sa purification sur gel, l'hybridation des oligonucléotides par paires, la ligation des hétéroduplex au vecteur pTEXCAT
linéarisé et la transformation dans E. coli de la librairie ainsi constituée sont réalisées selon les conditions décrites par Sambrook J., et al. (1989). Classiquement, 100 finol de vecteur et 1000 finol d'insert sont engagés dans une réaction de ligation en présence de T4 ligase dans un volume final de 15 p,1. La réaction est conduite pendant une nuit à
16°C. Des bactéries TOP10 électrocompétentes (50 ~,1) sont ensuite transformées par électroporation avec 3 ~.1 du mélange de ligation dans les conditions recommandées par le fournisseur (Invitrogen, Carlsbad, CA). Le mélange de transformation est étalé sur boîtes de LB agar contenant 200 ~,g/ml d'ampicilline, donnant lieu après 16 heures d'incubation à 37°C à l'apparition de colonies transformées.
Exemple II
Le criblage des librairies est effectué en partant de l'hypothèse que les clones surexprimant l'enzyme CAT auront une résistance accrue au chloramphénicol.
Ceci est validé par l'expérience dont les résultats sont présentés dans le tableau 1 ci-dessous.
Tableau 1. Résistance au chloramphénicol de bactéries TOP 10 x pTEXCAT en présence ou absence d'IAA.
Concentration en chloramphnicol (~,g /
ml) IAA = 0 85 91 74 73 47 0 0 0 +++ +++ ++ + +/- _ _ _ IAA = 25 ~ug/ml75 65 76 53 71 1 0 0 +++ -H-+ +++ ++ + +/- - -Les chiffres (rangée supérieure) indiquent le nombre de colonies comptées après 18 h d'incubation à 37°C, chaque milieu ayant été ensemencé avec environ 100 cellules.
L'index de la rangée inférieure est un critère qualitatif de croissance des colonies (- = absence de croissance à +++ = croissance maximale).
1o Ces résultats montrent que des bactéries E. coli TOP10 (Invitrogen, Carlsbad, CA) transformées par le vecteur pTEXCAT et étalées sur boîtes contenant différentes concentrations de chloramphénicol ont, entre 300 et 600 ~.g/ml de chloramphénicol, un développement plus fort en présence d'acide 3-~3 indole acrylique (IAA), un analogue du tryptophane agissant comme inducteur par un effet de dérépression de Ptrp (Marmorstein, R.Q. et Sigler, P.B., The Journal of Biological Chemistry, 264, 9154, 1989). Ceci laisse supposer que des clones surproducteurs de CAT du fait d'une région RBS optimisée pourront soit se développer plus rapidement que la population sauvage à une concentration en chloramphénicol inférieure à la CMI
(concentration minimale inhibitrice), soit se développer en présence de concentrations en 2o chloramphénicol létales pour la population sauvage.
Exemple III
Cet exemple illustre la sélection de clones parmi les librairies construites selon la description de l'exemple 1. Les librairies obtenues sous forme de tapis de colonies sur boîtes de LB agar + ampicilline sont reprises dans de l'eau stérile de manière à
reconstituer une suspension dont la Densité Optique (DO) à 580 nm est voisine de 1.
Conformément aux résultats de l'exemple 2, cette suspension est étalée sur boîtes de LB
agar contenant des doses létales de chloramphénicol (600, 700, 800 et 900 ~.g/ml) à
raison de 100 ~,1 de suspension par boîte de Petri. Les boîtes sont mises en incubation à
5 37°C et l'on observe l'apparition de colonies résistantes en vérifiant dans le même temps que des boîtes ensemencées à partir d'une suspension de bactéries TOP 10 transformées par le vecteur sauvage pTEXCAT ne donnent lieu à aucune croissance.
Les colonies résistantes sont isolées et repiquées plusieurs fois sur le milieu de sélection pour confirmer leur phénotype de résistance. Les clones retenus à cette étape sont l0 ensuite soumis à une série d'analyses : (i) extraction du plasmide (kit Qiagen, Hilden, D) et séquençage de la région recouvrant le RBS, (ü) culture en Erlenmeyers avec induction par l'IAA puis estimation du niveau d'expression de CAT par dosage ELISA, (iii) électrophorèse par SDS-PAGE des protéines totales extraites des cultures précédentes et coloration au bleu de Coomassie permettant de visualiser les protéines 15 totales intracellulaires. Le séquençage des clones est réalisé à l'aide du kit Dye Terminator sur séquenceur ABI 373A (Perkin Elmer Applied Biosystems, Foster City, CA). Les cultures en erlens sont réalisées en ensemençant 25 ml de milieu TSBY
(Tryptic Soy Broth (DIFCO) 30 g/1 + Yeast Extract (Difco) 5 g/1) +
tetracycline 8 mg/1 par une colonie sur boîte ou par une suspension bactérienne conservée à - 80 °C. Chaque 2o préculture est mise en incubation sur un plateau agité à 200 rpm et 37°C pendant une nuit. Une fraction est transférée dans 50 ml du même milieu de manière à
atteindre une densité optique initiale égale à 1. Pour l'induction de la protéine CAT, le milieu est additionné par 25 mg/1 d'IAA puis placé en agitation dans les mêmes conditions pendant 5 heures. Une fraction de la suspension (3 x 1 ml dilués à DO = 0,1) est centrifugée et les cellules conservées à - 20°C pour le dosage de la CAT par ELISA (kit CAT ELISA, Roche Diagnostics, Bâle, CH). Le reste de la biomasse est récupéré
par centrifugation à 10000 g, 4°C pendant 15 minutes. La biomasse est reprise dans un tampon TEL (Tris 25 mM, EDTA 1 mM, Lysozyme 500 ~.g/ml, pH 8) à raison de 5 ml pour 1 g de biomasse humide. Les cellules sont lysées par sonication (sonicateur VibraCell muni d'une micro-sonde, Sonics & Materials, Danbury, CT). Un ml de la suspension résultante est centrifugé 5 min à 12 000 rpm. Le culot est repris par 200 ~1 de TEL pour donner la fraction insoluble (I). Le surnageant est noté « S ».
Les protéines totales contenues dans les fractions I et S sont analysées par électrophorèse en conditions dénaturantes (SDS-PAGE) et coloration au bleu de Coomassie.
Le tableau 2 ci-après indique les différentes séquences RBS obtenues après criblage des deux librairies (N16) et (R~N6). A la suite de l'alignement dans les bases de données nucléotidiques GenBank et EMBL, nous pouvons conclure qu'aucune des séquences de 16 nucléotides (stratégie (N16)) ou de 13 nucléotides (stratégie (R~N6)) situées immédiatement en amont du codon AUG dans les différents clones isolés n'a été
décrite à ce jour.
Tableau 2. Nouvelles séquences RBS isolées par l'une des stratégies (N16) ou (R~N6).
CLONE STRATGIE RGION SD - PEPTIDE L (*) PTEXCAT -SEQ ID AAGGGUAUCUAGAAUUAUGAAAGCAAUUUUCGUACUGAAUGCGGAAUUC
SEQ ID M K A I F V L N A E F
NZO
PTEXCAT4 (N16) SEQ ID GGGCCGGUUUCUUAUUAUGAAAGCAAUUUUCGUACCGAAUGCGGAAUUC
SEQ ID M K A I F V P N A E F
pTEXCATl' (R7N6) SEQ ID UGGGAGGGUCAAUUAUGAAACCAAUUUUCGUACUGAAUGCGGAAUUC
SEQ ID M K P I F V L N A E F
pTEXCAT2' (R~N6) SEQ ID UAAAGGAACCAUAUAUGAAA***************AAUGCGGAAUUC
SEQ ID M K * * * * * N A E F
pTEXCAT3' (R~N6) SEQ ID UAGGAAAGAUAACGAUGAAAGCAAUUUUCGCACUGAAUGCGGAAUUC
SEQ ID M K A I F A L N A E F
pTEXCATS' (R~N6) SEQ ID UGAGGAGAAGACAGAUGAAAGCAAU*********GAAUGCGGAAUUC
SEQ ID M K A M * * * N A E F
pTEXCAT9' (R~N6) SEQ ID UGAGGAGAGUAAUCAUGAAAGCA***************GCGGAAUUC
SEQ ID M K A * * * * * A E F
(*) Chaque séquence nucléotidique (ARN messager) comprend Ia région mutée en aval du codon d'initiation. La séquence de référence du vecteur pTEXCAT figure en première ligne du tableau. Les séquences nucléiques en amont et en aval du codon d'initiation des vecteurs sont représentées dans ce tableau après transcription sous forme d'ARN. A l'extrémité 3' de ces séquences, seuls les deux premiers codons du site de clonage multiple sont représentés, à savoir GAAUUC.
C'est ainsi qu'il a été observé de manière tout à fait surprenante que les clones décrits dans le tableau 2 possèdent des mutations dans la région du RBS située immédiatement en aval du codon AUG. Les clones pTEXCAT4, pTEXCATl' et pTEXCAT3' sont porteurs d'une mutation ponctuelle affectant un acide aminé de la partie N-terminale de la protéine codée (respectivement Leu7Pro, Ala3Pro et Val6Ala).
Les autres clones sont porteurs de réarrangements plus importants : pTEXCAT2', pTEXCATS' et pTEXCAT9' ont des délétions induisant respectivement la perte des régions Ala3Leu7, Ile4Leu7 et Ile4Asn8. Etant donné que l'analyse au hasard de
ü) dosage de la protéine recombinante par une méthode mettant en jeu un anticorps spécifique (Elisa) ;
iii) dosage enzymatique si la protéine recombinante est dotée d'une activité
catalytique.
Préférentiellement, on utilise la méthode ü), détaillée dans (exemple III.
Par cassette de clonage multiple, on entend une séquence nucléotidique contenant un ou plusieurs sites de restriction, lesquels sites peuvent être utilisés lors d'étapes de clonage du gène d'intérêt en aval du codon d'initiation.
1o Préférentiellement, ledit au moins nucléotide de la séquence SEQ ID
N° 1 est délété de façon à permettre une surexpression de ladite protéine recombinante.
L'invention concerne également une construction selon l'invention dans laquelle ledit au moins nucléotide muté ou délété, préférentiellement délété, est situé
sur le fragment de séquence SEQ ID N° 2 de la séquence SEQ ID N° 1.
Un autre objet de (invention concerne les constructions dans lesquelles ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GTA
et/ou sur le codon GCA et/ou sur le codon CTG de la séquence SEQ ID N°
1.
Dans un mode de réalisation préféré de (invention, ladite séquence SEQ ID
N° 1 dont au moins un des nucléotides est muté ou délété, présente au moins en position 1, 2 2o et 3, le nucléotide A.
Dans un mode de réalisation préféré de (invention, au moins un des nucléotides, et préférentiellement tous les nucléotides, situés entre la séquence nucléique de séquence SEQ ID N° 1 et la cassette de clonage multiple destinée à
recevoir le gène codant pour ladite protéine recornbinante d'intérêt, sont délétés.
Dans un autre mode de réalisation encore plus préféré de l'invention, ladite séquence SEQ ID N° 1 dont au moins un des acides nucléiques est muté ou délété et tous les nucléotides situés entre la séquence nucléique de séquence SEQ ID
N° 1 et la cassette de clonage multiple sont totalement délétës, de façon à ce que le codon d'initiation se trouve directement en amont de la cassette de clonage multiple.
3o Dans une forme de réalisation préférée de (invention, les constructions contiennent une séquence nucléique directement en amont du codon d'initiation choisie parmi les séquences de séquence SEQ ID N° 3, SEQ ID N° 4, SEQ ID
N° 5, SEQ ID
N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9 et SEQ ID N° 10.
L'invention comprend une construction selon (invention, caractérisée en ce que la cellule hôte procaryote est une bactérie gram négative, de préférence appartenant à
5 l'espèce E. coli.
Un autre objet de l'invention concerne un vecteur contenant une construction telle que définie ci-avant, tout comme une cellule hôte procaryote, de préférence appartenant à (espèce E. coli, transformée par un tel vecteur.
La présente invention a aussi pour objet un procédé de production d'une protéine 1o recombinante d'intérêt dans une cellule hôte utilisant une construction telle que définie ci-avant.
La présente invention a encore pour objet un procédé de production d'une protéine recombinante d'intérêt selon l'invention, dans lequel ladite construction est introduite dans une cellule hôte procaryote, préférentiellement par un vecteur tel que défini ci-avant.
On préfère un procédé de production d'une protéine recombinante d'intérêt selon (invention, caractérisé en ce qu'il comprend les étapes suivantes a) le clonage d'un gène d'intérêt dans un vecteur selon (invention ;
b) la transformation d'une cellule procaryote par un vecteur contenant un gène codant 2o pour ladite protéine recombinante d'intérêt ;
c) la culture de ladite cellule transformée dans un milieu de culture permettant (expression de la protéine recombinante ; et d) la récupération de la protéine recombinante à partir du milieu de culture ou de ladite cellule transformée.
L'invention comprend en outre une utilisation d'une construction, d'un vecteur ou d'une cellule hôte procaryote selon la présente invention, pour la production d'une protéine recombinante.
Enfin, (invention concerne une utilisation d'une protéine recombinante pour la préparation d'un médicament destiné à être administré à un patient nécessitant un tel traitement, caractérisée en ce que ladite protéine recombinante est produite par un procédé de production d'une protéine recombinante d'intérêt selon l'invention.
Les exemples et figures qui suivent sont destinés à illustrer (invention sans aucunement en limiter la portée.
Légende des figures et des tableaux Figure 1 : Carte du vecteur plasmidique pTEXmpl8 et séquence SEQ ID N°
39 de la région 1-450 comprenant le promoteur/opérateur Ptrp, la région du leader TrpL;
le site de clonage multiple mp 18 et Ie terminateur de transcription.
Figure 2 : Carte de restriction de la région du RBS (Ribosome Binding Site) sur le vecteur pTEXmpl8 (SEQ ID N° 40).
1o Figure 3 : Estimation sur gel SDS-PAGE de l'expression de CAT dans des bactéries transformées par les vecteurs pTEXCAT ou pTEXCAT4.
Fi-u~re-4 : Etude comparative de l'expression de la (3-galactosidase à partir des vecteurs pTEX-(3GAL et pTEX4-(3GAL (cinétiques en fermenteur).
Exemple I .
Cet exemple illustre un des aspects ayant conduit à l'invention, et notamment la manière dont est construite la librairie de vecteurs plasmidiques porteurs du promoteur tryptophane Ptrp et mutés de manière aléatoire en amont du codon d'initiation.
Le vecteur d'origine est décrit en figure 1. Il s'agit d'un plasmide dérivé de pBR322 (Bolivar, F., et al., Gene, 2, 95-113, 1977) dans lequel a été cloné le promoteur/opérateur Ptrp (1-298), suivi de la séquence codant pour les 7 premiers acides aminés du leader TrpL d'E. coli (Yanofsky, C., et al., Nucleic Acids Research, 9, 6647-6668, 1981), d'un site de clonage multiple et du terminateur de transcription trpt d'E. coli (Yanofsky, C., et al., 1981). La partie 3' de Ptrp dans pTEXmpl8 diffère de la séquence naturelle par la présence d'un site de clonage XbaI en amont du codon d'initiation ATG (voir figure 2) et par un espacement plus grand entre SD et codon d' initiation.
Pour permettre la sélection de vecteurs modifiés dans leur partie RBS, le gène rapporteur de la chloramphénicol acétyl-transférase (CAT) est cloné aux sites EcoRI et PstI de pTEXmpl8. Pour cela, la séquence codante du gène cat est amplifiée par PCR à
l'aide des oligonucléotides CATfor et CATrev dont les séquences sont CATfor : 5'-CCGGAATTCATGGAGAAAAAAATCACTGG-3' (SEQ ID N° 11) EcoRI
CATrev : 5'-AAACTGCAGTTACGCCCCGCCCTG-3' (SEQ ID N° 12) PstI
La réaction de PCR est effectuée en utilisant comme matrice le phagemide pBC-SK (Stratagene, La Jolla, CA, USA). Le produit d'amplification est déposé sur gel d'agarose et purifié selon la méthode GeneClean (Bio101, La Jolla, CA). Le clonage de l'insert dans pTEXmpl8 est vérifié après transformation dans E. coli par l'apparition de colonies se développant sur boîtes de milieu LB agar (Sambrook J., et al., Molecular cloning. A laboratory manual, 2"d edition. Plainview, NY: Cold Spring Harbor Laboratory Press, 1989) en présence de 30 ~.g/ml de chloramphénicol. La séquence de l'insert est confirmée par séquençage automatique à l'aide du kit « Dye Terminator » et du séquenceur d'ADN 373A (Perkin Elmer Applied Biosystems, Foster City, CA).
Le vecteur obtenu est nommé pTEXCAT.
L'insertion de RBS ayant une séquence dégénérée en amont du codon d'initiation est effectuée par ligation d'oligonucléotides de synthèse aux sites SpeI et EcoRI du vecteur pTEXCAT. La région allant du site SpeI au site EcoRI
respectivement en positions - 49 et + 28 (voir figure 2) est délétée par digestion enzymatique et remplacée par un hétéroduplex formé par deux oligonucléotides de synthèse 2o partiellement dégénérés, hybridés entre eux. Deux couples d'oligonucléotides sont utilisés, mettant en jeu respectivement les oligonucléotides RanSDl/RanSD2 et RanSD3/RanSD4 dont les séquences sont RanSD 1 5'CTAGTTAACTAGTACGCAAGTTCACGTAAANNNN~ ATG
AAAGCAATTTTCGTACTGAATGCGG-3' (SEQ ID N° 13) RanSD2 5'AATTCCGCATTCAGTACGAAAATTGCTTTCA TT
TACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 14) RanSD3 5'CTAGTTAACTAGTACGCAAGTTCACGTAAATRRRRRRRNNNNNNATGAAA
GCAATTTTCGTACTGAATGCGG-3' (SEQ ID N° 15) RanSD4 5'AATTCCGCATTCAGTACGAAAATTGCTTTCA YYATTTA
CGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 16).
Les quatre oligonucléotides ont été synthétisés par MWG Biotech (Ebersberg, D) dans des conditions assurant une répartition équimolaire des bases pour chaque dégénérescence. Le couple RanSD 1 / RanSD2 apporte une dégénérescence complète (N
= mélange des 4 nucléotides A, C, T, G) sur les 16 nucléotides précédant le codon ATG.
Le nombre de combinaisons (416 soit environ 4,3 109) autorise le criblage de RBS qui soient optimisés tant du point de vue de leur séquence Shine-Dalgarno (SD), de la 1o séquence située entre la région SD et le codon d'initiation ainsi que dans l'espacement SD-ATG. Cette librairie sera nommée (N16) dans la suite du texte. Le couple RanSD3 /
RanSD4 apporte une dégénérescence complète sur 6 nucléotides précédant l'ATG
et une dégénérescence partielle sur les 7 nucléotides en amont. L'utilisation exclusive des purines (R = A ou G) sur le brin positif et de pyrimidines sur le brin complémentaire (Y
= C ou T) favorise la représentation de séquences de type Shine-Dalgarno à une distance optimale (6 nucléotides) du codon ATG. Cette seconde librairie est nommée (R~N6).
La linéarisation du vecteur pTEXCAT et sa purification sur gel, l'hybridation des oligonucléotides par paires, la ligation des hétéroduplex au vecteur pTEXCAT
linéarisé et la transformation dans E. coli de la librairie ainsi constituée sont réalisées selon les conditions décrites par Sambrook J., et al. (1989). Classiquement, 100 finol de vecteur et 1000 finol d'insert sont engagés dans une réaction de ligation en présence de T4 ligase dans un volume final de 15 p,1. La réaction est conduite pendant une nuit à
16°C. Des bactéries TOP10 électrocompétentes (50 ~,1) sont ensuite transformées par électroporation avec 3 ~.1 du mélange de ligation dans les conditions recommandées par le fournisseur (Invitrogen, Carlsbad, CA). Le mélange de transformation est étalé sur boîtes de LB agar contenant 200 ~,g/ml d'ampicilline, donnant lieu après 16 heures d'incubation à 37°C à l'apparition de colonies transformées.
Exemple II
Le criblage des librairies est effectué en partant de l'hypothèse que les clones surexprimant l'enzyme CAT auront une résistance accrue au chloramphénicol.
Ceci est validé par l'expérience dont les résultats sont présentés dans le tableau 1 ci-dessous.
Tableau 1. Résistance au chloramphénicol de bactéries TOP 10 x pTEXCAT en présence ou absence d'IAA.
Concentration en chloramphnicol (~,g /
ml) IAA = 0 85 91 74 73 47 0 0 0 +++ +++ ++ + +/- _ _ _ IAA = 25 ~ug/ml75 65 76 53 71 1 0 0 +++ -H-+ +++ ++ + +/- - -Les chiffres (rangée supérieure) indiquent le nombre de colonies comptées après 18 h d'incubation à 37°C, chaque milieu ayant été ensemencé avec environ 100 cellules.
L'index de la rangée inférieure est un critère qualitatif de croissance des colonies (- = absence de croissance à +++ = croissance maximale).
1o Ces résultats montrent que des bactéries E. coli TOP10 (Invitrogen, Carlsbad, CA) transformées par le vecteur pTEXCAT et étalées sur boîtes contenant différentes concentrations de chloramphénicol ont, entre 300 et 600 ~.g/ml de chloramphénicol, un développement plus fort en présence d'acide 3-~3 indole acrylique (IAA), un analogue du tryptophane agissant comme inducteur par un effet de dérépression de Ptrp (Marmorstein, R.Q. et Sigler, P.B., The Journal of Biological Chemistry, 264, 9154, 1989). Ceci laisse supposer que des clones surproducteurs de CAT du fait d'une région RBS optimisée pourront soit se développer plus rapidement que la population sauvage à une concentration en chloramphénicol inférieure à la CMI
(concentration minimale inhibitrice), soit se développer en présence de concentrations en 2o chloramphénicol létales pour la population sauvage.
Exemple III
Cet exemple illustre la sélection de clones parmi les librairies construites selon la description de l'exemple 1. Les librairies obtenues sous forme de tapis de colonies sur boîtes de LB agar + ampicilline sont reprises dans de l'eau stérile de manière à
reconstituer une suspension dont la Densité Optique (DO) à 580 nm est voisine de 1.
Conformément aux résultats de l'exemple 2, cette suspension est étalée sur boîtes de LB
agar contenant des doses létales de chloramphénicol (600, 700, 800 et 900 ~.g/ml) à
raison de 100 ~,1 de suspension par boîte de Petri. Les boîtes sont mises en incubation à
5 37°C et l'on observe l'apparition de colonies résistantes en vérifiant dans le même temps que des boîtes ensemencées à partir d'une suspension de bactéries TOP 10 transformées par le vecteur sauvage pTEXCAT ne donnent lieu à aucune croissance.
Les colonies résistantes sont isolées et repiquées plusieurs fois sur le milieu de sélection pour confirmer leur phénotype de résistance. Les clones retenus à cette étape sont l0 ensuite soumis à une série d'analyses : (i) extraction du plasmide (kit Qiagen, Hilden, D) et séquençage de la région recouvrant le RBS, (ü) culture en Erlenmeyers avec induction par l'IAA puis estimation du niveau d'expression de CAT par dosage ELISA, (iii) électrophorèse par SDS-PAGE des protéines totales extraites des cultures précédentes et coloration au bleu de Coomassie permettant de visualiser les protéines 15 totales intracellulaires. Le séquençage des clones est réalisé à l'aide du kit Dye Terminator sur séquenceur ABI 373A (Perkin Elmer Applied Biosystems, Foster City, CA). Les cultures en erlens sont réalisées en ensemençant 25 ml de milieu TSBY
(Tryptic Soy Broth (DIFCO) 30 g/1 + Yeast Extract (Difco) 5 g/1) +
tetracycline 8 mg/1 par une colonie sur boîte ou par une suspension bactérienne conservée à - 80 °C. Chaque 2o préculture est mise en incubation sur un plateau agité à 200 rpm et 37°C pendant une nuit. Une fraction est transférée dans 50 ml du même milieu de manière à
atteindre une densité optique initiale égale à 1. Pour l'induction de la protéine CAT, le milieu est additionné par 25 mg/1 d'IAA puis placé en agitation dans les mêmes conditions pendant 5 heures. Une fraction de la suspension (3 x 1 ml dilués à DO = 0,1) est centrifugée et les cellules conservées à - 20°C pour le dosage de la CAT par ELISA (kit CAT ELISA, Roche Diagnostics, Bâle, CH). Le reste de la biomasse est récupéré
par centrifugation à 10000 g, 4°C pendant 15 minutes. La biomasse est reprise dans un tampon TEL (Tris 25 mM, EDTA 1 mM, Lysozyme 500 ~.g/ml, pH 8) à raison de 5 ml pour 1 g de biomasse humide. Les cellules sont lysées par sonication (sonicateur VibraCell muni d'une micro-sonde, Sonics & Materials, Danbury, CT). Un ml de la suspension résultante est centrifugé 5 min à 12 000 rpm. Le culot est repris par 200 ~1 de TEL pour donner la fraction insoluble (I). Le surnageant est noté « S ».
Les protéines totales contenues dans les fractions I et S sont analysées par électrophorèse en conditions dénaturantes (SDS-PAGE) et coloration au bleu de Coomassie.
Le tableau 2 ci-après indique les différentes séquences RBS obtenues après criblage des deux librairies (N16) et (R~N6). A la suite de l'alignement dans les bases de données nucléotidiques GenBank et EMBL, nous pouvons conclure qu'aucune des séquences de 16 nucléotides (stratégie (N16)) ou de 13 nucléotides (stratégie (R~N6)) situées immédiatement en amont du codon AUG dans les différents clones isolés n'a été
décrite à ce jour.
Tableau 2. Nouvelles séquences RBS isolées par l'une des stratégies (N16) ou (R~N6).
CLONE STRATGIE RGION SD - PEPTIDE L (*) PTEXCAT -SEQ ID AAGGGUAUCUAGAAUUAUGAAAGCAAUUUUCGUACUGAAUGCGGAAUUC
SEQ ID M K A I F V L N A E F
NZO
PTEXCAT4 (N16) SEQ ID GGGCCGGUUUCUUAUUAUGAAAGCAAUUUUCGUACCGAAUGCGGAAUUC
SEQ ID M K A I F V P N A E F
pTEXCATl' (R7N6) SEQ ID UGGGAGGGUCAAUUAUGAAACCAAUUUUCGUACUGAAUGCGGAAUUC
SEQ ID M K P I F V L N A E F
pTEXCAT2' (R~N6) SEQ ID UAAAGGAACCAUAUAUGAAA***************AAUGCGGAAUUC
SEQ ID M K * * * * * N A E F
pTEXCAT3' (R~N6) SEQ ID UAGGAAAGAUAACGAUGAAAGCAAUUUUCGCACUGAAUGCGGAAUUC
SEQ ID M K A I F A L N A E F
pTEXCATS' (R~N6) SEQ ID UGAGGAGAAGACAGAUGAAAGCAAU*********GAAUGCGGAAUUC
SEQ ID M K A M * * * N A E F
pTEXCAT9' (R~N6) SEQ ID UGAGGAGAGUAAUCAUGAAAGCA***************GCGGAAUUC
SEQ ID M K A * * * * * A E F
(*) Chaque séquence nucléotidique (ARN messager) comprend Ia région mutée en aval du codon d'initiation. La séquence de référence du vecteur pTEXCAT figure en première ligne du tableau. Les séquences nucléiques en amont et en aval du codon d'initiation des vecteurs sont représentées dans ce tableau après transcription sous forme d'ARN. A l'extrémité 3' de ces séquences, seuls les deux premiers codons du site de clonage multiple sont représentés, à savoir GAAUUC.
C'est ainsi qu'il a été observé de manière tout à fait surprenante que les clones décrits dans le tableau 2 possèdent des mutations dans la région du RBS située immédiatement en aval du codon AUG. Les clones pTEXCAT4, pTEXCATl' et pTEXCAT3' sont porteurs d'une mutation ponctuelle affectant un acide aminé de la partie N-terminale de la protéine codée (respectivement Leu7Pro, Ala3Pro et Val6Ala).
Les autres clones sont porteurs de réarrangements plus importants : pTEXCAT2', pTEXCATS' et pTEXCAT9' ont des délétions induisant respectivement la perte des régions Ala3Leu7, Ile4Leu7 et Ile4Asn8. Etant donné que l'analyse au hasard de
10 clones de la librairie (N16) sélectionnés sur ampicilline (c'est-à-dire sans pression de sélection au chloramphénicol) ne montre aucune modification dans la région codant pour le peptide TrpL (données non présentées), il en est déduit que les mutations dans TrpL observées sur les clones sélectionnés pour leur capacité d'expression de CAT
jouent un rôle dans l'expression. Ainsi, nous démontrons la propriété
originale suivante : l'expression de protéines recombinantes est affectée positivement par des mutations en aval du codon d'initiation.
2o La figure 3 présente une analyse par SDS-PAGE des protéines totales de bactéries transformées par pTEXCAT ou pTEXCAT4. On y voit la confirmation du caractère surproducteur du vecteur pTEXCAT4 puisqu'une protéine majoritaire migrant à la position attendue pour CAT (28 kDa) est nettement mise en évidence dans des extraits induits par l'IAA tandis que les extraits du vecteur pTEXCAT obtenus dans les mêmes conditions d'induction ne font apparaître qu'une bande de faible intensité.
Pour écarter la possibilité que la surproduction soit causée par des modifications du vecteur en dehors de la partie SpeI-EcoRI, le vecteur pTEXCAT4 a été
reconstruit in vitro à partir de pTEXCAT par digestion SpeI-EcoRI et ligation d'un duplex formé par les deux oligonucléotides phosphorylés suivants SDopt4-f 5'CTAGTTAACTAGTACGCAAGTTCACGTAAAACGGAGAAACCCCCCAATGA
AAGCAATTTTCGTACCGAATGCGG-3' (SEQ ID N° 17) SDopt4-r 5'AATTCCGCATTCGGTACGAAAATTGCTTTCATTGGGGGGTTTCTCCGTTTT
ACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 18).
Le vecteur résultant noté pTEXCAT-SD4 a ensuite été transformé dans E. coli TOP10 et comparé à pTEXCAT4 en termes de potentiel d'expression de l'enzyme CAT. Les résultats obtenus indiquent que les niveaux d'expression de pTEXCAT4 et pTEXCAT-SD4 sont comparables entre eux et significativement supérieurs à
pTEXCAT. Ceci accrédite l'hypothèse que l'amélioration de l'expression observée avec les clones revendiqués dans cette demande de brevet est bien causée spécifiquement par les séquences situées entre les sites SpeI et EcoRI.
Afin de démontrer la spécificité des séquences mutées ou délétées situées directement en aval du codon d'initiation, la leucine CTG en septième position du vecteur sauvage pTEXCAT a été remplacée par une proline CCG pour donner le vecteur pTEXCAT-L7P. La proline CCG en septième position du vecteur pTEXCAT4 a été
remplacée par une leucine CTG pour donner le vecteur pTEXCAT4-P7L. Les résultats de cette expérience figurent dans le tableau 3 ci-dessous.
Tableau 3. Comparaison entre les niveaux d'expression donnés par les vecteurs pTEXCAT, pTEXCAT4, pTEXCAT-L7P et pTEXCAT4-P7L.
Vecteur Niveau d'expression de CAT
pTEXCAT4 128 0,7 pTEXCAT-L7P 119 2 pTEXCAT4-P7L 1,9 0,1 Les résultats (moyenne ~ écart-type) ont été obtenus sur deux expériences indépendantes. Le niveau 1 est affecté arbitrairement au vecteur pTEXCAT.
Ces résultats démontrent que la mutation en aval du codon d'initiation est responsable à elle seule de la surexpression, puisque cette mutation réintroduite dans le 5 vecteur sauvage permet d'obtenir la méme surexpression.
Exemple IV
Cet exemple montre que l'effet de surexpression des nouvelles séquences décrites n'est pas limité au gène rapporteur utilisé pour les sélectionner mais se transpose à d'autres gènes dès lors que ces gènes leur sont liés fonctionnellement sur le 10 même vecteur. A cet effet, le gène CAT des vecteurs pTEXCAT et pTEXCAT4 a été
remplacé par la séquence du gène lacZ codant pour la (3-galactosidase d'E.
coli. Le clonage a été réalisé en amplifiant la séquence lacZ par PCR à partir du vecteur p(3GAL
basic (Clontech, Palo Alto, CA) puis en insérant cette séquence en aval de trpL aux sites uniques BsmI et HindIII, pour donner respectivement les vecteurs pTEX-[3GAL et 15 pTEX4-bGAL.
Les deux vecteurs ont été transformés dans la souche E. coli ICONE 200 (demande de brevet français FR 2 777 292 publiée le 15 Octobre 1999) en vue d'une culture en fermenteur avec suivi en cinétique de l'expression de la (3-galactosidase.
Classiquement, les bactéries recombinantes ICONE 200 x pTEX-(3GAL et ICONE 200 20 x pTEX4-(3GAL ont été cultivées dans 200 ml de milieu complet (Tryptic Soy Broth (DIFCO) 30 g/1, Yeast Extract (DIFCO) 5 g/1) pendant une nuit à 37°C.
La suspension cellulaire obtenue a été transférée stérilement dans un fermenteur (modèle CF3000 de Chemap, capacité 3,5 1) contenant 1,8 litres du milieu suivant (concentrations pour 2 litres de culture finale) : glycérol 90 g/1, (NH4)2504 5 g/1, KH2P04 6 g/1, 4 g/1, Na3-citrate 2H20 9 g/1, MgS04 7H20 2 g/1, extrait de levure 1 g/1, oligo-éléments, antimousse 0,06 %, tétracycline 8 mg/1, tryptophane 200 mg/1. Le pH
est régulé à 7,0 par ajout d'ammoniaque. Le taux d'oxygène dissous est maintenu à
30 % de la saturation par asservissement de la vitesse d'agitation puis du débit d'aération à la mesure de l'02 dissous. Lorsque la Densité Optique de la culture atteint une valeur comprise entre 30 et 40, on procède à l'induction par l'ajout de 25 mg/1 d'IAA
(Sigma, St Louis, MO). Une analyse en cinétique de la densité optique de la culture (DO à
580 nm) et de l'activité (3-galactosidase intracellulaire a été effectuée. Le niveau d'activité (3-galactosidase est estimé par un dosage colorimétrique en mélangeant 30 ~,1 d'échantillon (fraction « S », voir exemple 3), 204 ~.1 de tampon (Tris-HCl 50 mM pH
7,5 - MgCl2 I mM) et 66 ~1 d'ONPG (4 mg/mI dans Tris-HCl 50 mM pH 7,5). Le mélange réactionnel est placé en incubation à 37°C. La réaction est stoppée par l'ajout de 500 p1 de NaZC03 1 M. La DO à 420 nm rapportée au temps d'incubation est proportionnelle à l'activité [3-galactosidase présente dans l'échantillon.
Sachant que E.
coli ICONE 200 a une délétion compléta de l'opéron lac, l'activité (3-galactosidase mesurée est uniquement due à l'expression du gène lacZ plasmidique.
Les résultats de cette étude comparative indiquent que dans deux expériences indépendantes, le vecteur pTEX4-(3GAL donne un niveau d'activité (3-galactosidase environ 50 fois supérieur à pTEX-(3GAL (figure 4). Nous en déduisons que la séquence originale isolée dans la zone RBS du vecteur pTEXCAT4 potentialise l'expression, non seulement de la protéine CAT, mais aussi d'autres protéines telles que, à
titre d'exemple, la (3-galactosidase. A partir de cet exemple, nous pouvons conclure que d'autres protéines d'intérêt biotechnologique pourront être avantageusement exprimées à partir d'un des vecteurs selon (invention en introduisant leur séquence codante en aval des séquences mutées ou délétées selon l'invention.
Exemple V
Comparaison entre les niveaux d'expression donnés par les vecteurs pTEXwt (ne fait pas partie de (invention) et les vecteurs pTEX9', pTEXlO', pTEXl l' et pTEXl2'.
Les vecteurs pTEXlO', pTEXl l' et pTEXl2' sont issus du vecteur pTEX9 mais comprennent en outre des mutations supplémentaires, telles qu'indiquées dans le tableau 4 ci-dessous Tableau 4. Comparaison entre les niveaux d'expression donnés par les vecteur pTEXwt, pTEX9', pTEX 10', pTEX 1 l' et pTEX 12'.
Expression Vecteur RGION SD - PEPTIDE L (*) CAT
PTEXwt SEQ ID ~'GGGUAUCUAGAAUUAUGAAAGCAAUUUUCGUACUGAAUGCGGAAUUC1 SEQ ID M K A I F V I~ N A E F
pTEX9' SEQ ID UGAGGAGAGUAAUCAUGAAAGCA***************GCGGAAUUC
SEQ ID M K A * * * * * A E F
pTEX 10' SEQ ID UGAGGAGAGUAAUCAUGAAAGCA******************GAAUUC2S3 SEQ ID M K A * * * * * * E F
pTEX 1 l' SEQ ID UGp'GG'~GAGUAAUCAUGAAA*********************GAAUUC124 SEQ ID M K * * * * * * * E F
pTEX 12' SEQ ID UGAGGAGAGUAAUCAUG************************GAAUUC1SS
N3~
SEQ ID M * * * * * * * * E F
(*) : Chaque séquence nucléotidique (ARN messager) comprend la région mutée en aval du codon d'initiation. La séquence de référence du vecteur pTEXCAT figure en première ligne du tableau. Les séquences nucléiques en amont et en aval du codon d'initiation des vecteurs sont représentées dans ce tableau après transcription sous forme d'ARN. A (extrémité 3' de ces séquences, seuls les deux premiers codons du site de clonage multiple sont représentés, à savoir GAAUUC.
Les méthodes de détermination de (expression sont celles utilisées dans les exemples ci-dessus.
Ces résultats démontrent que les délétions en aval du codon d'initiation 1S permettent d'obtenir une surexpression jusqu'à plus de 2S0 fois supérieure à (expression observée en utilisant le vecteur sauvage.
LISTE DE SÉQUENCES
<110> PIERRE FABRE MÉDICAMENT
<120> CONSTRUCTION MODIFIÉE EN AVAZ DU CODON D'INITIATION
POUR IrA SUREXPRESSION EN PROTÉINES RECOMBINANTES
<130> D18792 <150> FR 00 08 002 <151> 2000-06-22 <160> 40 <170> PatentIn Ver. 2.1 <210> 1 <211> 28 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 1 aaagcaattt tcgtactg 18 <210> 2 <211> 9 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 2 tttcgtact <210> 3 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 3 aagggtatct agaatt 16 <210> 4 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 4 gggccggttt cttatt 16 <210> 5 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux . ribosomes (RBS).
<400> 5 acggagaaac ccccca 16 <210> 6 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivêe de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 6 tgggagggtc aatt 14 <210> 7 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 7 ' taaaggaacc atat 14 <210> 8 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 8 taggaaagat aacg 14 <210> 9 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 9 tgaggagaag acag 14 <210> 10 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 10 tgaggagagt aatc 14 <210> 11 <211> 29 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence amorce dérivêe du gène rapporteur CAT
(Chloroamphênicol Acétyl-Transférase).
<400> 11 ccggaattca tggagaaaaa aatcactgg 29 <210> 12 <211> 24 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence amorce dérivée du gène rapporteur CAT
(Chloroamphénicol Acétyl-Transférase).
<400> 12 aaactgcagt tacgccccgc cctg 24 <210> 13 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dégénéré RanSDl.
<400> 13 ctagttaact agtacgcaag ttcacgtaaa nnnnnnnnnn nnnnnnatga aagcaatttt 60 cgtactgaat gcgg 74 <210> 14 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dêgénéré RanSD2.
<400> 14 aattccgcat tcagtacgaa aattgctttc atnnnnnnnn nnnnnnnntt tacgtgaact 60 tgcgtactag ttaa 74 <210> 15 <211> 72 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dégénéré RanSD3.
<400> 15 ctagttaact agtacgcaag ttcacgtaaa trrrrrrrnn nnnnatgaaa gcaattttcg 60 tactgaatgc gg 72 <210> 16 <211> 72 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dégénéré RanSD4.
<400> 16 aattccgcat tcagtacgaa aattgctttc atnnnnnnyy yyyyyattta cgtgaacttg 60 cgtactagtt aa 72 <210> 17 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide phosphorylé SDopt4-f.
<400> 17 ctagttaact agtacgcaag ttcacgtaaa acggagaaac cccccaatga aagcaatttt 60 cgtaccgaat gcgg 74 <210> 18 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide phosphorylé SDopt4-r.
<400> 1,8 aattccgcat tcggtacgaa aattgctttc attggggggt ttctccgttt tacgtgaact 60 tgcgtactag ttaa 74 <210> 19 <211> 49 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 19 aaggguaucu agaauuauga aagcaauuuu cguacugaau gcggaauuc 49 <210> 20 <211> 11 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dërivë de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 20 Met Zys Ala Ile Phe Val Zeu Asn Ala Glu Phe <210> 21 <211> 49 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 21 gggccgguuu cuuauuauga aagcaauuuu cguaccgaau gcggaauuc 49 <210> 22 <211> 11 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 22 Met Lys A1a Ile Phe Val Pro Asn A1a Glu Phe <210> 23 <211> 47 <212> ARN
<213> Séquence artificielle <220>
<223> Sëquence dérivée de séquences bactëriennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 23 ugggaggguc aauuaugaaa ccaauuuucg uacugaaugc ggaauuc 47 <210> 24 <211> 11 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 24 Met Lys Pro Ile Phe Val Leu Asn .Ala Glu Phe <210> 25 <211> 32 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactëriennes correspondant à des sïtes de fixation aux ribosomes (RBS).
<400> 25 uaaaggaacc auauaugaaa aaugcggaau uc 32 <210> 26 <211> 6 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dérivë de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 26 Met Lys Asn A1a Glu Phe <210> 27 <211> 47 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 27 uaggaaagau aacgaugaaa gcaauuuucg cacugaaugc ggaauuc 47 <210> 28 <211> 11 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherïchia Coli.
<400> 28 Met Lys Ala Ile Phe Ala Leu Asn Ala Glu Phe <210> 29 <211> 38 <212> RRN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 29 ugaggagaag acagaugaaa gcaaugaaug cggaauuc 38 <210> 30 <211> 8 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 30 Met Lys Rla Met Asn Ala Glu Phe <210> 31 <211> 32 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 31 ugaggagagu aaucaugaaa gcagcggaau uc 32 <210> 32 <211> 6 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 32 Met Zys Ala Ala Glu Phe <210> 33 <211> 29 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 33 ugaggagagu aaucaugaaa gcagaauuc 29 <210> 34 <211> 5 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 34 Met Zys Ala Glu Phe <210> 35 <211> 26 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 35 ugaggagagu aaucaugaaa gaauuc 26 <210> 36 <211> 4 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 36 Met Zys Glu Phe <210> 37 <211> 23 <212> RRN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 37 ugaggagagu aaucauggaa uuc 23 <210> 38 <211> 3 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpZ d'Escherichia Coli.
<400> 38 Met Glu Phe <210> 39 <211> 445 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée du vecteur plasmidique pTEXmpl8.
<400> 39 gaattaattc atgctgtggt gtcatggtcg gtgatcgcca gggtgccgac gcgcatctcg 60 actgcacggt gcaccaatgc ttctggcgtc aggcagccat cggaagctgt ggtatggctg 120 tgcaggtcgt aaatcactgc ataattcgtg tcgctcaagg cgcactcccg ttctggataa 280 tgttttttgc gccgacatca taacggttct ggcaaatatt ctgaaatgag ctgttgacaa 240 ttaatcatcg aactagttaa ctagtacgca agttcacgta aaaagggtat ctagaattat 300 gaaagcaatt ttcgtactga atgcggaatt cgagctcggt acccggggat cctctagagt 360 cgacctgcag gcatgcaagc ttaagtaagt aagccgccag ttccgctggc ggcatttttt 420 ttgatcctaa cgctcggttg ccgcc 445 <210> 40 <211> 178 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée du vecteur plasmidique pTEXmpl8.
<400> 40 ttaatcatcg aactagttaa ctagtacgca agttcacgta aaaagggtat ctagaattat 60 gaaagcaatt ttcgtactga atgcggaatt cgagctcggt acccggggat cctctagagt 120 cgacctgcag gcatgcaagc ttaagtaagt aagccgccag ttccgctggc ggcatttt 178
jouent un rôle dans l'expression. Ainsi, nous démontrons la propriété
originale suivante : l'expression de protéines recombinantes est affectée positivement par des mutations en aval du codon d'initiation.
2o La figure 3 présente une analyse par SDS-PAGE des protéines totales de bactéries transformées par pTEXCAT ou pTEXCAT4. On y voit la confirmation du caractère surproducteur du vecteur pTEXCAT4 puisqu'une protéine majoritaire migrant à la position attendue pour CAT (28 kDa) est nettement mise en évidence dans des extraits induits par l'IAA tandis que les extraits du vecteur pTEXCAT obtenus dans les mêmes conditions d'induction ne font apparaître qu'une bande de faible intensité.
Pour écarter la possibilité que la surproduction soit causée par des modifications du vecteur en dehors de la partie SpeI-EcoRI, le vecteur pTEXCAT4 a été
reconstruit in vitro à partir de pTEXCAT par digestion SpeI-EcoRI et ligation d'un duplex formé par les deux oligonucléotides phosphorylés suivants SDopt4-f 5'CTAGTTAACTAGTACGCAAGTTCACGTAAAACGGAGAAACCCCCCAATGA
AAGCAATTTTCGTACCGAATGCGG-3' (SEQ ID N° 17) SDopt4-r 5'AATTCCGCATTCGGTACGAAAATTGCTTTCATTGGGGGGTTTCTCCGTTTT
ACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID N° 18).
Le vecteur résultant noté pTEXCAT-SD4 a ensuite été transformé dans E. coli TOP10 et comparé à pTEXCAT4 en termes de potentiel d'expression de l'enzyme CAT. Les résultats obtenus indiquent que les niveaux d'expression de pTEXCAT4 et pTEXCAT-SD4 sont comparables entre eux et significativement supérieurs à
pTEXCAT. Ceci accrédite l'hypothèse que l'amélioration de l'expression observée avec les clones revendiqués dans cette demande de brevet est bien causée spécifiquement par les séquences situées entre les sites SpeI et EcoRI.
Afin de démontrer la spécificité des séquences mutées ou délétées situées directement en aval du codon d'initiation, la leucine CTG en septième position du vecteur sauvage pTEXCAT a été remplacée par une proline CCG pour donner le vecteur pTEXCAT-L7P. La proline CCG en septième position du vecteur pTEXCAT4 a été
remplacée par une leucine CTG pour donner le vecteur pTEXCAT4-P7L. Les résultats de cette expérience figurent dans le tableau 3 ci-dessous.
Tableau 3. Comparaison entre les niveaux d'expression donnés par les vecteurs pTEXCAT, pTEXCAT4, pTEXCAT-L7P et pTEXCAT4-P7L.
Vecteur Niveau d'expression de CAT
pTEXCAT4 128 0,7 pTEXCAT-L7P 119 2 pTEXCAT4-P7L 1,9 0,1 Les résultats (moyenne ~ écart-type) ont été obtenus sur deux expériences indépendantes. Le niveau 1 est affecté arbitrairement au vecteur pTEXCAT.
Ces résultats démontrent que la mutation en aval du codon d'initiation est responsable à elle seule de la surexpression, puisque cette mutation réintroduite dans le 5 vecteur sauvage permet d'obtenir la méme surexpression.
Exemple IV
Cet exemple montre que l'effet de surexpression des nouvelles séquences décrites n'est pas limité au gène rapporteur utilisé pour les sélectionner mais se transpose à d'autres gènes dès lors que ces gènes leur sont liés fonctionnellement sur le 10 même vecteur. A cet effet, le gène CAT des vecteurs pTEXCAT et pTEXCAT4 a été
remplacé par la séquence du gène lacZ codant pour la (3-galactosidase d'E.
coli. Le clonage a été réalisé en amplifiant la séquence lacZ par PCR à partir du vecteur p(3GAL
basic (Clontech, Palo Alto, CA) puis en insérant cette séquence en aval de trpL aux sites uniques BsmI et HindIII, pour donner respectivement les vecteurs pTEX-[3GAL et 15 pTEX4-bGAL.
Les deux vecteurs ont été transformés dans la souche E. coli ICONE 200 (demande de brevet français FR 2 777 292 publiée le 15 Octobre 1999) en vue d'une culture en fermenteur avec suivi en cinétique de l'expression de la (3-galactosidase.
Classiquement, les bactéries recombinantes ICONE 200 x pTEX-(3GAL et ICONE 200 20 x pTEX4-(3GAL ont été cultivées dans 200 ml de milieu complet (Tryptic Soy Broth (DIFCO) 30 g/1, Yeast Extract (DIFCO) 5 g/1) pendant une nuit à 37°C.
La suspension cellulaire obtenue a été transférée stérilement dans un fermenteur (modèle CF3000 de Chemap, capacité 3,5 1) contenant 1,8 litres du milieu suivant (concentrations pour 2 litres de culture finale) : glycérol 90 g/1, (NH4)2504 5 g/1, KH2P04 6 g/1, 4 g/1, Na3-citrate 2H20 9 g/1, MgS04 7H20 2 g/1, extrait de levure 1 g/1, oligo-éléments, antimousse 0,06 %, tétracycline 8 mg/1, tryptophane 200 mg/1. Le pH
est régulé à 7,0 par ajout d'ammoniaque. Le taux d'oxygène dissous est maintenu à
30 % de la saturation par asservissement de la vitesse d'agitation puis du débit d'aération à la mesure de l'02 dissous. Lorsque la Densité Optique de la culture atteint une valeur comprise entre 30 et 40, on procède à l'induction par l'ajout de 25 mg/1 d'IAA
(Sigma, St Louis, MO). Une analyse en cinétique de la densité optique de la culture (DO à
580 nm) et de l'activité (3-galactosidase intracellulaire a été effectuée. Le niveau d'activité (3-galactosidase est estimé par un dosage colorimétrique en mélangeant 30 ~,1 d'échantillon (fraction « S », voir exemple 3), 204 ~.1 de tampon (Tris-HCl 50 mM pH
7,5 - MgCl2 I mM) et 66 ~1 d'ONPG (4 mg/mI dans Tris-HCl 50 mM pH 7,5). Le mélange réactionnel est placé en incubation à 37°C. La réaction est stoppée par l'ajout de 500 p1 de NaZC03 1 M. La DO à 420 nm rapportée au temps d'incubation est proportionnelle à l'activité [3-galactosidase présente dans l'échantillon.
Sachant que E.
coli ICONE 200 a une délétion compléta de l'opéron lac, l'activité (3-galactosidase mesurée est uniquement due à l'expression du gène lacZ plasmidique.
Les résultats de cette étude comparative indiquent que dans deux expériences indépendantes, le vecteur pTEX4-(3GAL donne un niveau d'activité (3-galactosidase environ 50 fois supérieur à pTEX-(3GAL (figure 4). Nous en déduisons que la séquence originale isolée dans la zone RBS du vecteur pTEXCAT4 potentialise l'expression, non seulement de la protéine CAT, mais aussi d'autres protéines telles que, à
titre d'exemple, la (3-galactosidase. A partir de cet exemple, nous pouvons conclure que d'autres protéines d'intérêt biotechnologique pourront être avantageusement exprimées à partir d'un des vecteurs selon (invention en introduisant leur séquence codante en aval des séquences mutées ou délétées selon l'invention.
Exemple V
Comparaison entre les niveaux d'expression donnés par les vecteurs pTEXwt (ne fait pas partie de (invention) et les vecteurs pTEX9', pTEXlO', pTEXl l' et pTEXl2'.
Les vecteurs pTEXlO', pTEXl l' et pTEXl2' sont issus du vecteur pTEX9 mais comprennent en outre des mutations supplémentaires, telles qu'indiquées dans le tableau 4 ci-dessous Tableau 4. Comparaison entre les niveaux d'expression donnés par les vecteur pTEXwt, pTEX9', pTEX 10', pTEX 1 l' et pTEX 12'.
Expression Vecteur RGION SD - PEPTIDE L (*) CAT
PTEXwt SEQ ID ~'GGGUAUCUAGAAUUAUGAAAGCAAUUUUCGUACUGAAUGCGGAAUUC1 SEQ ID M K A I F V I~ N A E F
pTEX9' SEQ ID UGAGGAGAGUAAUCAUGAAAGCA***************GCGGAAUUC
SEQ ID M K A * * * * * A E F
pTEX 10' SEQ ID UGAGGAGAGUAAUCAUGAAAGCA******************GAAUUC2S3 SEQ ID M K A * * * * * * E F
pTEX 1 l' SEQ ID UGp'GG'~GAGUAAUCAUGAAA*********************GAAUUC124 SEQ ID M K * * * * * * * E F
pTEX 12' SEQ ID UGAGGAGAGUAAUCAUG************************GAAUUC1SS
N3~
SEQ ID M * * * * * * * * E F
(*) : Chaque séquence nucléotidique (ARN messager) comprend la région mutée en aval du codon d'initiation. La séquence de référence du vecteur pTEXCAT figure en première ligne du tableau. Les séquences nucléiques en amont et en aval du codon d'initiation des vecteurs sont représentées dans ce tableau après transcription sous forme d'ARN. A (extrémité 3' de ces séquences, seuls les deux premiers codons du site de clonage multiple sont représentés, à savoir GAAUUC.
Les méthodes de détermination de (expression sont celles utilisées dans les exemples ci-dessus.
Ces résultats démontrent que les délétions en aval du codon d'initiation 1S permettent d'obtenir une surexpression jusqu'à plus de 2S0 fois supérieure à (expression observée en utilisant le vecteur sauvage.
LISTE DE SÉQUENCES
<110> PIERRE FABRE MÉDICAMENT
<120> CONSTRUCTION MODIFIÉE EN AVAZ DU CODON D'INITIATION
POUR IrA SUREXPRESSION EN PROTÉINES RECOMBINANTES
<130> D18792 <150> FR 00 08 002 <151> 2000-06-22 <160> 40 <170> PatentIn Ver. 2.1 <210> 1 <211> 28 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 1 aaagcaattt tcgtactg 18 <210> 2 <211> 9 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 2 tttcgtact <210> 3 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 3 aagggtatct agaatt 16 <210> 4 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 4 gggccggttt cttatt 16 <210> 5 <211> 16 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux . ribosomes (RBS).
<400> 5 acggagaaac ccccca 16 <210> 6 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivêe de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 6 tgggagggtc aatt 14 <210> 7 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 7 ' taaaggaacc atat 14 <210> 8 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 8 taggaaagat aacg 14 <210> 9 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 9 tgaggagaag acag 14 <210> 10 <211> 14 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 10 tgaggagagt aatc 14 <210> 11 <211> 29 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence amorce dérivêe du gène rapporteur CAT
(Chloroamphênicol Acétyl-Transférase).
<400> 11 ccggaattca tggagaaaaa aatcactgg 29 <210> 12 <211> 24 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence amorce dérivée du gène rapporteur CAT
(Chloroamphénicol Acétyl-Transférase).
<400> 12 aaactgcagt tacgccccgc cctg 24 <210> 13 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dégénéré RanSDl.
<400> 13 ctagttaact agtacgcaag ttcacgtaaa nnnnnnnnnn nnnnnnatga aagcaatttt 60 cgtactgaat gcgg 74 <210> 14 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dêgénéré RanSD2.
<400> 14 aattccgcat tcagtacgaa aattgctttc atnnnnnnnn nnnnnnnntt tacgtgaact 60 tgcgtactag ttaa 74 <210> 15 <211> 72 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dégénéré RanSD3.
<400> 15 ctagttaact agtacgcaag ttcacgtaaa trrrrrrrnn nnnnatgaaa gcaattttcg 60 tactgaatgc gg 72 <210> 16 <211> 72 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide dégénéré RanSD4.
<400> 16 aattccgcat tcagtacgaa aattgctttc atnnnnnnyy yyyyyattta cgtgaacttg 60 cgtactagtt aa 72 <210> 17 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide phosphorylé SDopt4-f.
<400> 17 ctagttaact agtacgcaag ttcacgtaaa acggagaaac cccccaatga aagcaatttt 60 cgtaccgaat gcgg 74 <210> 18 <211> 74 <212> ADN
<213> Séquence artificielle <220>
<223> Oligonucléotide phosphorylé SDopt4-r.
<400> 1,8 aattccgcat tcggtacgaa aattgctttc attggggggt ttctccgttt tacgtgaact 60 tgcgtactag ttaa 74 <210> 19 <211> 49 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 19 aaggguaucu agaauuauga aagcaauuuu cguacugaau gcggaauuc 49 <210> 20 <211> 11 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dërivë de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 20 Met Zys Ala Ile Phe Val Zeu Asn Ala Glu Phe <210> 21 <211> 49 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 21 gggccgguuu cuuauuauga aagcaauuuu cguaccgaau gcggaauuc 49 <210> 22 <211> 11 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 22 Met Lys A1a Ile Phe Val Pro Asn A1a Glu Phe <210> 23 <211> 47 <212> ARN
<213> Séquence artificielle <220>
<223> Sëquence dérivée de séquences bactëriennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 23 ugggaggguc aauuaugaaa ccaauuuucg uacugaaugc ggaauuc 47 <210> 24 <211> 11 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 24 Met Lys Pro Ile Phe Val Leu Asn .Ala Glu Phe <210> 25 <211> 32 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactëriennes correspondant à des sïtes de fixation aux ribosomes (RBS).
<400> 25 uaaaggaacc auauaugaaa aaugcggaau uc 32 <210> 26 <211> 6 <212> PRT
<213> Sëquence artificielle <220>
<223> Peptide dérivë de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 26 Met Lys Asn A1a Glu Phe <210> 27 <211> 47 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 27 uaggaaagau aacgaugaaa gcaauuuucg cacugaaugc ggaauuc 47 <210> 28 <211> 11 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherïchia Coli.
<400> 28 Met Lys Ala Ile Phe Ala Leu Asn Ala Glu Phe <210> 29 <211> 38 <212> RRN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 29 ugaggagaag acagaugaaa gcaaugaaug cggaauuc 38 <210> 30 <211> 8 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 30 Met Lys Rla Met Asn Ala Glu Phe <210> 31 <211> 32 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 31 ugaggagagu aaucaugaaa gcagcggaau uc 32 <210> 32 <211> 6 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 32 Met Zys Ala Ala Glu Phe <210> 33 <211> 29 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 33 ugaggagagu aaucaugaaa gcagaauuc 29 <210> 34 <211> 5 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 34 Met Zys Ala Glu Phe <210> 35 <211> 26 <212> ARN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 35 ugaggagagu aaucaugaaa gaauuc 26 <210> 36 <211> 4 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpL d'Escherichia Coli.
<400> 36 Met Zys Glu Phe <210> 37 <211> 23 <212> RRN
<213> Séquence artificielle <220>
<223> Séquence dérivée de séquences bactériennes correspondant à des sites de fixation aux ribosomes (RBS).
<400> 37 ugaggagagu aaucauggaa uuc 23 <210> 38 <211> 3 <212> PRT
<213> Séquence artificielle <220>
<223> Peptide dérivé de la partie N-terminale du leader TrpZ d'Escherichia Coli.
<400> 38 Met Glu Phe <210> 39 <211> 445 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée du vecteur plasmidique pTEXmpl8.
<400> 39 gaattaattc atgctgtggt gtcatggtcg gtgatcgcca gggtgccgac gcgcatctcg 60 actgcacggt gcaccaatgc ttctggcgtc aggcagccat cggaagctgt ggtatggctg 120 tgcaggtcgt aaatcactgc ataattcgtg tcgctcaagg cgcactcccg ttctggataa 280 tgttttttgc gccgacatca taacggttct ggcaaatatt ctgaaatgag ctgttgacaa 240 ttaatcatcg aactagttaa ctagtacgca agttcacgta aaaagggtat ctagaattat 300 gaaagcaatt ttcgtactga atgcggaatt cgagctcggt acccggggat cctctagagt 360 cgacctgcag gcatgcaagc ttaagtaagt aagccgccag ttccgctggc ggcatttttt 420 ttgatcctaa cgctcggttg ccgcc 445 <210> 40 <211> 178 <212> ADN
<213> Séquence artificielle <220>
<223> Séquence dérivée du vecteur plasmidique pTEXmpl8.
<400> 40 ttaatcatcg aactagttaa ctagtacgca agttcacgta aaaagggtat ctagaattat 60 gaaagcaatt ttcgtactga atgcggaatt cgagctcggt acccggggat cctctagagt 120 cgacctgcag gcatgcaagc ttaagtaagt aagccgccag ttccgctggc ggcatttt 178
Claims (21)
1. Construction pour l'expression d'un gène codant pour une protéine recombinante d'intérêt placé sous le contrôle de l'opéron tryptophane Ptrp dans une cellule hôte procaryote comprenant directement en aval du codon d'initiation une séquence nucléique de séquence SEQ ID No 1 et en aval de cette séquence une cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID No 1 est muté ou délété de façon à permettre une surexpression de ladite protéine recombinante.
2. Construction selon la revendication 1, caractérisée en ce qu'au moins un des nucléotides de la séquence SEQ ID No 1 est délété.
3. Construction selon la revendication 1, caractérisée en ce que ledit au moins nucléotide muté ou délété est situé sur le fragment de séquence SEQ ID
No 2 de la séquence SEQ ID No 1.
No 2 de la séquence SEQ ID No 1.
4. Construction selon la revendication 1, caractérisée en ce que ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GTA de la séquence SEQ ID No 1.
5. Construction selon la revendication 1, caractérisée en ce ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon GCA
de la séquence SEQ ID No 1.
de la séquence SEQ ID No 1.
6. Construction selon la revendication 1, caractérisée en ce ledit au moins nucléotide muté ou délété, préférentiellement muté, est situé sur le codon CTG
de la séquence SEQ ID No 1.
de la séquence SEQ ID No 1.
7. Construction selon la revendication 1, caractérisée en ce que ladite séquence SEQ ID No 1 dont au moins un des acides nucléiques est muté ou délété, présente au moins en position 1, 2 et 3 le nucléotide A.
8. Construction selon la revendication 1, caractérisée en ce que ladite séquence SEQ ID No 1 est totalement délétée.
9. Construction selon l'une des revendications 1 à 8, caractérisée en ce qu'au moins un des nucléotides, et préférentiellement tous les nucléotides, situés entre la séquence nucléique de séquence SEQ ID N° 1 et la cassette de clonage multiple destinée à recevoir le gène codant pour ladite protéine recombinante d'intérêt, sont délétés.
10. Construction selon l'une quelconque des revendications 1 à 9, caractérisée en ce que la séquence nucléique directement en amont du codon d'initiation est choisie parmi les séquences SEQ ID N° 3 à SEQ ID N° 10.
11. Construction selon l'une quelconque des revendications 1 à 10, caractérisée en ce que la cellule hôte procaryote est une bactérie grain négative.
12. Construction selon l'une quelconque des revendications 1 à 11, caractérisée en ce que la cellule hôte procaryote est E. coli.
13. Vecteur contenant une construction selon l'une quelconque des revendications 1 à 12.
14. Cellule hôte procaryote transformée par un vecteur selon la revendication 13.
15. Cellule hôte procaryote selon la revendication 14, caractérisée en ce qu'il s'agit d' E. coli.
16. Procédé de production d'une protéine recombinante d'intérêt dans une cellule hôte utilisant une construction selon l'une quelconque des revendications 1 à 12.
17. Procédé de production d'une protéine recombinante d'intérêt selon la revendication 16, dans lequel ladite construction est introduite dans une cellule hôte procaryote.
18. Procédé de production d'une protéine recombinante d'intérêt selon la revendication 16 ou 17, dans lequel ladite construction est introduite dans une cellule hôte procaryote par un vecteur selon la revendication 13.
19. Procédé de production d'une protéine recombinante d'intérêt selon l'une des revendications 16 à 18, caractérisé en ce qu'il comprend les étapes suivantes:
a) le clonage d'un gène d'intérêt dans un vecteur selon la revendication 13 ;
b) la transformation d'une cellule procaryote par un vecteur contenant un gène codant pour ladite protéine recombinante d'intérêt ;
c) la culture de ladite cellule transformée dans un milieu de culture permettant l'expression de la protéine recombinante ; et d) la récupération de la protéine recombinante à partir du milieu de culture ou de ladite cellule transformée.
a) le clonage d'un gène d'intérêt dans un vecteur selon la revendication 13 ;
b) la transformation d'une cellule procaryote par un vecteur contenant un gène codant pour ladite protéine recombinante d'intérêt ;
c) la culture de ladite cellule transformée dans un milieu de culture permettant l'expression de la protéine recombinante ; et d) la récupération de la protéine recombinante à partir du milieu de culture ou de ladite cellule transformée.
20. Utilisation d'une construction selon l'une des revendications 1 à 12, d'un vecteur selon la revendication 13 ou d'une cellule selon la revendication 14 ou 15, pour la production d'une protéine recombinante.
21. Utilisation d'une protéine recombinante pour la préparation d'un médicament destiné à être administré à un patient nécessitant un tel traitement, caractérisée en ce que ladite protéine recombinante est produite par un procédé selon l'une des revendications 16 à 19.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0008002A FR2810675B1 (fr) | 2000-06-22 | 2000-06-22 | Construction modifiee en aval du codon d'initiation pour la surexpression de proteines recombinantes |
FR00/08002 | 2000-06-22 | ||
PCT/FR2001/001952 WO2001098453A2 (fr) | 2000-06-22 | 2001-06-21 | Vecteurs d'expression comprenant un fragment modifie de l'operon tryptophane |
Publications (1)
Publication Number | Publication Date |
---|---|
CA2413612A1 true CA2413612A1 (fr) | 2001-12-27 |
Family
ID=8851556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CA002413612A Abandoned CA2413612A1 (fr) | 2000-06-22 | 2001-06-21 | Vecteurs d'expression comprenant un fragment modifie de l'operon tryptophane |
Country Status (10)
Country | Link |
---|---|
US (1) | US20040260060A1 (fr) |
EP (1) | EP1315822A2 (fr) |
JP (1) | JP2004500875A (fr) |
CN (1) | CN1443242A (fr) |
AU (1) | AU6922401A (fr) |
BR (1) | BR0111907A (fr) |
CA (1) | CA2413612A1 (fr) |
FR (1) | FR2810675B1 (fr) |
MX (1) | MXPA02012880A (fr) |
WO (1) | WO2001098453A2 (fr) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008525041A (ja) * | 2004-12-22 | 2008-07-17 | ジェネンテック・インコーポレーテッド | 可溶性多膜貫通型タンパク質の産生方法 |
EP2185704A1 (fr) * | 2007-08-03 | 2010-05-19 | Pfenex, Inc. | Séquences de régions d'initiation de la traduction pour une expression optimale de protéines hétérologues |
KR100961565B1 (ko) * | 2008-03-10 | 2010-06-07 | 충남대학교산학협력단 | 목적하는 단백질 발현 수준을 제공하는 초기 코돈의발굴방법, 및 이를 이용한 재조합 단백질의 발현 조절 방법및 생산 방법 |
US20110129873A1 (en) * | 2008-04-30 | 2011-06-02 | Monsanto Technology Llc | Recombinant DNA Vectors for Expression of Human Prolactin Antagonists |
US20110111977A1 (en) * | 2008-07-03 | 2011-05-12 | Pfenex, Inc. | High throughput screening method and use thereof to identify a production platform for a multifunctional binding protein |
CN110491447B (zh) * | 2019-08-05 | 2021-08-17 | 浙江省农业科学院 | 一种用于异源基因体外表达的密码子优化方法及应用 |
CN115960934A (zh) * | 2022-08-24 | 2023-04-14 | 深圳柏垠生物科技有限公司 | 大肠杆菌表达外源基因优化方法及其序列 |
CN118440969B (zh) * | 2024-07-08 | 2024-10-15 | 天津凯莱英生物科技有限公司 | 可溶性表达质粒突变体库的构建方法及其应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4738921A (en) * | 1984-09-27 | 1988-04-19 | Eli Lilly And Company | Derivative of the tryptophan operon for expression of fused gene products |
US4772555A (en) * | 1985-03-27 | 1988-09-20 | Genentech, Inc. | Dedicated ribosomes and their use |
US5149792A (en) * | 1989-12-19 | 1992-09-22 | Amgen Inc. | Platelet-derived growth factor B chain analogs |
US6121416A (en) * | 1997-04-04 | 2000-09-19 | Genentech, Inc. | Insulin-like growth factor agonist molecules |
GB9716790D0 (en) * | 1997-08-07 | 1997-10-15 | Creative Peptides Sweden Ab | Recombinant DNA molecules comprising multimeric copies of a gene sequence and expression thereof |
-
2000
- 2000-06-22 FR FR0008002A patent/FR2810675B1/fr not_active Expired - Fee Related
-
2001
- 2001-06-21 MX MXPA02012880A patent/MXPA02012880A/es unknown
- 2001-06-21 JP JP2002504602A patent/JP2004500875A/ja active Pending
- 2001-06-21 CN CN01812988.9A patent/CN1443242A/zh active Pending
- 2001-06-21 US US10/311,976 patent/US20040260060A1/en not_active Abandoned
- 2001-06-21 AU AU69224/01A patent/AU6922401A/en not_active Abandoned
- 2001-06-21 BR BR0111907-9A patent/BR0111907A/pt not_active IP Right Cessation
- 2001-06-21 CA CA002413612A patent/CA2413612A1/fr not_active Abandoned
- 2001-06-21 WO PCT/FR2001/001952 patent/WO2001098453A2/fr not_active Application Discontinuation
- 2001-06-21 EP EP01947565A patent/EP1315822A2/fr not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
FR2810675B1 (fr) | 2002-09-27 |
JP2004500875A (ja) | 2004-01-15 |
US20040260060A1 (en) | 2004-12-23 |
BR0111907A (pt) | 2003-12-30 |
WO2001098453A3 (fr) | 2002-08-01 |
AU6922401A (en) | 2002-01-02 |
EP1315822A2 (fr) | 2003-06-04 |
FR2810675A1 (fr) | 2001-12-28 |
CN1443242A (zh) | 2003-09-17 |
WO2001098453A2 (fr) | 2001-12-27 |
MXPA02012880A (es) | 2003-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107278227B (zh) | 用于体外病毒基因组工程的组合物和方法 | |
KR20210149686A (ko) | 유전자 편집에 유용한 폴리펩티드 및 사용 방법 | |
KR20210023831A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법 | |
WO2002072846A9 (fr) | Genes synthetiques et plasmides bacteriens depourvus de cpg | |
WO2020168051A1 (fr) | Procédés d'édition d'un gène associé à une maladie à l'aide d'éditeurs de bases d'adénosine désaminase, y compris pour le traitement d'une maladie génétique | |
FR2734842A1 (fr) | Sequence adn d'un gene de l'hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l'hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides | |
JP2014516546A (ja) | 転写終結配列 | |
KR20220062289A (ko) | Rna-가이드된 뉴클레아제 및 그의 활성 단편 및 변이체 및 사용 방법 | |
CN116157144A (zh) | 尿嘧啶稳定蛋白及其活性片段和变体以及使用方法 | |
FR2920158A1 (fr) | Production de plasmides et expression de proteines recombinantes dans des cellules cultivees sans antibiotiques | |
AU2017379402B2 (en) | Oleic acid-enriched plant body having genetically modified FAD2 and production method therefor | |
CA2413612A1 (fr) | Vecteurs d'expression comprenant un fragment modifie de l'operon tryptophane | |
CN113748205A (zh) | 用于改进的基因编辑的组合物和方法 | |
KR102151064B1 (ko) | 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법 | |
KR102358538B1 (ko) | 유전자 총법을 이용한 미세조류의 교정 방법 | |
WO1993001293A1 (fr) | Origine de replication plasmidique augmentant le nombre de copies du plasmide comprenant ladite origine | |
FR2810674A1 (fr) | Construction modifiee en amont du codon d'initiation pour la surexpression de proteines recombinantes | |
CA2325601A1 (fr) | Nouvelles constructions pour l'expression controlee de proteines recombinantes dans des cellules procaryotes | |
WO2024079140A1 (fr) | Séquences de promoteurs modifiées | |
CN116888266A (zh) | 靶蛋白的生产方法 | |
ZA200300550B (en) | Construct modified downstream of the initiation codon for recombinant protein overexpression. | |
JP5785787B2 (ja) | プロトプラスト形質転換効率の向上方法 | |
JP2011217730A (ja) | タンパク質の製造方法 | |
JPH06233688A (ja) | 植物ウィルス改良転写ベクター |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FZDE | Discontinued |