COMBINAISONS DE VECTEURS ET LEURS HOTES
POUR PROPAGER ET EXPRIMER DES GENES RECOMBINANTS
SANS RECOURIR A DES ANTIBIOTIQUES
L'invention se rapporte à de nouveaux systèmes eubactériens d'expression de protéines, permettant de ne pas utiliser d'antibiotiques, ainsi qu'à leur utilisation pour la production de protéines recombinantes.
La production de protéines recombinantes dans des hôtes eubactériens s'effectue actuellement en utilisant des plasmides portant des gènes de résistance aux antibiotiques en tant que marqueurs de sélection positive. On transforme les microorganismes avec ces plasmides portant le gène codant pour la protéine d'intérêt, sous le contrôle d'un promoteur approprié (constitutif ou inductible selon le but recherché), et on sélectionne les transformants, par leur aptitude à proliférer dans un milieu contenant l'antibiotique marqueur de sélection. On utilise en général l'ampicilline, la tétracycline, la kanamycine ou le chloramphénicol pour la sélection. Parmi ces antibiotiques utilisés pour la sélection, ceux dont l'activité est bactéricide sont généralement préférés à ceux dont l'activité est bactériostatique.
Toutefois, de tels systèmes d'expression, s'ils peuvent éventuellement être adaptés à la production de protéines dans les laboratoires scientifiques, ne sont pas souhaitable pour la production de protéines à grande échelle. En particulier, les plasmides portant les gènes de résistance à un antibiotique peuvent être échangés entre des microorganismes, ce qui peut donner lieu à une dissémination du gène de résistance dans des organismes sauvages. Par ailleurs, il peut rester des traces d'antibiotiques dans les préparations de protéines, ce qui est rédhibitoire lorsque la protéine recombinante doit obtenir un agrément de la part d'autorités réglementaires.
Il convient donc de mettre au point de nouveaux systèmes d'expression de protéines, dont la propagation ne requiert pas l'emploi d'antibiotiques pour produire la protéine d'intérêt.
On peut définir la stabilité d'un plasmide dans son hôte comme étant la propriété de maintenir une expression de la (ou des) protéine(s) d'intérêt, tout en maintenant l'activité détectable de la protéine, après propagation de l'hôte, pendant
un nombre de génération supérieur à 40 générations, de préférence, supérieur à 50 générations, de façon plus préférée supérieur à 60 générations.
Une méthode de propagation de l'hôte consiste à ensemencer au millième un milieu de culture avec un aliquote provenant d'une culture stationnaire (généralement après 24 heures de culture dans les conditions normales (37 °C pour
Escherichia coli)), et à répéter cette opération. Chaque opération de nouvel ensemencement correspond à la réalisation d'environ 10 générations.
Dans un premier mode de réalisation, l'invention se rapporte à un vecteur d'expression d'une protéine dans ue eubactérie, caractérisé en ce qu'il comprend, en tant qu'unique facteur de sélection positive, un gène complémentant une auxotrophie à l'acide meso-diaminopimélique (DAP), choisi notamment dans les gènes de synthèse de DAP.
De préférence, le facteur de sélection positive n'est pas le gène dapD2, mais est le gène asd (codant pour l'aspartate semialdéhyde déhydrogénase, Haziza et al.,
EMBO J., 1982, 1(3), 379-84, GenBank V00262, SEQ ID N° 20), ou le gène dapA.
Le gène dapA choisi est de préférence issu de E. coli, tel le gène décrit dans
GenBank (M12844), et dont la séquence codante est représentée par SEQ ID N° 1.
Ce gène dapA code pour la dihydropicolinate synthase, enzyme qui catalyse la première étape de la synthèse de l'acide meso-diaminopimélique (DAP) précurseur du peptidoglycanne de la paroi et de la lysine des protéines.
Le gène asd code pour l'aspartate semialdéhyde déhydrogénase, enzyme impliquée non seulement dans la synthèse du DAP mais aussi dans celle de la lysine, la méthionine, et la thréonine des protéines. Un intérêt d'utiliser une auxotrophie au DAP est que, contrairement à la plupart des autres auxotrophies décrites, on peut utiliser des milieux riches classiques pour propager les bactéries. En effet, ceux-ci ne contiennent pas de DAP, alors qu'ils contiennent généralement les facteurs de complémentation pour les autres auxotrophies (acides aminés...), et qu'il est donc nécessaire, pour ces autres auxotrophies, d'utiliser des milieux minimaux.
Un autre intérêt du choix de DAP comme marqueur d' auxotrophie est que le déficit en cet élément est bactéricide (et non bactériostatique).
Afin de réaliser la sélection des transformants, on utilise alors des hôtes pour lesquels le gène dapA a été inactivé, de préférence de façon non réversible, c'est-à- dire qu'une mutation naturelle lors de la croissance de l'hôte ne peut pas restaurer l'activité endogène du gène dapA. Lorsque le gène est inactivé, les bactéries ne peuvent pas se développer sur un milieu ne contenant pas de DAP. En revanche, après transformation par le vecteur selon l'invention et complémentation en trans, la présence de DAP n'est plus requise pour la croissance des microorganismes.
On obtient les bactéries modifiées par des techniques classiques de mutagenèse dirigée ou d'inactivation du gène par recombinaison homologue. Toutes ces techniques sont bien connues de l'homme du métier. On préfère notamment le remplacement du gène dapA par recombinaison homologue, pour assurer que l'inactivation est irréversible. Pour ce faire, on peut utiliser un vecteur de recombinaison homologue, dans lequel un gène de résistance à un antibiotique (par exemple de résistance au chloramphénicol ou à l'érythromycine) est flanqué de séquences homologues aux séquences flanquant le gène dapA. On sélectionne les bactéries AdapA, en fonction de leur résistance à l'antibiotique et de leur incapacité à pousser en absence de DAP.
Il convient de noter que l'utilisation d'un antibiotique pour obtenir la bactérie mutante est moins gênante, dans la mesure où le gène de résistance à l'antibiotique est introduite dans le génome bactérien. Les risques de dissémination dudit gène à d'autres organismes sont alors réduits. De plus, le gène n'est présent qu'en une seule copie dans la bactérie (alors qu'il est présent à un grand nombre de copies lorsqu'il est porté par un plasmide). Par ailleurs, il n'est nul besoin de maintenir une pression de sélection en utilisant l'antibiotique sur la bactérie après avoir sélectionné la bactérie mutante désirée.
En conséquence, la technique classique d'obtention d'une bactérie knock- out pour le gène dapA peut être utilisée. De plus, si la présence d'un gène codant pour la résistance à l'antibiotique est réellement non désirable, certains systèmes de sélection négative peuvent permettre de supprimer ce gène, après inactivation du gène dapA.
Dans un mode de réalisation préféré, ledit vecteur est stable dans son hôte procaryote, qui est préférentiellement E. coli.
Dans un mode de réalisation préféré, ledit vecteur est dérivé du vecteur pQE-60 ou pQE-70 (le plasmide pQE-60 correspond à SEQ ID N° 3, le plasmide pQE-70 ne différant de celui ci que par un site multiple de clonage, ces deux plasmides étant commercialisés par Qiagen (www.qiagen.com)). Dans un mode de réalisation, ledit vecteur est dérivé d'un vecteur pUC, notamment du vecteur pUC 18.
L'homme du métier comprend le terme « dérivé », qui signifie notamment que le vecteur final possède globalement le même squelette (notamment les origines de réplication, et éléments stabilisateurs...) que le vecteur de départ dont il est dérivé. Il est important de noter que ceci signifie également que, de préférence, les éléments intergéniques sont conservés.
Dans le cas présent, les modifications apportées au vecteur de base sont restreintes et ne modifient pas l'hôte de réplication du vecteur, ni ses propriétés fondamentales (nombre de copies, taille de l'insert, stabilité...). Dans le cas présent, on considère surtout qu'un vecteur est dérivé d'un autre, après substitution du gène marqueur de sélection positive.
Dans le cas présent, le gène bla codant pour la résistance à l'ampicilline du vecteur pQE-60 ou pQE-70 est remplacé par le gène dapA.
Dans un cas particulier de l'invention, le vecteur comporte en outre un gène permettant la régulation ou l'induction de l'expression de ladite protéine.
En effet, lorsque le vecteur selon l'invention est dérivé de pQE-60 ou pQE- 70, le gène codant pour la protéine d'intérêt est alors sous le contrôle du promoteur T5, et de deux opérateurs lacO. Il peut donc être intéressant d'introduire, dans le squelette du vecteur selon l'invention, le gène lad, codant pour une protéine interagissant avec les opérateurs lacO, et restreignant l'expression de la protéine d'intérêt. Lorsque l'on ajoute de l'IPTG (Isopropyl-β-D-thiogalactosidase) au milieu de culture, celui-ci fixe la protéine Lad, menant donc à l'expression induite de la protéine d'intérêt.
Dans un cas préféré, le vecteur selon l'invention est un vecteur pSP102, pSPl 14, pSP150, pSP139, pSPl 17, pSP136, tel que décrits dans les exemples, et en particulier le vecteur pSP114 ou pSP139 déposés à la CNC sous les numéros d'ordre respectifs 1-2796 et 1-2793, le 08 février 2002.
Dans un mode de réalisation particulier de l'invention, ledit vecteur ne contient pas de séquences spécifiques permettant une purification simplifiée de ladite protéine.
Par séquences spécifiques permettant une purification simplifiée de ladite protéine, on entend des séquences nucléiques situées en phase avec ladite protéine, en 5' ou 3' de la séquence codante de ladite protéine, lesdites séquences spécifiques codant pour une série d'acides aminés capables d'interagir avec des composés situés sur des supports de polymérisation (purification par chromatographie d'affinité, et récupération de la protéine native par clivage spécifique). De nombreux éléments peuvent être envisagés, et sont notamment résumés dans Ford et al. ("Fusion tails for the recovery and purification of recombinant proteins", Protein Expr Purif 1991 Apr-Jun;2(2-3):95-107).
On peut citer la queue polyhistidine (purification par chromatographie d'affinité à ions métalliques), les queues à acides aminés chargés (arginine, aspartate, glutamate, avec une chromatographie d'échange d'ions), les domaines se liant à la biotine, les enzymes (β-galactosidase, glutathion-S-transférase, chloramphénicol acétyl transférase, avec les ligands respectifs APTG, glutathion, chloramphénicol), les protéines se liant à des polypeptides (protéine A du Staphylocoques - IgG, protéine G du streptocoques - Albumine), les épitopes antigéniques (Flag, recA, β-galactosidase), les domaines se liant à des glucides (malE - maltose ou amidon réticulé, domaines de liaison à l'amidon, la cellulose ou le galactose).
Dans un autre mode de réalisation, l'invention se rapporte à un système d'expression d'une protéine, caractérisé en ce qu'il comporte :
- un premier vecteur selon l'invention, tel que décrit ci-dessus, et
- un hôte eubactérien, présentant une inactivation dans le gène dapA.
On a vu plus haut comment obtenir un hôte eubactérien (en particulier E. coli) présentant une inactivation, de préférence par une mutation (insertion, substitution, délétion) non réversible du gène codant pour ledit marqueur métabolique.
Dans un autre mode de réalisation, ledit système d'expression comporte en outre un second vecteur portant un élément permettant la régulation ou l'induction de l'expression de ladite protéine. Ledit élément a été décrit plus haut. Il peut ainsi s'agir d'un gène codant pour une protéine se fixant au promoteur ou à un opérateur du système d'expression sur le premier vecteur, fixation pouvant être diminuée par l'addition d'un composé compétiteur.
Alternativement, ledit élément peut être un facteur de transcription, sous le contrôle d'un promoteur inductible, notamment par l'IPTG, ou le lactose.
Dans un mode de réalisation préféré, ledit second vecteur ne contient pas de gène de résistance à un antibiotique, et comprend le gène thyA, en tant qu'unique facteur de sélection positive.
Le gène thyA code pour la thymidylate synthase, et les bactéries présentant une inactivation dans le gène thyA nécessitent la présence de thymidine si elles possèdent l'allèle tdk, ou de thymine si elles possèdent aussi l'allèle deoA pour leur croissance. Un gène thyA préféré est celui d'E. coli, représenté par SEQ ID N° 2.
Dans ce cas, et pour permettre la sélection, l'hôte eubactérien présente aussi une inactivation dans le gène thyA.
Dans un cas particulier, ledit second vecteur est le vecteur pREP4 (SEQ ID N° 4, commercialisé par Qiagen), dans lequel le gène neo codant pour la résistance la kanamycine a été remplacé par le gène codant pour thyA.
Dans un cas préféré, ledit système d'expression comporte au moins l'un des vecteurs choisis parmi pSPl 14, pSP139 et pVDM62 et au moins une souche choisie parmi +552, +838, +849, +1005, +1010 déposés à la CNCM sous les numéros d'ordre 1-2792 à 1-2796 le 08 février 2002. L'invention se rapporte également à un kit pour la production de protéines, comprenant un système d'expression selon l'invention, ainsi qu'à l'utilisation d'un vecteur selon l'invention, d'un système d'expression selon l'invention, ou d'un kit selon l'invention pour la production de protéines recombinantes. Dans un mode de réalisation particulier, la protéine recombinante est la protéine pipA*, codée en particulier par le gène pipA* (SEQ ID N° 19).
Dépôt de matériel biologique
Les organismes suivants ont été déposés le 08 février 2002 à la Collection Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724 Paris Cedex 15, France, selon les dispositions du Traité de Budapest.
- Souche +552 Numéro d'ordre 1-2792
- Souche +838 Numéro d'ordre 1-2793
- Souche +849 Numéro d'ordre 1-2794
- Souche +1005 Numéro d'ordre 1-2795
- Souche +1010 Numéro d'ordre 1-2796
Les souches déposées ont les génotypes suivants :
- Souche +552 ΔdapA :: erm - Souche +838 ΔdapA :: erm pSP 139
- Souche +849 ΔdapA :: cm - Souche +1005 ΔdapA :: cm ΔthyA :: erm
- Souche +1010 ΔdapA :: cm ΔthyA :: erm pSPl 14 pVDM62
Les plasmides inclus dans les souches peuvent aisément être isolés par des techniques connues de l'homme du métier, notamment en utilisant des kits commerciaux.
Les exemples ci-après sont destinés à illustrer certains modes de mise en oeuvre de l'invention, et ne doivent pas être considérés comme limitant l'invention.
DESCRIPTION DES FIGURES Les figures représentent les plasmides décrits dans les exemples.
Figure 1 : pSP102. Description du plasmide : MCS (396-455) ; LacZ (fragment N- Term de la β-Galactosidase) (469-146) ; Origine de réplication (réplicon pMBl) (866) : Gène dapA (séquence codante de la dihydropicolinate synthetase) (2504- 1626) Figure 2 : pQE 60. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; MCS (113-132) ; 6xHis-tag (133-150) ; Lambda tO (terminaison de la transcription)
(173-267) ; rrnB Tl (terminaison de la transcription) (1033-1131) ; ColEl origine de réplication (1608) ; Gène bla (séquence codante de la b-lactamase) (3226-2366). Figure 3 : pSP1 14. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; MCS (113-132) ; 6xHis-tag (133-150) ; Lambda t0 (terminaison de la transcription) (173-267) ; rrnB Tl (terminaison de la transcription) (1033-1131) ; ColEl origine de réplication (1608) ; Gène dapA (séquence codante de la dihydropicolinate synthetase) (3244-2366) Figure 4 : pSP 139. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; MCS (113-132) ; 6xHis-tag (133-150) ; Lambda t0 (terminaison de la transcription) (173-267) ; rrnB Tl (terminaison de la transcription) (1033-1131) ; ColEl origine de réplication (2812) ; Gène régulateur de l'opéron lac (lad) (1219-2310) ; Gène dapA (4448-3570) Figure 5 : pSP150. Description du plasmide :Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; MCS (113-132) ; 6xHis-tag (133-150) ; Lambda t0 (terminaison de la transcription) (173-267) ; rrnB Tl (terminaison de la transcription) (1033-1131) ; ColEl origine de réplication (2812) ; Gène régulateur de l'opéron lac (lad) (1218-2309) ; Gène dapA (4447-3569)
Figure 6 : plasmide pSPl 17. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; 6xHis-tag (1203-1220) ; Lambda t0 (terminaison de la transcription) (1243- 1343) ; rrnB Tl (terminaison de la transcription) (2103-2201) ; ColEl origine de réplication ( 2684) ; Gène dapA (4303-3425)
Gène clone :Gène synthétique pipA* (1068 pb ; 355 AA) (115-1182) Figure 7 : pSP136. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; 6xHis-tag (1203-1220) ; Lambda t0 (terminaison de la transcription) (1243-1343) ; rrnB Tl (terminaison de la transcription) (2103-2201) ; ColEl origine de réplication (3882) ; Gène régulateur de l'opéron lac (lad) (2278-3369) ; Gène dapA (5507- 4629) ; Gène clone . Gène synthétique pipA* (1068 pb ; 355 AA) (115-1182)
Figure 8 : pREP4. Description du plasmide : Début de numérotation / site HindIII (1) ; Gène neo(codant 1 'aminoglycoside 3'-phosphotransférase) (357-1151) ; Gène régulateur de l'opéron lac (lad) (2620-1529)
Figure 9 : pVDM62. Description du plasmide : Début de numérotation / site HindIII (1) ; Gène thyA (527-1321) ; Extrémité 3' du gène neo (1471-1702) ; Gène régulateur de l'opéron lac (lad) (3171-2080).
Figure 10 : pEVL225. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; MCS (113-134) ; Lambda tO (terminaison de la transcription) (155-249) ; rrnB Tl (terminaison de la transcription) (1015-1113) ; ColEl origine de réplication (2794) ; Gène régulateur de l'opéron lac (lad) (1201-2292) ; Gène dapA (4430-3552) Figure 11 : pEVL227. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; MCS (113-134) ; Lambda tO (terminaison de la transcription) (155-249) ; rrnB Tl (terminaison de la transcription) (1015-1 1 13) ; ColEl origine de réplication (2794) ; Gène régulateur de l'opéron lac (lad) (1200-2291) ; Gène dapA (4429-3551) Figure 12 : pEVL254. Description du plasmide : Début de numérotation / site Xhol (1) ; Promoteur T5 / opérateur lac (7-87) ; Site + 1 de début de transcription (61) ; Lambda tO (terminaison de la transcription) (1225-1319) ; rrnB Tl (terminaison de la transcription) (2085-2183) ; ColEl origine de réplication (3864) ; Gène régulateur de l'opéron lac (la ) (2260-3351) ; Gène dapA (5489-4611) ; Gène clone : Gène synthétique pipA* (1068 pb ; 355 AA) (1 15-1182)
EXEMPLES Exemple 1: Construction de plasmides propagés de façon stable dans E. coli sans marqueur de résistance à un antibiotique.
1.1. Construction d'un plasmide de clonage sans marqueur de résistance à un antibiotique.
Cette construction est réalisée à partir du plasmide commercial pUC18 (BioLabs) qui porte une origine de réplication du groupe de compatibilité ColEI et le gène bla de résistance aux pénicillines spécifiant la β-lactamase.
La séquence du plasmide pUC18 a été modifiée par mutagénèse dirigée aux nucléotides 1615 (changement T vers C), 1617 (changement G vers A) et 1618
(changement T vers G) par une méthode décrite (Ansaldi et al., 1996 Anal. Biochem., 234: 110-1 1 1) en utilisant les oligonucléotides PUC1 et PUC2 (SEQ ID N° 5 et SEQ ID N° 6). Le plasmide pSP98 ainsi obtenu possède un site unique Xhol. La digestion du plasmide pSP98 par les enzymes de restriction Sspl et Xhol permet d'éliminer le gène bla.
Le gène dapA d'E. coli spécifie la dihydropicolinate synthase, enzyme qui catalyse la première étape de la synthèse de l'acide meso-diaminopimélique (DAP), un précurseur du peptidoglycanne. Ce gène a été amplifié par PCR sur l'ADN chromosomique d'E. coli. 2 μl d'ADN total ont été mis en présence des 4 dNTP (250 μM), de chacun des oligodésoxynucléotides PUC3 et PUC4 (500 nM) (SEQ ID N° 7 et SEQ ID N° 8) et d'une unité de Vent DNA Polymérase (BioLabs) dans un volume final de réaction de 50 ml dans le tampon 10 mM KC1, 10 mM (NH4)2SO4, 20 mM Tris-HCl pH 8.8, 2 mM MgSO4, 0.1 % Triton X-100. Après une période de dénaturation à 95°C pendant 5 min, l'amplification de l'ADN a été réalisée durant 30 cycles de dénaturation 30 sec à 95°C - hybridation 30 sec à 52°C - élongation 1 min à 72°C, et terminée par 5 min d'élongation à 72°C.
Le fragment ainsi amplifié a été digéré par Sspl et Xhol et introduit par ligation dans le plasmide pSP98 lui aussi préalablement digéré par Sspl et Xhol. Les produits de ligation ont été introduits dans des souches d'E. coli portant une délétion au locus dapA et qui nécessitent donc pour croître la présence dans le milieu de culture d'acide méso-diaminopimélique (DAP), et plus précisément dans les souches +849, (ΔdapA: :cat, construite selon Richaud et al., 1993 J. Biol. Chem., 268:26827-26835), déposée à la CNCM sous le numéro 1-2794, ou +552 (ΔdapA: :erm, construite selon une méthode analogue à celle utilisée pour la souche +849), et déposée à la CNCM sous le numéro 1-2792. Les transformants ont été sélectionnés sur le milieu riche de Luria-Bertani (LB, DIFCO) sans DAP.
Douze transformants ont été analysés pour essayer de déceler la présence de plasmides portant le gène dapA+ conformes à la construction espérée. Les ADN plasmidiques de ces 12 transformants ont été extraits (Kit Qiaprep, Qiagen) et soumis à des coupures analytiques par des enzymes de restriction appropriées. Un plasmide conforme a été isolé et nommé pSP102. Une représentation schématique de ce plasmide est donnée en Figure 1.
La souche +541 contenant le plasmide pSP102 (ΔdapA: :erm pSP102) a été restriée cinq fois consécutivement sur LB-agar sans DAP et le maintien du plasmide de clonage pSP102 en l'absence d'antibiotique a été établi.
1.2. Construction d'un plasmide d'expression sans marqueur de résistance à un antibiotique.
Cette construction utilise le plasmide commercial pQE60 (Qiagen, représenté schématique en Figure 2). Ce plasmide (origine de réplication ColEl, gène bla) contient le promoteur du phage T5, deux éléments de l'opérateur lac, le site synthétique de liaison ribosomique RBSII en 5' du polylinker et une séquence de codage pour un tag 6 x His en 3' du polylinker.
Afin de remplacer le gène bla par le gène dapA d'E. coli, la séquence du plasmide pQE60 a été modifiée par mutagénèse dirigée (méthode selon Ansaldi et al., 1996, op. cit.) au nucléotide 838 (changement T vers A, oligonucléotides PQE60/1 et PQE60/2, SEQ ID N° 9 et SEQ ID N° 10), entraînant la destruction d'un site de restriction Sspl et aux nucléotides 2358-2360 (changement TCT vers GTC, oligonucléotides PQE60/3 et PQE60/4, SEQ ID N° 11 et SEQ ID N° 12) entraînant la création d'un site de restriction Sali. Le plasmide obtenu, pSPHO, a été digéré ensuite par Sspl et Sali afin d'éliminer le gène bla. Le gène dapA d'E. coli a été amplifié par PCR sur ADN chromosomique d'E. coli comme décrit ci-dessus dans l'exemple 1.1 à l'aide des oligonucléotides PQE60/5 et PQE60/6 (SEQ ID N° 13 et SEQ ID N° 14) .
Le fragment ainsi amplifié a été digéré par les enzymes de restriction Xhol et EcoRV et introduit par ligation dans le plasmide pSPl 10 digéré par Sspl et Sali. Les produits de ligation ont été introduits dans la souche +552 (ddapA::erm ) et la souche transformante +644 sélectionnée sur milieu LB sans ajout de DAP. La présence du gène dapA sur le plasmide extrait de cette souche a été confirmée par séquençage. Ce plasmide, représenté schématiquement en Figure 3 a été nommé pSP114. La construction d'un vecteur d'expression dapA+ d'E. coli portant le gène répresseur la de l'opéron lactose a été réalisée à partir du plasmide pSPl 14 et le gène lad du plasmide pREP4 (Qiagen) amplifié par PCR. L'amplification a été réalisée selon le protocole décrit ci-dessus en 1.1. en présence d'ADN plasmidique
10 nM et des oligodésoxynucléotides PQE60/7 et PQE60/8 (SEQ ID N° 15 et SEQ ID N° 16). Le fragment ainsi amplifié a été digéré par Nhel et introduit par ligation dans le plasmide pSPl 14 préalablement digéré par Xbal (site de coupure unique au nucléotide 1 134). Les produits de ligation ont été introduits dans la souche +552 et les transformants sélectionnés sur milieu LB sans ajout de DAP.
Les ADN plasmidiques des transformants ont été extraits et analysés. Ainsi, la présence du gène lad sur le plasmide pSP139 (fig. 4) de la souche transformante +838 et son orientation par rapport aux autres éléments du plasmide ont été vérifiées par coupures analytiques avec des enzymes de restriction appropriées et par séquençage. La souche +838 a été déposée à la CNCM sous le numéro 1-2793. Le même schéma de construction a été appliqué au vecteur commercial pQE70 (QIAGEN) qui possède un site de clonage (MCS : multiple cloning site) différent de celui du pQE60. Le vecteur résultant (pSP150) est représenté schématiquement en Figure 5. Les plasmides pSP114, pSP139 (dérivés de pQE60) et pSP150 (dérivé de pQE70) offrent donc un large éventail de possibilités de clonage.
Exemple 2: Surexpression dans E. coli du gène hétérologue pipA* clone dans les plasmides dapA+. Le gène pipA d'une taille de 1066 pb codant pour la lysine cyclodésaminase de Streptomyces pristinaespiralis et dont la séquence est décrite dans le brevet WO 9601901 -Al, est composé d'une proportion en G + C de 69,6 %. Ce gène a été réécrit suivant le code génétique optimisé pour l'expression dans Escherichia coli (pipA*, SEQ ID n° 19) et est désormais composé d'une proportion en G + C de 38 %. Ce gène a été construit par PCR.
Afin d'introduire un site de restriction unique Kpnl, le résidu thréonine 97 a été codé par ACC au lieu de ACT. Un codon de terminaison de la traduction TAA a été également ajouté en position 1080 (1er nucléotide du codon) de la séquence SEQ ID n° 19, et des sites de restriction uniques EcoRI et Ncol d'une part, HindIII d'autre part, ont été introduits respectivement en 5' et en 3' du gène permettant ainsi son insertion dans un vecteur de clonage. La traduction commence à l' ATG en position 15.
Le gène synthétique pipA* a été préalablement clone dans le vecteur pQE60 pour donner le plasmide pSP47. Il a ensuite été inséré dans les vecteurs dapA+ pSP114 et pSP139 (décrits ci-dessus en 1.2.). Le plasmide pSP47 a été coupé par les enzymes de restriction Ncol et BglII ; le fragment de digestion de 1076 bp a été introduit par ligation dans les plasmides pSP114 et pSP139 digérés par Ncol et BglII. Les produits de ligation ont été introduits dans la souche +552 (décrite à l'exemple 1.1) et les transformants sélectionnés en milieu LB sans DAP. Les plasmides pSP117 (Figure 6) et pSP136 (Figure 7) résultant respectivement des ligations avec les vecteurs pSP114 et pSP139 ont été caractérisés et réintroduits dans la souche +552. Les souches +626 et +823 ont été ainsi isolées, hébergeant respectivement les plasmides pSP117 et pSP136.
L'expression du gène pipA* a été étudiée dans les trois souches +75, +626 et +823. La souche +75 est un dérivé de la souche d'E. coli K12 MG1655 (Vidal et al. (1998) J. Bacteriol., 180 :2442-2449) contenant le plasmide pSP47 (pQE60::pipA*) et le plasmide auxiliaire pREP4 portant le gène lad. Les souches +626 et +823 et la souche contrôle +75 ont été cultivées en milieu LB à 37°C jusqu'à atteindre la densité optique (600 nm) de 0,8.
Dans le cas des souches +75 et +823, 1TPTG a été ajouté au milieu de culture suivant le protocole du fournisseur (Kit Qiaexpressionist, Qiagen) pour induire l'expression du gène pipA*.
Les protéines totales des cellules ainsi cultivées ont été séparées par électrophorèse en gel de polyacrylamide/SDS et colorées par le bleu de Coomassie. Une protéine d'un poids moléculaire de 36 kDa a été détectée et son taux d'expression a été estimé à environ 5 % des protéines totales dans les trois souches. Des cultures témoins des souches +75 et +823 sans ajout d'IPTG ont permis de contrôler l'absence d'expression du gène pipA* et donc l'activité du répresseur lad porté, en trans sur le plasmide auxiliaire pREP4 (souche +75), en cis sur le plasmide pSP136 (souche +823).
Exemple 3: Stabilité de l'activité L-lysine cyclodésaminase propagée par un plasmide dapA+ lacl+ sans marqueur de résistance à un antibiotique.
Il est apparu que l'expression de l'activité de la L-lysine cyclodésaminase n'était pas stable dans la souche +626, bien que le plasmide se maintienne et assure
la croissance en absence de DAP dans le milieu de culture. Ceci laisse suggérer que l'enzyme PipA* est toxique pour les cellules. Cet effet n'a pas été décrit auparavant.
Les constructions décrites ci-dessus (souches +75 et +823) permettent de verrouiller l'expression du gène pipA* par expression du répresseur la , d'induire l'expression du gène toxique en présence d'IPTG et offrent, dans le cas de la souche
+823, un vecteur d'expression inductible dépourvu de gène de résistance à un antibiotique.
Les souches +75, +626 et +823 (décrites dans l'exemple 2) ont été cultivées chacune dans 100 ml de milieu LB à 37°C jusqu'à atteindre la phase stationnaire (24h). Ces cultures ont été ensuite diluées en inoculant 100 mL de LB neuf avec 100 mL de la culture stationnaire. Cette opération de dilution au millième a été réalisée sept fois consécutivement sur chaque culture, réalisant ainsi approximativement 70 générations. L'activité L-lysine-cyclodésaminase de la protéine PipA* exprimée dans les souches +75, +626 et +823 a été testée suivant un protocole décrit ci-dessous sur des aliquots conservés par congélation des cultures correspondant à 0, 20, 40, 60 et 70 générations.
Après induction, les cultures sont centrifugées à 13000g et les culots cellulaires sont repris dans du milieu minéral MS de façon à concentrer les cellules 100 fois. Les cellules sont alors perméabilisées par deux étapes de congélation/décongélation à -20°C favorisant l'accès du substrat à l'enzyme. La L- lysine monohydrochloride (pH = 7) est alors ajoutée à une concentration finale de 1 M dans les suspensions cellulaires (volume final = 2 mL). La réaction enzymatique se fait à 37°C sous agitation. Au bout de 20 heures on prélève un échantillon de 300 μl de chaque culture que l'on centrifuge à 13000g de façon à récupérer le surnageant. Une solution diluée des surnageants est ensuite déposée sur couche mince de silice.
L'activité de la lysine-cyclodésaminase est mesurée par la conversion de la L-lysine en acide-L-pipécolique dans des suspensions cellulaires et par la révélation de l'acide-L-pipécolique par coloration avec la ninhydrine après migration chromatographique en couche mince (Rf = 0.22 ; butanol / acide acétique / eau
4/1/1).
Dans le cas de la souche +626 on a constaté une perte totale d'activité au bout de 20 générations. En revanche, dans le cas des souches +75 et +823, l'activité de la L-lysine-cyclodésaminase est stable au-delà de 70 générations.
Exemple 4: Construction d'une souche permettant la propagation stable de deux plasmides sans gènes de résistance à des antibiotiques.
4.1. Construction d'une souche d'E. coli portant deux délétions : au locus thyA spécifiant la thymidylate synthase et au locus dapA spécifiant la dihydropicolinate svnthase. Un lysat du phage PI récolté sur la souche d'E. coli +849 (ΔdapA::cat, exemple 1.1) a été employé pour transduire le caractère ΔdapA::cat dans la souche βl308 (ΔthyA::erm, Lemeignan et al., 1993 J. Mol. Biol., 231 :161-166). La souche transductante +1005 (ΔdapA::cat ΔthyA::erm) a été sélectionnée en présence de chloramphénicol sur milieu LB supplémenté avec de la thymidine (dT, 0.3 mM) et du DAP (0.1 mM). Les auxotrophies pour la thymidine et pour le DAP ont été confirmées sur les milieux appropriés. La souche +1005 a été déposée à la CNCM sous le numéro 1-2795.
4.2. Construction d'un plasmide thyA+ sans marqueur de résistance à un antibiotique
Le gène thyA a été amplifié par PCR à partir du plasmide pTSO (Lemeignan et al., 1993) construit par insertion du gène thyA sauvage d'E. coli dans le plasmide commercial pTZ18R (BioRad). L'amplification PCR a été réalisée avec les oligonucléotides PREP1 et PREP2 (SEQ ID N° 17 et SEQ ID N° 18) en utilisant la Vent Polymerase (Biolabs) selon le protocole décrit à l'exemple 1.1. Le fragment amplifié a été coupé avec les enzymes de restriction Ncol et BglII et introduit par ligation dans le vecteur pREP4 (Qiagen, représenté schématiquement en Figure 8) dont la cassette de résistance à la kanamycine (neo) a été éliminée par digestion avec Ncol et BglII. Les produits de ligation ont été introduits dans la souche βl308 et des transformants sélectionnés sur milieu LB sans ajout de thymidine. Le plasmide pVDM62 (Figure 9) a été isolé. Le remplacement de la cassette neo par le
gène thyA a été vérifié par coupure du plasmide pVDM62 avec des enzymes de restriction appropriées et séquençage du gène lad.
4.3. Expression inductible et stable du gène hétérologue pipA* dans la souche +1005 (ΔdapA::cat ΔthyA::erm)
Le plasmide pVDM62 construit à l'exemple 4.2 a été introduit dans la souche +1005 décrite à l'exemple 4.1 ; les transformants ont été sélectionnés en milieur LB en présence de DAP et en absence de thymidine. Un de ces transformants (souche +1007) a été ensuite isolé puis transformé avec le plasmide pSPl 17 résultant de la ligation entre le pSP114 coupé par Ncol et BglII et l'insert portant le gène pipA* du plasmide pSP47 coupé par les mêmes enzymes. Les transformants ont été sélectionnés sur milieu LB en absence de DAP.
La souche (+ 1008) ainsi obtenue héberge les plasmides pVDM62 et pSP117. Cette souche a été cultivée en présence ou en absence d'IPTG et les activités de la lysine-cyclodésaminase produite ont été mesurées comme décrit à l'exemple 3 et comparées entre elles. Il a ainsi été vérifié que l'expression de l'enzyme est bien verrouillée par le répresseur lad présent en trans sur le plasmide pVDM62.
Parallèlement la souche (+1010) a été construite en introduisant le plasmide pSP114 dans la souche +1007. Cette souche, hébergeant les plasmides pSP114 et pVMD62 a été déposée à la CNCM sous le numéro 1-2796.
Ces exemples démontrent que les marqueurs de sélection métaboliques dapA et thyA peuvent être utilisés dans des vecteurs d'expression de protéines, dans des hôtes appropriés. Ils démontrent aussi l'utilité du répresseur lad, et son activité en cis ou en trans.
Exemple 5: Construction et utilisation de plasmides d'expression dépourvus de séquence étiquette utile pour la purification des protéines et propagés de façon stable dans E. coli sans marqueur de résistance à un antibiotique.
La séquence du plasmide pSP139 décrit à l'exemple 1.2. a été modifiée par mutagénèse dirigée selon la méthode décrite par Ansaldi et al. (1996) en utilisant les oligonucléotides 817 et 818 (SEQ ID N°21 et SEQ ID N°22). Le plasmide
pEVL225 ainsi obtenu et représenté schématiquement en Figure 10, ne comporte plus la séquence de 18 paires de bases présente sur le plasmide pQE60 et codant pour l'étiquette hexa-histidyl de purification des protéines.
Le même protocole de délétion par mutagénèse dirigée a été appliqué au plasmide pSP150 décrit à l'exemple 1.2. pour construire le plasmide pEVL227 représenté schématiquement en Figure 1 1.
Le gène synthétique pipA* spécifiant la lysine cyclodésaminase de Streptomyces pristinaespiralis préalablement clone dans le vecteur pQE60 (pSP47, FR 2 825 717 Al) a été inséré dans le vecteur dapA+ pEVL225 décrit ci-dessus. Le plasmide pSP47 a été coupé par les enzymes de restriction Ncol et BglII ; le fragment de digestion de 1076 bp ainsi obtenu a été introduit par ligation dans le plasmide pEVL225 digéré par Ncol et BglII. Le produit de la ligation a été introduit dans la souche +552 (décrite à l'exemple 1.1., déposée à la CNCM, sous le numéro 1-2792) et les transformants sélectionnés en milieu LB sans DAP. Le plasmide pEVL254 a été extrait à partir d'une culture de ces transformants puis caractérisé. Le plasmide pEVL254 est représenté schématiquement en Figure 12.
Les plasmides respectifs pEVL225, pEVL227, et pEVL254 ont été introduits dans la souche +552 (ΔdapA: :erm) et les souches transformantes respectives +2140, +2142 et +2294 ont été sélectionnée sur milieu LB sans ajout de DAP comme décrit à l'exemple 1.1.
L'expression efficace du gène pipA* dans la souche +2294 par induction à 1TPTG a été vérifiée par visualisation d'une bande de 36 kDa après électrophorèse sur gel de polyacrylamide en conditions dénaturantes comme décrit à l'exemple 2. Par ailleurs, la stabilité d'une telle expression du gène pipA* après propagation de la souche +2294 en milieu LB pendant plus de 70 générations et le maintien du niveau élevé d'activité de la lysine cyclodésaminase codée par le gène pipA* ont été confirmés en utilisant la méthode décrite à l'exemple 3.