WO2009121994A1 - Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones - Google Patents

Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones Download PDF

Info

Publication number
WO2009121994A1
WO2009121994A1 PCT/ES2009/070079 ES2009070079W WO2009121994A1 WO 2009121994 A1 WO2009121994 A1 WO 2009121994A1 ES 2009070079 W ES2009070079 W ES 2009070079W WO 2009121994 A1 WO2009121994 A1 WO 2009121994A1
Authority
WO
WIPO (PCT)
Prior art keywords
peptide
sequence
protein
fusion protein
seq
Prior art date
Application number
PCT/ES2009/070079
Other languages
English (en)
French (fr)
Inventor
José Miguel MANCHEÑO GÓMEZ
Iván ANGULO HERRERA
Original Assignee
Consejo Superior De Investigaciones Científicas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior De Investigaciones Científicas filed Critical Consejo Superior De Investigaciones Científicas
Publication of WO2009121994A1 publication Critical patent/WO2009121994A1/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • C07K14/42Lectins, e.g. concanavalin, phytohaemagglutinin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins

Definitions

  • the invention can be framed in a generic way in the biotechnology sector, with obvious applications in the pharmaceutical field and, currently, in the development of high performance structural genomics projects. More specifically, the invention would be framed in the processes of production and purification of fusion proteins.
  • Some systems considered are based on mammalian, yeast or insect eukaryotic cells (Greene, JJ. (2004). Methods Mol. Biol. 267, 3-14; DaIy, R. & Hearn, MT. (2005). J. Mol. Recognit. 18, 119-138; Kost, TA, Condreay, JP. & Jarvis, DL (2005). Nat. Biotechnol. 23, 567-575) or cell-free systems (Murthy, TV, Wu, W ., Qiu, QQ, Shi, Z. Labaer, J. & Brizuela, L. (2004). Prot. Expr. Purif. 36, 217-225).
  • affinity tag because they allow to develop generic purification protocols based on affinity chromatographs, while in Ia
  • Trx Trx
  • MBP has become one of the affinity labels on which most interest one of the most widely studied (Dyson, MR, Shadbolt, SP, Vincent, KJ, Perera, RL & McCafferty, J. (2004). BMC Biotechnol.
  • An aspect of the invention constitutes a recombinant fusion protein, hereinafter fusion protein of the invention, comprising at least one sequence of the following group: a) the amino acid sequence of the LSLi 50 peptide of the Laetiporus sulphureus (SEQ) fungus ID NO2), and b) a sequence analogous to SEQ ID NO2 of a).
  • analogous is intended to include any amino acid sequence that can be isolated or constructed based on the amino acid sequence shown in the SEQ. ID NO2, for example, by the introduction of conservative or non-conservative amino acid substitutions, including the insertion of one or more amino acids, the addition of one or more amino acids at any of the ends of the molecule or the deletion of one or more amino acids at any end or inside the sequence.
  • an analogous amino acid sequence is substantially homologous to the amino acid sequence identified as SEQ ID NO2.
  • Ia "substantially homologous" expression means that the amino acid sequences in question have a degree of identity, at the amino acid level, of at least 60%, preferably of at least 85%, or more preferably of at least 95%
  • Another aspect of the invention constitutes the method of obtaining the fusion protein, hereinafter the method of the invention, which comprises the following steps:
  • the gene construction or expression vector of i) under the control of suitable promoters allows the expression of the fusion protein or peptide of interest, and purification of the crude extract of the cells, iii) Immobilization of the protein or peptide of fusion in matrices derived from agarose by passing crude extract of ii) through the matrix, iv) Dissociation of the fusion protein or peptide from the chromatographic matrix by washing the matrix with a medium containing one or more competing sugars , and, optionally v) Separation of the SEQ ID NO2 peptide from the fusion protein by suitable proteolytic treatment.
  • step i) of the process of the invention it is necessary to develop a genetic construction comprising the DNA sequence encoding the peptide SEQ ID NO2, the protein or peptide of interest and optionally, an endoprotease recognition sequence, for example , TEV (tobaceous etch virus endoprotease) in order to separate the affinity tag from the protein of interest.
  • an endoprotease recognition sequence for example , TEV (tobaceous etch virus endoprotease)
  • Another aspect of the invention constitutes a genetic construction coding for the DNA sequence coding for the fusion protein of the invention, hereinafter genetic construction of the invention, which comprises, at least, a sequence of the following group: a) Ia DNA sequence SEQ ID NO1, and b) a sequence homologous to SEQ ID NO1.
  • the genetic construction of the invention allows the expression of a protein of interest linked to the peptide of SEQ ID NO2.
  • This genetic construction of the invention may also comprise, if necessary and to allow a better isolation, detection or secretion outside the cell of the expressed peptide of interest, a nucleotide sequence encoding a peptide capable of being used for purposes. for isolation, detection or secretion of said peptide.
  • a particular object of the present invention constitutes a genetic construction of the invention comprising any other nucleotide sequence encoding a peptide or peptide sequence that allows the isolation, detection or secretion outside the cell of the expressed peptide , for example, by way of illustration and without limiting the scope of the invention, a polyhistidine sequence (6xHis), a peptide sequence recognizable by a monoclonal antibody (for example, for identification, or any other that serves to purify the protein of fusion resulting by immunoaffinity chromatography: tag peptides such as c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David La ⁇ e (1999). CoId Spring Harbor Laboratory Press. New York.
  • another aspect of the present invention constitutes an expression vector, hereinafter the expression vector of the invention, comprising a genetic construction of the invention and allowing the expression of a protein or peptide. Examples of a particular embodiment can be found in the examples of the present invention.
  • an expression vector comprises, in addition to the genetic construction described in the invention, a promoter that directs its transcription (for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.), to which it is operatively linked , and other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (tlt2, etc.), polyadenylation signal, origin of replication , ribosome binding sequences (RBS), coding sequences of transcriptional regulators, (enhancers), transcriptional silencers (silencers), repressors, etc.
  • a promoter that directs its transcription for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.
  • other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (t
  • expression vectors can be selected according to the conditions and needs of each specific case among expression plasmids, viral vectors (DNA or RNA), cosmids, artificial chromosomes, etc. which may also contain markers that can be used to select cells transfected or transformed with the gene or genes of interest.
  • the choice of the vector will depend on the host cell and the type of use to be performed. Therefore, according to one embodiment Particular of the present invention said vector is a plasmid or a viral vector.
  • the obtaining of said vector can be carried out by conventional methods known to those skilled in the art, as well as for the transformation of microorganisms and eukaryotic cells different widely known methods can be used - chemical transformation, electroporation, microinjection, etc.
  • Another aspect of the present invention constitutes a host cell, hereinafter cell of the invention, which comprises the genetic construction or the expression vector of the invention, preferably a prokaryotic cell.
  • a particular embodiment of the invention constitutes a host cell of the invention constituted by an E. coli cell, preferably E. coli BL21 DE3 cells.
  • the present invention relates to a new general or universal method of expression and purification of fusion proteins containing a ⁇ -clover lectin domain as an affinity tag.
  • the present invention is based on the fact that the inventors have observed that the lectin module of the hemolytic protein of the fungus Laetiporus sulphureus (the first 150 amino acids: LSL150) (SEQ ID NO2) is functional as a constituent part of numerous recombinant fusion proteins designed ad hoc. That is, on the one hand, Ia
  • SEQ ID NO2 is versatile from a protein folding perspective because it folds properly being accompanied by different proteins at its C-terminal end and, on the other, retains its sugar binding capacity.
  • the recombinant proteins of interest fused to the C-terminal end of SEQ ID NO2 also fold properly, as deduced from the results of activity carried out with the pure proteins.
  • these proteins of interest maintain their native state even once separated from SEQ ID NO2 by proteolytic treatment (TEV protease; see below). All this has allowed to purify various fusion proteins containing the SEQ ID NO2 at its N-terminal end using a single purification protocol.
  • SEQ ID NO2 (of eukaryotic origin) is produced in E. coli (prokaryotic) with a high yield (approx. 80 mg per liter of culture), folding properly.
  • E. coli prokaryotic
  • Figure 3 the three-dimensional structure of SEQ ID NO2 produced in E. coli that they have determined is essentially equal to that of the corresponding LSL lectin module isolated directly from the L. sulphureus fungus ( Figure 3). This structure guarantees the proper folding of SEQ ID NO2 expressed heterologously in a prokaryotic organism, which is not always obvious.
  • the yield with which the constructed fusion proteins are obtained is such that it allows to tackle projects of crystallization of the pure proteins, once separated from SEQ ID NO2, with a low cost.
  • the A. haemolyticum PLD protein see example 3
  • its expression with a histidine tag (His6 tag) under the same conditions as LSL 150 -PLD did not allow obtaining the soluble fusion protein. That is, the sequence SEQ ID NO2 has affinity and solubility label properties.
  • SEQ ID NO2 allows to produce different fusion proteins with high yields and to establish a purification protocol for them of a general, efficient, simple and low cost nature. These characteristics are due to factors of different nature. In the first place, it is because the method of purification of the fusion protein implies a single chromatographic affinity stage. Secondly, the cost of the main components used in this protocol, that is, chromatographic matrices derived from agarose (Sepharose TM 4B, 6B, CL-4B, CL-6B) and eluents (D (+) - lactose ), is surprisingly low.
  • the chromatographic matrices used do not require any additional chemical treatment to act as affinity matrices against the sequence SEQ ID NO2 and, on the other, being essentially inert to the homogenized cell and not requiring regenerations beyond buffer washing, can be reused essentially continuously.
  • one aspect of the invention constitutes a recombinant fusion protein, hereinafter fusion protein of the invention, comprising at least one sequence of the following group: c) the amino acid sequence of the fungus LSL150 peptide
  • Laetiporus sulphureus (SEQ ID NO2), and d) a sequence analogous to SEQ ID NO2 of a).
  • analogous is intended to include any amino acid sequence that can be isolated or constructed based on the amino acid sequence shown in the SEQ. ID NO2, for example, by the introduction of conservative or non-conservative amino acid substitutions, including the insertion of one or more amino acids, the addition of one or more amino acids at any of the ends of the molecule or the deletion of one or more amino acids at any end or within the sequence.
  • an analogous amino acid sequence is substantially homologous to the amino acid sequence identified as SEQ ID N02.
  • the expression “substantially homologous” means that the amino acid sequences in question have a degree of identity, at the level of amino acids, of at least 60%, preferably of at least 85% , or more preferably of at least 95%.
  • Another aspect of the invention constitutes the method of obtaining the fusion protein, hereinafter the method of the invention, which comprises the following steps: v) Obtaining a gene construction comprising the nucleotide sequence of LSL 150 (SEQ ID NO1 ) and the sequence coding for the protein or peptide of interest, and of the expression vector that it comprises, vi) Transformation of a host cell, preferably prokaryotic, more preferably Escher ⁇ chia coli, in which the gene construct or the vector of expression of i) under control of suitable promoters, allows the expression of the fusion protein or peptide of interest, and purification of the crude extract from the cells, vii) Immobilization of the fusion protein or peptide in matrices derived from agarose by means of the passage of crude extract of ii) through the matrix, viii) Dissociation of the fusion protein or peptide from the chromatographic matrix ica by washing the matrix with a medium containing one or several competing sugars, and, optionally v) Separat
  • step i) of the process of the invention it is necessary to develop a genetic construction comprising the DNA sequence encoding the peptide SEQ ID NO2, the protein or peptide of interest and optionally, an endoprotease recognition sequence, for example , TEV (tobaceous etch virus endoprotease) in order to separate the affinity tag from the protein of interest.
  • an endoprotease recognition sequence for example , TEV (tobaceous etch virus endoprotease)
  • Another aspect of the invention constitutes a genetic construction coding for the DNA sequence coding for the fusion protein of the invention, hereinafter genetic construction of the invention, which comprises, at least, a sequence of the following group: c) Ia DNA sequence SEQ ID NO1, and d) a sequence homologous to SEQ ID NO1.
  • the genetic construction of the invention allows the expression of a protein of interest linked to the peptide of SEQ ID NO2.
  • This genetic construction of the invention may also comprise, if necessary and to allow a better isolation, detection or secretion outside the cell of the expressed peptide of interest, a nucleotide sequence encoding a peptide capable of being used for purposes. for isolation, detection or secretion of said peptide.
  • a particular object of the present invention constitutes a genetic construction of the invention comprising any other nucleotide sequence encoding a peptide or peptide sequence that allows the isolation, detection or secretion outside the cell of the expressed peptide , for example, by way of illustration and without limiting the scope of the invention, a polyhistidine sequence (6xHis), a peptide sequence recognizable by a monoclonal antibody (for example, for identification, or any other that serves to purify the resulting fusion protein by immunoaffinity chromatography: label peptides such as c-myc , HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David La ⁇ e (1999). CoId Spring Harbor Laboratory Press. New York. Chapter: Tagging proteins. Pp. 347-377).
  • Said nucleotide sequences can be integrated into a gene expression vector that allows the regulation of the expression thereof under suitable conditions inside the cells.
  • another aspect of the present invention constitutes an expression vector, hereinafter the expression vector of the invention, comprising a genetic construction of the invention and allowing the expression of a protein or peptide. Examples of a particular embodiment can be found in the examples of the present invention.
  • an expression vector comprises, in addition to the genetic construction described in the invention, a promoter that directs its transcription (for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.), to which it is operatively linked , and other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (tlt2, etc.), polyadenylation signal, origin of replication , ribosome binding sequences (RBS), sequences encoders of transcriptional regulators, (enhancers), transcriptional silencers (silencers), repressors, etc.
  • a promoter that directs its transcription for example, pT7, plac, ptrc, ptac, pBAD, ret, etc.
  • other necessary or appropriate sequences that control and regulate said transcription and, where appropriate, the translation of the product of interest, for example, transcription initiation and termination signals (
  • expression vectors can be selected according to the conditions and needs of each specific case among expression plasmids, viral vectors (DNA or RNA), cosmids, artificial chromosomes, etc. which may also contain markers that can be used to select cells transfected or transformed with the gene or genes of interest.
  • the choice of the vector will depend on the host cell and the type of use to be performed. Therefore, according to a particular embodiment of the present invention said vector is a plasmid or a viral vector.
  • the obtaining of said vector can be carried out by conventional methods known to those skilled in the art, as well as for the transformation of microorganisms and eukaryotic cells different widely known methods can be used - chemical transformation, electroporation, microinjection, etc.
  • Another aspect of the present invention constitutes a host cell, hereinafter cell of the invention, which comprises the genetic construction or the expression vector of the invention, preferably a prokaryotic cell.
  • a particular embodiment of the invention constitutes a host cell of the invention constituted by an E. coli cell, preferably E. coli BL21 DE3 cells.
  • FIG. 1 Plasmid pKLSL150 and sequence of the LSL 150 protein.
  • Left part scheme of the expression vector pKLSL150 containing Ia 450 nt sequence coding for the LSL 150 protein under the control of the T7 promoter and an IPTG inducible regulator. This plasmid contains the Kanamycin resistance gene (Kan), the lacl repressor gene, and a multiple cloning site (Ncol / Xhol).
  • Right part nucleotide and amino acid sequence of the LSL 150 protein flanked by the Ncol and EcoRI restriction sites used in the cloning.
  • Figure 2. Analysis by SDS-PAGE of the purification of the LSL 150 fusion protein.
  • samples of different fractions of the elution profile of LSL 150 appear when washing the column with buffer containing 0.2 M lactose.
  • molecular mass patterns with their corresponding masses in kDa are shown.
  • Figure 3 Three-dimensional structure of the LSLi 50 protein.
  • Left part representation of the LSL 150 peptide skeleton (black: ⁇ strands; gray: loops).
  • Right part peptide skeleton of the lectin module of the complete protein isolated directly from the fungus Laetiporus sulphureus
  • FIG. 4 Plasmid pKLSLt and recognition sequence of the TEV protease.
  • Upper part pKLSLt expression vector scheme derived from pKLSL150 ( Figure 1). In it, the sequences encoding the linker and the recognition site for the TEV protease have been inserted at the 3 ' end of the sequence that codes for the LSL 150 protein. The situation of a multiple cloning site (EcoRI / Xhol) is also indicated.
  • Bottom nucleotide and amino acid sequence of C-terminal end of LSL 150, as well as the linker, of the TEV cutting sequence and of the restriction sites.
  • Figure 5. Plasmid pKLSLt-EGFP.
  • Upper part scheme of the pKLSLt -EGFP expression vector derived from pKLSLt ( Figure 4) in which the sequence coding for the Enhancer Green has been inserted
  • EGFP Fluorescence Protein
  • Figure 6. Analysis by SDS-PAGE of the expression and purification of the LSL 150 -EGFP fusion protein and its treatment with the TEV protease. Streets: 1. molecular mass markers (kDa); 2. soluble fraction of the cell homogenate; 3. LSL150-EGFP protein after Sepharose TM 4B; 4. treatment of LSL150-EGFP with TEV protease; 5. EGFP after gel filtration with Superdex 75; 6. LSL 150 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
  • Figure 7. Plasmid pKLSLt-PLD.
  • Upper part scheme of the pKLSLt -PLD expression vector derived from pKLSLt ( Figure 4) in which the sequence coding for the PLD protein (sphingomyelin-dependent phospholipase of the microorganism Arcanobacterium haemolyticum) of 846 bp between the restriction sites has been inserted EcoRI and Hind III.
  • Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
  • Ia LSL 150 -PLD fusion protein and its treatment with TEV protease Streets: 1. molecular mass markers (kDa); 2. soluble fraction of the cell homogenate; 3. LSL 150 -PLD protein after Sepharose TM 4B; 4. treatment of LSL 150 -PLD with TEV protease; 5. PLD after gel filtration with Superdex 75; 6. LSLi 50 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
  • Figure 9. Plasmid pKLSLt-SMD.
  • Upper part pKLSLt -SMD expression vector scheme derived from pKLSLt ( Figure 4) in which the sequence coding for the SMD protein (sphingomyelin dependent phospholipase of the microorganism Corynebacterium pseudotuberculosis) of 802 bp between the restriction sites has been inserted EcoRI and Hind ///.
  • Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
  • Figure 10 Analysis by SDS-PAGE of the expression and purification of the LSLi 50 -SMD fusion protein and its treatment with the TEV protease. Streets: 1. molecular mass markers (kDa); 2. soluble fraction of the cell homogenate; 3. LSLi 50- SMD protein after Sepharose TM 4B; 4. treatment of LSLi 50 -SMD with TEV protease; 5. SMD after gel filtration with Superdex 75; 6. LSLi 50 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
  • FIG. 11 Plasmid pKLSLt-CPL7.
  • Upper part pKLSLt -CPL7 expression vector scheme derived from pKLSLt ( Figure 4) in which the sequence coding for the CPL7 protein (phage Murein hydrolase Cp-7 of the Streptoccocus pneumoniae microorganism) of 1003 bp has been inserted between EcoRI and Hind III restriction sites.
  • Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
  • FIG. 12 Analysis by SDS-PAGE of the expression and purification of the LSLi 50 -CPL7 fusion protein and its treatment with the TEV protease. Streets: 1. molecular mass markers (kDa); 2. fraction soluble cell homogenate; 3. LSI_i 5 o-CPL7 protein after Sepharose TM 4B; 4. treatment of LSLi 50 -CPL7 with TEV protease; 5. CPL7 after gel filtration with Superdex 75; 6. LSLi 50 after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
  • FIG. 13 Plasmid pKLSI_t-IP5_2K.
  • Upper part scheme of the expression vector pKLSLt -IP5_2K derived from pKLSLt ( Figure 4) in which the sequence coding for the protein IP5_2K (Inositol (1, 3,4,5,6) -pentakisphosphate kinase from Arabidopsis has been inserted thaliana) of 1353 bp between the EcoRI and Hind III restriction sites.
  • Lower part nucleotide and amino acid sequence of the TEV cutting site and part of the cloned protein.
  • FIG. 14 Analysis by SDS-PAGE of the expression and purification of the LSLiso-IP5_2K fusion protein and its treatment with the TEV protease. Streets: 1. soluble fraction of the cell homogenate; 2 molecular mass markers (kDa) .; 3. LSLiso-IP5_2K protein after Sepharose TM 4B; 4. treatment of LSLiso-IP5_2K with TEV protease; 5. IP5_2K after gel filtration with Superdex 75. The molecular mass in kDa is shown on the left.
  • Example 1 Development of the vector with the lectin domain ⁇ -clover of the fungus Laetiporus sulphureus
  • the gene coding for this peptide LSL150 was expressed heterologously in E. coli.
  • the LSL 150 peptide of the invention (SEQ ID NO2) is the lectin module of the LSL modular protein (Mr 35 kDa) produced by the fungus Laetiporus sulphureus (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463).
  • LSL150 is constituted by the first 150 amino acids of LSL (17 kDa), which they adopt a structure called ⁇ -clover (Manche ⁇ o. JM, Tateno, H., Goldstein, IJ., Mart ⁇ nez-Ripoll, M. & Hermoso, JA (2005). J. Biol. Chem. 280, 17251-17259).
  • This can be described as a small ⁇ barrel formed by 6 ⁇ strands, at one of whose ends is the so-called loop triplet.
  • the structure as a whole results from the triplication of a basic structural unit of about 50 wastes, each of which would have the ability to bind sugars derived from galactose.
  • LSL 150 has three potential sugar binding sites, two of which are competent to bind disaccharides containing galactose as demonstrated (Manche ⁇ o. JM, Tateno, H., Goldstein, IJ., Mart ⁇ nez-Ripoll, M. & Hermoso, JA (2005) J. Biol. Chem. 280, 17251-17259).
  • plasmid vector pKLSL150 ( Figure 1) was constructed by inserting the open reading phase of the first 450 nt of the LSL protein gene (LSL 450 ) into vector pET28a + (Novagen). The insert was obtained by means of a polymerase chain reaction (PCR) using pET43-LSLa as a template (Tateno, H. & Goldstein, IJ. (2003).
  • PCR polymerase chain reaction
  • E. coli bacteria (BL21 DE3) were transformed with the expression vector pKLSL150, where the expression of the gene that codes for it is under the transcriptional control of the T7 promoter.
  • E. coli cells were grown in 1 L of Luria Bertani LB medium containing kanamycin (50 ⁇ g / mL) for 3-4 hours at 37 0 C, until an OD 6 oonm of 0.6 was reached, at which point the expression is induced of the protein by adding 0.3 mM IPTG and subsequent incubation at 16 0 C for 20 hours. Cell cultures were separated from the culture medium by centrifugation at 4000 xg for 15 min.
  • the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
  • the resuspended sediment was passed through a French press.
  • the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
  • LSLi 50 The three-dimensional structure of recombinant LSLi 50 has been determined by protein crystallography, finding that it is perfectly superimposable ( rmsd 1.1 A for 148 carbons) to the lectin domain of LSL isolated directly from the fungus Laetiporus sulphureus ( Figure 3), which It guarantees the proper folding of this heterologously expressed protein.
  • Figure 3 The extraordinary performance of the production of LSLi 50 , which points to very efficient stages of transcription and translation, as well as the efficiency, simplicity and perfectly acceptable costs of the purification protocol led to the approach of the working hypothesis that LSL150 could act as affinity and solubility label in the production of fusion proteins.
  • this molecule has very attractive characteristics as a fusion label: first, it is extraordinarily soluble (solutions of up to 60-80 mg / ml have been prepared). Although this characteristic is not a sufficient requirement to be considered a solubilizing agent, it is a necessary requirement to be; secondly, it is monomeric, so it will not contribute to the establishment of intermolecular interactions between the fusion proteins of which it is part, and thirdly, it lacks cysteine residues, which implies the absence of oxidation problems .
  • the plasmid vector pKLSLt was constructed by inserting in the vector pET28a + (Novagen) the open reading phase of the first 450 nt of the LSL protein gene (LSL450) followed by the nucleotide sequences encoding a binding linker and the TEV protease recognition site [LTEV). Said insert was obtained by means of a polymerase chain reaction (PCR) using pET43-LSLa (Tateno, H. & Goldstein, IJ.
  • PCR polymerase chain reaction
  • the plasmid vector pKLSLt was constructed by inserting in the vector pET28a + (Novagen) the open reading phase of the first 450 nt of the LSL protein gene (LSL 450 ) followed by the nucleotide sequences encoding a binding linker and the TEV protease recognition site (LTEV).
  • Said insert was obtained by means of a polymerase chain reaction (PCR) using as template the pET43-LSLa (Tateno & Goldstein, 2003) and oligonucleotides that hybridize in the initial and final region of the LSL450 gene and have at their ends the target sequences of the restriction enzymes Ncol and the sequence (LTEV) followed by the target sequence for the restriction enzyme EcoRI, respectively ( Figure 4).
  • PCR polymerase chain reaction
  • the fragment obtained and the vector pET28a + were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche).
  • competent bacteria were transformed with the ligation product and selected the recombinant plasmid pKLSLt following standard cloning procedures (Sambrook and Russell; 2001).
  • the plasmid vector pKLSLt-EGFP ( Figure 5) was constructed by inserting an open reading phase of 720 nt of the gene of the EGFP protein (Enhancer Green Fluorescence Protein) in the vector pKLSLt ( Figure 4 ). The insert was obtained by means of a polymerase chain reaction (PCR) using as a template the plasmid pCMV-EGFP (Clontech), as well as specific oligonucleotides that hybridize in the initial and final region of the EGFP gene and present at their ends the target sequences of the restriction enzymes EcoRI and Notl, respectively.
  • PCR polymerase chain reaction
  • the fragment obtained and the pKLSLt vector were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche). Subsequently, competent bacteria were transformed with the ligation product and the recombinant plasmid pKLSLt-EGFP was selected following standard cloning procedures (Sambrook and Russell; 2001).
  • E. coli cells (BL21 DE3) containing plasmid pKLSLt-EGFP ( Figure 5) were incubated for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL), to achieved one of OD ⁇ oonm 0.6. Then the expression of the protein is induced LSL150-EGFP by the addition of 0.3 mM IPTG, after which purpose the culture is maintained at 16 0 C for 20 hours. After centrifugation at 4000 xg for 15 min, the cells were separated from the culture medium. The sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
  • the resuspended sediment was passed through a French press.
  • the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes.
  • This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
  • the elution of LSL150-EGFP is carried out by washing the chromatographic matrix with the same previous buffer containing 0.2 M lactose ( Figure 6).
  • the plasmid vector pKLSLt-PLD ( Figure 7) was constructed by inserting the open reading phase of the first 846nt of the sphingomyelin-dependent phospholipase (PLD) gene of the pathogenic bacterium Arcanobacterium haemolyticum into the vector pKLSLt ( Figure 4).
  • the insert was obtained by means of a polymerase chain reaction (PCR) using the plasmid pJB31 (provided by Dr.
  • E. coli cells (BL21 DE3) were incubated containing plasmid pKLSLt-PLD ( Figure 7) for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL) until reached an OD 6 0.6 oonm. Then the expression of the protein is induced -PLD LSLI 50 by the addition of 0.3 mM IPTG, after which purpose the culture is maintained at 16 0 C for 20 hours. After centrifugation at 4000 xg for 15min, the cells were separated from the culture medium.
  • the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
  • the resuspended sediment was passed through a French press.
  • the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
  • the plasmid vector pKLSLt-SMD ( Figure 9) was constructed by inserting the open reading phase of 802nt of the sphingomyelin-dependent phospholipase gene of the pathogenic microorganism Corynebacter ⁇ um pseudotuberculosis (SMD) into the vector pKLSLt ( Figure 4).
  • the insert was obtained by means of a polymerase chain reaction (PCR) using as a template the plasmid pJG90 (Tambourgi et al., 2002), as well as specific oligonucleotides that hybridize in the initial and final region of the EGFP gene and present at their ends target sequences of restriction enzymes EcoRI and Hindlll respectively.
  • the fragment obtained and the pKLSLt vector were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche). Subsequently, competent bacteria were transformed with the ligation product and the recombinant plasmid pKLSLt-SMD was selected following standard cloning procedures (Sambrook and Russell; 2001).
  • E. coli cells (BL21 DE3) were incubated containing plasmid pKLSLt-SMD ( Figure 9) for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL) until reached an OD 6 0.6 oonm.
  • Example 5 Expression of the LSLi 50 -CPL7 fusion protein
  • the plasmid vector pKLSLt-CPL7 ( Figure 11) was constructed by inserting the open reading phase of the first 1003nt of the murein hydrolase CPL7 protein gene of the bacteriophage Cp-7 of Streptococcus pneumoniae into the vector pKLSLt ( Figure 4).
  • the insert was obtained by means of a polymerase chain reaction (PCR) using plasmid pCP700 as a template (Garc ⁇ a, P., Garc ⁇ a, JL., Garc ⁇ a, E., Sánchez-Puelles, JM, López, R.
  • the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
  • the resuspended sediment was passed through a French press.
  • the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
  • the plasmid vector pKLSLt-IP5_2K ( Figure 13) was constructed by inserting the open reading phase of the first 1353nt of the Inositol protein (1, 3,4,5,6) -pentakisphosphate kinase gene from Arabidopsis thaliana into the pKLSLt vector ( Figure 4). The insert was obtained by polymerase chain reaction (PCR) using as a template the plasmid pET28c containing the cDNA of IP5_2K (provided by Dr. Beatriz González, Group of Crystallography, Insto.
  • PCR polymerase chain reaction
  • Rocasolano, CSIC as well as specific oligonucleotides that they hybridize in the initial and final region of the IP5_2K gene and present at their ends the target sequences of the Sacl and Xhol restriction enzymes respectively.
  • the fragment obtained and the pKLSLt vector were digested with the corresponding restriction enzymes, purified and ligated in the presence of the enzyme T4 ligase (Roche).
  • T4 ligase (Roche).
  • competent bacteria were transformed with the ligation product, the recombinant plasmid pKLSLt-IP5_2K being selected following standard cloning procedures (Sambrook and Russell; 2001).
  • E. coli cells (BL21 DE3) were incubated pKLSLt-containing plasmid IP5_2K (Figure 13) for 3-4 hours at 37 0 C in 1 L of LB medium containing kanamycin (50 ug / mL) until reached an OD 6 oonm of 1.
  • the expression of the LSL 150 -IP5_2K protein is induced by the addition of 0.3 mM IPTG, after which the culture is maintained at 16 0 C for 16 hours. After centrifugation at 4000 xg for 15min, the cells were separated from the culture medium.
  • the sediment thus obtained is resuspended in 25 ml of 20 mM Tris buffer, pH 8.0 containing 0.1 M NaCl and 0.04% sodium azide.
  • the resuspended sediment was passed through a French press.
  • the soluble fraction of the cell homogenate is obtained by centrifugation at 20,000 rpm in an SS34 rotor for 30 minutes. This soluble fraction was applied on a Sepharose TM 4B column, previously equilibrated in 20 mM Tris-HCI buffer, pH 8.0 with 0.1 M NaCI and 0.04% sodium azide and maintained at 4 0 C.
  • IP5_2K has been produced as a fusion protein with GST (GST-IP5_2K) and purified following standard protocols for this affinity / solubility label (results not shown).
  • GST-I P5_2K was treated with TEV protease, and subsequently IP5_2K purified by penetrability chromatography on Superdex 75.

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La presente invención describe un nuevo método general de expresión y purificación de proteínas de fusión conteniendo un dominio peptídico lectina β-trébol como etiqueta de afinidad y solubilidad. Esta etiqueta permite producir diferentes proteínas de fusión solubles con elevados rendimientos y purificarlas mediante un protocolo de purificación eficaz, sencillo y de bajo coste. Dicho protocolo está basado en Ia capacidad del péptido para unir azúcares derivados de galactosa y consta de una sola etapa de cromatografía de afinidad que emplea matrices derivadas de agarosa y lactosa como eluyente.

Description

PROTEÍNAS DE FUSIÓN CON UN DOMINIO LECTINA DE TIPO BETA- TRÉBOL, PROCEDIMIENTO DE OBTENCIÓN Y SUS APLICACIONES
SECTOR DE LA TÉCNICA La invención se puede encuadrar de un modo genérico en el sector de Ia biotecnología, con evidentes aplicaciones en el campo farmacéutico y, actualmente, en el desarrollo de proyectos de genómica estructural de alto rendimiento. De un modo más concreto, Ia invención se encuadraría en los procesos de producción y purificación de proteínas de fusión.
ESTADO DE LA TÉCNICA
El exitoso desarrollo de proyectos de genómica ocurrido en los últimos años ha permitido obtener una vasta cantidad de información genética, especialmente de organismos procariotas, en donde el número de genomas secuenciados se contará por miles en pocos años (Abby, S. & Daubin, V. (2007). Trends Microbiol. 15, 135-141 ). Un factor decisivo de este éxito ha sido, sin duda alguna, Ia homogeneidad química y estructural de los ácidos nucleicos, Io cual ha permitido desarrollar protocolos de secuenciación de alto rendimiento ("high throughput") de carácter universal. Actualmente, en Ia era post-genómica, el interés se dirige principalmente al análisis funcional y estructural de las proteínas codificadas por dichos genomas. En este sentido, y a diferencia de los ácidos nucleicos, las proteínas son química y estructuralmente mucho más heterogéneas, Io cual supone de fado Ia imposibilidad de desarrollar protocolos de alto rendimiento universales para Ia purificación y caracterización estructural de estas moléculas (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-320). Otros problemas relevantes asociados al diseño de este tipo de procesos de alto rendimiento es el bajo rendimiento en Ia producción y Ia escasa solubilidad de muchas de las proteínas sobre- expresadas (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353-358). Esto último ha conducido a Ia búsqueda de sistemas de sobre-expresión de proteínas recombinantes alternativos al que puede considerarse el sistema de expresión por excelencia: Ia bacteria Escheríchia coli. Algunos sistemas considerados están basados en células eucariotas de mamífero, levaduras o de insectos (Greene, JJ. (2004). Methods Mol. Biol. 267, 3-14; DaIy, R. & Hearn, MT. (2005). J. Mol. Recognit. 18, 119-138; Kost, T.A., Condreay, JP. & Jarvis, D. L. (2005). Nat. Biotechnol. 23, 567-575) o bien sistemas libres de células (Murthy, T.V., Wu, W., Qiu, Q.Q., Shi, Z. Labaer, J. & Brizuela, L. (2004). Prot. Expr. Purif. 36, 217-225). No obstante, el bajo coste, Ia facilidad de manejo y de escalado de cultivos siguen haciendo de E. coli el sistema de sobre- expresión prácticamente universal (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353-358).
Una aproximación empleada actualmente en el desarrollo de protocolos de alto rendimiento universales de producción/purificación de proteínas en E. coli es el uso de etiquetas de afinidad ("affinity tag") (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320; Arnau, J., Lauritzen, C, Petersen, G. E. & Petersen, J. (2006). Prot. Express. Purif. 48, 1-13). Estas etiquetas son proteínas o péptidos que, fusionados a Ia proteína recombinante de interés, idealmente permitirían aumentar el rendimiento de su expresión, incrementar su solubilidad y desarrollar un protocolo simple y eficaz de purificación. Se puede afirmar que actualmente no existe una etiqueta de afinidad que reúna estas características de un modo general o universal; de hecho, se considera que el uso combinado de varias etiquetas podría ser una posible solución al diseño de estrategias generales (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320). Obviamente, el empleo sistemático de esta aproximación combinatorial requiere de un conocimiento preciso de las ventajas e inconvenientes de las correspondientes etiquetas individuales. En Ia Tabla I se muestran las principales etiquetas de afinidad
("affinity tag") pues permiten desarrollar protocolos de purificación genéricos basados en cromatografías de afinidad, mientras que en Ia
Tabla II, aparecen etiquetas que en algunos casos se ha comprobado actúan como "agentes solubilizantes" ("solubility enhancers").
Tabla I. Principales etiquetas de afinidad
Etiqueta Proteína Matriz Referencia
His6 Etiqueta de seis Metales inmovilizados 1 histidinas
GST Glutathion-S-transferase Glutation 2
MBP Maltose-binding protein Amilosa 3
FLAG Péptido FLAG Anticuerpo anti-FLAG 4
BAP Péptido aceptor de Avidita 5 biotina
Strep Il Péptido de unión a Streptavidina 6 streptavidina
CBP Péptido de unión a Calmodulina 7 calmodulina
1. Gaberc-Porekar, V. & Menart, V. (2001 ). J. Biochem. Biophys.
Methods 49, 335-360. 2. Smith, D. B. & Johnson, K.S. (1988). Gene 67, 31-40.
3. di Guan, C, Li, P., Riggs, P. D. & Inoue, H. (1998). Gene 67, 21- 30.
4. Einhauer, A. & Jungbauer, A. (2001 ). J. Biochem. Biophys. Methods 49, 455-465. 5. Schatz, PJ. (1993). Biotechnology (NY) 11 , 1138-1143.
6. Voss, S. & Skerra, A. (1997). Protein Eng. 10, 975-982.
7. Vaillancourt, P., Zheng, C. F., Hoang, D.Q. & Breister, L. (2000) Methods Enzymol. 326, 340-362. Tabla I. Principales etiquetas solubilizantes
Etiqueta Proteína Origen Referencia
MBP Maltose-binding Escheríchia coli 8 protein
GST Glutathione-S- Schischosoma 9 transferase japonicum
Trx Thioredoxin Escherichia coli 10
NusA N-Utilization Escheríchia coli 11 substance
SUMO Small Ubiquitin- Homo sapiens 12 modifier
SET Solubility-enhancing Sintético 13 tag
8. Nallamsetty, S. & Waugh, D.S. (2006). Prot. Expr. Puríf. 45, 175- 182.
9. Nygren, P.A., Stahl, S. & Uhlen, M. (1993). Trends Biotechnol. 12, 184-188.
10. LaVaINe, E. R., DiBlasio, E.A., Kovacic, S., Grant, K.L., Schendel,
P.F. & McCoy, J. M. (1993). Biotechnology (NY). 11 , 187-193. H . Davis, G. D., Elisee, C, Newham, D. M. & Harrison, R.G. (1999).
Biotechnol. Bioeng. 65, 382-388. 12. Marblestone, J. G., Edavettal., S.C., Lim, Y., Lim, P., Zuo, X. &
Butt, T.R. (2006). Prot. Sci. 15, 182-189. 13.Zhang, Y.B., Howitt, J., McCorkle, S., Lawrence, P., Springer, K.
& Freimuth, P. (2004). Prot. Expr. Puríf. 36, 207-216.
Hoy día el interés se centra principalmente en MBP, GST, NusA y
Trx. No obstante y teniendo en cuenta, por un lado, que estudios recientes demuestran una baja eficacia de GST (Dyson, M. R., Shadbolt, S. P., Vincent, KJ. , Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32) y Trx (Marblestone, J.G., Edavettal., S.C., Lim, Y., Lim, P., Zuo, X. & Butt, T. R. (2006). Prot. Sci. 15, 182-189) como agentes solubilizantes en E. coli y, por otro, que NusA, aun con una eficacia similar a MBP como agente solubilizante, no permite desarrollar un protocolo de purificación inmediato (Davis, G. D., Elisee, C, Newham, D. M. & Harrison, R.G. (1999). Biotechnol. Bioeng. 65, 382-388; Dummler, A., Lawrence, A. M. & de Marco, A. (2005). Microb. CeII Fact. 4, 34), MBP ha devenido una de las etiquetas de afinidad sobre Ia que más interés se tiene y una de las más ampliamente estudiadas (Dyson, M. R., Shadbolt, S. P., Vincent, K. J., Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32; Braud, S., Moutiez, M., BeNn, P., Abello, N., Drevet, P., Zinn-Justin, S., Courcon, M., Masson, C, Dassa, J. & Charbonnier, J. B. (2005). J. Proteome Res. 4, 2137-2147). Asimismo, puede afirmarse que Ia eficacia de estas etiquetas es función de Ia proteína "acompañante" (Dyson, M. R., Shadbolt, S. P., Vincent, KJ. , Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32), Io cual no es sino reflejo de Ia diversidad química y estructural de las proteínas. Indudablemente, una validación cualitativa de las etiquetas de afinidad requerirá de una aproximación a gran escala o "proteómica" (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353- 358).
Tabla II. Principales etiquetas de afinidad
Etiqueta Proteína Matriz Referencia
His6 Etiqueta de seis Metales inmovilizados 7 histidinas
GST Glutathion-S-transferase Glutation 8
MBP Maltose-binding protein Amilosa 9
FLAG Péptido FLAG Anticuerpo anti-FLAG 10
BAP Péptido aceptor de Avidina 11 biotina
Strep Il Péptido de unión a Streptavidina 12 streptavidina
CBP Péptido de unión a Calmodulina 13 calmodulina
H. Gaberc-Porekar, V. & Menart, V. (2001 ). J. Biochem. Biophys.
Methods 49, 335-360.
15.Smith, D. B. & Johnson, K.S. (1988). Gene 67, 31-40. 16. di Guan, C, Li, P., Riggs, P. D. & Inoue, H. (1998). Gene 67, 21-
30. 17. Einhauer, A. & Jungbauer, A. (2001 ). J. Biochem. Biophys.
Methods 49, 455-465.
18.Schatz, PJ. (1993). Biotechnology (NY) 11 , 1138-1143. 19.Voss, S. & Skerra, A. (1997). Protein Eng. 10, 975-982.
20.Vaillancourt, P., Zheng, C. F., Hoang, D.Q. & Breister, L. (2000)
Methods Enzymol. 326, 340-362.
Una etiqueta de afinidad ideal aumenta el rendimiento en Ia producción de proteínas (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-
320). Este efecto está asociado normalmente con etiquetas proteicas (no péptidos pequeños) situadas en el extremo N-terminal de Ia fusión, en donde Ia etiqueta proporcionaría un entorno eficaz para iniciar el proceso de traducción, evitando que el ARNm adoptara estructuras secundarias que pudiesen interferir en Ia unión a los ribosomas (Hartz, D., McPheeters,
D.S., Green, L. & GoId, L. (1991 ). J. Mol. Biol. 218, 99-105). Por otro lado, también deben permitir desarrollar un protocolo de purificación eficaz, potencialmente escalable a procesos de alto rendimiento con costes mínimos (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320). En este sentido, Ia matriz cromatográfica de afinidad cobra especial relevancia (ver
Tabla II), distinguiéndose dos grandes grupos: matrices con proteínas inmovilizadas, que suelen ser caras, con baja capacidad de unión y vidas medias cortas (FLAG, BAP, Strepll, CBP), y matrices con ligandos de pequeño tamaño (MBP, GST), más baratas y estables. Por otro lado, Ia disociación de Ia proteína inmovilizada en Ia matriz debe producirse en condiciones no "agresivas" para el estado nativo de Ia proteína.
Claramente, cualquier estrategia basada en el uso de etiquetas de afinidad debería proporcionar Ia posibilidad de eliminarla de un modo eficaz (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320), aspecto éste especialmente relevante cuando se trata de proteínas con potenciales aplicaciones en terapia humana (Arnau, J., Lauritzen, C, Petersen, G. E. & Petersen, J. (2006). Prot. Express. Purif. 48, 1-13). La disponibilidad de endoproteasas con una especificidad exquisita como AcTEV® (tobáceo etch virus; Invitrogen) o PreScission® (Amersham Biotech) han mitigado notablemente este problema. Puesto que los determinantes de Ia especificidad de estas endoproteasas se localizan en el lado C-terminal del enlace peptídico diana (TEV: ENLYFQ/G; PreScission: LEVLFQ/GP), tras Ia hidrólisis, estos permanecerán en las etiquetas si están situadas en el extremo N-terminal de Ia proteína de fusión.
Finalmente, de acuerdo a las expectativas de aumento de inversiones en el mercado farmacéutico en fármacos de naturaleza proteica para el periodo 2004-2010 (de 34000 a 52000 millones de dólares; Pavlou, A.K. & Reichert, J. M. (2004). Nat. Biotechnol. 22, 1513-
1519), se espera Ia aparición de nuevas proteínas de interés terapéutico, de ahí que Ia búsqueda de nuevas etiquetas de afinidad sea actualmente un campo de intensa investigación (Arnau, J., Lauritzen, C, Petersen, G. E.
& Petersen, J. (2006). Prot. Express. Purif. 48, 1-13).
En resumen, Ia puesta a punto de un procedimiento de alto rendimiento de carácter general de producción y/o purificación de proteínas se enfrenta al problema de Ia heterogeneidad química y estructural de estas moléculas. Concretamente, los tres principales desafíos a los que se intenta aportar soluciones mediante el uso de las etiquetas de afinidad y solubilidad son:
• Aumento del rendimiento de Ia producción de las proteínas heterólogas, • Aumento de Ia solubilidad de Ia proteína de interés, y
• Aportar un protocolo de purificación eficaz y fácilmente escalable a procesos de alto rendimiento
DESCRIPCIÓN DE LA INVENCIÓN
Breve Descripción
Un aspecto de Ia invención Io constituye una proteína de fusión recombinante, en adelante proteína de fusión de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de aminoácidos del péptido LSLi50 del hongo Laetiporus sulphureus (SEQ ID NO2), y b) una secuencia análoga a Ia SEQ ID NO2 de a).
En el sentido utilizado en esta descripción, el término "análoga" pretende incluir a cualquier secuencia de aminoácidos que pueda ser aislada o construida en base a Ia secuencia de aminoácidos mostrada en Ia SEQ. ID NO2, por ejemplo, mediante Ia introducción de sustituciones de aminoácidos conservativas o no conservativas, incluyendo Ia inserción de uno o más aminoácidos, Ia adición de uno o más aminoácidos en cualquiera de los extremos de Ia molécula o Ia deleción de uno o más aminoácidos en cualquier extremo o en el interior de Ia secuencia.
En general, una secuencia de aminoácidos análoga es sustancialmente homologa a Ia secuencia de aminoácidos identificada como Ia SEQ ID NO2. En el sentido utilizado en esta descripción, Ia expresión "sustancialmente homologa" significa que las secuencias de aminoácidos en cuestión tienen un grado de identidad, a nivel de aminoácidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o más preferentemente de, al menos, un 95%.
Otro aspecto de Ia invención Io constituye el procedimiento de obtención de Ia proteína de fusión, en adelante procedimiento de Ia invención, que comprende las siguientes etapas:
i) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSLi50 (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, ii) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escherichia coli, en
Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, iii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, iv) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado. Para llevar a cabo el paso i) del procedimiento de Ia invención es necesario elaborar una construcción genética que comprenda Ia secuencia de ADN codificante del peptido SEQ ID NO2, Ia proteína o péptido de interés y opcionalmente, una secuencia de reconocimiento de endoproteasas, por ejemplo, TEV (tobáceo etch virus endoprotease) con objeto de separar Ia etiqueta de afinidad de Ia proteína de interés.
Así, otro aspecto de Ia invención Io constituye una construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión de Ia invención, en adelante construcción genética de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de ADN SEQ ID NO1 , y b) una secuencia homologa a Ia SEQ ID NO1.
La construcción genética de Ia invención permite Ia expresión de una proteína de interés unida al péptido de SEQ ID NO2. Esta construcción genética de Ia invención, también puede comprender, en caso necesario y para permitir un mejor aislamiento, detección o secreción al exterior de Ia célula del péptido de interés expresado, una secuencia de nucleótidos que codifica para un péptido susceptible de ser utilizado con fines de aislamiento, detección o secreción de dicho péptido. Por tanto, un objeto particular de Ia presente invención Io constituye una construcción genética de Ia invención que comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David Lañe (1999). CoId Spring Harbor Laboratory Press. New York. Capítulo: Tagging proteins. Pp. 347-377). La construcción genética de Ia invención descrita previamente puede aislarse y obtenerse por un experto mediante el empleo de técnicas ampliamente conocidas en el estado de Ia técnica (Sambrook et al. "Molecular cloning, a Laboratory Manual 2nd ed., CoId Sping Harbor Laboratory Press, N.Y., 1989 vol 1-3). Dichas secuencias de nucleótidos pueden estar integradas en un vector de expresión génica que permite Ia regulación de Ia expresión de Ia misma en condiciones adecuadas en el interior de las células.
Por tanto, otro aspecto de Ia presente invención Io constituye un vector de expresión, en adelante vector de expresión de Ia invención, que comprende una construcción genética de Ia invención y que permite Ia expresión de una proteína o péptido. Ejemplos de una realización particular se pueden encontrar en los ejemplos de Ia presente invención. En general, un vector de expresión comprende, además de Ia construcción genética descrita en Ia invención, un promotor que dirige su transcripción (por ejemplo, pT7, plac, ptrc, ptac, pBAD, ret, etc.), al que está operativamente enlazado, y otras secuencias necesarias o apropiadas que controlan y regulan dicha transcripción y, en su caso, Ia traducción del producto de interés, por ejemplo, señales de inicio y terminación de transcripción (tlt2, etc.), señal de poliadenilación, origen de replicación, secuencias de unión a ribosomas (RBS), secuencias codificantes de reguladores transcripcionales, (enhancers), silenciadores transcripcionales (silencers), represores, etc. Ejemplos de vectores de expresión apropiados pueden seleccionarse de acuerdo con las condiciones y necesidades de cada caso concreto entre plásmidos de expresión, vectores virales (DNA o RNA), cósmidos, cromosomas artificiales, etc. que pueden contener, además, marcadores utilizables para seleccionar las células transfectadas o transformadas con el gen o genes de interés. La elección del vector dependerá de Ia célula huésped y del tipo de uso que se quiera realizar. Por tanto, según un modo de realización particular de Ia presente invención dicho vector es un plásmido o un vector viral. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en Ia materia al igual que para Ia transformación de microorganismos y células eucariotas se pueden utilizar diferentes métodos ampliamente conocidas - transformación química, electroporación, microinyección, etc. - descritos en diversos manuales [Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989). Molecular cloning: a laboratory manual, 2nd ed. CoId Spring Harbor Laboratory, CoId Spring Harbor, N.Y.].
Otro aspecto de Ia presente invención Io constituye una célula huésped, en adelante célula de Ia invención, que comprende Ia construcción genética o el vector de expresión de Ia invención, preferentemente una célula procariota. Una realización particular de Ia invención Io constituye una célula huésped de Ia invención constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.
Descripción detallada La presente invención se refiere a un nuevo método general o universal de expresión y purificación de proteínas de fusión conteniendo un dominio lectina β-trébol como etiqueta de afinidad.
La presente invención se basa en que los inventores han observado que el módulo lectina de Ia proteína hemolítica del hongo Laetiporus sulphureus (los primeros 150 aminoácidos: LSL150) (SEQ ID NO2) es funcional en tanto que parte constituyente de numerosas proteínas recombinantes de fusión diseñadas ad hoc. Es decir, que por un lado, Ia
SEQ ID NO2 es versátil desde una perspectiva de plegamiento de proteínas pues se pliega adecuadamente estando acompañada de diferentes proteínas en su extremo C-terminal y, por otro, conserva su capacidad de unión de azúcares. Sorprendentemente, las proteínas recombinantes de interés fusionadas al extremo C-terminal de SEQ ID NO2 también se pliegan adecuadamente, según se deduce de los resultados de actividad llevados a cabo con las proteínas puras. Además, estas proteínas de interés mantienen su estado nativo incluso una vez separadas de SEQ ID NO2 mediante tratamiento proteolítico (TEV proteasa; ver más abajo). Todo ello ha permitido purificar diversas proteínas de fusión conteniendo Ia SEQ ID NO2 en su extremo N-terminal empleando un único protocolo de purificación.
En este sentido, los inventores han observado que Ia SEQ ID NO2 (de origen eucariota) se produce en E. coli (procariota) con un elevado rendimiento (aprox. 80 mg por litro de cultivo), plegándose adecuadamente. De hecho, Ia estructura tridimensional de SEQ ID NO2 producida en E. coli que han determinado es esencialmente igual a Ia del correspondiente módulo lectina de LSL aislada directamente del hongo L. sulphureus (Figura 3). Esta estructura es garantía del plegamiento adecuado de SEQ ID NO2 expresada heterólogamente en un organismo procariota, Io cual no es siempre obvio. Sorprendentemente, en todos los ejemplos indicados más abajo, el rendimiento con el que se obtienen las proteínas de fusión construidas (ver ejemplos más abajo) es tal que permite afrontar proyectos de cristalización de las proteínas puras, una vez separadas de SEQ ID NO2, con un coste bajo. En el caso concreto de Ia proteína PLD de A. haemolyticum (ver ejemplo 3), su expresión con una etiqueta de histidinas (His6 tag) en las mismas condiciones que LSL150- PLD, no permitía obtener Ia proteína de fusión soluble. Es decir, Ia secuencia SEQ ID NO2 reúne propiedades de etiqueta de afinidad y de solubilidad. En este sentido, es de destacar que actualmente se desconocen las bases moleculares por las cuales una proteína actúa como etiqueta de solubilidad y que, por ello, no disponemos de criterios objetivos con los cuales realizar una búsqueda sistemática de proteínas que pudiesen actuar como tales. En nuestro caso particular, podemos afirmar que del análisis estructural y biofísico de Ia secuencia SEQ ID N02 no se pueden deducir sus propiedades como etiqueta de solubilidad. La idea inicial de que cualquier proteína muy soluble puede actuar como tal se ha comprobado incorrecta (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-320). Aunque Ia solubilidad es una propiedad necesaria para una potencial etiqueta de solubilidad, es obvio que no es un requisito suficiente.
En tanto que etiqueta de afinidad y de solubilidad, Ia SEQ ID NO2 permite producir diferentes proteínas de fusión con elevados rendimientos y establecer un protocolo de purificación de las mismas de carácter general, eficaz, sencillo y de bajo coste. Estas características se deben a factores de distinta naturaleza. En primer lugar, se debe a que el método de purificación de Ia proteína de fusión implica una única etapa cromatográfica de afinidad. En segundo lugar, a que el costo de los principales componentes empleados en dicho protocolo, esto es, las matrices cromatográficas derivadas de agarosa (Sepharose™ 4B, 6B, CL- 4B, CL-6B) y eluyentes (D(+)-lactosa), es sorprendentemente bajo. Así, y a modo de comparación, mientras que el precio medio de estas resinas está en torno a unos 420-580€/litro (en el caso de Sepharose™ 6B se emplea una columna con unos 25 mi de resina) y el de D(+)-lactosa como eluyente unos 28€/kilo, el precio de los componentes empleados en el sistema descrito en (Tielker, D., Rosenau, F., Bartels, K. M., Rosenbaum, T. & Jaeger, K.E. (2006). Bio-Techniques 41 , 327-332), esto es, manosa- agarosa es de 33120 €/litro y el de D-manosa de unos 900 €/kilo. Y, finalmente, en tercer lugar, las matrices cromatográficas empleadas, por una parte, no requieren de ningún tratamiento químico adicional para actuar como matrices de afinidad frente a Ia secuencia SEQ ID NO2 y, por otra, al ser esencialmente inertes a los homogeneizados celulares y no requerir regeneraciones más allá de su lavado con buffer, pueden reutilizarse de un modo esencialmente continuo.
Una vez comprobada Ia capacidad de Ia secuencia SEQ ID N02 para actuar como etiqueta de afinidad y solubilidad, se puede afirmar a posteriorí que ésta reúne características ventajosas adicionales para ser empleada biotecnológicamente en procesos de producción y purificación de proteínas. En primer lugar, al ser un dominio monomérico no impone restricciones estéricas sobre Ia proteína C-terminal "acompañante"; en segundo lugar, al carecer de residuos de cisteína Ia secuencia SEQ ID NO2 no demanda el uso de agentes moduladores del estado redox del medio y, finalmente, en tercer lugar, esta secuencia es LSLi50 es desde una perspectiva evolutiva un módulo proteico, por Io que está adaptada estructural y funcionalmente a ser parte constituyente de proteínas modulares, como son de facto las proteínas recombinantes de fusión. En este sentido es destacable el hecho de que ninguna de las etiquetas de afinidad (proteínas) actualmente relevantes, como MBP, GST o Trx, proceden de proteínas modulares.
Por tanto, un aspecto de Ia invención Io constituye una proteína de fusión recombinante, en adelante proteína de fusión de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: c) Ia secuencia de aminoácidos del péptido LSL150 del hongo
Laetiporus sulphureus (SEQ ID NO2), y d) una secuencia análoga a Ia SEQ ID NO2 de a).
En el sentido utilizado en esta descripción, el término "análoga" pretende incluir a cualquier secuencia de aminoácidos que pueda ser aislada o construida en base a Ia secuencia de aminoácidos mostrada en Ia SEQ. ID NO2, por ejemplo, mediante Ia introducción de sustituciones de aminoácidos conservativas o no conservativas, incluyendo Ia inserción de uno o más aminoácidos, Ia adición de uno o más aminoácidos en cualquiera de los extremos de Ia molécula o Ia deleción de uno o más aminoácidos en cualquier extremo o en el interior de Ia secuencia.
En general, una secuencia de aminoácidos análoga es sustancialmente homologa a Ia secuencia de aminoácidos identificada como Ia SEQ ID N02. En el sentido utilizado en esta descripción, Ia expresión "sustancialmente homologa" significa que las secuencias de aminoácidos en cuestión tienen un grado de identidad, a nivel de aminoácidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o más preferentemente de, al menos, un 95%.
Otro aspecto de Ia invención Io constituye el procedimiento de obtención de Ia proteína de fusión, en adelante procedimiento de Ia invención, que comprende las siguientes etapas: v) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSL150 (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, vi) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escheríchia coli, en Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, vii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, viii) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.
Para llevar a cabo el paso i) del procedimiento de Ia invención es necesario elaborar una construcción genética que comprenda Ia secuencia de ADN codificante del peptido SEQ ID NO2, Ia proteína o péptido de interés y opcionalmente, una secuencia de reconocimiento de endoproteasas, por ejemplo, TEV (tobáceo etch virus endoprotease) con objeto de separar Ia etiqueta de afinidad de Ia proteína de interés.
Así, otro aspecto de Ia invención Io constituye una construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión de Ia invención, en adelante construcción genética de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: c) Ia secuencia de ADN SEQ ID NO1 , y d) una secuencia homologa a Ia SEQ ID NO1.
La construcción genética de Ia invención permite Ia expresión de una proteína de interés unida al péptido de SEQ ID NO2. Esta construcción genética de Ia invención, también puede comprender, en caso necesario y para permitir un mejor aislamiento, detección o secreción al exterior de Ia célula del péptido de interés expresado, una secuencia de nucleótidos que codifica para un péptido susceptible de ser utilizado con fines de aislamiento, detección o secreción de dicho péptido. Por tanto, un objeto particular de Ia presente invención Io constituye una construcción genética de Ia invención que comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David Lañe (1999). CoId Spring Harbor Laboratory Press. New York. Capítulo: Tagging proteins. Pp. 347-377).
La construcción genética de Ia invención descrita previamente puede aislarse y obtenerse por un experto mediante el empleo de técnicas ampliamente conocidas en el estado de Ia técnica (Sambrook et al.
"Molecular cloning, a Laboratory Manual 2nd ed., CoId Sping Harbor
Laboratory Press, N.Y., 1989 vol 1-3). Dichas secuencias de nucleótidos pueden estar integradas en un vector de expresión génica que permite Ia regulación de Ia expresión de Ia misma en condiciones adecuadas en el interior de las células.
Por tanto, otro aspecto de Ia presente invención Io constituye un vector de expresión, en adelante vector de expresión de Ia invención, que comprende una construcción genética de Ia invención y que permite Ia expresión de una proteína o péptido. Ejemplos de una realización particular se pueden encontrar en los ejemplos de Ia presente invención.
En general, un vector de expresión comprende, además de Ia construcción genética descrita en Ia invención, un promotor que dirige su transcripción (por ejemplo, pT7, plac, ptrc, ptac, pBAD, ret, etc.), al que está operativamente enlazado, y otras secuencias necesarias o apropiadas que controlan y regulan dicha transcripción y, en su caso, Ia traducción del producto de interés, por ejemplo, señales de inicio y terminación de transcripción (tlt2, etc.), señal de poliadenilación, origen de replicación, secuencias de unión a ribosomas (RBS), secuencias codificantes de reguladores transcripcionales, (enhancers), silenciadores transcripcionales (silencers), represores, etc. Ejemplos de vectores de expresión apropiados pueden seleccionarse de acuerdo con las condiciones y necesidades de cada caso concreto entre plásmidos de expresión, vectores virales (DNA o RNA), cósmidos, cromosomas artificiales, etc. que pueden contener, además, marcadores utilizables para seleccionar las células transfectadas o transformadas con el gen o genes de interés. La elección del vector dependerá de Ia célula huésped y del tipo de uso que se quiera realizar. Por tanto, según un modo de realización particular de Ia presente invención dicho vector es un plásmido o un vector viral. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en Ia materia al igual que para Ia transformación de microorganismos y células eucariotas se pueden utilizar diferentes métodos ampliamente conocidas - transformación química, electroporación, microinyección, etc. - descritos en diversos manuales [Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989). Molecular cloning: a laboratory manual, 2nd ed. CoId Spring Harbor Laboratory, CoId Spring Harbor, N.Y.].
Otro aspecto de Ia presente invención Io constituye una célula huésped, en adelante célula de Ia invención, que comprende Ia construcción genética o el vector de expresión de Ia invención, preferentemente una célula procariota.
Una realización particular de Ia invención Io constituye una célula huésped de Ia invención constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.
DESCRIPCIÓN DE LAS FIGURAS
Figura 1.- Plásmido pKLSL150 y secuencia de Ia proteína LSL150. Parte izquierda: esquema del vector de expresión pKLSL150 que contiene Ia secuencia de 450 nt que codifica para Ia proteína LSL150 bajo el control del promotor de T7 y un regulador inducible por IPTG. Este plásmido contiene el gen de resistencia a Ia Kanamicina (Kan), el gen del represor lacl, y un sitio múltiple de clonaje (Ncol/Xhol). Parte derecha: secuencia de nucleótidos y aminoácidos de Ia proteína LSL150 flanqueada por los sitios de restricción Ncol y EcoRI utilizados en el clonaje.
Figura 2.- Análisis mediante SDS-PAGE de Ia purificación de Ia proteína de fusión LSL150. En el gel aparecen muestras de diferentes fracciones del perfil de elución de LSL150 al lavar Ia columna con buffer conteniendo 0.2 M lactosa. A Ia izquierda se muestran patrones de masa molecular con sus correspondientes masas en kDa.
Figura 3.- Estructura tridimensional de Ia proteína LSLi50. Parte izquierda: representación del esqueleto peptídico de LSL150 (negro: hebras β; gris: bucles). Parte derecha: esqueleto peptídico del módulo lectina de Ia proteína completa aislada directamente del hongo Laetiporus sulphureus
(negro: hebras β; gris: bucles). N: extremo amino terminal; C: extremo carboxilo terminal. La estructura de ambas proteínas se ha determinado mediante cristalografía de proteínas. La superposición revela una rmsd para 148 carbonos α de 1.1 A, esto es, son casi perfectamente superponibles.
Figura 4.- Plásmido pKLSLt y secuencia de reconocimiento de Ia TEV proteasa. Parte superior: esquema del vector de expresión pKLSLt derivado del pKLSL150 (Figura 1 ). En él se han insertado, en el extremo 3' de Ia secuencia que codifica para Ia proteína LSL150, las secuencias que codifican para el linker y para el sitio de reconocimiento por Ia TEV proteasa. Se indica asimismo, Ia situación de un sitio múltiple de clonaje (EcoRI/Xhol). Parte inferior: secuencia de nucleótidos y aminoácidos del extremo C-terminal de LSL150, así como del linker, de Ia secuencia de corte TEV y de los sitios de restricción.
Figura 5.- Plásmido pKLSLt-EGFP. Parte superior: esquema del vector de expresión pKLSLt -EGFP derivado del pKLSLt (Figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia Enhancer Green
Fluorescence Protein (EGFP) de Aequorea victoria (Clontech) de 720 pb entre los sitios de restricción EcoRI y Not I. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 6.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSL150-EGFP y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSL150-EGFP tras Sepharose™ 4B; 4. tratamiento de LSL150-EGFP con TEV proteasa; 5. EGFP tras filtración en gel con Superdex 75; 6. LSL150 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 7.- Plásmido pKLSLt-PLD. Parte superior: esquema del vector de expresión pKLSLt -PLD derivado del pKLSLt (Figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína PLD (fosfolipasa dependiente de esfingomielina del microorganismo Arcanobacterium haemolyticum) de 846 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 8.- Análisis mediante SDS-PAGE de Ia expresión y purificación de
Ia proteína de fusión LSL150-PLD y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSL150-PLD tras Sepharose™ 4B; 4. tratamiento de LSL150-PLD con TEV proteasa; 5. PLD tras filtración en gel con Superdex 75; 6. LSLi50 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 9.- Plásmido pKLSLt-SMD. Parte superior: esquema del vector de expresión pKLSLt -SMD derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína SMD (fosfolipasa dependiente de esfingomielina del microorganismo Corynebacteríum pseudotuberculosis) de 802 pb entre los sitios de restricción EcoRI y Hind ///. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 10.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLi50-SMD y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSLi50-SMD tras Sepharose™ 4B; 4. tratamiento de LSLi50-SMD con TEV proteasa; 5. SMD tras filtración en gel con Superdex 75; 6. LSLi50 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 11.- Plásmido pKLSLt-CPL7. Parte superior: esquema del vector de expresión pKLSLt -CPL7 derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína CPL7 (mureín hidrolasa del fago Cp-7 del microorganismo Streptoccocus pneumoniae) de 1003 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 12.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLi50-CPL7 y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSI_i5o-CPL7 tras Sepharose™ 4B; 4. tratamiento de LSLi50-CPL7 con TEV proteasa; 5. CPL7 tras filtración en gel con Superdex 75; 6. LSLi50 tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
Figura 13.- Plásmido pKLSI_t-IP5_2K. Parte superior: esquema del vector de expresión pKLSLt -IP5_2K derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína IP5_2K (Inositol (1 ,3,4,5,6)-pentakisfosfato quinasa de Arabidopsis thaliana) de 1353 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.
Figura 14.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLiso-IP5_2K y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. fracción soluble del homogeneizado celular; 2 marcadores de masa molecular (kDa).; 3. proteína LSLiso-IP5_2K tras Sepharose™ 4B; 4. tratamiento de LSLiso-IP5_2K con TEV proteasa; 5. IP5_2K tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.
EJEMPLOS DE LA INVENCIÓN
Ejemplo 1.- Desarrollo del vector con el dominio lectina β-trébol del hongo Laetiporus sulphureus Con objeto de caracterizar estructuralmente el dominio lectina β-trébol base de Ia invención, el gen que codifica para este péptido LSL150 fue expresado heterólogamente en E. coli. Concretamente, el péptido LSL150 de Ia invención (SEQ ID NO2) es el módulo lectina de Ia proteína modular LSL (Mr 35 kDa) producida por el hongo Laetiporus sulphureus (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463). LSL150 está constituido por los 150 primeros aminoácidos de LSL (17 kDa), que adoptan una estructura denominada de β-trébol (Mancheño. J. M., Tateno, H., Goldstein, IJ. , Martínez-Ripoll, M. & Hermoso, J.A. (2005). J. Biol. Chem. 280, 17251-17259). Este se puede describir como un pequeño barril β formado por 6 hebras β, en uno de cuyos extremos se encuentra el denominado triplete de bucles. La estructura en su conjunto resulta de Ia triplicación de una unidad estructural básica de unos 50 residuos, cada una de las cuales poseería capacidad de unión de azúcares derivados de galactosa. Por ello, LSL150 tiene tres potenciales sitios de unión de azúcares, dos de los cuales son competentes para unir disacáridos conteniendo galactosa según se ha demostrado (Mancheño. J. M., Tateno, H., Goldstein, IJ. , Martínez-Ripoll, M. & Hermoso, J.A. (2005). J. Biol. Chem. 280, 17251-17259).
Previamente, el vector plasmídico pKLSL150 (Figura 1 ) fue construido insertando Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) en el vector pET28a+ (Novagen). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno, H. & Goldstein, IJ. (2003).
J. Biol. Chem. 278, 40455-40463), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen LSL45O y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y EcoRI respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSL150 siguiendo procedimientos estándares de clonaje (Sambrook, J.
& Russell, D.W. (2001 ). CoId Spring Harbour Lab. Press. 3rd Ed).
Para Ia producción de Ia proteína LSLi50 recombinante, se transformaron bacterias E. coli (BL21 DE3) con el vector de expresión pKLSL150, en donde Ia expresión del gen que codifica para ella se encuentra bajo el control transcripcional del promotor de T7. Las células de E. coli fueron crecidas en 1 L de medio Luria Bertani LB conteniendo kanamicina (50 μg/mL) durante 3-4 horas a 370C, hasta alcanzarse una OD6oonm de 0.6, momento en donde se induce Ia expresión de Ia proteína mediante Ia adición de 0.3 mM IPTG y posterior incubación a 160C durante 20 horas. Los cultivos celulares se separaron del medio de cultivo mediante centrifugación a 4000 x g durante 15 min. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de Ia proteína LSLi50 mediante lavado con el mismo buffer anterior conteniendo lactosa 0.2 M. La columna puede ser empleada de nuevo sin necesidad de etapas de regeneración adicionales, simplemente tras equilibrarla de nuevo en el buffer de lavado sin azúcar. Debido a que Ia matriz cromatográfica resulta ser inerte a los homogeneizados celulares su uso continuado está garantizado. La proteína así purificada se ha conseguido con un rendimiento de aproximadamente 50 mg/litro de cultivo. El protocolo de purificación proporciona proteína LSLi50 electroforéticamente pura (Figura 2).Todas las etapas del proceso de purificación se realizan a 40C. Se ha determinado Ia estructura tridimensional de LSLi50 recombinante mediante cristalografía de proteínas, encontrándose que es perfectamente superponible (rmsd 1.1 A para 148 carbonos) al dominio lectina de LSL aislada directamente del hongo Laetiporus sulphureus (Figura 3), Io cual es garantía del plegamiento adecuado de esta proteína expresada heterólogamente. El extraordinario rendimiento de Ia producción de LSLi50, que apunta a unas muy eficaces etapas de transcripción y traducción, así como Ia eficacia, sencillez y costes perfectamente asumibles del protocolo de purificación condujeron al planteamiento de Ia hipótesis de trabajo de que LSL150 pudiese actuar como etiqueta de afinidad y de solubilidad en Ia producción de proteínas de fusión. Además, esta molécula posee características muy atractivas como etiqueta de fusión: en primer lugar, es extraordinariamente soluble (se han preparado soluciones de hasta 60-80 mg/ml). Aunque esta característica no es un requisito suficiente para considerarse un agente solubilizante, sí que es un requisito necesario para serlo; en segundo lugar, es monomérica, por Io que no va a contribuir al establecimiento de interacciones intermoleculares entre las proteínas de fusión de las que forme parte, y en tercer lugar, carece de residuos de cisteína, Io que implica Ia ausencia de problemas de oxidaciones.
Con objeto de validar esta hipótesis se han construido una serie de fusiones génicas entre Ia secuencia que codifica para LSLi50 y las secuencias que codifican para distintas proteínas, entre las cuales se ha incorporado Ia secuencia de reconocimiento de Ia proteasa TEV. Para ello se construyó el vector plasmídico pKLSLt insertando en el vector pET28a+ (Novagen) Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) seguida de Ia secuencias de nucleótidos que codifican para un linker de unión y el sitio de reconocimiento de Ia TEV proteasa [LTEV). Dicho inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463) y oligonucleótidos que hibridan en Ia región inicial y final del gen LSL450 y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y Ia secuencia (LTEV) seguida de Ia secuencia diana para Ia enzima de restricción EcoRI, respectivamente (Figura 4). Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt siguiendo procedimientos estándares de clonaje (Sambrook, J. & Russell, D. W. (2001 ). CoId Spring Harbour Lab. Press. 3rd Ed).
Ejemplo 2.- Expresión de Ia proteína de fusión LSLI50-EGFP
2.1.- Construcción del vector plasmídico pKLSLt
Con objeto de validar las aplicaciones del dominio SEQ ID NO2 se han construido una serie de fusiones génicas entre Ia secuencia de ADN que codifica para el dominio LSL150 (SEQ ID NO1 ) y las secuencias que codifican para distintas proteínas, entre las cuales se ha incorporado Ia secuencia de reconocimiento de Ia proteasa TEV. Para ello se construyó el vector plasmídico pKLSLt insertando en el vector pET28a+ (Novagen) Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) seguida de Ia secuencias de nucleótidos que codifican para un linker de unión y el sitio de reconocimiento de Ia TEV proteasa (LTEV). Dicho inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno & Goldstein, 2003) y oligonucleótidos que hibridan en Ia región inicial y final del gen LSL450 y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y Ia secuencia (LTEV) seguida de Ia secuencia diana para Ia enzima de restricción EcoRI, respectivamente (Figura 4). Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
2.2.- Construcción del vector plasmídico pKLSLt-EGFP El vector plasmídico pKLSLt-EGFP (Figura 5) fue construido insertando una fase de lectura abierta de 720 nt del gen de Ia proteína EGFP (Enhancer Green Fluorescence Protein) en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pCMV-EGFP (Clontech), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen EGFP y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Notl, respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-EGFP siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
2.3.- Producción y purificación de Ia proteína de fusión LSL150-EGFP
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-EGFP (Figura 5) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una ODβoonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSL150-EGFP mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 20 horas. Tras centrifugación a 4000 x g durante 15 min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-EGFP mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 6). Las fracciones conteniendo LSL150-EGFP se juntaron (Figura 6, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas Centriprep YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde EGFP y LSL150 (Figura 6, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 6, calles 5 y 6, respectivamente).
Ejemplo 3.- Expresión de Ia proteína de fusión LSLi50-PLD
3.1.- Construcción de los plásmidos bacterianos El vector plasmídico pKLSLt-PLD (Figura 7) fue construido insertando Ia fase de lectura abierta de los primeros 846nt del gen de Ia fosfolipasa dependiente de esfingomielina (PLD) de Ia bacteria patógena Arcanobacterium haemolyticum en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pJB31 (proporcionado por el Dr. Stephen Billington del Department of Veterinary Science and Microbiology, University of Arizona), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen PLD y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-PLD siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
3.2.- Producción y purificación de Ia proteína de fusión LSLi50-PLD
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-PLD (Figura 7) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSLi50-PLD mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-PLD mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 8). Las fracciones conteniendo LSLi50-PLD se juntaron (Figura 8, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde PLD y LSLi50 (Figura 8, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 8, calles 5 y 6, respectivamente).
Ejemplo 4.- Expresión de Ia proteína de fusión LSL150-SMD
4.1. - Construcción de los plásmidos bacterianos
El vector plasmídico pKLSLt-SMD (Figura 9) fue construido insertando Ia fase de lectura abierta de 802nt del gen de Ia fosfolipasa dependiente de esfingomielina del microorganismo patógeno Corynebacteríum pseudotuberculosis (SMD) en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pJG90 (Tambourgi et al., 2002), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen EGFP y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-SMD siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
4.2.- Purificación de Ia proteína de fusión LSLi50-SMD
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-SMD (Figura 9) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 0.6.
En ese momento se induce Ia expresión de Ia proteína LSL150-SMD mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a
160C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-SMD mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 10). Las fracciones conteniendo LSL150-SMD se juntaron (Figura 10, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde SMD y LSL150 (Figura 10, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 10, calles 5 y 6, respectivamente).
Ejemplo 5.- Expresión de Ia proteína de fusión LSLi50-CPL7
5.1.- Construcción de los plásmidos bacterianos
El vector plasmídico pKLSLt-CPL7 (Figura 11 ) fue construido insertando Ia fase de lectura abierta de los primeros 1003nt del gen de Ia proteína mureín hidrolasa CPL7 del bacteriófago Cp-7 de Streptococcus pneumoniae en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pCP700 (García, P., García, JL., García, E., Sánchez-Puelles, J. M., López, R. (1990) Gene 86, 81-88), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen CPL7 y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionándose el plásmido recombinante pKLSI_t-CPL7 siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
5.2.- Purificación de Ia proteína de fusión LSLi50-CPL7 Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-CPL7 (Figura 11 ) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSL150-CPI-J mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSLi50-CPL7 mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 12). Las fracciones conteniendo LSLi50-CPL7 se juntaron (Figura 12, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde CPL7 y LSL150 (Figura 12, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 12, calles 5 y 6, respectivamente).
Ejemplo 6.- Expresión de Ia proteína de fusión LSLi50-IP5_2K
5.1.- Construcción de los plásmidos bacterianos
El vector plasmídico pKLSLt-IP5_2K (Figura 13) fue construido insertando Ia fase de lectura abierta de los primeros 1353nt del gen de Ia proteína Inositol (1 ,3,4,5,6)-pentakisfosfato quinasa de Arabidopsis thaliana en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pET28c conteniendo el cDNA de IP5_2K (proporcionado por Ia Dr. Beatriz González, Grupo de Cristalografía, Insto. Rocasolano, CSIC), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen IP5_2K y presentan en sus extremos las secuencias diana de las enzimas de restricción Sacl y Xhol respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación, seleccionándose el plásmido recombinante pKLSLt-IP5_2K siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).
5.2.- Purificación de Ia proteína de fusión LSLi50-IP5_2K
Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-IP5_2K (Figura 13) durante 3-4 horas a 370C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD6oonm de 1. En ese momento se induce Ia expresión de Ia proteína LSL150-IP5_2K mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 160C durante 16 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpm en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 40C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSLi50-IP5_2K mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 14). Las fracciones conteniendo LSL150- IP5_2K se juntaron (Figura 14, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde IP5_2K y LSL150 (Figura 14, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 14, calles 5).
A modo de comparación, IP5_2K se ha producido como proteína de fusión con GST (GST-IP5_2K) y purificado siguiendo protocolos estándar para esta etiqueta afinidad/solubilidad (resultados no mostrados). Al igual que LSL-I P5_2K, GST-I P5_2K fue tratada con TEV proteasa, y posteriormente IP5_2K purificada mediante cromatografía de penetrabilidad en Superdex 75. Los rendimientos finales de ambas purificaciones llevadas a cabo en paralelo, en condiciones experimentales esencialmente idénticas, fueron: 23 mg de IP5 2K partiendo de 4 litros de cultivo con el sistema basado en LSL y de 3.2 mg con el basado en GST.

Claims

REIVINDICACIONES
1.- Proteína de fusión recombinante caracterizada porque comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de aminoácidos del péptido LSL150 del hongo
Laetiporus sulphureus (SEQ ID NO2), y b) una secuencia análoga a Ia SEQ ID NO2 de a).
2.- Procedimiento de obtención de Ia proteína de fusión según reivindicación 1 caracterizado porque comprende las siguientes etapas: i) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSLi50 (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, ii) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escherichia coli, en Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, iii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, iv) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.
3.- Construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión según reivindicación 1 caracterizada porque comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de ADN SEQ ID NO1 , y b) una secuencia homologa a Ia SEQ ID NO1.
A - Construcción genética según reivindicación 3 caracterizada porque comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag).
5.- Vector de expresión caracterizado porque comprende una construcción genética según reivindicaciones 3 y 4 que permite Ia expresión de una proteína o péptido.
6.- Vector de expresión según reivindicación 5 caracterizado porque el vector es un plásmido o un vector viral.
7.- Célula huésped caracterizada porque comprende Ia construcción genética según reivindicaciones 3 y 4 o el vector de expresión según reivindicaciones 5 y 6, preferentemente una célula procariota.
8.- Célula huésped según reivindicación 7 caracterizada porque está constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.
PCT/ES2009/070079 2008-04-02 2009-03-30 Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones WO2009121994A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ESP200800909 2008-04-02
ES200800909A ES2327309B1 (es) 2008-04-02 2008-04-02 Proteinas de fusion con un dominio lectina de tipo beta-trebol, procedimiento de obtencion y sus aplicaciones.

Publications (1)

Publication Number Publication Date
WO2009121994A1 true WO2009121994A1 (es) 2009-10-08

Family

ID=41134867

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2009/070079 WO2009121994A1 (es) 2008-04-02 2009-03-30 Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones

Country Status (2)

Country Link
ES (1) ES2327309B1 (es)
WO (1) WO2009121994A1 (es)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999066053A1 (en) * 1998-06-16 1999-12-23 Rmf Dictagene S.A. Expression vector for use in a one-step purification protocol

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999066053A1 (en) * 1998-06-16 1999-12-23 Rmf Dictagene S.A. Expression vector for use in a one-step purification protocol

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MANCHEÑO, J.M. ET AL.: "Structural Analysis of the Laetiporus sulphureus Hemolytic Pore-forming lectin in Complex with Sugars.", J. BIOLOGICAL CHEMISTRY, vol. 280, no. 17, April 2005 (2005-04-01), pages 17251 - 17259 *
TATENO, H. ET AL.: "Molecular Cloning, Expression, and Characterization of Novthe Hemolytic Lectins from the Mushroom Laetiporus sulphureus, Which Show Homology to Bacterial Toxins.", J. BIOLOGICAL CHEMISTRY, vol. 278, no. 42, October 2003 (2003-10-01), pages 40455 - 40463 *
TAYLOR, M.E. ET AL.: "Carbohydrate- recognition domains as tools for rapid purification of recombinant eukaryotic proteins.", BIOCHEM. J., vol. 274, March 1991 (1991-03-01), pages 575 - 580 *
TIELKER, D. ET AL.: "Lectin-based affinity tag for one-step protein purification.", BIO-TECHNIQUES., vol. 41, no. 3, September 2006 (2006-09-01), pages 327 - 332 *

Also Published As

Publication number Publication date
ES2327309A1 (es) 2009-10-27
ES2327309B1 (es) 2010-07-26

Similar Documents

Publication Publication Date Title
Guerrero et al. Tandem SUMO fusion vectors for improving soluble protein expression and purification
US7271256B2 (en) Method for producing circular or multimeric protein species in vivo or in vitro and related methods
Garinot-Schneider et al. Identification of putative active-site residues in the DNase domain of colicin E9 by random mutagenesis
Lin et al. Aggregating tags for column‐free protein purification
ES2321058T7 (es) Purificación de proteínas recombinantes fusionadas con epítopos múltiples
Olson et al. Design, expression, and stability of a diverse protein library based on the human fibronectin type III domain
US8357511B2 (en) Protein purification tags and uses thereof
US10358461B2 (en) Precipitable peptides
CN110511950B (zh) Pab蛋白在构建具有类伴侣样蛋白作用的融合蛋白表达载体中的应用
Loughran et al. Modified His-tag fusion vector for enhanced protein purification by immobilized metal affinity chromatography
ES2327309B1 (es) Proteinas de fusion con un dominio lectina de tipo beta-trebol, procedimiento de obtencion y sus aplicaciones.
US20160319287A1 (en) Atypical inteins
EP1981978B1 (en) Affinity polypeptide for purification of recombinant proteins
Mochnáčová et al. Simple and rapid pipeline for the production of cyclic and linear small-sized peptides in E. coli
US20220042063A1 (en) Novel peptide for enhancing expression efficiency of target protein, and fusion protein comprising same
KR20090018315A (ko) 대장균 유래 ptsL 프로모터를 함유하는 재조합벡터 및이를 이용한 외래 단백질의 제조방법
Clifford et al. Production of native recombinant proteins using a novel split intein affinity technology
CN114921449B (zh) 一种组织蛋白酶k的制备方法
WO2023108026A2 (en) Biological production of histidine-rich peptides
US11214791B2 (en) Engineered FHA domains
WO2023177526A2 (en) Compositions and methods for detecting an endotoxin
WO2024119434A1 (zh) 一种提高重组蛋白表达效率的酸性表面助溶短肽标签
US20200291080A1 (en) Recombinase Purification
JP2018000174A (ja) ヒトFcRnをコードするポリヌクレオチドおよび当該ポリヌクレオチドを利用したヒトFcRnの製造方法
US20110136169A1 (en) Expression system compositions and methods

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09728641

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09728641

Country of ref document: EP

Kind code of ref document: A1