WO2017194810A1 - Método de doble híbrido en reverso para la identificación de mutaciones missense - Google Patents

Método de doble híbrido en reverso para la identificación de mutaciones missense Download PDF

Info

Publication number
WO2017194810A1
WO2017194810A1 PCT/ES2017/070298 ES2017070298W WO2017194810A1 WO 2017194810 A1 WO2017194810 A1 WO 2017194810A1 ES 2017070298 W ES2017070298 W ES 2017070298W WO 2017194810 A1 WO2017194810 A1 WO 2017194810A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
seq
promoter
gene
nucleotide sequence
Prior art date
Application number
PCT/ES2017/070298
Other languages
English (en)
French (fr)
Inventor
Olivier Vincent
Original Assignee
Consejo Superior De Investigaciones Científicas (Csic)
Universidad Autónoma de Madrid
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior De Investigaciones Científicas (Csic), Universidad Autónoma de Madrid filed Critical Consejo Superior De Investigaciones Científicas (Csic)
Publication of WO2017194810A1 publication Critical patent/WO2017194810A1/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Definitions

  • the present invention relates to a double hybrid method in reverse useful for the identification of missense type mutations, that is, those sense change mutations that prevent the binding between two interacting proteins.
  • the present invention further describes the gene constructs useful in the method of the invention, as well as the host cell comprising said constructs and which is used in the method of the invention.
  • the double hybrid system (Fields S, Song O. Nature. 1989; 340 (6230): 245-6) is a reference technique for analyzing protein-protein interactions. This technique has been adapted to high-throughput ("high-throughpuf") screening allowing the interaction of numerous organisms, such as human interactome (Rolland T. et al., Cell. 2014; 159 (5): 1212-26 Currently, two companies, Clontech (USA) and Invitrogen (Life Technologies, Thermofisher, USA), sell classic double hybrid system kits.
  • the classic double hybrid system has derived in the double hybrid system in reverse (White MA. Proc Nati Acad Sci US A. 1996; 93 (19): 10001-3).
  • This methodology allows the selection of mutations that cancel out a defined interaction between a pair of interacting proteins and, consequently, also allows the identification of the amino acids involved in said interaction.
  • the detection of the regions, and more specifically, of the specific amino acids involved in protein-protein interactions, is necessary to define the physiological relevance and molecular basis of such interactions.
  • the reverse double hybrid technique is also used to identify molecules that interfere with said protein-protein interaction (Vidal M, Endoh H. Trends Biotechnol. 1999; 17 (9): 374-81). Although the potential of the double hybrid system in reverse is evident, this system has not been as successful as its predecessor.
  • the system uses two markers or reporters that are recognized by two different DNA binding domains, as in previous studies (Jiang R, et ai. Genes Dev. 1996; 10 (24): 3105-15 ; Inouye C. et al. Genetics. 1997; 147 (2): 479-92) in which the double hybrid system was adapted to identify mutations that cancel out the interaction of one protein with another but not with a third.
  • the selection is made in two different steps but with the same transformed cells that the reporters understand and express and the proteins to be studied.
  • DNA binding domains such as GBD are structural domains that can interfere with the interaction being analyzed.
  • the present invention solves the problem of the aforementioned technique by means of a new reverse double hybrid system capable of exclusively detecting missense mutations that prevent the union between a pair of interacting proteins from which it is desired to know the specific regions involved in their union.
  • the reverse double hybrid system of the invention uses a plasmid comprising the nucleotide sequence encoding a peptide capable of interacting with a heterologous protein expressed from a gene construct that has been integrated into the genome of the cell used in the system of the invention, and where the nucleotide sequence encoding for said peptide is fused to the nucleotide sequence that codes for one of the interacting proteins under study.
  • another advantage of the reverse double hybrid method of the invention is the identification of missense mutants in a single stage, by using the mutagenic PCR technique linked to the in vivo recombination technique ("gap-repair” ") and the dual system of reporters that allows simultaneous selection of mutations that are missense and cause the loss of interaction between the pair of proteins to be studied.
  • the reverse double hybrid system of the invention for the identification of missense mutations between a pair of interacting proteins under study in addition to being a fast and simple system, is a very efficient system, correctly identifying 100% of the missense mutations obtained, without giving rise to false positives.
  • the present invention provides a reverse double hybrid method capable of identifying missense mutations that prevent binding between two interacting proteins in a single stage.
  • the invention also features cells, preferably yeast strains and various gene constructs that are useful for the identification of mutations that inhibit molecular interactions between the proteins to be studied by the method described herein. Invention Method
  • the present invention relates to an in vitro method for identifying at least one mutation in a reference protein where said mutation affects the ability of said reference protein to bind to another target protein, wherein said method comprises:
  • At least one host cell comprising:
  • a first nucleotide sequence encoding a reporter gene wherein said nucleotide sequence is operably linked to a promoter comprising a recognition sequence for a protein that binds to DNA
  • a second nucleotide sequence encoding a second reporter gene wherein said second nucleotide sequence is operably linked to a promoter comprising a recognition sequence for a protein that binds to DNA, with the proviso that said recognition sequence is different from the recognition sequence of i), and
  • plasmid comprising the nucleotide sequence encoding a third fusion protein comprising the Gal4 transactivation domain and the reference protein with at least one mutation, where the nucleotide sequence encoding said third fusion protein is operably linked to a promoter
  • the terms "reference” protein, or DNA molecule refers to that molecule capable of binding or associating transiently or constitutively with another protein, or DNA molecule to which for the purpose of This invention is called "target.”
  • the human protein glucokinase (GK) of SEQ ID NO: 10 encoded by the nucleotide sequence SEQ ID NO
  • GKRP human glucokinase regulatory protein
  • DNA binding domain is understood as a set of amino acids that is capable of directing the specific binding of a polypeptide to a particular DNA sequence, for example to a recognition sequence for a transcription factor that specifically interacts with a nucleic acid sequence in the promoter of a gene.
  • the DNA binding domain can be any protein domain that specifically interacts with a sequence that can occur naturally or is artificially inserted into the promoter of a reporter gene.
  • the DNA binding domain can be covalently linked to a transactivation domain, so that protein binding to DNA at a site located within the promoter of a chosen reporter gene, activates its transcription.
  • DNA binding domains and transactivation domains that are suitable for use in the various aspects of the invention.
  • any DNA binding domain or any transactivation domain of any transcription factor can be used in the present invention.
  • the DNA binding domain and the transactivation domain may or may not belong to different transcription factors.
  • Useful recognition sequences include, but are not limited to, the binding sites of yeast Gal4 and Ace1 and LexA transcription factors of bacteria. These binding sites can easily be used with a repressed promoter (for example, the SPAL, SPEX and ESPACE promoters combine an SP013 promoter with the recognition sequences for Gal4, Ace1 and LexA, respectively).
  • Other useful transcription factors include S.
  • the recognition sequence must include at least one binding site for the DNA binding domain of the transcription factor used. The number of binding sites can be adjusted to provide greater or lesser sensitivity to the assay.
  • recognition sequence is meant a segment of DNA that is necessary and sufficient to specifically interact with a given polypeptide, such as, for example, the DNA binding domain of a transcription factor.
  • operably linked is meant that a gene and a regulatory sequence (s) (eg, a promoter) are connected in such a way that they allow gene expression when the appropriate molecules (eg, proteins that include domains that activate transcription) ) bind to regulatory sequences.
  • a regulatory sequence eg, a promoter
  • covalently bound is meant when two molecules, for example proteins, are directly linked by covalent bonds.
  • covalently bound protein or protein domains can be located immediately adjacent, or can be located separated by residues of one or more amino acids within the same hybrid protein.
  • reporter gene refers to a gene whose expression can be analyzed as a measure of the ability of two test molecules to interact (ie, as a measure of protein / protein, protein / RNA, RNA / RNA or protein / DNA interactions).
  • the reporter genes described herein can be located in a plasmid or can be integrated into the genome of a haploid or diploid cell.
  • the reporter gene is preferably operably linked to a promoter that has sequences that direct transcription of the reporter gene.
  • the reporter gene is positioned such that it is expressed when a transactivation domain of a transcription factor is placed in close proximity to the gene (for example, by the use of hybrid proteins to reconstitute a transcription factor, or by covalent binding from the transactivation domain to a DNA binding domain).
  • the reporter gene can also be operatively linked to regulatory sequences that make it very sensitive to the presence or absence of a transcription factor. For example, in the absence of a specific transcription factor, the URA3 reporter gene operably linked to a highly sensitive promoter confers a Ura " Foa r phenotype in the cell. In the presence of a specific transcription factor, this gene construct confers a Ura phenotype.
  • a useful reporter gene has in its promoter a recognition sequence for the DNA binding domain of a transcription factor that can be reconstituted by the interaction of a protein with a DNA binding domain and another protein with a transactivation domain.
  • genes include, without limitation, lacZ, amino acid biosynthetic genes such as, for example, the LEU2, HIS3, LYS2, LYS5, or TRP1 yeast genes, the URA3 gene, nucleic acid biosynthetic genes, the gene that encodes chloramphenicol.
  • reporter genes are considered as “selectable” or “counter-selectable” reporter genes as described below.
  • the reverse double hybrid method as described in the present invention is characterized in that the cell used in said method comprises at least two reporter genes, where the first of said genes is a positive selection gene and The second of these genes is a counter-selection gene.
  • the marker “select” means a gene that, when expressed, confers a growth advantage on a cell that contains it.
  • selectable markers include, without limitation, LEU2, TRP1, and HIS3.
  • Certain selectable markers described herein can be used to promote the growth of cells comprising a plasmid expressing this selectable marker.
  • the promoter operably linked to this selectable marker is the natural promoter for the marker.
  • the marker can be designed to be operatively linked to a promoter other than that to which it is naturally linked.
  • the selectable marker is operably linked to a promoter with a recognition sequence for a transcription factor that can be reconstituted by the interaction of a protein with DNA binding domain and another protein with transactivation domain.
  • counter-selectable means a gene that, when expressed, prevents the growth of the cell that contains it.
  • counter-selectable markers include URA3, LYS2, GAL1, CYH2 and CAN1.
  • select reporter genes include the LEU2, TRP1, and HIS3 markers. In the present invention, the preferred selectable reporter gene is the HIS3 gene.
  • counter-selectable reporter gene is meant a reporter gene that, when expressed under a certain set of conditions, prevents the growth of a cell that contains it.
  • Examples of counter-selectable reporter genes include the URA3, LYS2, GAL1, CYH2 and CAN1 markers.
  • the preferred counter-selectable reporter gene is the URA3 gene.
  • detectable reporter gene is meant a gene whose expression can be detected in a cell by a means other than conferring an advantage of selective growth on a cell.
  • An example of a detectable reporter gene is the lacZ gene.
  • a detectable reporter gene can be integrated into the genome of a cell, preferably a yeast cell.
  • a detectable reporter gene can be used in the invention to measure the ability of two molecules to interact.
  • the promoter that is operatively linked to a detectable reporter gene must contain a recognition sequence for a transcription factor that can be reconstituted by the interaction of a protein with DNA binding domain and another protein with transactivation domain.
  • each of the reporter genes is operatively linked to a promoter that carries a repressor sequence that prevents transcription in the absence of a gene activation motif. Therefore, the reporter gene must be placed in such a way that its expression is highly sensitive to the presence or absence of a transcription factor. For example, it is preferred that when the reporter gene encoding the URA3 allele is used, said allele confers a Ura " Foa r phenotype in the absence of the transcription factor, and a Ura + Foa s phenotype in its presence.
  • promoters such like the SP013 promoter, they naturally contain an upstream repressor sequence.Other promoters can be designed or modified using conventional cloning methods, to understand such sequences.
  • a counter-selection reporter gene When a counter-selection reporter gene is used, the expression of the gene can be detected by detecting cell growth inhibition.
  • reporter genes can be operatively linked to promoters that are identical to each other only in their recognition sequences.
  • the reporter gene is one that allows titillable selection; therefore, cell growth can be measured in a range of conditions (for example, 5-FoA concentrations).
  • Confra-se / equitable markers While the selectable markers have been used to, under certain conditions, promote the growth of only those cells that express the selectable markers, the counter-selectable marker have been used, under certain conditions, to promote the growth of only those cells that do not express the counter-selectable marker.
  • Counter-selectable markers when present in plasmids can be used to select cells that have lost the plasmid.
  • the expression of the URA3 gene which codes for orotidine-5'-phosphate, is lethal in the presence of a medium containing 5-fluoro-orotic acid (5- FOA).
  • URA3-expressing cells can also be positively selected by growing them in a medium without uracil.
  • the URA3 marker can be used either to select positively or negatively.
  • the LYS2 gene which encodes ⁇ -aminoadipate reductase, can also be used for counter-selection. Yeast cells expressing LYS2 do not grow in a medium containing ⁇ -aminoadipate as a source of primary nitrogen. Similarly, the expression of LYS5 in a medium containing ⁇ -aminoadipate is lethal. These genes, which are involved in lysine biosynthesis, can be positively selected in a lysine-free medium.
  • Another counter-selectable marker is the CAN1 gene that encodes an arginine permease.
  • the positively selected reporter genes are selected from the group consisting of any of the following selectable markers HIS3, LEU2, URA3, ADE2, TRP1, LYS2 and LYS5.
  • the positive selection reporter gene is preferably the HIS3 gene.
  • the counter-selection reporter genes are selected from the group consisting of any of the counter-selectable markers URA3, TRP1, LYS2, LYS5, CYH2, CAN1, GAL1 and mazF.
  • the counter-selection reporter gene is preferably the URA3 gene.
  • the gene construct with the reporter gene can be integrated into the genome of a haploid or diploid cell.
  • more than one reporter gene preferably at least four reporter genes, at least three reporter genes and more preferably, at least two reporter genes can be integrated into the genome of a haploid or diploid cell.
  • a combination of reporter genes can be chromosomally integrated into the genome of the cell and other reporter genes can be located in an episomal plasmid and expressed from it.
  • the cell used in said method comprises recognition sequences for proteins that bind to DNA selected from any of the following transcription factors : Gal4, LexA and Ace1.
  • the reverse double hybrid method is characterized in that the cell used in said method comprises integrated into its genome at least two reporter genes, preferably one of positive selection and one of counter-selection.
  • the positive selection reporter gene is HIS3 and the counter-selection reporter gene is URA3.
  • the cell used in the method of the invention is also characterized in that it comprises, preferably integrated in its genome via transformation with an integrative plasmid, the nucleotide sequence encoding a first fusion protein, wherein said first protein of fusion it comprises the same DNA-binding domain as in part ii), and a heterologous protein that binds to the peptide used in the method of the invention and that is comprised in a plasmid which in turn comprises the nucleotide sequence encoding for the reference protein under study.
  • the integrative plasmid comprises the nucleotide sequences of the gene construct where the ADH1 promoter is operably linked to the nucleotide sequence encoding the fusion of the LexA DNA binding domain with the heterologous protein that binds to the peptide of the invention.
  • the human protein TSG101 SEQ ID NO: 32, encoded by, has been used as a heterologous protein expressed from a gene construct integrated in the genome of the cell of the invention. the nucleotide sequence SEQ ID NO: 31).
  • the cell of the invention expresses a first fusion protein comprising the DNA binding domain of LexA and TSG101 (LexA-TSG101), its nucleotide sequence being SEQ ID NO: 48 encoding the SEQ fusion protein ID NO: 49.
  • TSG101 protein belongs to a group of apparently inactive enzymes for ubiquitin conjugation (ubiquitin-conjugating enzymes); in the present invention TSG101 preferably refers to Homo sapiens Gene ID: 7251 although any expert in the State of the art will understand that it is possible to use other sequences from other species, preferably mammals, more preferably primate mammals, which are homologous to the human sequence.
  • This protein is part of the ESCRT-I complex that recognizes ubiquitinated proteins in the endocytic pathway and is involved in the formation of the multivesicular body (MVB) .
  • TSG101 is in turn capable of interacting with a small sequence of a peptide called P (S / T) TAP that is present in the Gag p6 protein of the HIV virus ( PNAS (2001) 98, 7724-9; Cell (2001) 107, 55-65) It has been observed that a sequence comprising a triple repetition of the peptide PTAP,
  • this triple repetition of the PTAP peptide (3xPTAP) of SEQ ID NO: 12 has been used to increase the interaction strength of the LexA-TSG101 fusion protein (SEQ ID NO: 49).
  • the combination of the YPX () peptide and the human ALIX protein or any homologue of this protein could be used in other organisms that binds this peptide (for example, the PalA protein of the filamentous fungus Aspergillus nidulans) (Mol Cell Biol ( 2003) 23, 1647-55).
  • the 3xPTAP peptide (SEQ ID NO: 12) binds human TSG101 protein (SEQ ID NO: 32) with great affinity in the reverse double hybrid system used in the present invention.
  • fusion of the 3xPTAP peptide at the C-terminal end of the reference protein (which is subjected to mutagenesis) has been carried out, to identify mutations that cancel out the interaction with a target protein, without affecting the interaction mediated by the 3xPTAP peptide with the TSG101 protein, which allows us to rule out all false positives that correspond to mutations that truncate the protein.
  • the fusion protein with the 3xPTAP peptide at the C-terminal end of the mutated target protein is fused to the Gal4 transactivation domain (GAD) at its N-terminal end, allowing interaction in the double-hybrid system of the invention with the LexA-TSG101 fusion protein integrated in the cell chromosome, and consequently the activation of the reporter (lexAop) 4-HIS3.
  • GID Gal4 transactivation domain
  • This system allows a positive and unambiguous selection of missense mutations since all mutations that truncate, destabilize or prevent the entry of the protein in the nucleus block its interaction with the heterologous protein TSG101 (SEQ ID NO: 32) and consequently activation of the HIS3 reporter gene, which results in a lack of growth in a medium without histidine (see Figure 1).
  • the selection of the mutants that have incorporated the missense mutations is done in a single step, with a double system of reporters, as we have mentioned previously, the first reporter allows the selection of the mutants that lose the interaction, while the second simultaneously selects mutants that do not truncate the protein.
  • the cell used in the method of the invention preferably comprises LexAop-HIS3 ((lexAop) 4-HIS3) and UASGal-URA3 (SPAL10 :: URA3) reporters, which code for the positive selection and counter-selection markers HIS3 and URA3, respectively.
  • the cell used in the The method described in the present invention comprises the gene construct where the ADH1 promoter is operably linked to the nucleotide sequence encoding the fusion of the LexA DNA binding domain with the heterologous protein, preferably said heterologous protein is the human TSG101 protein, which binds to the peptide of the invention.
  • the cell of the invention expresses the LexA-TSG101 fusion protein of SEQ ID NO: 49.
  • hybrid in relation to proteins or DNA, refer to a chimera of at least two polypeptides, or two DNA molecules, covalently linked.
  • transactivation domain the set of amino acids capable of inducing the expression of a gene in the region to which promoter is linked is understood.
  • peptide “tag”, “epitope”, “tail”, or “stem”, functional at the C-terminal end of the reference protein, is understood as a set of amino acids located at the C-terminal end of the reference protein.
  • it is used as a functional peptide at the C-terminal end of the reference protein analyzed to a small peptide sequence that interacts with great affinity with the heterologous protein expressed by the cell of the invention from step a ).
  • the functional peptide at the C-terminal end of the reference protein refers to the sequence SEQ ID NO: 12 which corresponds to three repetitions of the PTAP peptide (3xPTAP).
  • the PTAP peptide used in the present invention is found in the HIV virus Gag p6 protein, as indicated above.
  • the cell used in the reverse double hybrid method of the invention comprises integrated in its genome, the gene constructs SPAL10-URA3, (lexAop) 4-HIS3 and ADH1 :: LexA-TSG101. Additionally, it can also comprise the gene construct comprising the detectable reporter gene GAL1-LacZ, which, like the reporter gene will select SPAL10-URA3, is under the control of a promoter with the UASGal recognition sequence. The presence of said detectable reporter allows, if necessary, confirm or validate the results obtained with the reporter SPAL10-URA3 in the method of the invention, with assays of the ⁇ -galactosidase enzyme activity.
  • the plasmid used in step b) comprises the nucleotide sequence encoding the DNA binding domain of Gal4 fused to the nucleotide sequence encoding the target protein to be tested.
  • the human protein GKRP of SEQ ID NO: 2 has been used as a target protein, all under the control of a constitutive promoter, preferably and by way of example, it has been used the ADH1 promoter.
  • the cell used in the method of the invention is pre-transformed with said plasmid to ensure expression of the GKRP target protein, thus ensuring that the cell expresses the protein. target, and subsequently as indicated in step c), is grown under conditions that exclusively allow the growth of the cells that have incorporated said plasmid.
  • the culture media used for the growth of the cells described in the present invention and used in the method described herein are known culture media for preferably the growth of yeast cells.
  • the culture media used in the present invention are the minimum culture medium (SD) and the complete culture medium (YPAD).
  • SD minimum culture medium
  • YPAD complete culture medium
  • the preparation of such culture media is described in Methods in yeast genetics— A laboratory course manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York. 1990; pp 198.
  • the complete culture medium (YPAD) contains 1% (w / v) yeast extract, 2% (w / v) bactopeptone, 0.02% (w / v) adenyl (hemi) sulfate and as a source carbon, 2% glucose.
  • the minimum culture medium is composed of nitrogen base for yeast (YNB) without amino acids at 0.17% (w / v), and ammonium sulfate, (NH4) 2S04, at 0.5% (w / v) supplemented with 2% glucose (w / v).
  • the pre-transformed cell as mentioned above is transformed with a linearized vector and a DNA fragment comprising the nucleotide sequence encoding for the reference protein that has previously been subjected.
  • the culture of the pre-transformed cell with the linearized vector and the previously mentioned DNA fragment causes homologous recombination ("repair-repair") to occur between both molecules and a plasmid comprising the Gal4 transactivation domain is obtained.
  • repair-repair homologous recombination
  • the reference protein is the GK protein of SEQ ID NO: 10, all under the control of the constitutive promoter of ADH1.
  • mutations in the nucleotide sequence encoding the reference protein are preferably obtained using the mutagenic PCR and in vivo recombination ("gap-repair") technique.
  • the method of mutagenesis by polymerase chain reaction (PCR) provides a convenient method for inducing mutagenesis of a chosen sequence (Muhlrad et al, 1992, Yeast 8: 79-82), for the purpose of the present invention in the sequence of the reference protein.
  • the DNA encoding the sequence of the mutated protein is amplified in a PCR reaction under conditions that favor the incorporation of incorrect nucleotides in the DNA molecule.
  • Such conditions include relatively high levels of manganese and / or an uneven mixture of the different nucleotides.
  • the PCR primers used in the "gap-repair" mutagenic PCR and in vivo recombination method generate linear PCR products that have homologous sequences at their ends at the ends of the linearized plasmid, which favors recombination between the two after its co-transformation in yeast.
  • steps b) and d) can be carried out simultaneously.
  • the cells of the invention were co-transformed with the plasmid. which codes for the target protein and simultaneously with the linearized plasmid and the products obtained from the mutagenic PCR.
  • mutated refers to the modified sequence, either by directed mutagenesis or random mutagenesis, with respect to the same sequence found naturally in nature (native sequence or wild sequence -type) and that does not present mutations. Mutated sequences include those sequences that have point mutations, insertions, deletions or rearrangements.
  • promoter refers to a minimum sequence sufficient to direct transcription; such elements may be located at the 5 'or 3' ends of the native gene sequence.
  • Suitable promoters for the expression of a reporter gene are those that, when linked to the reporter gene, can direct transcription thereof in the presence of appropriate molecules (i.e., proteins that have transactivation domains).
  • An example of a useful promoter is the ADH1 promoter or the SP013 promoter.
  • Other useful promoters include those promoters that contain upstream repressor sequences (see, for example, Vidal et al, 1995, Proc Nati Acad Sci US 92: 2370-2374), and that inhibit reporter gene expression in the absence of a transcriptional activator.
  • the ability of a promoter to transcribe a reporter gene can be measured with conventional methods of gene expression assays (for example, the detection of the gene product or its mRNA, or the detection of cell growth under conditions where the reporter gene expression for cell growth).
  • the SP013 promoter can be designed to include one or more copies of the Gal4 binding site.
  • the natural binding sites of Gal4 have been widely characterized, allowing the creation of a synthetic sequence to which Gal4 binds with a relatively high affinity.
  • Other useful recognition sequences for proteins that bind to DNA include the binding sites of LexA and Ace1.
  • the recognition sequence of a protein which binds to DNA can be of the native or wild-type type, or it can have any design, both intentionally and randomly, to test the ability of the DNA sequence to interact with this protein.
  • the promoters used are preferably constitutive promoters.
  • said constitutive promoters are selected from any of the list consisting of: ADH1 PGK1, TEF1, TPL1, HXT7, TDH3 and PYK1.
  • the reverse double hybrid method of the invention is characterized in that the plasmid used in step d), before transforming the cell with it, is subjected to a mutagenesis procedure, in vivo or in vitro, to inducing random mutations in the nucleotide sequence comprising said plasmid and encoding the reference protein.
  • the mutagenesis procedure is carried out by means of mutagenic PCR of the nucleotide sequence that encodes the reference protein and in vivo recombination ("gap-repair") of the product obtained in a plasmid.
  • step b) and d) of the method of the invention can be carried out separately or simultaneously, it being preferred to carry them out separately.
  • mutagenic PCR used to introduce random mutations in the nucleotide sequence encoding the GK protein
  • different DNA polymerases can be used with different mutation rates each, in order to compare suitability of each polymerase in the method of the invention.
  • the results have been shown using Taq DNA polymerase from Takara or Roche, and Mutazyme II DNA polymerase from the Agilent Genemorph II random mutagenesis kit.
  • mutant cell strains preferably bacterial strains, such as, for example, Escherichia coli mutant strain described in Rasila TS. et al. Biochem anal. 2009; 388 (1): 71-80.
  • step e) the transformed cell of step d) is cultured under conditions that allow the growth of cells presenting missense mutations that cause the loss of interaction between the pair of proteins to study.
  • the minimum selective medium used is a medium without tryptophan, leucine, adenine and histidine and with 0.1% 5-FoA and 1 to 5 mM 3-AT (SD-AHTL + 5-FoA + 3-AT).
  • This medium lacks adenine since the strain used is prototrophic for this requirement.
  • the absence of tryptophan and leucine makes it possible to select the transformants that have incorporated the two plasmids that express the target protein (TRP1 marker) and the reference protein (LEU2 marker).
  • the absence of histidine makes it possible to select the transformants that activate the reporter ((lexAop) 4: HIS3), and the presence of 3-AT (3-aminotriazole), an HIS3 inhibitor, prevents the growth of the transformants with a baseline level of Activation of this reporter.
  • the presence of 5-FoA prevents the growth of the transformants that activate the SPAL10 reporter: URA3.
  • the SD-AHTL + 5-FoA + 3-AT medium allows the growth of only the transformants that have incorporated the two plasmids, the one that expresses the target protein and the one that expresses the reference protein, and that on the other hand activate the reporter (lexAop) 4: HIS3, but do not activate the reporter SPAL10.URA3. Since the interaction between the target protein and the reference protein activates the reporter SPAL10: URA3, the transformants that do not have mutations, or those that do have them but do not block the interaction between the two proteins, will activate the reporter SPAL10: URA3 and they cannot grow in the presence of 5-FoA ( Figure 1a).
  • the activation of the reporter (lexAop) 4: HIS3 depends on the interaction between TSG101 and the 3xPTAP peptide located at the C-terminal end of the reference protein. Consequently, plasmids with mutations in the coding sequence of the reference protein that cause their truncation, and consequently eliminate the 3xPTAP peptide, as well as the Recircularized plasmids without incorporating the mutagenic PCR product in the in vivo recombination process (or those that had remained undigested) will not activate the reporter (lexAop) 4: HIS3 and will not be able to grow in the absence of histidine ( Figure 1b). Consequently, the only transformants that can grow in this medium are those that carry a mutation that blocks the interaction between the target protein and the reference protein without this mutation causing a truncation in the protein, that is, it is a missense mutation ( Figure 1c).
  • the reverse double hybrid method is characterized in that the cell is selected from the list consisting of: yeast cell, bacterial cell and mammalian cell.
  • the cell is preferably a yeast cell.
  • the yeast cell is selected from the group consisting of Yarrowia lipolytica, Pichia pastoris and Saccharomyces cerevisiae. Cells of the S. cerevisiae species are particularly useful in the method of the invention.
  • the strains used in the present invention are maintained in standard cultures by standard methods.
  • step f) the missense mutations present in the plasmids carrying the cells that have grown in step e) of the method of the invention will be compared and identified, with respect to the native sequence or wild-type of the reference protein.
  • the identification of the missense mutations obtained by the method of the invention are carried out by extracting the plasmid comprising the sequence with the missense mutation, by techniques commonly known in the present technical field, and subsequently proceeding to the sequencing of said mutated sequence, directly from the plasmid DNA, to determine the specific mutation by comparing it with the native or wild-type sequence of the analyzed protein.
  • the yeast cell used in the present invention has integrated into its genome a counter-selectable reporter gene, the reporter gene URA3 being preferred, which is operatively linked to a promoter comprising a recognition sequence for a protein that binds to DNA, the UASGal sequence recognized by the DNA binding domain of Gal4 being preferred.
  • the cell used also comprises another selectable reporter gene integrated into its genome, the HIS3 reporter gene being preferred, which is operatively linked to a promoter comprising a recognition sequence for a protein that binds to DNA, the lexAop sequence being preferred recognized by the LexA DNA binding domain.
  • the cell of the invention comprises the ADH1 :: LexA-TSG101 (SEQ ID NO: 48) gene construct integrated into its genome, which codes for the SEQ ID NO: 49 fusion protein.
  • the three genes mentioned above that is, a counter-selectable reporter gene, a selectable reporter gene, preferably of positive selection, and the heterologous protein to which the functional peptide of the C-terminal end of the reference protein subjected to mutagenesis and recombination in vivo binds, which forms the fusion protein of SEQ ID NO: 49
  • the promoters of the two reporter genes are distinct, specifically in the region of DNA-protein binding recognition sites ( Figure 1), while the rest of the promoter may be similar.
  • Host cell of the invention is a Host cell of the invention.
  • the inventors have constructed a set of yeast cells or strains that have the following characteristics: i) A first nucleotide sequence encoding a reporter gene, wherein said nucleotide sequence is operably linked to a promoter comprising a nucleotide sequence recognized by a protein that binds to DNA,
  • a second nucleotide sequence encoding a second reporter gene wherein said second nucleotide sequence is operably linked to a promoter comprising a recognition sequence for a protein that binds to DNA, with the proviso that said sequence is recognized by a DNA binding domain other than that of i), and
  • a third nucleotide sequence encoding a first fusion protein comprising the DNA binding domain of ii) and a heterologous protein capable of binding to a functional peptide located at the C-terminal end of the study reference protein , where the nucleotide sequence encoding said first fusion protein is operably linked to a promoter.
  • the cell of the invention comprises said constructions integrated in its genome.
  • the cell of the invention is characterized in that the first nucleotide sequence comprising integrated into its genome comprises a reporter gene that is selected from reporter genes of positive selection and / or, counter-selection, preferably a gene counter-selection reporter, and more preferably selected from any of the following list: URA3, TRP1, LYS2, LYS5, CYH2, CAN1, GAL1, mazF.
  • said reporter gene is operatively linked to a recognition sequence for a protein that binds to DNA, as previously defined in the same manner for the method of the invention.
  • the second nucleotide sequence comprising integrated into its genome comprises a reporter gene that is selected from among reporter genes of positive selection and / or counter-selection, preferably a positive selection reporter gene, and more preferably selected from any of the following list: HIS3, LEU2, URA3, ADE2, TRP1, LYS2, LYS5.
  • said reporter gene is operatively linked to a recognition sequence for a protein that binds to DNA, with the proviso that said recognition sequence is different from the recognition sequence comprised in the first nucleotide sequence comprising the cell, that is, different from the recognition sequence of i).
  • the second nucleotide sequence comprising the cell of the invention is characterized in that it comprises the gene construct (lexAop) 4-HIS3, which expresses the positive selection reporter HIS3.
  • DNA binding domains that may comprise the strains of the invention are selected from any of the following transcription factors: Gal4, LexA and Ace1.
  • the cell of the invention is characterized in that it also comprises, integrated into its genome, a third nucleotide sequence that encodes a fusion protein, referred to herein as the first fusion protein, which comprises the DNA binding domain of LexA and the heterologous protein that binds to the functional peptide described and used in the present invention, all under the control of the ADH1 promoter.
  • the first fusion protein which comprises the DNA binding domain of LexA and the heterologous protein that binds to the functional peptide described and used in the present invention, all under the control of the ADH1 promoter.
  • the cell of the invention expresses the LexA-TSG101 fusion protein of SEQ ID NO: 49, from the nucleotide sequence SEQ ID NO: 48.
  • the gene construct encoding the cell fusion protein of the invention described herein is operatively linked to a promoter, preferably constitutive and selected from any of those described above, the promoter being preferred.
  • a promoter preferably constitutive and selected from any of those described above, the promoter being preferred.
  • the cell of the invention comprises integrated into its genome, at least two reporter genes, preferably one of positive selection and another of counter-selection.
  • the positive selection reporter gene is HIS3 and the counterselection reporter gene is URA3.
  • the cell of the invention comprises integrated in its genome, the gene constructs SPAL10-URA3, (lexAop) 4-HIS3 and ADH1 :: LexA-TSG101. Additionally, it can also comprise the gene construct that it expresses for the detectable reporter gene GAL1-LacZ, which is under the control of a promoter with the UASGal recognition sequence. The presence of said detectable reporter allows, if necessary, to confirm or validate the results obtained with the URA3 reporter in the method of the invention, with assays of ⁇ -galactosidase activity.
  • the reverse double hybrid method is characterized in that the cell is selected from the list consisting of: yeast cell, bacterial cell and mammalian cell.
  • the cell is preferably a yeast cell.
  • the yeast cell is selected from the group consisting of Yarrowia lipolytica, Pichia pastoris and Saccharomyces cerevisiae. Cells of the S. cerevisiae species are particularly useful in the method of the invention.
  • the strains used in the present invention are maintained in standard cultures by standard methods.
  • the cell of the invention is the OVY216 cell.
  • strain OVY216 of the present invention also comprises the construction expressing the detectable reporter gene GAL1-lacZ.
  • This reporter gene like the SPAL10 :: URA3 construct, is under the control of UASGal.
  • the presence of the detectable reporter GAL1-lacZ allows, if necessary, confirm or validate the results obtained with the URA3 reporter, with tests of ⁇ -galactosidase activity.
  • Another aspect described in the present invention relates to the gene constructs used to obtain the host cell described in the present invention, as well as to carry out the reverse double hybrid method described herein.
  • One of the gene constructs described herein from now on we will call it the first gene construct of the invention, comprises the nucleotide sequences that code for:
  • a heterologous protein capable of binding to a functional peptide located at the C-terminal end of the reference protein.
  • the first gene construct of the invention is characterized in that it comprises a promoter, preferably constitutive promoter, which can be selected from any of those previously described in the present invention. Additionally, said first gene construct also comprises a DNA binding domain, which is selected from any of those described throughout this document.
  • the first gene construct of the invention also comprises the nucleotide sequence encoding the heterologous protein that binds to the functional peptide described in the present invention.
  • said heterologous protein is the human protein TSG101 (SEQ ID NO: 32, encoded by the nucleotide sequence SEQ ID NO: 31).
  • the TSG101 protein is capable of interacting with a small peptide called PTAP that is present in the Gag p6 protein of the HIV virus (PNAS (2001) 98, 7724-9; Cell (2001) 107, 55-65).
  • the first gene construct of the invention is preferably plasmid pRS402-LexA-TSG101, more preferably plasmid pRS402-LexA-TSG101 comprising the sequence SEQ ID NO: 30.
  • the first gene construct described in the present invention is integrated into the host cell chromosome of the invention and encodes for the first fusion protein described in the present invention, the LexQ-TSG101 fusion protein of SEQ ID NO: 49.
  • Another aspect described in the present invention refers to a second gene construct, from here we will call it the second gene construct of the invention, which comprises the nucleotide sequences encoding for:
  • the second gene construct of the invention therefore comprises a promoter, preferably constitutive, any of those described in the present invention being able to be used, a DNA binding domain, which is selected from any of those described throughout this document, and the sequence of the target protein that binds to the reference protein.
  • the exemplified target protein is the human glucokinase regulatory protein of SEQ ID NO: 2 encoded by SEQ ID NO: 1.
  • the third gene construct of the invention refers to to plasmid pGBKT7-GKRP, more preferably to plasmid pGBKT7-GKRP comprising SEQ ID NO: 6.
  • the second gene construct described in the present invention codes for the second fusion protein described in the present invention, the GBD-GKRP fusion protein of SEQ ID NO: 51.
  • Another aspect described in the present invention relates to a third gene construct, from here we will call it the third gene construct of the invention, which comprises the nucleotide sequences encoding for:
  • a reference protein that also at its carboxyl terminal end comprises the sequence encoding the functional peptide 3xPTAP that specifically binds to the heterologous protein encoded by the first gene construct of the invention.
  • the third gene construct of the invention therefore comprises a promoter, preferably constitutive, any of those described in the present invention being able to be used, a transactivation domain, any of those described in the present invention being used, and the sequence of the reference protein to be studied, fused to the 3xPTAP functional peptide of SEQ ID NO: 12 at its C-terminal end.
  • the exemplified reference protein is the human glucokinase protein of SEQ ID NO: 10 encoded by SEQ ID NO: 9.
  • the second gene construct of the invention relates to the plasmid. pACT2-GK-3xPTAP, more preferably the plasmid pACT2-GK-3xPTAP comprising SEQ ID NO: 14.
  • the third gene construct described in the present invention codes for the third fusion protein described in the present invention, the GAD-GK-3xPTAP fusion protein of SEQ ID NO: 53.
  • they can use other plasmids to those described here, with the same DNA binding domains, such as for example plasmid pDEST TM 32 (Invitrogen), or with others (replacing GBD and LexA) in combination with a strain with low reporters control of promoters with the corresponding recognition sequences, replacing UASGal and lexAop, as well as other plasmids with the same transactivation domain (GAD), such as for example plasmid pEXP TM -AD502 (Invitrogen), or with another domain of transactivation, such as, for example, VP16.
  • GAD transactivation domain
  • the present invention could also be used as a functional peptide, in substitution of the 3xPTAP peptide used in the present invention, together with its interactor protein, TSG101, any other couple, provided that the condition that the functional peptide must meet be a small peptide, preferably less than 30 amino acids and more preferably less than 25 amino acids, that does not interfere with the interaction of the proteins studied, or that to be detected requires more stages increasing the complexity of the technique, as well as another promoter other than ADH1 to express fusion to TSG101 and another marker than ADE2 for genomic integration.
  • FIG. 1 Schematic representation of the URA3 counter-selection and HIS3 positive selection reporter genes, under the control of promoters with recognition sequences for different DNA binding domains.
  • (a) The absence of mutation in the Y protein (exemplified in the human protein glucokinase) results in the activation of URA3 and the lack of growth in the presence of 5-FoA.
  • (b) A truncation mutation in Y does not allow the activation of HIS3 and growth in the absence of histidine.
  • a missense mutation in Y produces the activation of HIS3 but not that of URA3, which allows growth in a medium without histidine and with 5-FoA.
  • X refers to the glucokinase regulatory protein (GKRP).
  • FIG. 1 Gene constructs used in the method of the invention, (a) Constructions integrated in the genome of the yeast strain OVY216. (b) Gene constructs used for the transformation of the strain of the invention OVY216.
  • X refers to the human glucokinase regulatory protein (GKRP).
  • Y refers to the human protein glucokinase (GK).
  • Figure 3 Representation of the mutagenic PCR technique and in vivo recombination ("gap repait”) for the introduction of random mutations in the Y gene (exemplified in the gene encoding the human protein glucokinase) comprised in plasmid pACT2- Y-3xPTAP of SEQ ID NO: 14.
  • Figure 4 Test of the ⁇ -galactosidase activity in filter to detect the interaction in the classical double-hybrid system of OVY216 cells transformed with the plasmid pACT2-GK-3xPTAP without mutating or subjected to mutagenic PCR and with the plasmid pGBKT7-GKRP (left panel) or with plasmid pLexA (1-202) PL-TSG101 (right panel).
  • the interaction between the GK and GKRP proteins (left) or between the 3xPTAP and TSG101 peptide (right) causes the activation of the lacZ reporter gene, and consequently the expression of ⁇ -galactosidase and the hydrolysis of X-Gal in a compound of color blue.
  • a total of 7-8 transformed independent cells have been analyzed for each interaction.
  • Example 1 Analysis of the validity of the reverse double hybrid method of the invention by analyzing the interaction between the GK and GKRP protein pair.
  • the human glucokinase regulatory protein (GKRP) of SEQ ID NO: 2, encoded by the human glucokinase gene comprising SEQ ID NO: 1 has been selected
  • the commercial plasmid pGBKT7 (Clontech) has been used ) comprising TRP1 as a selection marker.
  • Said commercial plasmid pGBKT7 (SEQ ID NO: 3), comprises the nucleotide sequence encoding the DNA binding domain of the transcriptional activator Gal4 (GBD) (SEQ ID NO: 4), under the control of the ADH1 promoter (SEQ ID NO: 5).
  • the nucleotide sequence encoding the GKRP (SEQ ID NO: 1) is cloned in phase, fused at the N-terminal end to the GBD.
  • the coding sequence (SEQ ID NO: 1) of the human GKRP protein (SEQ ID NO: 2), including the start codon and stop codon, is cloned into the plasmid pGBKT7 (Clontech).
  • the plasmid pFlag-ctc-hGKRP-FlagC (Brocklehurst K, et al. Biochem) was used as a template. J. 2004; 378 (Pt2): 693-7) and specific primers designed to hybridize with the 5 'and 3' regions of the gene encoding the GKRP protein (SEQ ID NO: 1) and with the sites of the restriction endonucleases EcoR1 and BamH1 at the ends.
  • the primers used for this purpose are the primers of SEQ ID NO: 7 (hGKRP-EcoR1) (5'- GGAATTCATGCCAGGCACAAAACGGTTTC-3 ') and SEQ ID NO: 8 (hGKRP-BamM) (5'-GGGATCCTACTGAACGTCAGGCTC' TBGTCAGGCTC-GATTAGGC .
  • the fusion protein comprising the other interacting pair protein to be studied is the human glucokinase protein (GK) of SEQ ID NO: 10, encoded by the nucleotide sequence SEQ ID NO: 9, and in addition to the three repetitions of the PTAP (3xPTAP) peptide (SEQ ID NO: 12: EPEPTAPPEPTAPPEPTAPPAE), encoded by the nucleotide sequence SEQ ID NO: 1 1, the commercial plasmid pACT2 (Clontech) of SEQ has been used ID NO: 13, which comprises as the LEU2 selection marker.
  • GK human glucokinase protein
  • the coding sequence SEQ ID NO: 9 of the GK protein (SEQ ID NO: 10) is fused at the end N-terminal to the Gal4 transactivation domain (GAD) (SEQ ID NO: 15), and at the C-terminal at the three repetitions of the PTAP peptide (SEQ ID NO: 1 1), all under the control of the promoter of ADH1 (SEQ ID NO: 16).
  • the commercial plasmid pACT2 (Clontech) of SEQ ID NO: 13 has been modified by inserting into the Xho1 site of the polylinker, the nucleotide sequence (SEQ ID NO: 1 1) that encodes the 3xPTAP peptide of SEQ ID NO : 12 (EPEPTAPPEPTAPPEPTAPPAE).
  • SEQ ID NO: 1 1 This nucleotide sequence (SEQ ID NO: 1 1) has been obtained by the ringing of two complementary oligonucleotides of SEQ ID NO: 17 (OV570) (5'- TCGAGAGCCAGAACCCACAGCACCGCCTGAGCCTACCGCCCCACCCGAACCGAC GGCGCCTCCAGCTGAGTAA-1 'IDB) SEV-3' ID: 18 (5'- TCGATTACTCAGCTGGAGGCGCCGTCGGTTCGGGTGGGGCGGTAGGCTCAGGC GGTGCTGTGGGTTCTGGCTC-3 ').
  • the resulting double stranded oligonucleotide has 5 'protruding ends (TCGA) that allow cloning at the Xho1 site of plasmid pACT2.
  • TCGA 'protruding ends
  • the resulting plasmid after cloning of said nucleotide sequence is called pACT2-3xPTAP (SEQ ID NO: 19) and has the same polylinker as the original pACT2 plasmid of SEQ ID NO: 1 1, but limited at each N-terminal end and C-terminal with the sequences encoding the Gal4 activation domain (GAD) and the 3xPTAP peptide, respectively, in phase with each other.
  • GCD Gal4 activation domain
  • plasmid pACT2-GK-3xPTAP of SEQ ID NO: 14 is obtained by PCR cloning of the coding sequence of human GK (SEQ ID NO: 9), including the start codon, but excluding the stop codon , at the BamH1 site of the polylinker of plasmid pACT2-3xPTAP of SEQ ID NO: 19, previously obtained, so that the nucleotide sequences encoding the Gal4 activation domain (GAD), for the GK protein and for the 3xPTAP peptide , remain in phase.
  • GID Gal4 activation domain
  • the primers used for that purpose are the primers of SEQ ID NO: 20 (OV500) (5'-GGGATCCTGATGCTGGACGACAGAGCCAGG-3 ') and SEQ ID NO: 21 (OV562) (5'-GGGATCCACTGGCCCAGCATACAGGCCTTC-3').
  • SEQ ID NO: 32 the human TSG101 protein
  • SEQ ID NO: 30 plasmid pRS402-LexA-TSG101
  • nucleotide sequence SEQ ID NO: 23 that encodes the DNA binding domain of the LexA transcriptional repressor (amino acids 1-202) was cloned. of SEQ ID NO: 24, together with the promoter (SEQ ID NO: 25) and terminator (SEQ ID NO: 26) of ADH1, between the Kpn1 and Sac1 sites of the integrative plasmid pRS402 (Brachmann CB. et al. Yeast. 1998 ; 14 (2): 115-32).
  • This gene sequence was amplified by PCR using the plasmid pLexA (1-202) PL (Ruden DM, et al. Nature.
  • SEQ ID NO: 27 SEQ ID NO: 27 and primers capable of hybridizing as template. at the beginning of the ADH1 promoter (SEQ ID NO: 25) and at the end of the ADH1 terminator (SEQ ID NO: 26), and with the restriction endonuclease sites Kpn1 and Sac1 at the ends.
  • the primers used for this purpose were the primers of SEQ ID NO: 28 (OV502) (5'-GGGTACCTTTTGTTGTTTCCGGGTGTAC-3 ') and SEQ ID NO: 29 (OV503) (5'-GGAGCTCGCATGCCGGTAGAGGTGTGGTC-3').
  • the definitive plasmid called pRS402-LexA-TSG101 of SEQ ID NO: 30 was obtained by PCR and cloning of the nucleotide sequence SEQ ID NO: 31 which codes for the TSG101 protein (SEQ ID NO: 32) (including the start codon and stop codon), at the BamH1 site of the previously constructed plasmid pRS402-LexA (SEQ ID NO: 22).
  • plasmid pRS402-LexA-TSG101 (SEQ ID NO: 30) is integrated into the chromosome of the yeast cell OVY216 described in the present invention, specifically in the locus of the ADE2 marker of said cell.
  • a human cDNA library (Clontech ref 638805) and primers capable of hybridizing with the 5 'and 3' regions of the TSG101 gene (SEQ ID NO : 31) and with restriction endonuclease sites BamH1 at each end.
  • the primers used for that purpose were sequence primers SEQ ID NO: 34 (OV310) (5'- GGGATCCTCATGGCGGTGTCGGAGAGCCAGC-3 ') and SEQ ID NO: 35 (OV311) (5'- GGGATCCTCAGTAGAGGTCACTGAGACCGGC-3').
  • plasmid pl_exA (1-202) PL-TSG101 (SEQ ID NO: 33) used in the classic double hybrid system, which is used to validate the method of the invention and described below, was obtained in the same manner as plasmid pRS402-LexA-TSG101 (SEQ ID NO: 30) mentioned previously, but using plasmid pl_exA (1-202) PL (SEQ ID NO: 27), instead of plasmid pRS402-LexA (SEQ ID NO: 22), as receptor vector.
  • the yeast strain OVY216 of the present invention has been obtained by crossing the commercial strain from Invitrogen MAV203 (MATct, Ieu2-3, 112, trpl-901, his3-A200, gal4A, gal80A, canIR, cyh2R, LYS2: : GAL1-HIS3, GAL1-lacZ, SPAL10 :: URA3) comprising the reporter gene URA3 under the control of UASGal, and of the commercial strain from Invitrogen L40-ura (MATa, Ieu2-3, 112, trp1-901, his3-A200, ade2-101, gal80A, LYS2: (lexAop) 4-HIS3, ura3: (lexAop) 8-lacZ), which comprises the HIS3 reporter gene under the control of LexAop.
  • Invitrogen MAV203 MATct, Ieu2-3, 112, trpl-901, his3-A200, gal4A
  • the yeast culture media used in the present invention for the growth of the strains are the minimum culture medium (SD) and the complete culture medium (YPAD).
  • SD minimum culture medium
  • YPAD complete culture medium
  • strain OVY216 equivalent amounts of each strain L40-ura and MAV203 were mixed in a plate of complete culture medium (YPAD) and incubated at 30 ° C for 5 hours.
  • YPAD complete culture medium
  • Obtaining diploid organisms (ade2-101 / ade2-101, his3-A200 / his3-A200, Ie2-3, 112 / leu2-3, 112, trp 1-901 / trp 1-901, gal4A / GAL4, gal80A / gal80A, LYS2 :: GAL1-HIS3 / LYS2: (lexAop) 4-HIS3, ura3: (lexAop) 8-lacZ / SPAL10 :: URA3, GAL1-lacZ / -) was checked by microscope observation and several of them were collected with a micromanipulator (Model MSM system SINGER) and deposited on another culture plate in the presence of YPAD complete culture medium.
  • the diploids were transferred to a pre-sporulation medium plate (0.8% yeast extract, 0.3% bactopeptone, 10% glucose, 2% agar) and incubated at 30 ° C for 24 hours, then be transferred to a sporulation medium plate (1% potassium acetate, 0.1% yeast extract, 0.05% glucose, 2% agar) and incubated at 30 ° C for 3 days. Subsequently, a suspension of each of the diploids was prepared and the obtaining of tetrads was verified by microscopic observation.
  • a pre-sporulation medium plate (0.8% yeast extract, 0.3% bactopeptone, 10% glucose, 2% agar
  • a sporulation medium plate 1% potassium acetate, 0.1% yeast extract, 0.05% glucose, 2% agar
  • one of the suspensions of the diploid individuals was incubated in the presence of beta-glucuronidase for 15 minutes at 25 ° C and the spores were separated with the MSM system SINGER micromanipulator and cultured in a YPAD complete medium plate.
  • GAL1-lacZ SEQ ID NO: 40 (OV715) SEQ ID NO: 41 (OV741)
  • strain OVY21 1 has been identified, which has the genotype: MATa ade2-101, his3-A200, Ieu2-3, 112, trp1-901, gal4A, gal80A, LYS2: (lexAop) 4-HIS3, SPAL10 :: URA3, GAL1-lacZ.
  • Figure 2a yeast strain OVY211 was transformed with plasmid pRS402-LexA-TSG101 (SEQ ID NO: 30) linearized with restriction endonuclease Stu1 that recognizes a single site on the ADE2 marker of said plasmid.
  • the selection of the transformants in which said plasmid has been integrated by homologous recombination in the locus of the ADE2 marker was carried out on a minimum SD medium plate without adenine.
  • strain OVY216 of the present invention comprises the construction that expresses the inducible reporter gene GAL1-lacZ.
  • This reporter gene like the SPAL10 :: URA3 construct, is under the control of UASGal.
  • the presence of the inducible reporter gene GAL1-lacZ allows, if necessary, to confirm or validate the results obtained with the reporter gene URA3, by means of ⁇ -galactosidase activity assays.
  • the strain of the invention After obtaining the strain of the invention OVY216 as previously described in 1.2, it is transformed with the plasmid pGBKT7-GKRP (SEQ ID NO: 6) to express one of the interacting pair proteins studied herein. example, the GKRP protein (SEQ ID NO: 2).
  • the transformation of said cell could be carried out, to obtain by means of in vivo recombination "gap repair", the second plasmid pACT2-GK-3xPTAP , but to ensure the expression of the GBD-GKRP fusion protein (SEQ ID NO: 51), by the OVY216 cell, it is preferred to first carry out the transformation of said cell with the plasmid pGBKT7-GKRP (SEQ ID NO: 6), and once the cell comprises said plasmid, then carry out the second transformation and obtain the plasmid pACT2-GK-3xPTAP recombined.
  • plasmid pGBKT7-GKRP expresses the GBD-GKRP fusion protein (SEQ ID NO: 51) at a level sufficient to activate the expression of the URA3 positive selection reporter gene (by its interaction with the GAD-GK-3xPTAP fusion protein (SEQ ID NO: 53)) expressed by the plasmid pACT2-GK-3xPTAP of SEQ ID NO: 14, and prevent the growth, in the presence of 5-FoA, of the clones that comprise the GK protein that do not have missense mutations.
  • the transformation protocol of the yeast strain OVY216 with the plasmid pGBKT7-GKRP was carried out by the standard methodology with lithium acetate. Briefly, the yeast cell OVY216 is maintained in culture in YPAD complete medium until it reaches the logarithmic phase of growth. The culture is then centrifuged for 5 min at 2000 rpm and the supernatant is discarded. The pellet where the OVY216 cell of the invention is resuspended in 1 ml of water and transferred to an eppendorf tube to be centrifuged again for 5 min at 2000 rpm and re-discard the supernatant.
  • the pellet of the OVY216 cell is resuspended in the TELiAc solution (100 ⁇ 5/5 ml culture) comprising the TE buffer with 0.1 M LiAc.
  • a 50 ⁇ suspension of the OVY216 cell of the invention is mixed in an eppendorf with 2 ⁇ (20 ⁇ g) of carrier DNA and 100 ng of plasmid pGBKT7-GKRP (SEQ ID NO: 6).
  • 250 ⁇ of the TELiPEG solution comprising TE with 0.1 M LiAc and 40% PEG 3350 are added and vortexed for 15 sec.
  • the generation of mutations by said technique is based on the use of PCR conditions that favor the random introduction of mutations in the PCR product obtained, making use of primers that allow the amplification of the nucleotide sequence encoding the GK, together with the flanking sequences present in plasmid pACT2-GK-3xPTAP (SEQ ID NO: 14).
  • the mutagenic PCR and in vivo recombination technique is based on recombination, after transformation, between a linearized plasmid and a PCR product obtained under conditions that favor the random introduction of mutations
  • the transformants obtained comprise a plasmid, a priori, identical to pACT2-GK-3xPTAP, but with random mutations introduced into the nucleotide sequence encoding the GK protein.
  • the primers used in the mutagenic PCR have been the primers of SEQ ID NO: 44 (OV621) (5'-CACTGTCACCTGGTTGGACGG-3 ') and of SEQ ID NO: 45 (OV622) (5'-CTATAGATCAGAGGTTACATGGC-3'), which hybridize 213bp upstream and 174bp downstream of the nucleotide sequence (SEQ ID NO: 9) encoding the GK protein (SEQ ID NO: 10) in plasmid pACT2-GK-3xPTAP (SEQ ID NO: 14).
  • two mutagenic PCRs have been carried out to introduce random mutations in the nucleotide sequence encoding the GK protein, the only difference between said mutagenic PCRs being the DNA polymerase enzyme used in each of them.
  • the DNA polymerase enzymes have different mutation rates between them, hence it has been wanted to compare two of said enzymes to know which one is the most suitable for the method of the invention.
  • Taq DNA polymerase from Takara or Roche has been tested, and Mutazyme II DNA polymerase from the Agilent Genemorph II random mutagenesis kit.
  • reaction mixture (50 ⁇ total) comprises: 33.1 ⁇ H 2 0 + 5 ⁇ 10x buffer + 1 ⁇ 10 mM dNTPs + 0.25 ⁇ of the primers of SEQ ID NO: 44 and SEQ ID NO: 45 (100 ⁇ ) + 9.4 ⁇ pACT2-GK-3xPTAP (2.5 ⁇ g) + 1 ⁇ Mutazyme II (pol DNA).
  • the PCR cycles were: (1) 95 ° C 2 min; (2) 95 ° C 30 sec + 55 ° C 30 sec + 72 ° C 1 min / Kb (repeat step 20 (2)) and (3) 72 ° C 10 min.
  • Taq DNA polymerase Takara Ref. R001 or Roche Ref 1 1647679001. Standard conditions have been used to minimize the number of mutations per Kb.
  • the reaction mixture (50 ⁇ total) comprises: 42 ⁇ H 2 0 + 5 ⁇ buffer + 1 ⁇ dNTPs 10 mM + 0.25 ⁇ of the primers of SEQ ID NO : 44 and SEQ ID NO: 45 (100 ⁇ ) + 1 ⁇ pACT2-GK-3xPTAP (265 ng) + 0.5 ⁇ Taq (pol DNA).
  • the PCR cycles were (1) 94 ° C 2 min; (2) 94 ° C 30 sec + 55 ° C 30 sec + 72 ° C 1 min / Kb (repeat step 30 (2)) and (3) 72 ° C 7 min.
  • Plasmid pACT2 (SEQ ID NO: 13) (Clontech) in the polylinker with the restriction enzyme BamH1 ( Figure 3) is linearized for the technique of mutagenic PCR and in vivo recombination.
  • Other restriction enzymes such as Nco1, Sma1, EcoR1, Sac1 or Xhol could be used.
  • the digestion mixture (100 ⁇ total) comprises: 80 ⁇ H 2 0 + 10 ⁇ buffer 10x + 7.4 ⁇ pACT2 (1.74 ⁇ g) + 2.5 ⁇ (25u) BamH1 (Roche). The mixture was incubated for 2h at 37 ° C. Subsequently, the DNA was precipitated with sodium acetate and ethanol, and then resuspended in 20 ⁇ H 2 0.
  • Compound 3-AT (3- aminotriazole) is a competitive inhibitor of the HIS3 gene product that is used in the present example to prevent the baseline activity of the LexA (op) -HIS3 reporter from being sufficient to allow cell growth in absence of histidine
  • a concentration of 1 mM 3-AT compound has been used but it has been observed that using said concentration there are transformed OVY216 cells that are capable of growing in the absence of histidine due to the basal activity of the LexA (op) -HIS3 reporter, although colonies obtained are much smaller than those obtained with transformants that comprise the sequence encoding the GK protein with missense mutations.
  • a 3-AT concentration of 5mM has been tested. This higher concentration is able to completely inhibit the growth of these transformants.
  • the yeast cell of the invention OVY216, previously transformed with the plasmid pGBKT7-GKRP (SEQ ID NO: 6), is now transformed with the plasmid pACT2 linearized with BamH1 together with the products of the mutagenic PCR.
  • said cell is inoculated in 5ml of minimal culture medium without tryptophan (SD-T) and is kept in culture until its growth reaches the logarithmic phase. This culture ensures the growth of cells that comprise plasmid pGBKT7-GKRP and will consequently express the GBD-GKRP fusion protein (SEQ ID NO: 51).
  • a high concentration of the mutagenic PCR product with respect to the linearized plasmid is used to favor its integration by recombination or "gap repait" ( Figure 3).
  • the pellet of the transformed yeast cells is resuspended in 5ml of YPAD complete medium and cultured at 30 ° C for 150 min. Subsequently, it is centrifuged for 1 min at 13000 rpm and all the supernatant is removed.
  • the pellet is resuspended yeast in 50 ⁇ of water and 1% of the transformation mixture is planted in a control plate with a non-selective minimum medium without tryptophan, leucine, or adenine (SD-TLA) to calculate the total number of transformants containing the two plasmids pGBKT7 -GKRP (SEQ ID NO: 6) and pACT2-GK-3xPTAP obtained by recombination (“gap repait”), including transformants that do not carry mutations or those that carry mutations without the desired effect.
  • SD-TLA non-selective minimum medium without tryptophan, leucine, or adenine
  • This selective medium lacks adenine since the strain is prototrophic for this requirement and lacks tryptophan and leucine since the markers of the two plasmids are TRP1 and LEU2.
  • An average of 500 transformants has been obtained in this control plate, which indicates that the total number of tracked transformants is 50,000, with 1% of the transformation mixture being seeded.
  • the number of transformants obtained in the selective medium SD-AHTL + 5-FoA + 3-AT varies according to the DNA polymerase used to introduce random mutations in the nucleotide sequence encoding the GK protein in the mutagenic PCR.
  • Mutazyme II DNA polymerase the number of transformants in the selective medium is 1.25% of the total of the transformants tracked.
  • Taq DNA polymerase 10 times less positive clones (0.125% of total transformants) have been obtained than those obtained with Mutazyme II. This difference is probably due to the fact that standard conditions that do not favor the appearance of mutations have been used with DNA polymerase Taq, with the aim of limiting the number of plasmid mutations.
  • Plasmid DNA from 19 transformants obtained in the selective medium SD-AHTL + 5-FoA + 3-AT has been extracted.
  • these 19 transformants (10 obtained with the DNA polymerase mutazyme II and 9 obtained with the DNA polymerase Taq), which present the mutations in the nucleotide sequence encoding the GK protein, obtained by the mutagenic PCR and in vivo recombination technique " gap-repair ", and selected by the reverse double hybrid method described in the present invention, the mutated plasmid pACT2-GK-3xPTAP comprising said transformants has been isolated.
  • each transformant is grown in 5ml_ of minimum medium without leucine (SD-L) until it reaches the stationary phase of its growth.
  • SD-L minimum medium without leucine
  • the plasmid DNA is then isolated by the commercial kit "High Puré Plasmid Isolation Kit '(Roche), which has been adapted for the extraction of plasmids in yeast, since said kit is specific for plasmid purification in bacteria. It was resuspended.
  • the purified plasmid DNA of each transformant comprises a mixture of plasmid pGBKT7-GKRP (comprising a kanamycin resistance marker) and plasmid pACT2-GK-3xPTAP with the mutated GK gene sequence (comprising an ampicillin resistance marker).
  • the plasmid is isolated from said mixture with the nucleotide sequence encoding the mutated GK.
  • the E. coli DH5a strain with 10 ⁇ of the mixture of the extracted plasmid DNA is transformed by the standard rubidium chloride methodology as mentioned above.
  • said transformed bacterial cells are cultured on a plate with LB culture medium in the presence of 5C ⁇ g / ml ampicillin to select only those bacterial transformants that had incorporated plasmid pACT2-GK -3xPTAP presenting missense mutations.
  • the plasmid pACT2-GK-3xPTAP comprising the missense mutations was purified with the "High Puré Plasmid Isolation Kif (Roche) kit. To do this, a bacterial transformant of each transformation plate was cultured in 5ml_ of LB medium with ampicillin and the plasmid was purified according to the manufacturer's instructions Finally, it was verified with the restriction enzyme BamH1 that the mutated plasmid pACT2-GK-3xPTAP has the same restriction pattern as the parental plasmid pACT2-GK-3xPTAP (SEQ ID NO: 14) not mutated In the present example, the 19 purified plasmids presenting the mutated GK nucleotide sequence by means of the "gap-repair" mutagenic PCR and in vivo recombination technique, released 2 fragments of 8.2 Kb and 1.4 Kb each, at same as the plasmid pACT2-GK-3xPTAP parental (SEQ
  • yeast strain Y187 (Clontech) comprising the lacZ reporter under the control of UASGal has been used.
  • yeast strain CTY10-5d Cellular interactions in development: a practice! approach ed. DA Hartley Oxford: Oxford University Press 153-17
  • lacZ reporter under the control of lexAop
  • the transformation mixture was seeded on a minimal medium plate without tryptophan, leucine and uracil (SD-TLU) since strain Y187 is capable of synthesizing uracil and the markers of the two plasmids are TRP1 and LEU2.
  • the transformation mixture was seeded on a minimal medium plate without histidine, leucine and uracil (SD-HLU) since strain CTY10-5d is capable of synthesizing uracil and the markers of the two plasmids are HIS3 and LEU2.
  • SD-HLU histidine, leucine and uracil
  • a nitrocellulose filter was placed on top of the culture plate to transfer, by gentle application, the yeast to the filter.
  • the filter was incubated at -80 ° C for 1 h to permeabilize the cells and subsequently the filter was placed on Whatman 3MM paper dipped in Z buffer (60 mM Na 2 HP0 4, 40 mM NaH 2 P0 4 , 10 mM KCI, 1 mM MgS0 4 , 38 mM ⁇ -mercaptoethanol) with 0.1% X-Gal and incubated for 1 h at 30 ° C.
  • Z buffer 60 mM Na 2 HP0 4, 40 mM NaH 2 P0 4 , 10 mM KCI, 1 mM MgS0 4 , 38 mM ⁇ -mercaptoethanol
  • the oligonucleotides used for sequencing and identification of missense mutations in the nucleotide sequence of the gene encoding the GK protein were the following: SEQ ID NO: 46 (OV284) (5'-CG ATG ATG AAGATACCCCACC-3 '), that hybrid 67bp upstream of the polylinker where the nucleotide sequence of the GK gene is cloned and SEQ ID NO: 47 (OV285) (5'-GAGATGGTGCACGATGCACAG-3 '), which hybridizes 120bp downstream of the polylinker where the nucleotide sequence of the GK gene is cloned
  • the mutations present in 5 additional transformants different from the previous 19 and from the transformation with the PCR product obtained with the Taq DNA polymerase have also been identified by sequencing.
  • the analyzed plasmid has not been previously extracted or validated in the classic double-hybrid system.
  • the insert comprising the mutated GK gene has been amplified directly from the plasmid DNA extracted from the additional 5 transformants and sequenced.
  • the high efficiency of the reverse double hybrid system described in the present invention (100% positive detected - 100% missense mutations with the 19 transformants), the fact of being able to directly amplify and sequence the plasmid DNA, without having to isolate the plasmid and validate it saves time.
  • the extraction of the mutated plasmid and its validation with the classic double-hybrid system can be carried out later, once the mutation has been identified, which avoids validating repeated or already known mutants.
  • the identification of mutations in the 5 additional transformants has been carried out as follows: Extraction of plasmid DNA from the transformants of yeast selected by the reverse double hybrid system of the invention (see section 1.5) and use of this DNA as a template to amplify the GK gene by PCR with the oligonucleotides used for sequencing (SEQ ID NO: 46 (OV284 ) and SEQ ID NO: 47 (OV285)). Subsequently, the amplified PCR product is sequenced with these same oligonucleotides to identify the mutations present in the insert.
  • the sequencing of the 24 mutants shows that the frequency of missense mutations in each clone is different depending on the DNA polymerase used.
  • the optimal situation would be to obtain a single missense mutation in the GK coding sequence (1.5 Kb). If there are several, it is necessary to analyze in the classic double hybrid system the effect of each mutation in isolation to know which is responsible for the loss of interaction. In this case, plasmids comprising a single mutation have been obtained by directed mutagenesis.
  • Mutazyme II DNA polymerase Using Mutazyme II DNA polymerase, about 2 missense mutations have been obtained per Kb on average. In the case of Taq DNA polymerase, an average of 1 missense mutation per Kb has been obtained (half that of Mutazyme II). This difference is consistent with the fact that 10 times less transformants have been obtained in the selective medium SD-AHTL + 5-FoA + 3-AT when Taq DNA polymerase has been used than when Mutazyme II DNA polymerase has been used. Although the result with Taq is better in terms of frequency of mutations, this polymerase has a mutational spectrum with a strong tendency for AT to GC changes, which causes many of the mutations obtained to be repeated. Thus, as the results obtained show, Taq DNA polymerase results in 70% of repeated missense mutations, while Mutazyme II DNA polymerase only results in 40% of repeated mutations.
  • missense mutations that prevent the union between the GK and GKRP proteins were identified, these mutations were compared with the already known structure of the GK-GKPR complex (Choi JM et al. Proc Nati Acad Sci US A. 2013 Jun 18; 110 (25): 10171-6), showing the good correlation between the results obtained in the identification of missense mutations by the double hybrid method in reverse of the invention and the structure of the complex, since:
  • the proline substitutions of the S64P, L75P and T209P residues may have an indirect effect on the interaction breakage (via Thr60, Gly72 and Ala201), since the Ser64 residue is located at the beta sheet adjacent to Thr60 while Leu75 and Thr209 are located in beta sheets adjacent to the motifs containing Gly72 and Ala201, and due to the interruption of these beta sheets by proline residues,
  • Cysteine residues are part of a ring of 5 cysteine residues, close to the hydrophobic pocket and probably involved in the formation of disulfide bridges and in the maintenance of the conformation of the GK (Arch Biochem Biophys. 2000 Mar 15; 375 (2): 251-60).
  • the amino acid residue Gly407 is located next to the cysteine residue ring.
  • Example 3 Comparison between reverse double hybrid system of the invention comprising the counter-selection reporter gene URA3 with respect to the same reverse hybrid double system but using the TetR repressor gene as the counter-selection system.
  • a missense mutation in the GK protein coding sequence that blocks its interaction with GKRP activates the ADE2 reporter, which allows the strain to grow in the absence of adenine.
  • the ADH1 :: LexA-TSG101 fusion protein has been integrated into the URA3 locus of strain LY26 (Thomas LR et al. J Biol Chem.
  • strain OVY158 ⁇ MATalpha canl his3 Ieu2 met15 trpl ura3 gal4 :: hisG gal80 :: hisG LYS2 :: LexA (op) -HIS3 TetO-ADE2 ho :: KanMX :: GAL 1-TetR URA3 :: LexA-TSG101).
  • the loss of interaction between GK and GKRP proteins is selected by growth in a selective medium with absence of adenine (minimum culture medium (SD) with arginine and methionine as sole requirements and 1 mM 3- AT) instead of growth in the presence of 5-FoA.
  • SD minimum culture medium
  • 5-FoA 5-FoA
  • sucrose has been used as a carbon source, instead of glucose, thus trying to eliminate the negative effect of glucose on the GAL1 promoter and, consequently the expression of the TetR reporter, this problem has only been partially resolved, but this system is less efficient than the system that uses URA3 and 5-FoA, since through the use of TetR 15% of false positives are obtained, while, as we have mentioned previously, by the reverse double hybrid system using URA3, HIS3 and 5-FoA, described in the present invention do not obtain false positives.

Abstract

La presente invención se refiere a un método de doble híbrido en reverso útil para la identificación de mutaciones de tipo missense, es decir, aquéllas mutaciones de cambio de sentido que impiden la unión entre dos proteínas interaccionantes. En la invención se describen además las construcciones génicas útiles en el método de la invención, así como la célula huésped que comprende dichas construcciones y que se utiliza en el método de la invención.

Description

MÉTODO DE DOBLE HÍBRIDO EN REVERSO PARA LA IDENTIFICACIÓN DE
MUTACIONES MISSENSE
DESCRIPCIÓN
La presente invención se refiere a un método de doble híbrido en reverso útil para la identificación de mutaciones de tipo missense, es decir, aquéllas mutaciones de cambio de sentido que impiden la unión entre dos proteínas interaccionantes. La presente invención describe además las construcciones génicas útiles en el método de la invención, así como la célula huésped que comprende dichas construcciones y que se utiliza en el método de la invención.
ESTADO DE LA TÉCNICA El sistema de doble híbrido (Fields S, Song O. Nature. 1989;340(6230):245-6) es una técnica de referencia para analizar las interacciones proteína-proteína. Esta técnica ha sido adaptada a cribados de alto rendimiento ("high-throughpuf) permitiendo caracterizar el interactoma de numerosos organismos, como por ejemplo el interactoma humano (Rolland T. et al., Cell. 2014; 159(5): 1212-26). Actualmente, dos empresas, Clontech (USA) e Invitrogen (Life Technologies, Thermofisher, USA), comercializan kits del sistema de doble híbrido clásico.
El sistema de doble híbrido clásico ha derivado en el sistema de doble híbrido en reverso (White MA. Proc Nati Acad Sci U S A. 1996;93(19): 10001-3). Esta metodología permite la selección de mutaciones que anulan una interacción definida entre un par de proteínas interaccionantes y, en consecuencia, permite también la identificación de los aminoácidos implicados en dicha interacción. La detección de las regiones, y más específicamente, de los aminoácidos concretos implicados en las interacciones proteína-proteína, es necesaria para definir la relevancia fisiológica y las bases moleculares de dichas interacciones. La técnica de doble híbrido en reverso se utiliza también para identificar moléculas que interfieren con dicha interacción proteína- proteína (Vidal M, Endoh H. Trends Biotechnol. 1999; 17(9):374-81). Aunque el potencial del sistema de doble híbrido en reverso es evidente, dicho sistema no ha tenido tanto éxito como su predecesor. La razón principal de esta diferencia es que el sistema de doble híbrido en reverso genera un numero demasiado alto de falsos positivos que corresponden a mutaciones que truncan la proteína, no a mutaciones de cambio de sentido o de tipo missense, que son las que interesan al impedir la unión entre dos proteínas interaccionantes, de hecho, >97% de las mutaciones al azar generadas por PCR producen un truncamiento en la proteína.
Teniendo en cuenta el alto número de falsos positivos del sistema de doble híbrido en reverso se han propuesto diferentes mejoras para identificar únicamente las mutaciones missense, aunque ninguna de dichas mejoras ha conseguido resolver de forma definitiva el problema del alto número de falsos positivos detectados. La primera de dichas mejoras fue dirigida al uso de fusiones C-terminal a la proteína verde fluorescente (GFP-"Green Fluorescent Protein"), para seleccionar los mutantes no truncados mediante análisis de la fluorescencia (Endoh H, et al., Methods Enzymol. 2000;328:74-88). Sin embargo, la proteína GFP puede interferir en la interacción entre las proteínas a estudiar y además, el hecho de que la selección mediante fluorescencia se haga a posteriori, incrementa mucho la complejidad de la técnica.
Para evitar el uso de proteínas de tipo GFP y evitar la posible interferencia con la interacción analizada, se propuso utilizar fusiones a epítopos cortos reconocidos por anticuerpos (revisado en Bennett MA. et al. Methods Mol Biol. 2015; 1278:433-46). De nuevo, este sistema es demasiado largo y complejo ya que requiere validar todos los mutantes mediante la técnica de Western blot. Más recientemente, una fusión a GBD (Ga/4 Binding Domalrí) ha sido utilizada en un sistema denominado "one-plus two- hybrid system" (Kim JY, et al., Mol Cell Proteomics. 2007;6(10): 1727-40; Kim JY et ai; Methods Mol Biol. 2012;812:209-23). En este último caso, el sistema utiliza dos marcadores o reporteros que son reconocidos por dos dominios de unión al ADN distintos, al igual que en estudios previos (Jiang R, et ai. Genes Dev. 1996; 10(24):3105-15; Inouye C. et al. Genetics. 1997; 147(2):479-92) en los cuales el sistema de doble híbrido fue adaptado para identificar mutaciones que anulan la interacción de una proteína con otra pero no con una tercera. En este sistema, la selección se hace en dos pasos diferentes pero con las mismas células transformadas que comprenden y expresan los reporteros y las proteínas a estudiar. Sin embargo, al igual que la proteína GFP, los dominios de unión al ADN como GBD son dominios estructurales que pueden interferir con la interacción que se está analizando. Este mismo problema tampoco ha sido superado por el método descrito por el equipo de Solomon MJ, que utiliza fusiones que comprenden el gen que codifica la proteína a analizar unida en su extremo C-terminal al gen URA3 para detectar las mutaciones que truncan la proteína estudiada y en consecuencia no permiten la síntesis y expresión de la proteína de fusión formada por la proteína a analizar y Ura3. Específicamente, se clona el gen URA3 en fase con el gen que codifica la proteína a estudiar de tal forma que cuando dichos genes se expresan, se produce una proteína de fusión o proteína quimérica (proteína a estudiar-Ura3). La presencia de una mutación de truncamiento en la proteína estudiada impide la expresión y síntesis de la fusión de dicha proteína a Ura3, de tal forma que una levadura que comprenda el gen URA3 endógeno inactivado no crecerá en un medio de cultivo en ausencia de uracilo (Burton JL. et al. EMBO J. 201 1 May 4;30(9): 1818-29; Lickfeld M. et al. Yeast. 201 1 Jul;28(7):535-45).
Otro de los métodos alternativos descritos (Gray PN, et al. Mol Cell Proteomics. 2007 Mar;6(3):514-26; WO2006060595), y comercializados en forma de kit por Invitrogen, propuso la expresión de una proteína de fusión que comprende el gen mutado de una de las proteínas del par interaccionante a estudiar unido en el extremo C-terminal a un marcador de resistencia a antibióticos, por lo que era necesaria una doble selección en bacterias y levaduras dotando a la técnica de una gran complejidad metodológica. Dicha tecnología no consiguió superar las carencias antes mencionadas, ya que mediante dicha técnica se seguían detectando al menos un 50% de falsos positivos correspondientes a proteínas no mutadas.
En este sentido, sigue existiendo en el estado de la técnica la necesidad de sistemas de doble híbrido en reverso para la detección exclusiva de mutaciones missense que anulan la unión entre proteínas interaccionantes, donde dichos sistemas sean de una simplicidad técnica tal que permita su uso rutinario tanto en clínica como en investigación, y además, sin dar lugar a la detección de falsos positivos.
DESCRIPCIÓN DE LA INVENCIÓN
La presente invención soluciona el problema de la técnica mencionado previamente mediante un nuevo sistema de doble híbrido en reverso capaz de detectar exclusivamente las mutaciones missense que impiden la unión entre un par de proteínas interaccionantes de las que se desee conocer las regiones concretas implicadas en su unión. El sistema de doble híbrido en reverso de la invención utiliza un plásmido que comprende la secuencia nucleotídica que codifica para un péptido capaz de interaccionar con una proteína heteróloga expresada desde una construcción génica que se ha integrado en el genoma de la célula utilizada en el sistema de la invención, y donde la secuencia nucleotídica que codifica para dicho péptido está fusionada a la secuencia nucleotídica que codifica para una de las proteínas interaccionantes sometidas a estudio. La transformación de la célula utilizada en el método de doble híbrido en reverso de la invención con el plásmido que codifica para el péptido que se une a dicha proteína heteróloga expresada desde una construcción génica integrada en el genoma de dicha célula, junto con un sistema dual de genes reporteros de selección positiva y contra-selección, permite la identificación positiva e inequívoca de las mutaciones missense que impiden la interacción entre el par de proteínas a estudiar.
La utilización del péptido mencionado anteriormente en lugar de proteínas o dominios proteicos, tal y como se utiliza actualmente en el estado de la técnica para la detección de mutaciones missense, tiene la ventaja de reducir una posible interferencia de la fusión en los extremos C-terminal de las proteínas del par interaccionante a estudiar.
Adicionalmente, otra de las ventajas del método de doble híbrido en reverso de la invención es la identificación de los mutantes missense en una única etapa, mediante el uso de la técnica de PCR mutagénica unida a la técnica de recombinación in vivo ("gap-repair") y el sistema dual de reporteros que permite la selección simultánea de mutaciones que son missense y que provocan la perdida de interacción entre el par de proteínas a estudiar.
Tal y como se muestran en los ejemplos incluidos en el presente documento, el sistema de doble híbrido en reverso de la invención para la identificación de mutaciones missense entre un par de proteínas interaccionantes sometidas a estudio, además de ser un sistema rápido y sencillo, es un sistema muy eficiente, llegando a identificar correctamente el 100% de las mutaciones missense obtenidas, sin dar lugar a falsos positivos.
Por tanto, la presente invención proporciona un método de doble híbrido en reverso capaz de identificar mutaciones missense que impiden la unión entre dos proteínas interaccionantes en una única etapa. La invención también presenta células, preferentemente cepas de levadura y varias construcciones génicas que son útiles para la identificación de las mutaciones que inhiben las interacciones moleculares entre las proteínas a estudiar mediante el método descrito aquí. Método de la invención
En un primer aspecto, la presente invención se refiere a un método in vitro para identificar al menos una mutación en una proteína de referencia donde dicha mutación afecta a la capacidad de dicha proteína de referencia de unirse a otra proteína diana, donde dicho método comprende:
a) al menos una célula huésped que comprende:
i) Una primera secuencia nucleotídica que codifica para un gen reportero, donde dicha secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN,
ii) Una segunda secuencia nucleotídica que codifica para un segundo gen reportero, donde dicha segunda secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN, con la condición de que dicha secuencia de reconocimiento es diferente de la secuencia de reconocimiento de i), y
iii) Una tercera secuencia nucleotídica que codifica para una primera proteína de fusión que comprende el dominio de unión al ADN de ii) y una proteína heteróloga capaz de unirse a un péptido funcional localizado en el extremo C-terminal de la proteína de referencia de estudio, donde la secuencia nucleotídica que codifica para dicha primera proteína de fusión está operativamente unida a un promotor, b) Pre-transformar la célula de la etapa a) con un plásmido que comprende la secuencia nucleotídica que codifica para una segunda proteína de fusión que comprende el dominio de unión al ADN de i) y la proteína diana, donde la secuencia nucleotídica que codifica para dicha segunda proteína de fusión está operativamente unida a un promotor, c) Cultivar la célula pre-transformada de la etapa b) bajo condiciones que permitan exclusivamente el crecimiento de las células que hayan incorporado el plásmido de la etapa b), d) Transformar la célula de la etapa c) con un vector linearizado y al menos un fragmento de ADN que previamente ha sido sometido a mutagénesis y que comprende la secuencia nucleotídica que codifica para la proteína de referencia con al menos una mutación, donde entre el vector linearizado y el fragmento de ADN sometido a mutagénesis se produce recombinación homologa obteniéndose un plásmido que comprende la secuencia nucleotídica que codifica para una tercera proteína de fusión que comprende el dominio de transactivación de Gal4 y la proteína de referencia con al menos una mutación, donde la secuencia nucleotídica que codifica para dicha tercera proteína de fusión está operativamente unida a un promotor,
) Cultivar la célula de la etapa d) bajo condiciones tales que permitan exclusivamente el crecimiento de las células que presentan mutaciones missense que impiden la unión entre la proteína de referencia y la proteína diana,
Comparar la secuencia de la proteína de referencia mutada con la secuencia de la proteína de referencia sin mutar (nativa o wild-type) e identificar la mutación que impide la unión de la proteína de referencia con la proteína diana.
A efectos de la presente invención, los términos proteína, o molécula de ADN "de referencia", se refiere a aquélla molécula capaz de unirse o asociarse de forma transitoria o constitutiva con otra proteína, o molécula de ADN a la que a efectos de la presente invención se le denomina "diana". En los ejemplos que se muestran en el presente documento para poner de manifiesto la validez del método de la invención se ha utilizado como proteína de referencia la proteína humana glucoquinasa (GK) de SEQ ID NO: 10, codificada por la secuencia nucleotídica SEQ ID NO: 9, y como proteína diana a la que se une la proteína de referencia, se ha utilizado la proteína reguladora de la glucoquinasa humana (GKRP) de SEQ ID NO: 2, codificada por la secuencia nucleotídica SEQ ID NO: 1. Mediante el método de la invención se puede utilizar cualquier par de proteínas interaccionantes de las que se quiera analizar la presencia de mutaciones missense que impidan su interacción.
A efectos de la presente invención, el término "dominio de unión al ADN" se entiende como un conjunto de amino ácidos que es capaz de dirigir la unión específica de un polipéptido a una secuencia particular de ADN, por ejemplo a una secuencia de reconocimiento para un factor de transcripción que interactúa específicamente con una secuencia de ácido nucleico en el promotor de un gen. Alternativamente, el dominio de unión al ADN puede ser cualquier dominio proteico que interactúa específicamente con una secuencia que se puede producir de forma natural o se inserta artificialmente en el promotor de un gen reportero. El dominio de unión al ADN puede estar unido covalentemente a un dominio de transactivación, de manera que la unión de la proteína al ADN en un sitio localizado dentro del promotor de un gen reportero elegido, activa su transcripción.
A efectos de la presente invención, existe una gran variedad de dominios de unión al ADN y de dominios de transactivación que son adecuados para su uso en los diversos aspectos de la invención. En general, cualquier dominio de unión al ADN o cualquier dominio de transactivación de cualquier factor de transcripción puede ser utilizado en la presente invención. El dominio de unión al ADN y el dominio de transactivación pueden pertenecer o no a distintos factores de transcripción. Secuencias de reconocimiento útiles incluyen, sin ser limitativos, los sitios de unión de los factores de transcripción Gal4 y Ace1 de levadura y LexA de bacteria. Estos sitios de unión pueden utilizarse fácilmente con un promotor reprimido (por ejemplo, los promotores SPAL, SPEX y ESPACE combinan un promotor SP013 con las secuencias de reconocimiento para Gal4, Ace1 y LexA, respectivamente). Otros factores de transcripción útiles incluyen la proteína Gcn4 de S. cerevisiae (véase, por ejemplo, Hope and Struhl, 1986, Cell 46: 885-894) y la proteína Adr1 de S. cerevisiae (véase, por ejemplo, Kumar et al, 1987, Cell 51 : 941-951). La secuencia de reconocimiento debe incluir al menos un sitio de unión para el dominio de unión al ADN del factor de transcripción que se utiliza. El número de sitios de unión se puede ajusfar para proporcionar mayor o menor sensibilidad al ensayo. Por "secuencia de reconocimiento" se entiende un segmento de ADN que es necesario y suficiente para interaccionar específicamente con un polipéptido dado, tal como por ejemplo, el dominio de unión al ADN de un factor de transcripción. Por "unido operativamente" se entiende que un gen y una secuencia reguladora (s) (por ejemplo, un promotor) están conectados de tal manera que permiten la expresión génica cuando las moléculas apropiadas (por ejemplo, proteínas que incluyen dominios que activan la transcripción) se unen a las secuencias reguladoras. Por "unido covalentemente" se entiende cuando dos moléculas, por ejemplo proteínas, están unidas directamente por uniones covalentes. Por ejemplo, proteínas o dominios proteicos unidos covalentemente se pueden localizar inmediatamente contiguos, o pueden localizarse separados por residuos de uno o más aminoácidos dentro de la misma proteína híbrida.
Tal y como se utiliza en la presente invención, el término "gen reportero" utilizado a lo largo del documento, se refiere a un gen cuya expresión puede analizarse como una medida de la capacidad de dos moléculas de ensayo para interactuar (es decir, como una medida de las interacciones proteína/proteína, proteína/ARN, ARN/ARN o proteína/ADN). Los genes reporteros descritos en este documento pueden localizarse en un plásmido o pueden integrarse en el genoma de una célula haploide o diploide. El gen reportero se une preferentemente de manera operativa a un promotor que tiene secuencias que dirigen la transcripción del gen reportero. El gen reportero está posicionado de tal manera que se expresa cuando un dominio de transactivación de un factor de transcripción se pone en estrecha proximidad con el gen (por ejemplo, mediante el uso de proteínas híbridas para reconstituir un factor de transcripción, o por unión covalente del dominio de transactivación a un dominio de unión al ADN). El gen reportero también puede estar unido operativamente a secuencias reguladoras que le hacen muy sensible a la presencia o ausencia de un factor de transcripción. Por ejemplo, en ausencia de un factor de transcripción específico, el gen reportero URA3 unido operativamente a un promotor altamente sensible confiere un fenotipo Ura" Foar en la célula. En presencia de un factor de transcripción específico, esta construcción génica confiere un fenotipo Ura+ Foas en la célula. Métodos conocidos por el experto medio en el presente campo técnico pueden ser utilizados para conectar un gen reportero a un promotor y para introducir el gen reportero en una célula. A efectos de la presente invención, un gen reportero útil tiene en su promotor una secuencia de reconocimiento para el dominio de unión al ADN de un factor de transcripción que puede ser reconstituido mediante la interacción de una proteína con un dominio de unión al ADN y otra proteína con un dominio de transactivación. Tales genes incluyen, sin limitación, lacZ, genes biosintéticos aminoacídicos tales como por ejemplo, los genes de levadura LEU2, HIS3, LYS2, LYS5, o TRP1, el gen URA3, genes biosintéticos de ácidos nucleicos, el gen que codifica para la cloranfenicol- transacetilasa bacteriana {caí), y el gen bacteriano gus. También se incluyen los genes que codifican marcadores fluorescentes, tales como el gen de la proteína fluorescente verde (GFP). Ciertos genes reporteros son considerados como genes reporteros "seleccionables" o "contra-seleccionables" tal y como se describe a continuación.
En una realización más preferida, el método de doble híbrido en reverso según se describe en la presente invención se caracteriza por que la célula utilizada en dicho método comprende al menos dos genes reporteros, donde el primero de dichos genes es un gen de selección positiva y el segundo de dichos genes es un gen de contraselección.
Por marcador "seleccionare" se entiende un gen que, cuando se expresa, confiere una ventaja de crecimiento sobre una célula que lo contiene. Ejemplos de marcadores seleccionables incluyen, sin limitación, LEU2, TRP1, e HIS3. Ciertos marcadores seleccionables descritos en este documento pueden usarse para promover el crecimiento de células que comprenden un plásmido que expresa este marcador seleccionable. En este caso, el promotor unido operativamente a este marcador seleccionable es el promotor natural para el marcador. Por otra parte, el marcador puede ser diseñado para ser unido operativamente a un promotor distinto de aquel al que está naturalmente ligado. Así, en el caso de los genes reporteros utilizados en esta invención, el marcador seleccionable está unido operativamente a un promotor con una secuencia de reconocimiento para un factor de transcripción que puede ser reconstituido mediante la interacción de una proteína con dominio de unión al ADN y otra proteína con dominio de transactivación.
Por marcador "contra-seleccionable" se entiende un gen que, cuando se expresa, impide el crecimiento de la célula que lo contiene. Ejemplos de marcadores contra- seleccionable incluyen URA3, LYS2, GAL1, CYH2 y CAN1. Por gen reportero "seleccionable" se entiende un gen reportero que, cuando se expresa bajo un determinado conjunto de condiciones, confiere una ventaja de crecimiento sobre las células que lo contienen. Ejemplos de genes reporteros seleccionares incluyen los marcadores LEU2, TRP1, e HIS3. En la presente invención, el gen reportero seleccionable preferido es el gen HIS3.
Por gen reportero "contra-seleccionable" se entiende un gen reportero que, cuando se expresa bajo un determinado conjunto de condiciones, impide el crecimiento de una célula que lo contiene. Ejemplos de genes reporteros contra-seleccionables incluyen los marcadores URA3, LYS2, GAL1, CYH2 y CAN1. En la presente invención, el gen reportero contra-seleccionable preferido es el gen URA3.
Por gen reportero "detectable" se entiende un gen cuya expresión puede ser detectada en una célula por un medio distinto al de conferir una ventaja de crecimiento selectivo en una célula. Un ejemplo de un gen reportero detectable es el gen lacZ. Si se desea, un gen reportero detectable puede ser integrado en el genoma de una célula, preferentemente de una célula de levadura. Un gen reportero detectable se puede utilizar en la invención para medir la capacidad de dos moléculas de interactuar. Así, el promotor que está unido operativamente a un gen reportero detectable debe contener una secuencia de reconocimiento para un factor de transcripción que puede ser reconstituido mediante la interacción de una proteína con dominio de unión al ADN y otra proteína con dominio de transactivación. Preferiblemente, cada uno de los genes reportero esta operativamente unido a un promotor que porta una secuencia represora que impide la transcripción en ausencia de un motivo de activación génica. Por lo tanto, el gen reportero debe colocarse de tal manera que su expresión sea altamente sensible a la presencia o ausencia de un factor de transcripción. Por ejemplo, se prefiere que cuando se utiliza el gen reportero que codifica para el alelo URA3, dicho alelo confiere un fenotipo Ura" Foar en ausencia del factor de transcripción, y un fenotipo Ura+ Foas en su presencia. Ciertos promotores, tales como el promotor SP013, contienen de forma natural una secuencia represora aguas arriba. Otros promotores pueden ser diseñados o modificados utilizando métodos convencionales de clonación, para que comprendan dichas secuencias. Cuando se utiliza un gen reportero de contra-selección, la expresión del gen puede ser detectada mediante la detección de la inhibición del crecimiento celular. Cuando se emplea más de un gen reportero, los genes reporteros pueden estar unidos operativamente a promotores que son idénticos entre sí sólo en sus secuencias de reconocimiento. Preferiblemente, el gen reportero es uno que permite la selección titulable; por lo tanto, el crecimiento celular se puede medir en un rango de condiciones (por ejemplo, concentraciones de 5-FoA).
Marcadores "confra-se/eccionables": Mientras que los marcadores seleccionares se han utilizado para, bajo ciertas condiciones, promover el crecimiento de sólo aquellas células que expresan los marcadores seleccionares, el marcador contra- seleccionable se han utilizado, bajo ciertas condiciones, para promover el crecimiento de sólo aquellas células que no expresan el marcador contra-seleccionable. Los marcadores contra-seleccionables cuando están presentes en los plásmidos se pueden utilizar para seleccionar las células que han perdido el plásmido. Por ejemplo, la expresión del gen URA3, que codifica para la orotidina-5'-fosfato, es letal en presencia de un medio que contiene ácido 5-fluoro-orótico (5- FOA). Las células que expresan URA3 también se pueden seleccionar positivamente haciéndolas crecer en un medio sin uracilo. Por lo tanto, dependiendo de las condiciones de crecimiento, el marcador URA3 se puede utilizar ya sea para seleccionar de manera positiva o negativa. El gen LYS2, que codifica la α-aminoadipato reductasa, también se puede utilizar para contra-selección. Las células de levadura que expresan LYS2 no crecen en un medio que contiene α-aminoadipato como fuente de nitrógeno primario. Del mismo modo, la expresión de LYS5 en un medio que contiene α-aminoadipato es letal. Estos genes, que están implicados en la biosíntesis de lisina, se pueden seleccionar de una manera positiva en un medio libre de lisina. Otro marcador contra- seleccionable es el gen CAN1 que codifica una permeasa de arginina. La expresión de este gen en ausencia de arginina y en presencia de canavanina es letal. Del mismo modo, la expresión del marcador de contra-selección CYH2 es letal en presencia de cicloheximida. La expresión de un gen marcador contra-seleccionable se ha utilizado para identificar las mutaciones en el dominio de activación de receptor de estrógeno que inhiben su capacidad para activar la transcripción (Pierrat et al, 1992, Gene 119: 237-245).
En otra realización preferida del método de la invención, este se caracteriza por que los genes reporteros de selección positiva se seleccionan del grupo que consiste en cualquiera de los siguientes marcadores seleccionares HIS3, LEU2, URA3, ADE2, TRP1, LYS2 y LYS5. En otra realización más preferida aún, el gen reportero de selección positiva es preferentemente el gen HIS3. En otra realización preferida, los genes reporteros de contra-selección se seleccionan del grupo que consiste en cualquiera de los marcadores contra-seleccionables URA3, TRP1, LYS2, LYS5, CYH2, CAN1, GAL1 y mazF. En otra realización más preferida aún, el gen reportero de contra-selección es preferentemente el gen URA3. En otra realización preferida, si se desea, la construcción génica con el gen reportero (por ejemplo, SPAL10:URA3 o (lexAop)4:HIS3) se puede integrar en el genoma de una célula haploide o diploide. En una realización más preferida aún, se pueden integrar en el genoma de una célula haploide o diploide, más de un gen reportero, preferiblemente al menos cuatro genes reporteros, al menos tres genes reporteros y más preferiblemente, al menos dos genes reporteros. Si se desea, una combinación de genes reporteros se puede integrar cromosómicamente en el genoma de la célula y otros genes reporteros pueden localizarse en un plásmido episomal y expresarse a partir del mismo. En una realización preferida del método de doble híbrido en reverso descrito en la presente invención, este se caracteriza por que la célula utilizada en dicho método comprende las secuencias de reconocimiento para proteínas que se unen al ADN seleccionadas de entre cualquiera de los siguientes factores de transcripción: Gal4, LexA y Ace1.
A efectos de la presente invención, el método de doble híbrido en reverso se caracteriza por que la célula utilizada en dicho método comprende integrado en su genoma al menos dos genes reporteros, preferentemente uno de selección positiva y otro de contra-selección. En otra realización más preferida aún, el gen reportero de selección positiva es HIS3 y el gen reportero de contra-selección es URA3.
En otra realización preferida, la célula utilizada en el método de la invención también se caracteriza por que comprende, preferentemente integrado en su genoma vía transformación con un plásmido integrativo, la secuencia nucleotídica que codifica para una primera proteína de fusión, donde dicha primera proteína de fusión comprende el mismo dominio de unión al ADN que el comprendido en el apartado ii), y una proteína heteróloga que se une al péptido utilizado en el método de la invención y que está comprendido en un plásmido que comprende a su vez la secuencia nucleotídica que codifica para la proteína de referencia sometida a estudio. En una realización más preferida aún, el plásmido integrativo comprende las secuencias nucleotídicas de la construcción génica donde el promotor de ADH1 esta operativamente unido a la secuencia nucleotídica que codifica para la fusión del dominio de unión al ADN de LexA con la proteína heteróloga que se une al péptido de la invención. A efectos de la presente invención y a modo de ejemplo, sin querer ser limitativo se ha utilizado como proteína heteróloga expresada desde una construcción génica integrada en el genoma de la célula de la invención, la proteína humana TSG101 (SEQ ID NO: 32, codificada por la secuencia nucleotídica SEQ ID NO: 31). Así, la célula de la invención expresa una primera proteína de fusión que comprende el dominio de unión al ADN de LexA y TSG101 (LexA-TSG101), siendo su secuencia nucleotídica la SEQ ID NO: 48 que codifica para la proteína de fusión de SEQ ID NO: 49.
La proteína TSG101 (del inglés Tumor Susceptibility Gene 101 pertenece a un grupo de enzimas aparentemente inactivas para conjugación con ubiquitina (ubiquitin- conjugating enzymes); en la presente invención TSG101 preferiblemente se refiere al Gene ID: 7251 de Homo sapiens aunque cualquier experto en el estado de la técnica entenderá que es posible el uso de otras secuencias procedentes de otras especies, preferiblemente mamíferos, más preferiblemente mamíferos primates, que son homologas a la secuencia humana. Dicha proteína forma parte del complejo ESCRT-I que reconoce las proteínas ubiquitinadas en la ruta endocítica y está implicada en la formación del cuerpo multivesicular (MVB). TSG101 es a su vez capaz de interaccionar con una pequeña secuencia de un péptido denominado P(S/T)TAP que está presente en la proteína Gag p6 del virus VIH (PNAS (2001) 98, 7724-9; Cell (2001) 107, 55-65). Se ha observado que una secuencia que comprende una triple repetición del péptido PTAP, que denominamos 3xPTAP, a lo largo del presente documento, presente de forma natural en una cepa de VIH aislada (GenBank: ACS76886.1) interacciona con TSG101 más fuertemente que una única repetición del péptido PTAP aislado. A efectos de la presente invención, para aumentar la fuerza de interacción de la proteína de fusión LexA-TSG101 (SEQ ID NO: 49) se ha utilizado esta triple repetición del péptido PTAP (3xPTAP) de SEQ ID NO: 12. Se podrían utilizar otras secuencias que comprendan el péptido P(S/T)AP y que interaccionan con TSG101 , u otras combinaciones de proteína y péptido que interaccionan entre si. A modo de ejemplo, se podría utilizar la combinación del péptido YPX( ) y la proteína humana ALIX o cualquier homólogo de esta proteína en otros organismos que une este péptido (por ejemplo la proteína PalA del hongo filamentoso Aspergillus nidulans) (Mol Cell Biol (2003) 23, 1647-55).
El péptido 3xPTAP (SEQ ID NO: 12) une con gran afinidad la proteína humana TSG101 (SEQ ID NO: 32) en el sistema de doble híbrido en reverso utilizado en la presente invención. De esta manera, se ha llevado a cabo la fusión del péptido 3xPTAP en el extremo C-terminal de la proteína de referencia (que es sometida a mutagénesis), para identificar mutaciones que anulan la interacción con una proteína diana, sin afectar a la interacción mediada por el péptido 3xPTAP con la proteína TSG101 , lo que permite descartar todos los falsos positivos que corresponden a mutaciones que truncan la proteína. La proteína de fusión con el péptido 3xPTAP en el extremo C-terminal de la proteína diana mutada, se encuentra fusionada al dominio de transactivación de Gal4 (GAD) en su extremo N-terminal, permitiendo la interacción en el sistema de doble-híbrido de la invención con la proteína de fusión LexA-TSG101 integrada en el cromosoma de la célula, y en consecuencia la activación del reportero (lexAop)4-HIS3. Este sistema permite una selección positiva e inequívoca de las mutaciones missense ya que todas la mutaciones que truncan, inestabilizan o impiden la entrada de la proteína en el núcleo bloquean su interacción con la proteína heteróloga TSG101 (SEQ ID NO: 32) y en consecuencia la activación del gen reportero HIS3, lo que se traduce en una falta de crecimiento en un medio sin histidina (ver Figura 1). La selección de los mutantes que han incorporado las mutaciones missense, se realiza en un solo paso, con un sistema doble de reporteros, tal y como hemos mencionado anteriormente, el primer reportero permite la selección de los mutantes que pierden la interacción, mientras que el segundo selecciona de forma simultánea los mutantes que no truncan la proteína.
En una realización más preferida aún, la célula utilizada en el método de la invención comprende, preferentemente integrado en su genoma los reporteros LexAop-HIS3 ((lexAop)4-HIS3) y UASGal-URA3 (SPAL10::URA3), que codifican para los marcadores de selección positiva y contra-selección HIS3 y URA3, respectivamente. Adicionalmente, tal y como se ha mencionado anteriormente, la célula utilizada en el método descrito en la presente invención comprende la construcción génica donde el promotor de ADH1 esta operativamente unido a la secuencia nucleotídica que codifica para la fusión del dominio de unión al ADN de LexA con la proteína heteróloga, preferentemente dicha proteína heteróloga es la proteína humana TSG101 , que se une al péptido de la invención. Así, la célula de la invención expresa la proteína de fusión LexA-TSG101 de SEQ ID NO: 49.
Los términos "híbrida" o "de fusión", en relación a proteínas o ADN, hacen referencia a una quimera de al menos dos polipéptidos, o dos moléculas de ADN, unidas covalentemente.
Por "dominio de transactivación", se entiende al conjunto de aminoácidos capaces de inducir la expresión de un gen de la región a cuyo promotor está unido. A efectos de la presente invención se entiende por "péptido", "etiqueta", "epítopo", "cola", o "tallo", funcional en el extremo C-terminal de la proteína de referencia, a un conjunto de amino ácidos ubicados en el extremo C-terminal de la proteína de referencia. A efectos de la presente invención se utiliza como péptido funcional en el extremo C-terminal de la proteína de referencia analizada a una secuencia peptídica de pequeño tamaño que interactúa con gran afinidad con la proteína heteróloga que expresa la célula de la invención de la etapa a).
En una realización preferida, el péptido funcional en el extremo C-terminal de la proteína de referencia se refiere a la secuencia SEQ ID NO: 12 que se corresponde con tres repeticiones del péptido PTAP (3xPTAP). El péptido PTAP utilizado en la presente invención se encuentra en la proteína Gag p6 del virus VIH, según se ha indicado anteriormente.
En una realización más preferida, la célula utilizada en el método de doble híbrido en reverso de la invención, comprende integrado en su genoma, las construcciones génicas SPAL10-URA3, (lexAop)4-HIS3 y ADH1::LexA-TSG101. Adicionalmente, también puede comprender la construcción génica que comprende el gen reportero detectable GAL1-LacZ, que, al igual que el gen reportero seleccionare SPAL10- URA3, está bajo el control de un promotor con la secuencia de reconocimiento UASGal. La presencia de dicho reportero detectable permite, si fuera necesario, confirmar o validar los resultados obtenidos con el reportero SPAL10-URA3 en el método de la invención, con ensayos de la actividad enzimática β-galactosidasa.
En otra realización preferida del método de la invención, el plásmido utilizado en la etapa b) comprende la secuencia nucleotídica que codifica para el dominio de unión al ADN de Gal4 fusionada a la secuencia nucleotídica que codifica para la proteína diana a ensayar. A efectos de la presente invención y, a modo de ejemplo, se ha utilizado como proteína diana a ensayar la proteína humana GKRP de SEQ ID NO: 2, todo ello bajo el control de un promotor constitutivo, preferentemente y a modo de ejemplo, se ha utilizado el promotor de ADH1.
Según se describe en los ejemplos incluidos en el presente documento, la célula utilizada en el método de la invención se pre-transforma con dicho plásmido para asegurar la expresión de la proteína diana GKRP, de esta manera, se asegura que la célula expresa la proteína diana, y posteriormente tal y como se indica en la etapa c), se cultiva en condiciones que permiten exclusivamente el crecimiento de las células que han incorporado dicho plásmido.
Los medios de cultivo utilizados para el crecimiento de las células descritas en la presente invención y utilizados en el método aquí descrito, son medios de cultivo conocidos para el crecimiento preferentemente de células de levadura. Preferentemente, los medios de cultivo utilizados en la presente invención son el medio de cultivo mínimo (SD) y el medio de cultivo completo (YPAD). La preparación de dichos medios de cultivo se describe en Methods in yeast genetics— A laboratory course manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York. 1990; pp 198. El medio de cultivo completo (YPAD) contiene extracto de levadura al 1 % (p/v), bactopeptona al 2% (p/v), 0.02% (p/v) de adenil(hemi)sulfato y como fuente de carbono, glucosa al 2%. El medio de cultivo mínimo (SD) se compone de base nitrogenada para levadura (YNB) sin aminoácidos al 0, 17% (p/v), y sulfato amónico, (NH4)2S04, al 0,5% (p/v) suplementado con glucosa al 2% (p/v). Cuando no se especifica lo contrario, se añaden los requerimientos siguientes a una concentración final de 20 mg/l (histidina, triptófano, uracilo, arginina, metionina), 30 mg/l (isoleucina, lisina, tirosina), 50 mg/l (adenina, fenilalanina), 100 mg/l (leucina), 150 mg/l (valina) o 200 mg/l (treonina). En otra realización preferida del método de la invención, la célula pre-transformada según se ha mencionado anteriormente, se transforma con un vector linearizado y un fragmento de ADN que comprende la secuencia nucleotídica que codifica para para la proteína de referencia que previamente ha sido sometida a un procedimiento de mutagénesis, in vivo o in vitro, y por lo tanto comprende al menos una mutación. Así, el cultivo de la célula pre-transformada con el vector linearizado y el fragmento de ADN previamente mencionado hace que entre ambas moléculas se produzca recombinación homologa ("gap-repair") y se obtenga un plásmido que comprende el dominio de transactivación de Gal4 fusionado a la secuencia nucleotídica que codifica para la proteína de referencia, y estando la secuencia nucleotídica comprendida en dicho plásmido bajo el control de un promotor. A efectos de la presente invención y a modo de ejemplo, sin ser limitativo, la proteína de referencia es la proteína GK de SEQ ID NO: 10, todo ello bajo el control del promotor constitutivo de ADH1. En una realización preferida del método de la invención, las mutaciones en la secuencia nucleotídica que codifica para la proteína de referencia se obtienen utilizando preferentemente la técnica de PCR mutagénica y recombinación in vivo ("gap-repair"). A efectos de la presente invención, el método de mutagénesis mediante reacción en cadena de la polimerasa (PCR) proporciona un método conveniente para inducir mutagénesis de una secuencia elegida (Muhlrad et al, 1992, Yeast 8: 79-82), a efectos de la presente invención en la secuencia de la proteína de referencia. En el método de PCR mutagénica y recombinación in vivo "gap-repair", el ADN que codifica la secuencia de la proteína que se muta se amplifica en una reacción de PCR en condiciones que favorecen la incorporación de nucleótidos incorrectos en la molécula de ADN. Tales condiciones incluyen niveles relativamente altos de manganeso y/o una mezcla desigual de los diferentes nucleótidos. Los cebadores de PCR que se utilizan en el método de PCR mutagénica y recombinación in vivo "gap-repair" generan productos de PCR lineales que tienen en sus extremos secuencias homologas a los extremos del plásmido linealizado, lo que favorece la recombinación entre ambos después de su co-transformación en levadura.
En una realización preferida del método de doble híbrido en reverso descrito en la presente invención se caracteriza por que las etapas b) y d) se pueden llevar a cabo simultáneamente. Así, las células de la invención se co-transformaron con el plásmido que codifica para la proteína diana y simultáneamente también con el plásmido linearizado y los productos obtenidos de la PCR mutagénica.
A efectos de la presente invención, el término "mutado" o "mutación" se refiere a la secuencia modificada, bien mediante mutagénesis dirigida o mutagénesis al azar, respecto a la misma secuencia encontrada de manera natural en la naturaleza (secuencia nativa o secuencia wild-type) y que no presenta mutaciones. Las secuencias mutadas incluyen aquellas secuencias que tienen mutaciones puntuales, inserciones, deleciones o reordenamientos.
A efectos de la presente invención, el término "promotor" se refiere a una mínima secuencia suficiente para dirigir la transcripción; tales elementos pueden estar situados en los extremos 5' o 3' de la secuencia del gen nativo. Promotores adecuados para la expresión de un gen reportero son aquellos que, cuando se enlaza con el gen reportero, puede dirigir la transcripción del mismo en presencia de moléculas apropiadas (es decir, proteínas que tienen dominios de transactivación). Un ejemplo de un promotor útil es el promotor de ADH1 o el promotor de SP013. Otros promotores útiles incluyen aquellos promotores que contienen secuencias represoras aguas arriba (véase, por ejemplo, Vidal et al, 1995, Proc Nati Acad Sci EE.UU. 92:2370-2374), y que inhiben la expresión del gen reportero en ausencia de un activador transcripcional. La capacidad de un promotor para la transcripción de un gen reportero se puede medir con métodos convencionales de ensayos de expresión de genes (por ejemplo, la detección del producto del gen o su ARNm, o la detección del crecimiento celular bajo condiciones donde se requiere la expresión del gen reportero para el crecimiento de una célula).
Técnicas convencionales de biología molecular pueden ser usadas para construir derivados de promotores que incluyen una o más secuencias de reconocimiento para proteínas que se unen el ADN. Por ejemplo, el promotor de SP013 puede diseñarse para incluir una o más copias del sitio de unión de Gal4. Los sitios de unión naturales de Gal4 han sido ampliamente caracterizados, permitiendo la creación de una secuencia sintética a la que se une Gal4 con una afinidad relativamente alta. Otras secuencias de reconocimiento útiles para proteínas que se unen al ADN incluyen los sitios de unión de LexA y Ace1. Además, donde se mide la capacidad de una proteína para unirse a una secuencia de ADN, la secuencia de reconocimiento de una proteína que se une al ADN puede ser de tipo nativo o wild-type, o puede tener cualquier diseño, tanto intencionalmente como al azar, para probar la capacidad de la secuencia de ADN para interactuar con esta proteína. En una realización preferida del método de doble híbrido en reverso descrito en la presente invención, los promotores utilizados son preferentemente promotores constitutivos. En una realización más preferida aún, dichos promotores constitutivos se seleccionan de entre cualquiera de la lista que consiste en: ADH1 PGK1, TEF1, TPL1, HXT7, TDH3 y PYK1.
En una realización preferida el método de doble híbrido en reverso de la invención se caracteriza por que el plásmido utilizado en la etapa d), antes de transformar la célula con él, es sometido a un procedimiento de mutagénesis, in vivo o in vitro, para inducir mutaciones al azar en la secuencia nucleotídica que comprende dicho plásmido y que codifica para la proteína de referencia. En una realización más preferida aún, el procedimiento de mutagénesis se lleva a cabo mediante PCR mutagénica de la secuencia nucleotídica que codifica para la proteína de referencia y recombinación in vivo ("gap-repair") del producto obtenido en un plásmido. Preferiblemente, la etapa b) y d) del método de la invención, pueden realizarse por separado o simultáneamente, siendo preferido llevarlas a cabo por separado.
A efectos de la presente invención, en la PCR mutagénica utilizada para introducir mutaciones al azar en la secuencia nucleotídica que codifica para la proteína GK se pueden utilizar diferentes ADN polimerasas con diferentes tasas de mutación cada una de ellas, con la finalidad de comparar la idoneidad de cada polimerasa en el método de la invención. En los ejemplos mostrados en el presente documento, se han mostrado los resultados utilizando la ADN polimerasa Taq procedente de Takara o Roche, y la ADN polimerasa Mutazyme II procedente del kit de mutagénesis al azar Genemorph II de Agilent. A efectos de la presente invención es preferible usar una ADN polimerasa que incluya una única mutación en cada plásmido.
Otras técnicas conocidas para generar mutaciones al azar, y que pueden ser utilizadas en el método de la invención, pueden ser el uso de mutágenos físicos y/o químicos, cepas celulares mutadoras, preferentemente cepas bacterianas, tal como por ejemplo, la cepa de Escherichia coli mutadora descrita en Rasila TS. et al. Anal Biochem. 2009;388(1):71-80.
Técnicas convencionales de transformación celular, preferentemente de transformación en células de levadura pueden ser utilizadas a efectos de la presente invención. A modo de ejemplo y sin pretender limitar, electroporación, método de transformación en presencia de litio, método de transformación con esferoplastos, método de transformación con bolas de vidrio, etc. En una realización preferida del método de la invención, a continuación en la etapa e) se cultiva la célula transformada de la etapa d) bajo condiciones que permiten el crecimiento de las células que presentan mutaciones missense que provocan la perdida de interacción entre el par de proteínas a estudiar. El medio mínimo selectivo utilizado es un medio sin triptófano, leucina, adenina e histidina y con 0.1 % 5-FoA y de 1 a 5 mM 3-AT (SD-AHTL+5-FoA+3-AT). Este medio carece de adenina ya que la cepa utilizada es protótrofa para este requerimiento. La ausencia de triptófano y leucina permite seleccionar los transformantes que han incorporado los dos plásmidos que expresan la proteína diana (marcador TRP1) y la proteína de referencia (marcador LEU2). La ausencia de histidina permite seleccionar los transformantes que activan el reportero ((lexAop)4:HIS3), y la presencia de 3-AT (3-aminotriazol), un inhibidor de HIS3, impide el crecimiento de los transformantes con un nivel basal de activación de este reportero. Finalmente, la presencia de 5-FoA impide el crecimiento de los transformantes que activan el reportero SPAL10:URA3. En consecuencia, el medio SD-AHTL+5-FoA+3-AT permite el crecimiento únicamente de los transformantes que han incorporado los dos plásmidos, el que expresan la proteína diana y el que expresa la proteína de referencia, y que por otra parte activan el reportero (lexAop)4:HIS3, pero no activan el reportero SPAL10.URA3. Dado que la interacción entre la proteína diana y la proteína de referencia activa el reportero SPAL10:URA3, los transformantes que no tienen mutaciones, o los que si las tienen pero que no bloquean la interacción entre las dos proteínas, activarán el reportero SPAL10:URA3 y no podrán crecer en presencia de 5-FoA (Figura 1a). Por otra parte, la activación del reportero (lexAop)4:HIS3 depende de la interacción entre TSG101 y el péptido 3xPTAP situado en el extremo C-terminal de la proteína de referencia. En consecuencia, los plásmidos con mutaciones en la secuencia codificante de la proteína de referencia que provocan su truncamiento, y en consecuencia eliminan el péptido 3xPTAP, así como los plásmidos recircularizados sin incorporar el producto de PCR mutagénico en el proceso de recombinación in vivo (o los que se habían quedado sin digerir) no activarán el reportero (lexAop)4:HIS3 y no podrán crecer en ausencia de histidina (Figura 1 b). En consecuencia, los únicos transformantes que podrán crecer en este medio son los que portan una mutación que bloquea la interacción entre la proteína diana y la proteína de referencia sin que esta mutación produzca un truncamiento en la proteína, es decir que sea una mutación missense (Figura 1c).
En una realización preferida, el método de doble híbrido en reverso se caracteriza por que la célula se selecciona de la lista que consiste en: célula de levadura, célula bacteriana y célula de mamífero. En una realización más preferida, la célula es preferentemente una célula de levadura. En una realización más preferida aún, la célula de levadura se selecciona del grupo que consiste en Yarrowia lipolytica, Pichia pastoris y Saccharomyces cerevisiae. Las células de la especie S. cerevisiae son particularmente útiles en el método de la invención. Las cepas utilizadas en la presente invención se mantienen en cultivos estándar mediante métodos estándar.
En otra realización preferida del método de la invención, en la etapa f) se compararán e identificarán las mutaciones missense presentes en los plásmidos que portan las células que han crecido en la etapa e) del método de la invención, respecto a la secuencia nativa o wild-type de la proteína de referencia.
En una realización preferida, la identificación de las mutaciones missense obtenidas mediante el método de la invención se llevan a cabo mediante la extracción del plásmido que comprende la secuencia con la mutación missense, mediante técnicas comúnmente conocidas en el presente campo técnico, y posteriormente se procede a la secuenciación de dicha secuencia mutada, directamente desde el ADN plasmídico, para determinar la mutación concreta comparándola con la secuencia nativa o wild- type de la proteína analizada.
Dada la eficiencia del sistema de doble híbrido en reverso descrito en la presente invención, para detectar el 100% de las mutaciones missense entre un par de proteínas interaccionantes de estudio, sin falsos positivos, sería posible aislar en masa, y de una sola vez el ADN de todas los clones positivos para luego amplificar la secuencia codificante de la proteína de referencia estudiada (GK en los ejemplos mostrados) mediante PCR y secuenciar de una sola vez todos los mutantes obtenidos, con un sistema de secuenciación masiva (Next Generation Sequencing), de tipo lllumina. El análisis bioinformático del resultado permitiría generar una huella genética del sitio de interacción en la proteína del par interaccionante analizado y que ha sido sometida a mutagénesis.
Tal y como hemos mencionado previamente, la célula de levadura utilizada en la presente invención, ha integrado en su genoma un gen reportero contra-seleccionable, siendo preferido el gen reportero URA3, que está unido operativamente a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN, siendo preferida la secuencia UASGal reconocida por el dominio de unión al ADN de Gal4. Además, la célula utilizada comprende también integrado en su genoma otro gen reportero seleccionable, siendo preferido el gen reportero HIS3, que está unido operativamente a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN, siendo preferida la secuencia lexAop reconocida por el dominio de unión al ADN de LexA. Adicionalmente, la célula de la invención comprende integrado en su genoma la construcción génica ADH1::LexA-TSG101 (SEQ ID NO: 48), que codifica para la proteína de fusión de SEQ ID NO: 49. Cuando los tres genes mencionados anteriormente (es decir, un gen reportero contra- seleccionable, un gen reportero seleccionable, preferiblemente de selección positiva, y la proteína heteróloga a la que se une el péptido funcional del extremo C-terminal de la proteína de referencia sometida a mutagénesis y recombinación in vivo, que forma la proteína de fusión de SEQ ID NO: 49), se integran en el genoma de una célula, los promotores de los dos genes reporteros son distintos, específicamente en la región de los sitios de reconocimiento de la unión ADN-proteína (Figura 1), mientras que el resto del promotor puede ser similar.
Célula huésped de la invención.
A efectos de la presente invención se utilizan los términos "célula", "célula huésped", "cepa", indistintamente a lo largo del presente documento.
Tal y como se demuestra en el presente documento, los inventores han construido un conjunto de células o cepas de levadura que tienen las siguientes características: i) Una primera secuencia nucleotídica que codifica para un gen reportero, donde dicha secuencia nucleotídica está operativamente unida un promotor que comprende una secuencia nucleotídica reconocida por una proteína que se une al ADN,
ii) Una segunda secuencia nucleotídica que codifica para un segundo gen reportero, donde dicha segunda secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN, con la condición de que dicha secuencia sea reconocida por un dominio de unión al ADN distinto del de i), y
iii) Una tercera secuencia nucleotídica que codifica para una primera proteína de fusión que comprende el dominio de unión al ADN de ii) y una proteína heteróloga capaz de unirse a un péptido funcional localizado en el extremo C- terminal de la proteína de referencia de estudio, donde la secuencia nucleotídica que codifica para dicha primera proteína de fusión está operativamente unida a un promotor.
En una realización preferida, la célula de la invención comprende dichas construcciones integradas en su genoma. En otra realización más preferida, la célula de la invención se caracteriza por que la primera secuencia nucleotídica que comprende integrada en su genoma comprende un gen reportero que se selecciona de entre genes reporteros de selección positiva y/o, contra-selección, preferentemente un gen reportero de contra-selección, y más preferentemente seleccionado de entre cualquiera de la siguiente lista: URA3, TRP1, LYS2, LYS5, CYH2, CAN1, GAL1, mazF. En otra realización preferida, dicho gen reportero está operativamente unido a una secuencia de reconocimiento para una proteína que se une al ADN, según se ha definido previamente de igual manera para el método de la invención. En una realización más preferida aún, la primera secuencia nucleotídica que comprende la célula de la invención se caracteriza por que comprende la construcción génica UASGal-URA3 (=SPAL10::URA3), que expresa el marcador de contra-selección URA3.
En otra realización preferida de la célula de la invención, ésta se caracteriza por que la segunda secuencia nucleotídica que comprende integrada en su genoma comprende un gen reportero que se selecciona de entre genes reporteros de selección positiva y/o contra-selección, preferentemente un gen reportero de selección positiva, y más preferentemente seleccionado de entre cualquiera de la siguiente lista: HIS3, LEU2, URA3, ADE2, TRP1, LYS2, LYS5. En otra realización preferida, dicho gen reportero está operativamente unido a una secuencia de reconocimiento para una proteína que se une al ADN, con la condición de que dicha secuencia de reconocimiento es diferente de la secuencia de reconocimiento comprendida en la primera secuencia nucleotídica que comprende la célula, es decir, diferente a la secuencia de reconocimiento de i). En una realización más preferida aún, la segunda secuencia nucleotídica que comprende la célula de la invención se caracteriza por que comprende la construcción génica (lexAop)4-HIS3, que expresa el reportero de selección positiva HIS3.
Tal y como se ha descrito a lo largo del presente documento, los dominios de unión al ADN que pueden comprender las cepas de la invención se seleccionan de entre cualquiera de los siguientes factores de transcripción: Gal4, LexA y Ace1.
En otra realización preferida de la célula de la invención, ésta se caracteriza por que comprende además integrado en su genoma, una tercera secuencia nucleotídica que codifica para una proteína de fusión, denominada aquí primera proteína de fusión, que comprende el dominio de unión al ADN de LexA y la proteína heteróloga que se une al péptido funcional descrito y utilizado en la presente invención, todo ello bajo el control del promotor de ADH1. A efectos de la presente invención, y a modo de ejemplo, sin querer ser limitativo se ha utilizado como proteína heteróloga con la que se transforma la célula de la invención y que se integra en su genoma la proteína humana TSG101 (SEQ ID NO: 32, codificada por la secuencia nucleotídica SEQ ID NO: 31). Así, la célula de la invención expresa la proteína de fusión LexA-TSG101 de SEQ ID NO: 49, a partir de la secuencia nucleotídica SEQ ID NO: 48.
En una realización preferida, la construcción génica que codifica para la proteína de fusión de la célula de la invención aquí descrita, está unida operativamente a un promotor, preferentemente constitutivo y que se selecciona de entre cualquiera de los descritos anteriormente, siendo preferido el promotor de ADH1.
En otra realización preferida de la célula de la invención, ésta se caracteriza por que comprende integrado en su genoma, al menos dos genes reporteros, preferentemente uno de selección positiva y otro de contra-selección. En otra realización más preferida aún, el gen reportero de selección positiva es HIS3 y el gen reportero de contraselección es URA3. En una realización más preferida, la célula de la invención, comprende integrado en su genoma, las construcciones génicas SPAL10-URA3, (lexAop)4-HIS3 y ADH1::LexA- TSG101. Adicionalmente, también puede comprender la construcción génica que expresa para el gen reportero detectable GAL1-LacZ, que está bajo el control de un promotor con la secuencia de reconocimiento UASGal. La presencia de dicho reportero detectable permite, si fuera necesario, confirmar o validar los resultados obtenidos con el reportero URA3 en el método de la invención, con ensayos de la actividad β-galactosidasa.
En una realización preferida, el método de doble híbrido en reverso se caracteriza por que la célula se selecciona de la lista que consiste en: célula de levadura, célula bacteriana y célula de mamífero. En una realización más preferida, la célula es preferentemente una célula de levadura. En una realización más preferida aún, la célula de levadura se selecciona del grupo que consiste en Yarrowia lipolytica, Pichia pastoris y Saccharomyces cerevisiae. Las células de la especie S. cerevisiae son particularmente útiles en el método de la invención. Las cepas utilizadas en la presente invención se mantienen en cultivos estándar mediante métodos estándar.
En una realización más preferida aún, la célula de la invención es la célula OVY216. Dicha célula OVY216 se caracteriza por el genoma: MATa ade2-101, his3-A200, Ieu2- 3, 112, trp1-901, gal4A, gal80A, LYS2:(lexAop)4-HIS3, SPAL10::URA3, GAL1-lacZ ADE2::LexA-TSG101, que comprende integrado cromosómicamente las construcciones génicas (lexAop)4-HIS3 y UASGal-URA3 (=SPAL10::URA3), que expresan los reporteros HIS3 y URA3, y la construcción génica ADH1 ::LexA-TSG101 , que expresa la proteína de fusión LexA-TSG101 (SEQ ID NO: 49) que es la proteína que se une al péptido funcional 3xPTAP (SEQ ID NO: 12). Adicionalmente, tal y como se han indicado anteriormente, la cepa OVY216 de la presente invención también comprende la construcción que expresa el gen reportero detectable GAL1-lacZ. Este gen reportero, al igual que la construcción SPAL10::URA3, está bajo el control de UASGal. La presencia del reportero detectable GAL1-lacZ permite, si fuese necesario, confirmar o validar los resultados obtenidos con el reportero URA3, con ensayos de la actividad β-galactosidasa.
Construcciones génicas
Otro aspecto descrito en la presente invención se refiere a las construcciones génicas utilizadas para obtener la célula huésped descrita en la presente invención, así como para llevar a cabo el método de doble híbrido en reverso aquí descrito. Una de las construcciones génicas aquí descritas, a partir de ahora la denominaremos primera construcción génica de la invención, comprende las secuencias nucleotídicas que codifican para:
i) un promotor
ii) un dominio de unión al ADN, y
iii) una proteína heterologa capaz de unirse a un péptido funcional localizado en el extremo C-terminal de la proteína de referencia.
En una realización preferida, la primera construcción génica de la invención se caracteriza por que comprende un promotor, preferentemente promotor constitutivo, que puede seleccionarse de entre cualquiera de los descritos previamente en la presente invención. Adicionalmente, dicha primera construcción génica comprende también un dominio de unión al ADN, que se selecciona de entre cualquiera de los descritos a lo largo del presente documento. De la misma manera, la primera construcción génica de la invención, comprende también la secuencia nucleotídica que codifica para la proteína heterologa que se une al péptido funcional descrito en la presente invención. En una realización preferida, dicha proteína heterologa es la proteína humana TSG101 (SEQ ID NO: 32, codificada por la secuencia nucleotídica SEQ ID NO: 31). La proteína TSG101 es capaz de interaccionar con un pequeño péptido denominado PTAP que está presente en la proteína Gag p6 del virus VIH (PNAS (2001) 98, 7724-9; Cell (2001) 107, 55-65).
En una realización más preferida aún, la primera construcción génica de la invención es preferentemente el plásmido pRS402-LexA-TSG101 , más preferentemente el plásmido pRS402-LexA-TSG101 que comprende la secuencia SEQ ID NO: 30. En otra realización preferida, la primera construcción génica descrita en la presente invención se encuentra integrada en el cromosoma de la célula huésped de la invención y codifica para la primera proteína de fusión descrita en la presente invención, la proteína de fusión LexA-TSG101 de SEQ ID NO: 49.
Otro aspecto descrito en la presente invención se refiere a una segunda construcción génica, a partir de aquí la denominaremos segunda construcción génica de la invención, que comprende las secuencias nucleotídicas que codifican para:
i) un promotor,
ii) un dominio de unión al ADN, y
iii) una proteína diana a la que se une la proteína de referencia.
En una realización preferida, la segunda construcción génica de la invención, comprende por tanto, un promotor, preferentemente constitutivo, pudiendo utilizarse cualquiera de los descritos en la presente invención, un dominio de unión al ADN, que se selecciona de entre cualquiera de las descritos a lo largo del presente documento, y la secuencia de la proteína diana que se une a la proteína de referencia. A efectos de la presente invención, la proteína diana ejemplificada es la proteína reguladora de la glucoquinasa humana de SEQ ID NO: 2 codificada por la SEQ ID NO: 1. En una realización más preferida aún, la tercera construcción génica de la invención se refiere al plásmido pGBKT7-GKRP, más preferentemente al plásmido pGBKT7-GKRP que comprende la SEQ ID NO: 6.
En otra realización preferida, la segunda construcción génica descrita en la presente invención codifica para la segunda proteína de fusión descrita en la presente invención, la proteína de fusión GBD-GKRP de SEQ ID NO: 51.
Otro aspecto descrito en la presente invención se refiere a una tercera construcción génica, a partir de aquí la denominaremos tercera construcción génica de la invención, que comprende las secuencias nucleotídicas que codifican para:
i) un promotor
ii) un dominio de transactivación, y
iii) una proteína de referencia que además en su extremo carboxilo terminal comprende la secuencia que codifica para el péptido funcional 3xPTAP que se une específicamente a la proteína heteróloga codificada por la primera construcción génica de la invención.
En una realización preferida, la tercera construcción génica de la invención, comprende por tanto, un promotor, preferentemente constitutivo, pudiendo utilizarse cualquiera de los descritos en la presente invención, un dominio de transactivación, pudiendo utilizarse cualquiera de los descritos en la presente invención, y la secuencia de la proteína de referencia que se quiera estudiar, fusionada al péptido funcional 3xPTAP de SEQ ID NO: 12 en su extremo C-terminal. A efectos de la presente invención, la proteína de referencia ejemplificada es la proteína glucoquinasa humana de SEQ ID NO: 10 codificada por la SEQ ID NO: 9. En una realización más preferida aún, la segunda construcción génica de la invención se refiere al plásmido pACT2-GK- 3xPTAP, más preferentemente al plásmido pACT2-GK-3xPTAP que comprende la SEQ ID NO: 14.
En otra realización preferida, la tercera construcción génica descrita en la presente invención codifica para la tercera proteína de fusión descrita en la presente invención, la proteína de fusión GAD-GK-3xPTAP de SEQ ID NO: 53. A efectos de la presente invención se pueden utilizar otros plásmidos a los descritos aquí, con los mismos dominios de unión al ADN, tal como por ejemplo el plásmido pDEST™32 (Invitrogen), o con otros (en substitución de GBD y LexA) en combinación con una cepa con reporteros bajo el control de promotores con las secuencias de reconocimiento correspondientes, en substitución de UASGal y lexAop, así como otros plásmidos con el mismo dominio de transactivación (GAD), tal como por ejemplo el plásmido pEXP™-AD502 (Invitrogen), o con otro dominio de transactivación, tal como por ejemplo, VP16.
A efectos de la presente invención, también se podría utilizar como péptido funcional, en sustitución del péptido 3xPTAP utilizado en la presente invención, junto con su proteína interactora, TSG101 , cualquier otra pareja, siempre que se cumpla la condición de que el péptido funcional debe ser un péptido pequeño, preferentemente menos de 30 aminoácidos y más preferentemente menos de 25 aminoácidos, que no interfiera con la interacción de las proteínas estudiadas, o que para ser detectado requiera de más etapas incrementando la complejidad de la técnica, así como otro promotor diferente a ADH1 para expresar la fusión a TSG101 y otro marcador que ADE2 para su integración genómica.
A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y figuras se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención.
BREVE DESCRIPCIÓN DE LAS FIGURAS
Figura 1. Representación esquemática de los genes reporteros de contra-selección URA3 y selección positiva HIS3, bajo el control de promotores con secuencias de reconocimiento para distintos dominios de unión al ADN. (a) La ausencia de mutación en la proteína Y (ejemplificada en la proteína humana glucoquinasa) produce la activación de URA3 y la falta de crecimiento en presencia de 5-FoA. (b) Una mutación de truncamiento en Y no permite la activación de HIS3 y el crecimiento en ausencia de histidina. (c) Una mutación missense en Y produce la activación de HIS3 pero no la de URA3, lo que permite el crecimiento en un medio sin histidina y con 5-FoA. X: se refiere a la proteína reguladora de la glucoquinasa (GKRP).
Figura 2. Construcciones génicas utilizadas en el método de la invención, (a) Construcciones integradas en el genoma de la cepa de levadura OVY216. (b) Construcciones génicas utilizadas para la transformación de la cepa de la invención OVY216. X: se refiere a la proteína reguladora de la glucoquinasa humana (GKRP). Y: se refiere a la proteína humana glucoquinasa (GK).
Figura 3. Representación de la técnica de PCR mutagénica y recombinación in vivo ("gap repait") para la introducción de mutaciones al azar en el gen Y (ejemplificada en el gen que codifica para la proteína humana glucoquinasa) comprendido en el plásmido pACT2-Y-3xPTAP de SEQ ID NO: 14.
Figura 4. Ensayo de la actividad β-galactosidasa en filtro para detectar la interacción en el sistema de doble-híbrido clásico de células OVY216 transformadas con el plásmido pACT2-GK-3xPTAP sin mutar o sometido a PCR mutagénica y con el plásmido pGBKT7-GKRP (panel izquierda) o con el plásmido pLexA(1-202)PL- TSG101 (panel derecha). La interacción entre las proteínas GK y GKRP (izquierda) o entre el péptido 3xPTAP y TSG101 (derecha) produce la activación del gen reportero lacZ, y en consecuencia la expresión de la β-galactosidasa y la hidrólisis del X-Gal en un compuesto de color azul. Un total de 7-8 células independientes transformadas han sido analizadas para cada interacción.
EJEMPLOS A continuación se ilustrará la invención mediante unos ensayos realizados por los inventores, que pone de manifiesto la efectividad del producto de la invención.
En los ejemplos que se detallan a continuación se muestra como mediante el sistema de doble híbrido en reverso, utilizando la célula huésped descrita en la presente invención, así como las construcciones génicas específicas, diseñadas de acuerdo a los ejemplos mostrados, se han localizado mutaciones en la proteína glucoquinasa humana que bloquean su interacción con la proteína humana GKRP. Además, al ser conocida la estructura del complejo GK-GKRP (Choi JM. et al. Proc Nati Acad Sci U S A. 2013 Jun 18; 110(25): 10171 -6), ha permitido validar los resultados obtenidos mediante el método descrito en la presente invención, poniendo de manifiesto la consistencia entre los resultados aquí obtenidos con la estructura conocida del complejo.
Ejemplo 1. Análisis de la validez del método de doble híbrido en reverso de la invención mediante el análisis de la interacción entre el par de proteínas GK y GKRP.
1.1. Diseño y obtención de los plásmidos utilizados en el método de la invención.
Las construcción de los plásmidos utilizados en el método de invención ha sido realizada mediante técnicas estándar de ADN recombinante (Sambrook et al. Molecular Cloning: A Laboratory Manual, 2d ed. (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.).
Para expresar una de las proteína de fusión descritas en el presente documento y que comprende una de las proteínas del par interaccionante a estudiar, específicamente para el presente ejemplo se ha seleccionado la proteína reguladora de la glucoquinasa humana (GKRP) de SEQ ID NO: 2, codificada por el gen de la glucoquinasa humana que comprende la SEQ ID NO: 1 , se ha utilizado el plásmido comercial pGBKT7 (Clontech) que comprende como marcador de selección TRP1. Dicho plásmido comercial pGBKT7 (SEQ ID NO: 3), comprende la secuencia nucleotídica que codifica para el dominio de unión al ADN del activador transcripcional Gal4 (GBD) (SEQ ID NO: 4), bajo el control del promotor de ADH1 (SEQ ID NO: 5). De esta manera, para obtener el plásmido pGBKT7-GKRP (SEQ ID NO: 6), la secuencia nucleotídica que codifica para la GKRP (SEQ ID NO: 1) se clona en fase, fusionada en el extremo N- terminal al GBD. Brevemente, mediante la técnica de PCR se clona en el plásmido pGBKT7 (Clontech) la secuencia codificante (SEQ ID NO: 1) de la proteína GKRP humana (SEQ ID NO: 2), incluyendo el codón de iniciación y el codón de parada, entre los sitios EcoR1 y BamH1 , de tal forma que las secuencias nucleotídicas que codifican para el dominio de unión al ADN de Gal4 (GBD) y la secuencia codificante (SEQ ID NO: 1) para la proteína GKRP (SEQ ID NO: 2) quedan en fase.
Para la amplificación de la secuencia codificante (SEQ ID NO: 1) de la proteína GKRP (SEQ ID NO: 2) mediante PCR, se utilizó como molde el plásmido pFlag-ctc-hGKRP- FlagC (Brocklehurst K, et al. Biochem. J. 2004;378(Pt2):693-7) y se diseñaron cebadores específicos capaces de hibridar con las regiones 5' y 3' del gen que codifica para la proteína GKRP (SEQ ID NO: 1) y con los sitios de las endonucleasas de restricción EcoR1 y BamH1 en los extremos. Los cebadores utilizados para dicho fin son los cebadores de SEQ ID NO: 7 (hGKRP-EcoR1) (5'- GGAATTCATGCCAGGCACAAAACGGTTTC-3') y de SEQ I D NO: 8 (hGKRP-BamM) (5'-GGGATCCTACTGAACGTCAGGCTCTAGGATTTC-3').
Por otro lado, para expresar la proteína de fusión que comprende la otra proteína del par interaccionante a estudiar, específicamente para el presente ejemplo, se trata de la proteína glucoquinasa humana (GK) de SEQ ID NO: 10, codificada por la secuencia nucleotídica SEQ ID NO: 9, y además las tres repeticiones del péptido PTAP (3xPTAP) (SEQ ID NO: 12: EPEPTAPPEPTAPPEPTAPPAE), codificado por la secuencia nucleotídica SEQ ID NO: 1 1 , se ha utilizado el plásmido comercial pACT2 (Clontech) de SEQ ID NO: 13, que comprende como marcador de selección LEU2. Así, para la obtención del plásmido final pACT2-GK-3xPTAP (SEQ ID NO: 14), la secuencia codificante SEQ ID NO: 9 de la proteína GK (SEQ ID NO: 10) se fusiona en el extremo N-terminal al dominio de transactivación de Gal4 (GAD) (SEQ ID NO: 15), y en el extremo C-terminal a las tres repeticiones del péptido PTAP (SEQ ID NO: 1 1), todo ello bajo el control del promotor de ADH1 (SEQ ID NO: 16). Brevemente, el plásmido comercial pACT2 (Clontech) de SEQ ID NO: 13 ha sido modificado mediante la inserción en el sitio Xho1 del polylinker, de la secuencia nucleotídica (SEQ ID NO: 1 1) que codifica para el péptido 3xPTAP de SEQ ID NO: 12 (EPEPTAPPEPTAPPEPTAPPAE). Esta secuencia nucleotídica (SEQ ID NO: 1 1) ha sido obtenida mediante el anillamiento de dos oligonucleótidos complementarios de SEQ ID NO: 17 (OV570) (5'- TCGAGAGCCAGAACCCACAGCACCGCCTGAGCCTACCGCCCCACCCGAACCGAC GGCGCCTCCAGCTGAGTAA-3') y de SEQ ID NO: 18 (OV571) (5'- TCGATTACTCAGCTGGAGGCGCCGTCGGTTCGGGTGGGGCGGTAGGCTCAGGC GGTGCTGTGGGTTCTGGCTC-3'). El oligonucleótido de doble cadena resultante presenta extremos protuberantes 5' (TCGA) que permiten su clonaje en el sitio Xho1 del plásmido pACT2. Así, el plásmido resultante tras el clonaje de dicha secuencia nucleotídica se denomina pACT2-3xPTAP (SEQ ID NO: 19) y presenta el mismo polylinker que el plásmido pACT2 original de SEQ ID NO: 1 1 , pero limitado en cada extremo N-terminal y C-terminal con las secuencias que codifican para el dominio de activación de Gal4 (GAD) y para el péptido 3xPTAP, respectivamente, en fase uno con el otro. A continuación, el plásmido pACT2-GK-3xPTAP de SEQ ID NO: 14 se obtiene mediante clonaje por PCR de la secuencia codificante de la GK humana (SEQ ID NO: 9), incluyendo el codón de iniciación, pero excluyendo el codón de parada, en el sitio BamH1 del polylinker del plásmido pACT2-3xPTAP de SEQ ID NO: 19, obtenido previamente, de modo que las secuencias nucleotídicas que codifican para el dominio de activación de Gal4 (GAD), para la proteína GK y para el péptido 3xPTAP, quedan en fase.
Para la amplificación por PCR de la secuencia nucleotídica SEQ ID NO: 9, que codifica para la proteína GK humana (SEQ ID NO: 10), se utilizó como molde el plásmido pGEX-5X-hGKi (Alvarez E, et al. J. Neurochem. 2002;80(1):45-53) y se diseñaron cebadores específicos capaces de hibridar con las regiones 5' y 3' del gen que codifica para la proteína GK y con los sitios de la endonucleasa de restricción BamH 1 en cada extremo. Los cebadores utilizados para dicho fin son los cebadores de SEQ ID NO: 20 (OV500) (5'-GGGATCCTGATGCTGGACGACAGAGCCAGG-3') y de SEQ ID NO: 21 (OV562) (5'-GGGATCCACTGGCCCAGCATACAGGCCTTC-3'). Por otro lado, para la expresión y síntesis de la proteína TSG101 humana (SEQ ID NO: 32) por parte de la célula OVY216 descrita en la presente invención, se sintetizó el plásmido pRS402-LexA-TSG101 (SEQ ID NO: 30) en dos etapas. En una primera etapa, se construyó el plásmido pRS402-LexA de SEQ ID NO: 22. Para ello, se clonó la secuencia nucleotídica SEQ ID NO: 23 que codifica el dominio de unión al ADN del represor transcripcional LexA (aminoácidos 1-202) de SEQ ID NO: 24, junto con el promotor (SEQ ID NO: 25) y terminador (SEQ ID NO: 26) de ADH1, entre los sitios Kpn1 y Sac1 del plásmido integrativo pRS402 (Brachmann CB. et al. Yeast. 1998; 14(2): 115-32). Esta secuencia génica se amplificó mediante PCR utilizando como molde el plásmido pLexA(1-202)PL (Ruden DM, et al. Nature. 1991 ;350(6315):250-2) de SEQ ID NO: 27 y cebadores capaces de hibridar al inicio del promotor de ADH1 (SEQ ID NO: 25) y al final del terminador de ADH1 (SEQ ID NO: 26), y con los sitios de las endonucleasas de restricción Kpn1 y Sac1 en los extremos. Los cebadores utilizados para dicho fin fueron los cebadores de SEQ ID NO: 28 (OV502) (5'-GGGTACCTTTTGTTGTTTCCGGGTGTAC-3') y SEQ ID NO: 29 (OV503) (5'-GGAGCTCGCATGCCGGTAGAGGTGTGGTC-3'). En la segunda etapa, se obtuvo el plásmido definitivo denominado pRS402-LexA-TSG101 de SEQ ID NO: 30 mediante PCR y clonaje de la secuencia nucleotídica SEQ ID NO: 31 que codifica para la proteína TSG101 (SEQ ID NO: 32) (incluyendo el codón de iniciación y el codón de parada), en el sitio BamH1 del plásmido previamente construido pRS402- LexA (SEQ ID NO: 22). Como se mostrará a continuación, el plásmido pRS402-LexA- TSG101 (SEQ ID NO: 30) se integra en el cromosoma de la célula de levadura OVY216 descrita en la presente invención, específicamente en el locus del marcador ADE2 de dicha célula.
Para la amplificación del gen TSG101 (SEQ ID NO: 31) por PCR, se utilizó como molde una librería de ADNc humano (Clontech ref 638805) y cebadores capaces de hibridar con las regiones 5' y 3' de gen TSG101 (SEQ ID NO: 31) y con sitios de la endonucleasa de restricción BamH1 en cada extremo. Los cebadores utilizados para dicho fin fueron los cebadores de secuencias SEQ ID NO: 34 (OV310) (5'- GGGATCCTCATGGCGGTGTCGGAGAGCCAGC-3') y SEQ ID NO: 35 (OV311) (5'- GGGATCCTCAGTAGAGGTCACTGAGACCGGC-3'). Por otra parte, el plásmido pl_exA(1-202)PL-TSG101 (SEQ ID NO: 33) utilizado en el sistema de doble híbrido clásico, que se utiliza para validar el método de la invención y que se describe a continuación, se obtuvo de la misma manera que el plásmido pRS402-LexA-TSG101 (SEQ ID NO: 30) mencionado previamente, pero utilizando el plásmido pl_exA(1-202)PL (SEQ ID NO: 27), en vez del plásmido pRS402-LexA (SEQ ID NO: 22), como vector receptor.
1.2. Diseño y obtención de la cepa OVY216 de la invención
La cepa de levadura OVY216 de la presente invención comprende integrado cromosómicamente las construcciones génicas (lexAo)4p-HIS3 y UASGal-URA3 (=SPAL10::URA3), que expresan los genes reporteros HIS3 (utilizado en la presente invención como gen reportero de selección positiva) y URA3 (utilizado en la presente invención como gen reportero de contra-selección), y la construcción génica ADH1::LexA-TSG101, que expresa la proteína de fusión LexA-TSG101 (SEQ ID NO: 49), que se une al péptido 3xPTAP (SEQ ID NO: 12) expresado por el plásmido pACT2-GK-3xPTAP (SEQ ID NO: 14).
La cepa de levadura OVY216 de la presente invención se ha obtenido mediante el cruce de la cepa comercial procedente de Invitrogen MAV203 (MATct, Ieu2-3, 112, trpl- 901, his3-A200, gal4A, gal80A, canIR, cyh2R, LYS2::GAL1-HIS3, GAL1-lacZ, SPAL10::URA3) que comprende el gen reportero URA3 bajo el control de UASGal, y de la cepa comercial procedente de Invitrogen L40-ura (MATa, Ieu2-3, 112, trp1-901, his3-A200, ade2-101, gal80A, LYS2:(lexAop)4-HIS3, ura3:(lexAop)8-lacZ), que comprende el gen reportero HIS3 bajo el control de LexAop.
Los medios de cultivo de levadura utilizados en la presente invención para el crecimiento de las cepas son el medio de cultivo mínimo (SD) y el medio de cultivo completo (YPAD). La preparación de dichos medios de cultivo se describe en Methods in yeast genetics— A laboratory course manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York. 1990; pp 198.
Así, para obtener la cepa OVY216 se mezclaron cantidades equivalentes de cada cepa L40-ura y MAV203, en una placa de medio de cultivo completo (YPAD) y se incubaron a 30°C durante 5 horas. La obtención de organismos diploides (ade2- 101/ade2-101, his3-A200/his3-A200, Ieu2-3, 112/leu2-3, 112, trp 1 -901/trp 1-901, gal4A/GAL4, gal80A/gal80A, LYS2::GAL1-HIS3/LYS2:(lexAop)4-HIS3, ura3:(lexAop)8- lacZ/SPAL10::URA3, GAL1-lacZ/-) se comprobó por observación al microscopio y varios de ellos fueron recogidos con un micromanipulador (Modelo MSM system SINGER) y depositados en otra placa de cultivo en presencia de medio de cultivo completo YPAD. Trascurridos dos días de cultivo a 30°C, los diploides fueron transferidos a una placa de medio de pre-esporulación (0.8% extracto de levadura, 0.3% bactopeptona, 10% glucosa, 2% agar) e incubados a 30°C durante 24 horas, para luego ser transferidos a una placa de medio de esporulación (1 % acetato potásico, 0.1 % extracto de levadura, 0.05% glucosa, 2% agar) e incubados a 30°C durante 3 días. Posteriormente, se preparó una suspensión de cada uno de los diploides y se comprobó la obtención de tétradas por observación al microscopio. Para la disección de tétradas, se incubó una de las suspensiones de los individuos diploides en presencia de beta-glucuronidasa durante 15 minutos a 25°C y las esporas fueron separadas con el micromanipulador MSM system SINGER y cultivadas en una placa de medio completo YPAD.
De dicho cultivo se obtuvieron 70 segregantes haploides viables que se caracterizaron mediante análisis genotípico/fenotípico. Para la caracterización fenotípica se seleccionaron aquellos segregantes que no pueden utilizar la galactosa como fuente de carbono (gal4A) y que requieren adenina en el medio de cultivo (ade2-101). Estos cultivos se llevaron a cabo a 30°C en placas que comprendían medio de cultivo completo con un 2% de galactosa como fuente de carbono o medio mínimo SD sin adenina. Por otra parte, el análisis genotípico se realizó mediante técnicas de PCR, seleccionando aquellos segregantes que comprenden las construcciones génicas SPAL10-URA3, (lexAop)4-HIS3 y GAL1-lacZ. Para la detección de las construcciones génicas mencionadas se amplificó vía PCR un fragmento de 300-400 pb del genoma de los segregantes utilizando como cebadores los descritos a continuación:
Construcción génica Cebador directo (5 -3 ) Cebador inverso (5 -3 )
SPAL10-URA3 SEQ ID NO: 36 (OV713) SEQ ID NO: 37 (OV714)
(GCGAGGCATA I I I ATGG (CA I I I CCGTGCAAAGGTA TGAAGG) CTAAC)
(lexAop)4-HIS3 SEQ ID NO: 38 (OV731) SEQ ID NO: 39 (OV732)
(CTGTATATAAAACCAGT (TCGAGTGCTCTATCGCTA
GGTTATATGTAC) GGG) Construcción génica Cebador directo (5 -3 ) Cebador inverso (5 -3 )
GAL1-lacZ SEQ ID NO: 40 (OV715) SEQ ID NO: 41 (OV741)
(CCATAGGATGATAATGC (CGCTTCTGGTGCCGGAAA
GATTAG) CC)
De los 70 segregantes haploides obtenidos del cruce de las cepas de levadura L40-ura (Invitrogen) y MAV203 (Invitrogen), se ha identificado un único segregante denominado en la presente invención cepa OVY21 1 , que presenta el genotipo: MATa ade2-101, his3-A200, Ieu2-3, 112, trp1-901, gal4A, gal80A, LYS2:(lexAop)4-HIS3, SPAL10::URA3, GAL1-lacZ.
En el locus ADE2 de esta cepa OVY211 se ha integrado el plásmido pRS402-LexA- Tsg101 de SEQ ID NO: 30 (obtenido previamente según se ha descrito) que codifica para la proteína de fusión LexA-Tsg101 (SEQ ID NO: 49), dando lugar a la cepa de levadura de la invención, OVY216 (MATa ade2-101, his3-A200, Ieu2-3, 112, trp1-901, gal4A, gal80A, LYS2:(lexAop)4-HIS3, SPAL10::URA3, GAL1-lacZ ADE2::LexA- TSG101) que comprende integrado cromosómicamente las construcciones génicas (lexAop)4-HIS3 y UASGal-URA3 (=SPAL10::URA3), que expresan los genes reporteros HIS3 (selección positiva) y URA3 (contra-selección), y la construcción génica ADH1::LexA-TSG101, que expresa la proteína de fusión LexA-TSG101 (SEQ ID NO: 49) que es la proteína que se une al péptido funcional 3xPTAP (SEQ ID NO: 12). (Figura 2a). Brevemente, se transformó la cepa de levadura OVY211 con el plásmido pRS402-LexA-TSG101 (SEQ ID NO: 30) linearizado con la endonucleasa de restricción Stu1 que reconoce un único sitio en el marcador ADE2 de dicho plásmido. La selección de los transformantes en los cuales dicho plásmido se ha integrado mediante recombinación homologa en el locus del marcador ADE2 se llevó a cabo en una placa de medio mínimo SD sin adenina. La correcta integración del plásmido se confirmó mediante amplificación por PCR de un fragmento de 2.3Kb con los cebadores de SEQ ID NO: 42 (OV508) (5'-CAGATTGTACTGAGAGTGCACC-3') y SEQ ID NO: 43 (OV747) (5'-ATTCCTTGCTTCTTGTTACTGG-3') . Por lo tanto, la cepa de levadura de la invención, OVY216, tal y como hemos indicado anteriormente comprende integrado cromosómicamente las construcciones génicas LexAop-HIS3 y UASGal- URA3 {=SPAL10::URA3), que expresan los reporteros HIS3 y URA3, y la construcción génica ADH1::LexA-TSG101, que expresa la proteína de fusión LexA-TSG101 (SEQ ID NO: 49) que es la proteína que se une al péptido funcional 3xPTAP (SEQ ID NO: 12) incluido en el plásmido pACT2-GK-3xPTAP (SEQ ID NO: 14).
Adicionalmente, la cepa OVY216 de la presente invención comprende la construcción que expresa el gen reportero inducible GAL1-lacZ. Este gen reportero, al igual que la construcción SPAL10::URA3, está bajo el control de UASGal. La presencia del gen reportero inducible GAL1-lacZ permite, si fuese necesario, confirmar o validar los resultados obtenidos con el gen reportero URA3, mediante ensayos de actividad β- galactosidasa.
1.3. Transformación de la cepa OVY216 con el plásmido pGBKT7-GKRP de SEQ ID NO: 6
Tras la obtención de la cepa de la invención OVY216 según se ha descrito previamente en 1.2, ésta se transforma con el plásmido pGBKT7-GKRP (SEQ ID NO: 6) para que exprese una de las proteínas del par interaccionante que se estudia en el presente ejemplo, la proteína GKRP (SEQ ID NO: 2). Simultáneamente a la transformación de la célula OVY216 con el plásmido pGBKT7-GKRP de SEQ ID NO: 6 se podría llevar a cabo la transformación de dicha célula, para obtener mediante recombinación in vivo "gap repair", el segundo plásmido pACT2-GK-3xPTAP, pero para asegurar la expresión de la proteína de fusión GBD-GKRP (SEQ ID NO: 51), por parte de la célula OVY216, se prefiere llevar a cabo en primer lugar la transformación de dicha célula con el plásmido pGBKT7-GKRP (SEQ ID NO: 6), y una vez que la célula comprende dicho plásmido, posteriormente llevar a cabo la segunda transformación y obtener el plásmido pACT2-GK-3xPTAP recombinado. De esta manera, el plásmido pGBKT7-GKRP (SEQ ID NO: 6) expresa la proteína de fusión GBD-GKRP (SEQ ID NO: 51) a un nivel suficiente como para activar la expresión del gen reportero de selección positiva URA3 (mediante su interacción con la proteína de fusión GAD-GK-3xPTAP (SEQ ID NO: 53)) expresada por el plásmido pACT2-GK- 3xPTAP de SEQ ID NO: 14, e impedir el crecimiento, en presencia de 5-FoA, de los clones que comprenden la proteína GK que no presentan mutaciones missense.
El protocolo de transformación de la cepa de levadura OVY216 con el plásmido pGBKT7-GKRP (SEQ ID NO: 6) se llevó a cabo mediante la metodología estándar con acetato de litio. Brevemente, la célula de levadura OVY216 se mantiene en cultivo en medio completo YPAD hasta que llega a la fase logarítmica de crecimiento. A continuación, se centrifuga el cultivo durante 5 min a 2000 rpm y se desecha el sobrenadante. Se resuspende el pellet donde se encuentra la célula OVY216 de la invención en 1 mi de agua y se transfiere a un tubo eppendorf para volver a centrifugarlo durante 5 min a 2000 rpm y volver a desechar el sobrenadante. Posteriormente, se resuspende el pellet de la célula OVY216 en la solución TELiAc (100 μΙ/5 mi cultivo) que comprende el tampón TE con 0.1 M de LiAc. A continuación, se mezcla en un eppendorf 50 μΙ de suspensión de la célula OVY216 de la invención con 2 μΙ (20 μg) de ADN carrier y 100 ng del plásmido pGBKT7-GKRP (SEQ ID NO: 6). Adicionalmente, se añaden 250μΙ de la solución TELiPEG que comprende TE con 0.1 M LiAc y 40% PEG 3350 y se vortea durante 15 seg. Posteriormente, se incuba dicha mezcla durante 30 min a 30°C y transcurrido dicho tiempo se vuelve a incubar durante 15 min a 42 °C. A continuación, se centrifuga 1 min a 13000 rpm y se elimina todo el sobrenadante. Finalmente, se resuspende el pellet en 50 μΙ de agua y se siembra en una placa con medio de cultivo mínimo SD sin triptófano (SD-T) dado que el marcador de selección del plásmido pGBKT7-GKRP es TRP1. Las cepas transformadas que han incorporado el plásmido pGBKT7-GKRP (SEQ ID NO: 6) son visibles a cabo de 3-4 días de cultivo a 30°C. 1.4. Generación y selección simultánea de mutaciones missense mediante PCR- mutagénica y recombinación in vivo ("gap-repair") en la secuencia nucleotídica gue codifica para la proteína GK comprendida en el plásmido pACT2-GK- 3xPTAP (SEQ ID NO: 14). Para generar mutaciones al azar en la secuencia nucleotídica SEQ ID NO: 9 que codifica para la proteína GK (SEQ ID NO: 10) comprendida en el plásmido pACT2-GK- 3xPTAP (SEQ ID NO: 14), se ha utilizado la técnica de PCR mutagénica y recombinación in vivo "gap-repair". La generación de mutaciones mediante dicha técnica se basa en la utilización de condiciones de PCR que favorecen la introducción al azar de mutaciones en el producto de PCR obtenido, haciendo uso de cebadores que permiten la amplificación de la secuencia nucleotídica que codifica para la GK, junto con las secuencias flanqueantes presentes en el plásmido pACT2-GK-3xPTAP (SEQ ID NO: 14). La técnica de PCR mutagénica y recombinación in vivo se basa en la recombinación, después de transformación, entre un plásmido linearizado y un producto de PCR obtenido en condiciones que favorecen la introducción al azar de mutaciones. La homología entre los extremos del producto de PCR y los extremos del plásmido pACT2 digerido con BamH1 , permiten la recombinación homologa entre ambos ("gap repait") después de co-transformación en la célula de levadura (Figura 3). De esta forma, los transformantes obtenidos comprenden un plásmido, a priori, idéntico a pACT2-GK-3xPTAP, pero con mutaciones introducidas al azar en la secuencia nucleotídica que codifica para la proteína GK.
Los cebadores utilizados en la PCR mutagénica han sido los cebadores de SEQ ID NO: 44 (OV621) (5'-CACTGTCACCTGGTTGGACGG-3') y de SEQ ID NO: 45 (OV622) (5'-CTATAGATCAGAGGTTACATGGC-3'), que hibridan 213bp corriente arriba y 174bp corriente abajo de la secuencia nucleotídica (SEQ ID NO: 9) que codifica para la proteína GK (SEQ ID NO: 10) en el plásmido pACT2-GK-3xPTAP (SEQ ID NO: 14).
En el presente ejemplo se han llevado a cabo dos PCR mutagénicas para introducir mutaciones al azar en la secuencia nucleotídica que codifica para la proteína GK, siendo la única diferencia entre dichas PCRs mutagénicas la enzima ADN polimerasa utilizada en cada una de ellas. Las enzimas ADN polimerasas presentan tasas de mutación diferentes entre ellas, de ahí que se ha querido comparar dos de dichas enzimas para conocer cuál es la más idónea para el método de la invención. En el presente ejemplo se han probado la ADN polimerasa Taq procedente de Takara o Roche, y la ADN polimerasa Mutazyme II procedente del kit de mutagénesis al azar Genemorph II de Agilent.
Las condiciones para las PCR mutagénicas en función de la ADN polimerasa utilizada se describen a continuación:
- ADN polimerasa Mutazyme II (kit de mutagénesis al azar Genemorph II de Agilent). Se utilizan 2.5 μg de ADN molde (pACT2-GK-3xPTAP de SEQ ID NO: 14) y se amplifica durante 20 ciclos para minimizar el número de mutaciones por Kb. Se siguieron las recomendaciones indicadas por el fabricante. Brevemente, la mezcla de reacción (50μΙ total) comprende: 33.1 μΙ H20 + 5 μΙ buffer 10x + 1 μΙ dNTPs 10 mM + 0.25 μΙ de los cebadores de SEQ ID NO: 44 y SEQ ID NO: 45 (100 μΜ) + 9.4 μΙ pACT2-GK-3xPTAP (2.5 μg) + 1 μΙ Mutazyme II (ADN pol). Los ciclos de la PCR fueron: (1) 95 °C 2 min; (2) 95 °C 30 sec + 55 °C 30 sec + 72 °C 1 min/Kb (repetir 20 veces el paso (2)) y (3) 72 °C 10 min. - ADN polimerasa Taq (Takara Ref. R001 o Roche Ref 1 1647679001). Se han utilizado condiciones estándar para minimizar el número de mutaciones por Kb. La mezcla de reacción (50 μΙ total) comprende: 42 μΙ H20 + 5 μΙ buffer + 1 μΙ dNTPs 10 mM + 0.25 μΙ de los cebadores de SEQ ID NO: 44 y SEQ ID NO: 45 (100 μΜ) + 1 μΙ pACT2-GK-3xPTAP (265 ng) + 0.5 μΙ Taq (ADN pol). Los ciclos de la PCR fueron (1) 94 °C 2 min; (2) 94 °C 30 sec + 55 °C 30 sec + 72 °C 1 min/Kb (repetir 30 veces el paso (2)) y (3) 72 °C 7 min.
Después de cada reacción de PCR mutagénica, se añadió 1 μΙ de la enzima dpnl (Roche) y se incubó la mezcla durante 1 h a 37°C para eliminar el ADN molde. Posteriormente se precipitó el producto de PCR con acetato de sodio y etanol, para después resuspenderlo en 20 μΙ H20.
Para la técnica de la PCR mutagénica y recombinación in vivo se lineariza el plásmido pACT2 (SEQ ID NO: 13) (Clontech) en el polylinker con el enzima de restricción BamH1 (Figura 3). Para dicha linearización del plásmido pACT2 en el polylinker se podrían utilizar otras enzimas de restricción tales como Nco1 , Sma1 , EcoR1 , Sac1 o Xhol La mezcla de digestión (100 μΙ total) comprende: 80 μΙ H20 + 10 μΙ buffer 10x + 7.4 μΙ pACT2 (1.74 μg) + 2.5 μΙ (25u) BamH1 (Roche). Se incubó la mezcla durante 2h a 37°C. Posteriormente se precipitó el ADN con acetato de sodio y etanol, para después resuspenderlo en 20 μΙ H20.
A continuación, se lleva a cabo la transformación de la célula OVY216, previamente pre-transformada con el plásmido pGBKT7-GKRP de SEQ ID NO: 6, con el plásmido pACT2 linearizado con BamH1 y los diferentes productos obtenidos en las PCR mutagénicas, según se ha descrito anteriormente.
La generación de mutaciones en el plásmido pACT2-GK-3xPTAP (SEQ ID NO: 14) mediante la técnica de PCR mutagénica y recombinación in vivo, así como la selección de las mutaciones "missense" en la proteína GK que producen una pérdida de interacción con la proteína GKRP, se llevan a cabo en un solo paso mediante la utilización combinada de genes reporteros, específicamente en la presente invención mediante los genes reporteros SPAL10-URA3 e (lexAop)4-HIS3, y el medio selectivo SD-AHTL+5FoA+3-AT, que permiten exclusivamente el crecimiento de los transformantes en los que la mutación en el gen de la GK bloquea su interacción con GKRP, pero no trunca la proteína (mutación missense). El compuesto 3-AT (3- aminotriazol) es un inhibidor competitivo del producto del gen HIS3 que se utiliza en el presente ejemplo para evitar que la actividad basal del reportero LexA(op)-HIS3 sea suficiente para permitir el crecimiento de la célula en ausencia de histidina. Se ha utilizado una concentración del compuesto 3-AT de 1 mM pero se ha observado que utilizando dicha concentración existen células OVY216 transformadas que son capaces de crecer en ausencia de histidina debido a la actividad basal del reportero LexA(op)-HIS3, aunque las colonias obtenidas son mucho más pequeñas que las obtenidas con los transformantes que comprenden la secuencia que codifica para la proteína GK con mutaciones missense. Para evitar este inconveniente se ha probado una concentración de 3-AT de 5mM. Esta mayor concentración es capaz de inhibir completamente el crecimiento de estos transformantes.
Brevemente, la célula de levadura de la invención OVY216, previamente transformada con el plásmido pGBKT7-GKRP (SEQ ID NO: 6), se transforma ahora con el plásmido pACT2 linearizado con BamH1 junto con los productos de la PCR mutagénica. Para ello, dicha célula se inocula en 5ml de medio de cultivo mínimo sin triptofano (SD-T) y se mantiene en cultivo hasta que su crecimiento llegue a la fase logarítmica. Este cultivo asegura el crecimiento de las células que comprenden el plásmido pGBKT7- GKRP y en consecuencia, expresarán la proteína de fusión GBD-GKRP (SEQ ID NO: 51). A continuación, se centrifuga dicho cultivo y se resuspende el pellet de las células en 15 mi de medio completo (YPAD) para mejorar la eficiencia de la transformación. Se mantiene dicho cultivo hasta que llegue de nuevo a fase logarítmica (alrededor de 3-4h). A continuación, se sigue el protocolo de transformación con acetato de litio según se ha explicado previamente, utilizando como mezcla de transformación: 50μΙ de suspensión de la célula de levadura en TELiAc + 2 μΙ (20 μg) de ADN carrier + 2 μΙ (175 ng) de pACT2 linearizado con BamH1 + 2 μΙ (Taq) o 4 μΙ (Mutazyme II) de PCR mutagénico. Se utiliza una concentración alta del producto de PCR mutagénico respecto al plásmido linearizado para favorecer su integración mediante recombinación o "gap repait" (Figura 3). Para incrementar aún más la eficiencia del procedimiento de transformación y asegurar la expresión de los marcadores de selección URA3 e HIS3 al final del protocolo de transformación, se resuspende el pellet de las células de levadura transformadas en 5ml de medio completo YPAD y se cultiva a 30°C durante 150 min. Posteriormente, se centrifuga durante 1 min a 13000 rpm y se elimina todo el sobrenadante. A continuación, se resuspende el pellet de levadura en 50μΙ de agua y se siembra el 1 % de la mezcla de transformación en una placa control con medio mínimo no selectivo sin triptófano, leucina, ni adenina (SD- TLA) para calcular el número total de transformantes que contienen los dos plásmidos pGBKT7-GKRP (SEQ ID NO: 6) y pACT2-GK-3xPTAP obtenido mediante recombinación ("gap repait"), incluyendo los transformantes que no llevan mutaciones o los que llevan mutaciones sin el efecto deseado. Este medio selectivo carece de adenina ya que la cepa es prototrofa para este requerimiento y carece de triptófano y leucina dado que los marcadores de los dos plásmidos son TRP1 y LEU2. Se ha obtenido una media de 500 transformantes en esta placa control, lo que indica que el número total de transformantes rastreados es de 50000, al haberse sembrado el 1 % de la mezcla de transformación.
Para seleccionar las células transformadas que expresan la secuencia muíante de la proteína GK que bloquea su unión a la proteína GKRP (mutaciones missense) (Figura 1), se siembra el resto de la mezcla de transformación (99%) en una placa de cultivo con medio mínimo selectivo sin triptófano, leucina, adenina e histidina y con 0.1 % 5- FoA y 1 mM 3-AT (SD-AHTL+5-FoA+3-AT). En dicho medio selectivo solo crecerán aquellas células OVY216 transformadas según se describe en el presente ejemplo, que presenten mutaciones missense en la secuencia que codifica para la proteína GK y que, por tanto, impidan su unión a la proteína GKRP. Por el contrario, las células OVY216 transformadas con el plásmido pACT2 que ha quedado sin digerir o que se ha recircularizado, así como las células transformadas con el plásmido pACT2-GK- 3xPTAP no mutado (SEQ ID NO: 14) o con mutaciones que producen un truncamiento en la proteína GK, no son capaces de crecer en dicho medio selectivo SD-AHTL+5- FoA+3-ΑΤ. Adicionalmente, también se ha observado que con 1 mM 3-AT en el medio de cultivo selectivo, el bloqueo del crecimiento de los transformantes que no activan el reportero HIS3 no es absoluto, existiendo una pequeña actividad basal del reportero (lexAop)4-HIS3, aunque las colonias obtenidas son mucho más pequeñas que las obtenidas con los transformantes que comprenden la secuencia que codifica para la proteína GK con mutaciones missense. Para evitar este inconveniente se ha probado una concentración de 3-AT de 5mM. Esta mayor concentración es capaz de inhibir completamente el crecimiento de estos transformantes.
Es interesante mencionar que el número de transformantes obtenidos en el medio selectivo SD-AHTL+5-FoA+3-AT varía según la ADN polimerasa utilizada para introducir mutaciones al azar en la secuencia nucleotídica que codifica para la proteína GK en la PCR mutagénica. Así, cuando se utiliza la ADN polimerasa Mutazyme II, el número de transformantes en el medio selectivo es el 1.25% del total de los transformantes rastreados. Sin embargo, con la ADN polimerasa Taq, se han obtenido 10 veces menos clones positivos (0.125% del total de transformantes) que los obtenidos con Mutazyme II. Esta diferencia se debe probablemente al hecho de que con la ADN polimerasa Taq se han utilizado condiciones estándar que no favorecen la aparición de mutaciones, con el objetivo de limitar el número de mutaciones por plásmido.
1.5. Análisis de las células OVY216 transformadas según se ha descrito previamente que han crecido en el medio selectivo SD-AHTL+5-FoA+3-AT y purificación de los plásmidos que comprenden las mutaciones missense en la secuencia que codifica para la proteína GK humana.
Se ha extraído el ADN plasmídico de 19 transformantes obtenidos en el medio selectivo SD-AHTL+5-FoA+3-AT. En estos 19 transformantes (10 obtenidos con la DNA polimerasa mutazyme II y 9 obtenidos con la DNA polimerasa Taq), que presentan las mutaciones en la secuencia nucleotídica que codifica para la proteína GK, obtenidas mediante la técnica de PCR mutagénica y recombinación in vivo "gap- repair", y seleccionadas mediante el método de doble híbrido en reverso descrito en la presente invención, se ha aislado el plásmido pACT2-GK-3xPTAP mutado que comprendían dichos transformantes. Brevemente, dado que LEU2 es el marcador para seleccionar este plásmido en levaduras, cada transformante se cultiva en 5ml_ de medio mínimo sin leucina (SD-L) hasta que llega a la fase estacionaria de su crecimiento. A continuación, se aisla el ADN plasmídico mediante el kit comercial "High Puré Plasmid Isolation Kit' (Roche), que se ha adaptado para la extracción de plásmidos en levadura, ya que dicho kit es específico para purificación de plásmidos en bacterias. Se resuspendió el pellet de los transformantes de levaduras seleccionados en el medio selectivo SD-AHTL+5-FoA+3- AT en 250 μΙ de la solución 1 del kit "High Puré Plasmid Isolation Kif (Roche) y se añadieron 10μΙ de zimoliasa 50 mg/ml que se incubó durante 30 min a 37 °C para digerir la pared celular de la levadura. Posteriormente, se añadió la solución 2 de dicho kit y se siguieron las instrucciones del fabricante hasta la obtención del ADN plasmídico purificado. El ADN plasmídico purificado de cada transformante comprende una mezcla del plásmido pGBKT7-GKRP (que comprende un marcador de resistencia a kanamicina) y del plásmido pACT2-GK-3xPTAP con la secuencia génica GK mutada (que comprende un marcador de resistencia a ampicilina). Posteriormente, de dicha mezcla se aisla el plásmido con la secuencia nucleotídica que codifica para la GK mutada. Para ello, se transforma mediante la metodología estándar del cloruro de rubidio la cepa de E. coli DH5a con 10μΙ de la mezcla del ADN plasmídico extraído tal y como se ha mencionado anteriormente. Después de un choque térmico de 2 min a 37°C, se cultivan dichas células bacterianas transformadas en una placa con medio de cultivo LB en presencia de 5C^g/ml ampicilina para seleccionar únicamente aquéllos transformantes bacterianos que habían incorporado el plásmido pACT2-GK-3xPTAP que presentaba las mutaciones missense.
A continuación, se purificó el plásmido pACT2-GK-3xPTAP que comprende las mutaciones missense con el kit "High Puré Plasmid Isolation Kif (Roche). Para ello, se cultivó un transformante bacteriano de cada placa de transformación en 5ml_ de medio LB con ampicilina y se purificó el plásmido siguiendo las instrucciones del fabricante. Finalmente, se comprobó con el enzima de restricción BamH1 que el plásmido pACT2- GK-3xPTAP mutado presenta el mismo patrón de restricción que el plásmido parental pACT2-GK-3xPTAP (SEQ ID NO: 14) no mutado. En el presente ejemplo, los 19 plásmidos purificados que presentan la secuencia nucleotídica GK mutada mediante la técnica de PCR mutagénica y recombinación in vivo "gap-repair", liberaron 2 fragmentos de 8.2 Kb y 1.4 Kb cada uno, al igual que el plásmido pACT2-GK-3xPTAP parental (SEQ ID NO: 14) que no presentaba las mutaciones.
1.6. Validación del método de doble híbrido en reverso de la invención con el sistema de doble híbrido clásico.
Mediante el sistema de doble híbrido clásico (ensayo de actividad β-galactosidasa en filtro) se ha confirmado que los 19 plásmidos pACT2-GK-3xPTAP que comprenden la secuencia de la proteína GK mutada, no interaccionan con el plásmido pGBKT7- GKRP, es decir existe una pérdida de la interacción entre las proteínas GK-GKRP, esto indica que la mutación en la secuencia nucleotídica que codifica para la proteína GK es una mutación missense que bloquea su interacción con la proteína GKRP. Pero, por otro lado, mediante el sistema de doble híbrido clásico se ha confirmado que los plásmidos pACT2-GK-3xPTAP que comprenden la secuencia de la proteína GK mutada, si interaccionan con el plásmido pLexA(1-202)PL-TSG101 de SEQ ID NO: 33, a través de la unión a TSG101-3xPTAP, lo que demuestra que estas mutaciones son missense y no producen un truncamiento de la proteína. Para validar los resultados obtenidos mediante el sistema de doble híbrido en reverso descrito en la presente invención, ejemplificado en la detección de mutaciones missense que bloquean la interacción entre las proteína GK codificada por el plásmido pACT2-GK-3xPTAP y la proteína GKPR codificada por el plásmido pGBKT7-GKRP, mediante el sistema de doble híbrido clásico, se ha utilizado la cepa de levadura Y187 (Clontech) que comprende el reportero lacZ bajo el control de UASGal. Por otro lado, para validar la unión entre la proteína TSG101 codificada por el plásmido pLexA(1- 202)PL-TSG101 (SEQ ID NO: 33), y el péptido 3xPTAP codificado por el plásmido pACT2-GK-3xPTAP, que comprende la secuencia GK mutada, se ha utilizado la cepa de levadura CTY10-5d (Cellular interactions in development: a practica! approach ed. D.A. Hartley Oxford: Oxford University Press 153-17) que comprende el reportero lacZ bajo el control de lexAop. En ambos casos, se han realizado ensayos de la actividad β-galactosidasa en filtro para cuantificar la activación de los reporteros.
Brevemente, para llevar a cabo dicho análisis de interacción, se transformaron las cepas de levadura mencionadas, Y187 (Clontech) y CTY10-5d, siguiendo el protocolo con acetato de litio descrito previamente, pero utilizando las mezclas siguientes:
- 50 μΙ de una suspensión de la cepa de levadura Y187 (Clontech) en TELiAc + 2 μΙ (20 μ9) de ADN carrier + 1 μΙ (100 ng) del plásmido pGBKT7-GKRP (SEQ ID NO: 6) + 1 μΙ (100 ng) del plásmido pACT2-GK-3xPTAP muíante aislado según se ha descrito previamente. Como controles negativos y positivos, hemos co- transformado también pGBKT7-GKRP + pACT2, así como pGBKT7-GKRP + pACT2-GK-3xPTAP (original, no mutado). La mezcla de transformación se sembró en una placa de medio mínimo sin triptófano, leucina y uracilo (SD- TLU) ya que la cepa Y187 es capaz de sintetizar uracilo y los marcadores de los dos plásmidos son TRP1 y LEU2.
- 50 μΙ de suspensión de la cepa de levadura CTY10-5d en TELiAc + 2 μΙ (20 μg) de ADN carrier + 1 μΙ (100ng) del plásmido pLexA(1-202)PL-TSG101 + 1 μΙ (100 ng) del plásmido pACT2-GK-3xPTAP muíante. Como controles negaíivos y posiíivos, hemos co-íransformado íambién pLexA(1-202)PL-TSG101 + pACT2, así como pLexA(1-202)PL-TSG101 + pACT2-GK-3xPTAP (original, no mutado). La mezcla de transformación se sembró en una placa de medio mínimo sin histidina, leucina y uracilo (SD-HLU) ya que la cepa CTY10-5d es capaz de sintetizar uracilo y los marcadores de los dos plásmidos son HIS3 y LEU2. Después de 3-4 días de cultivo a una temperatura de 30°C, replicamos de 8-10 transformantes de cada mezcla de transformación a placas con los medios de cultivo SD-TLU o SD-HLU, y se mantuvieron en cultivo durante 2 días a 30 °C. Transcurrido dicho tiempo se llevó a cabo el ensayo de actividad β-galactosidasa en filtro (Breeden L, Nasmyth K. Cold Spring Harb Symp Quant Biol. 1985;50:643-50) para cuantificar la activación de los reporteros. Para ello se colocó un filtro de nitrocelulosa encima de la placa de cultivo para transferir, mediante aplicación suave, la levadura al filtro. Se incubó el filtro a -80 °C durante 1 h para permeabilizar las células y posteriormente se colocó el filtro encima de papel Whatman 3MM mojado en tampón Z (Na2HP04 60 mM, NaH2P04 40 mM, KCI 10 mM, MgS04 1 mM, β-mercaptoetanol 38 mM) con 0.1 % X- Gal y se incubó durante 1 h a 30 °C. La interacción entre las proteínas produce la activación del gen reportero lacZ, y en consecuencia la expresión de la β- galactosidasa y la hidrólisis del X-Gal en un compuesto de color azul.
Los resultados obtenidos indican que en todos los casos, es decir con los 19 plásmidos pACT2-GK-3xPTAP que comprenden la secuencia codificante de la proteína GK mutada, no se detecta actividad β-galactosidasa en la cepa Y187 co- transformada con cada uno de estos plásmidos y con pGBKT7-GKRP, lo que confirma el hecho de que las proteínas GKRP y GK mutadas no interaccionan en el sistema de doble-híbrido clásico y no activan el reportero que comprende lacZ bajo el control de UASGal. Este resultado indica que la selección de mutaciones en GK que bloquean su interacción con GKRP ha sido eficiente al 100% con este método. Por otra parte, los resultados obtenidos indican que en todos los casos, se detecta actividad β- galactosidasa en la cepa CTY10-5d co-transformada con cada uno de estos plásmidos y pLexA(1-202)PL-TSG101 , lo que confirma el hecho de que las proteínas TSG101 y GK mutadas siguen interaccionando mediante la unión entre TSG101 y el péptido 3xPTAP fusionado al extremo C-terminal de GK y activan el reportero que comprende lacZ bajo el control de lexAop. Este resultado demuestra que la selección de mutaciones missense en GK que no truncan la proteína y en consecuencia no eliminan el péptido 3xPTAP ha sido eficiente al 100% con este método. En conjunto, estos resultados muestran que la selección de mutaciones missense en GK que bloquean su interacción con GKRP ha sido eficiente al 100% con este método. En la Figura 4, se presentan los ensayos de la actividad β-galactosidasa en filtro para 10 de los mutantes seleccionados. Ejemplo 2. Identificación de las mutaciones missense presentes en la secuencia que codifica para la proteína GK y que impiden su unión a la proteína GKRP.
Las mutaciones missense en los 19 plásmidos mutados aislados y validados con el sistema de doble-híbrido clásico según se ha descrito anteriormente, han sido identificadas mediante secuenciación del inserto que comprende el gen de la GK en cada plásmido. Los oligonucleótidos utilizados para la secuenciación y la identificación de las mutaciones missense en la secuencia nucleotídica del gen que codifica para la proteína GK fueron los siguientes: SEQ ID NO: 46 (OV284) (5'- CG ATG ATG AAGATACCCCACC-3') , que híbrida 67bp corriente arriba del polylinker donde la secuencia nucleotídica del gen GK está clonada y SEQ ID NO: 47 (OV285) (5'-GAGATGGTGCACGATGCACAG-3') , que híbrida 120bp corriente abajo del polylinker donde la secuencia nucleotídica del gen GK está clonada.
Por otro lado, también se han identificado mediante secuenciación las mutaciones presentes en 5 transformantes adicionales, diferentes a los 19 anteriores y procedentes de la transformación con el producto de PCR obtenido con la ADN polimerasa Taq. Para estos 5 transformantes adicionales, el plásmido analizado no ha sido extraído ni validado previamente en el sistema de doble-híbrido clásico. El inserto que comprende el gen de la GK mutado ha sido amplificado directamente desde el ADN plasmídico extraído de los 5 transformantes adicionales y secuenciado. Teniendo en cuenta la alta eficiencia del sistema de doble híbrido en reverso descrito en la presente invención (100% de positivos detectados- 100% mutaciones de tipo missense con los 19 transformantes), el hecho de poder amplificar y secuenciar directamente el ADN plasmídico, sin tener que aislar el plásmido y validarlo permite ahorrar tiempo. La extracción del plásmido mutado y su validación con el sistema de doble-híbrido clásico puede llevarse a cabo posteriormente, una vez que la mutación haya sido identificada, lo que evita validar mutantes repetidos o ya conocidos.
La identificación de las mutaciones en los 5 transformantes adicionales ha sido realizada de la forma siguiente: Extracción del ADN plasmídico de los transformantes de levadura seleccionados mediante el sistema de doble híbrido en reverso de la invención (ver apartado 1.5) y utilización de este ADN como molde para amplificar el gen de la GK mediante PCR con los oligonucleótidos utilizados para la secuenciación (SEQ ID NO: 46 (OV284) y SEQ ID NO: 47 (OV285)). Posteriormente se secuencia el producto de PCR amplificado con estos mismos oligonucleótidos para identificar la ó las mutaciones presentes en el inserto.
La secuenciación del total de los 24 clones analizados (19+5) junto con los ensayos de validación con el sistema de doble híbrido clásico ha demostrado que todos ellos comprenden mutaciones missense que provocan una pérdida de interacción entre la GK y la GKRP. Esto demuestra la eficacia del método ya que el 100% de los clones analizados, un total de 24, comprenden mutaciones missense en el gen de la GK que bloquean su interacción con la proteína GKRP. Los resultados obtenidos con la secuenciación de los 24 mutantes analizados ha permitido la identificación de 21 mutaciones missense responsables de la pérdida de la interacción de la proteína GK con la proteína GKRP (Tabla 1). Varias de estas mutaciones están repetidas y algunos clones que comprendían varias mutaciones no han sido caracterizados.
Tabla 1. Mutaciones missense identificadas en la proteína GK que impiden la interacción con la proteína GKRP (substituciones aa).
Substitución Repetición
A201V 1
T60A 2
G72W 1
G72E 1
S64P 4
L75P 4
T209P 1
C220R 1
C233Y 1
C252Y 3
G407D 1 Substitución Repetición
L306R 1
La secuenciación de los 24 mutantes muestra que la frecuencia de mutaciones missense en cada clon es distinta en función de la ADN polimerasa utilizada. La situación óptima seria obtener una única mutación missense en la secuencia codificante de la GK (1.5 Kb). En el caso de que sean varias, es necesario analizar en el sistema de doble híbrido clásico el efecto de cada mutación de forma aislada para saber cuál es la responsable de la pérdida de interacción. En este caso, los plásmidos que comprendían una sola mutación se han obtenido mediante mutagénesis dirigida.
Utilizando la ADN polimerasa Mutazyme II, se han obtenido cerca de 2 mutaciones missense por Kb de media. En el caso de la ADN polimerasa Taq, se han obtenido una media de 1 mutación missense por Kb (la mitad que con Mutazyme II). Esta diferencia es consistente con el hecho de que se han obtenido 10 veces menos transformantes en el medio selectivo SD-AHTL+5-FoA+3-AT cuando se ha utilizado la ADN polimerasa Taq que cuando se ha utilizado la ADN polimerasa Mutazyme II. Aunque el resultado con Taq es mejor en cuanto a frecuencia de mutaciones, esta polimerasa presenta un espectro mutacional con una fuerte tendencia para los cambios AT a GC, lo que hace que muchas de las mutaciones obtenidas se repitan. Así, tal y como muestran los resultados obtenidos, la ADN polimerasa Taq da lugar a un 70% de mutaciones missense repetidas, mientras que la ADN polimerasa Mutazyme II solo da lugar a un 40% de mutaciones repetidas.
Una vez identificadas las mutaciones missense que impiden la unión entre las proteínas GK y GKRP, se procedió a comparar dichas mutaciones con la estructura ya conocida del complejo GK-GKPR (Choi JM et al. Proc Nati Acad Sci U S A. 2013 Jun 18; 110(25): 10171 -6), poniéndose de manifiesto la buena correlación existente entre los resultados obtenidos en la identificación de mutaciones missense mediante el método de doble híbrido en reverso de la invención y la estructura del complejo, ya que:
- los residuos aminoacídicos Ala201 y Thr60 se localizan junto con el bolsillo hidrofóbico de la GK que media la interacción con GKRP (Proc Nati Acad Sci U S A. 2006 Sep 5; 103(36): 13368-73), el residuo aminoacídico Gly72 está próximo a los residuos aminoacídicos Ala201 y Thr60, y el puente de hidrogeno que forma con el residuo aminoacídico Tyr215 parece estabilizar la conformación súper-abierta de la GK que interacciona con GKRP (J Biol Chem. 2006 Dec 29;281 (52):40201-7), las sustituciones a prolinas de los residuos S64P, L75P y T209P, pueden tener un efecto indirecto en la rotura de la interacción (vía Thr60, Gly72 y Ala201), ya que el residuo Ser64 se localiza en la lámina beta adyacente a Thr60 mientras que Leu75 y Thr209 se localizan en láminas beta adyacentes a los motivos conteniendo Gly72 y Ala201 , y debido a la interrupción de estas láminas beta por los residuos de prolina,
los residuos de cisteína: Cys220, Cys233 y Cys252, forman parte de un anillo de 5 residuos de cisteína, próximo al bolsillo hidrofóbico y probablemente implicados en la formación de puentes disulfuro y en el mantenimiento de la conformación de la GK (Arch Biochem Biophys. 2000 Mar 15;375(2):251-60). Además, el residuo aminoacídico Gly407 se localiza junto al anillo de residuos de cisteína.
Ejemplo 3. Comparación entre sistema de doble híbrido en reverso de la invención que comprende el gen reportero de contra-selección URA3 respecto al mismo sistema de doble híbrido en reverso pero utilizando como sistema de contra-selección el gen represor TetR.
Para poner de manifiesto que los reporteros de selección utilizados en el sistema de doble híbrido de la invención presentan ventajas adicionales sorprendentes respecto de otros reporteros conocidos en el estado de la técnica, se ha probado un sistema alternativo a la contra-selección con el gen reportero URA3 y 5-FoA, basado en el gen represor TetR (Shih HM et al. Proc Nati Acad Sci U S A. 1996;93: 13896-901). En este sistema de doble híbrido en reverso alternativo, la unión de las proteínas interaccionantes a estudiar activa la transcripción de TetR que reprime la transcripción del reportero ADE2. En consecuencia, siguiendo con el ejemplo mostrado en la presente invención, una mutación missense en la secuencia codificante de la proteína GK que bloquea su interacción con GKRP activa el reportero ADE2, lo que permite el crecimiento de la cepa en ausencia de adenina. Para probar este sistema, se ha integrado la proteína de fusión ADH1::LexA-TSG101 en el locus URA3 de la cepa LY26 (Thomas LR et al. J Biol Chem. 2002;277:34343-8) para obtener la cepa OVY158 {MATalpha canl his3 Ieu2 met15 trpl ura3 gal4::hisG gal80::hisG LYS2::LexA(op)-HIS3 TetO-ADE2 ho::KanMX::GAL 1-TetR URA3::LexA-TSG101).
En este caso, la pérdida de interacción entre las proteínas GK y GKRP se selecciona mediante crecimiento en un medio selectivo con ausencia de adenina (medio de cultivo mínimo (SD) con arginina y metionina como únicos requerimientos y 1 mM 3- AT) en vez de crecimiento en presencia de 5-FoA. Se ha observado que este sistema de doble híbrido en reverso utilizando como método de contra-selección TetR en lugar de URA3 y 5-FoA no es tan eficiente como el sistema de doble híbrido en reverso con 5-FoA, ya que el crecimiento de los clones no mutados no está completamente bloqueado apareciendo en los cultivos colonias más pequeñas. Para intentar solucionar este problema se ha utilizado sacarosa como fuente de carbono, en lugar de glucosa, intentando así eliminar el efecto negativo de la glucosa sobre el promotor GAL1 y, en consecuencia la expresión del reportero TetR, se ha resuelto sólo parcialmente este problema, pero este sistema es menos eficiente que el sistema que utiliza URA3 y 5-FoA, ya que mediante el uso de TetR se obtienen un 15% de falsos positivos, mientras que, como hemos mencionado anteriormente, mediante el sistema de doble híbrido en reverso utilizando URA3, HIS3 y 5-FoA, descrito en la presente invención no se obtienen falsos positivos.

Claims

REIVINDICACIONES
Método in vitro para identificar al menos una mutación missense en una proteína de referencia donde dicha mutación afecta a la capacidad de unión de dicha proteína de referencia con otra proteína diana, donde dicho método comprende: a) al menos una célula huésped que comprende integrado en su genoma: i) Una primera secuencia nucleotídica que codifica para un gen reportero, donde dicha secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia nucleotídica reconocida por una proteína que se une al ADN, ii) Una segunda secuencia nucleotídica que codifica para un segundo gen reportero, donde dicha segunda secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia nucleotídica reconocida por una proteína que se une al ADN, con la condición de que dicha secuencia nucleotídica sea reconocida por un dominio de unión al ADN distinto del de i), y iii) Una tercera secuencia nucleotídica que codifica para una primera proteína de fusión que comprende el dominio de unión al ADN de ii) y una proteína heteróloga, capaz de unirse a un péptido funcional localizado en el extremo C-terminal de la proteína de referencia de estudio, donde la secuencia nucleotídica que codifica para dicha primera proteína de fusión está operativamente unida a un promotor, b) Pre-transformar la célula de la etapa a) con un plásmido que comprende la secuencia nucleotídica que codifica para una segunda proteína de fusión que comprende el dominio de unión al ADN de i) y la proteína diana, donde la secuencia nucleotídica que codifica para dicha segunda proteína de fusión está operativamente unida a un promotor, c) Cultivar la célula de la etapa b) bajo condiciones que permitan exclusivamente el crecimiento de las células que hayan incorporado el plásmido de la etapa b), d) Transformar la célula de la etapa c) con un vector linearizado y al menos un fragmento de ADN que previamente ha sido sometido a mutagénesis y que comprende la secuencia nucleotídica que codifica para la proteína de referencia con al menos una mutación, donde entre el vector linearizado y el fragmento de ADN sometido a mutagénesis se produce recombinación homologa obteniéndose un plásmido que comprende la secuencia nucleotídica que codifica para una tercera proteína de fusión que comprende el dominio de transactivación de Gal4 y la proteína de referencia con al menos una mutación, donde la secuencia nucleotídica que codifica para dicha tercera proteína de fusión está operativamente unida a un promotor, e) Cultivar la célula de la etapa d) bajo condiciones tales que permitan exclusivamente el crecimiento de las células que presentan mutaciones missense que impiden la unión entre la proteína de referencia y la proteína diana, f) Comparar la secuencia de la proteína de referencia mutada con la secuencia de la proteína de referencia wild-type e identificar la mutación missense que impide la unión de la proteína de referencia con la proteína diana.
Método según la reivindicación 1 donde el procedimiento de mutagénesis al que ha sido sometido el fragmento de ADN de la etapa d) es un procedimiento de mutagénesis in vitro o in vivo.
Método según la reivindicación 1 donde el plásmido de la etapa d) se obtiene mediante recombinación in vivo "gap-repait" .
Método según cualquiera de las reivindicaciones 1 a 3 donde el gen reportero se selecciona de entre genes reporteros de selección positiva y genes reporteros de contra-selección.
Método según la reivindicación 4 donde los genes reporteros de selección positiva se seleccionan del grupo que consiste en: HIS3, LEU2, URA3, ADE2, TRP1, LYS2 y LYS5; y los genes reporteros de contra-selección se seleccionan del grupo que consiste en: URA3, TRP1, LYS2, LYS5, CYH2, CAN1, GAL1 y mazF.
6. Método según la reivindicación 5 donde el gen reportero de selección positiva es el gen HIS3, y el gen reportero de contra-selección es el gen URA3 7. Método según cualquiera de las reivindicaciones 1 a 6 donde las secuencias de reconocimiento para dominios de unión al ADN comprenden los sitios de unión de una proteína seleccionada de entre cualquiera de las siguientes: Gal4, LexA y Ace1.
8. Método según cualquiera de las reivindicaciones 1 a 7 donde la secuencia nucleotídica que codifica para un dominio de transactivación comprende los dominios de activación transcripcional de una proteína seleccionada de entre cualquiera de las siguientes: Gal4, VP16 y Acel
9. Método según cualquiera de las reivindicaciones 1 a 8 donde los promotores son promotores constitutivos. 10. Método según la reivindicación 9 donde los promotores constitutivos se seleccionan de entre cualquiera de la lista que consiste en: ADH1, PGK1, TEF1, TPI1, HXT7, TDH3 y PYK1.
1 1. Método según cualquiera de las reivindicaciones 1 a 10 donde la proteína heteróloga es la proteína de SEQ ID NO: 32, y el péptido funcional es el péptido de SEQ ID NO: 12.
12. Método según cualquiera de las reivindicaciones 1 a 11 donde la primera proteína de fusión es la proteína de SEQ ID NO: 49.
13. Método según cualquiera de las reivindicaciones 1 a 12 donde la segunda proteína de fusión es la proteína de SEQ ID NO: 51. 14. Método según cualquiera de las reivindicaciones 1 a 13 donde la célula se selecciona del grupo que consiste en: célula de levadura, célula bacteriana y célula de mamífero.
15. Método según la reivindicación 14 donde la célula de levadura se selecciona del grupo que consiste en Yarrowia lipolytica, Pichia pastoris y Scacharomyces cerevisiae, preferentemente la célula de levadura pertenece a la especie S. cerevisiae.
16. Método según cualquiera de las reivindicaciones 1 a 15 donde la célula es OVY216.
17. Método según cualquiera de las reivindicaciones 1 a 16 caracterizado por que las células que presentan al menos una mutación missense, crecen en un medio de cultivo que comprende 5-FoA y 3-AT, y carece de triptófano, leucina, adenina e histidina.
18. Método según cualquiera de las reivindicaciones 1 a 17 donde la identificación de las mutaciones missense, se lleva a cabo mediante técnicas de amplificación y secuenciación.
19. Célula huésped que comprende integrado en su genoma: i) Una primera secuencia nucleotídica que codifica para un gen reportero, donde dicha secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN, ii) Una segunda secuencia nucleotídica que codifica para un segundo gen reportero, donde dicha segunda secuencia nucleotídica está operativamente unida a un promotor que comprende una secuencia de reconocimiento para una proteína que se une al ADN, con la condición de que dicha secuencia de reconocimiento sea diferente de la secuencia de reconocimiento de i), y iii) Una tercera secuencia nucleotídica que codifica para una primera proteína de fusión que comprende el dominio de unión al ADN de ii) y una proteína heteróloga capaz de unirse a un péptido funcional localizado en el extremo C-terminal de la proteína de referencia, donde la secuencia nucleotídica que codifica para dicha primera proteína de fusión está operativamente unida a un promotor.
20. Célula huésped según la reivindicación 17, donde el gen reportero se selecciona de la lista que consiste en genes reporteros de selección positiva y genes reporteros de contra-selección.
21. Célula huésped según la reivindicación 20 donde los genes reporteros de selección positiva se seleccionan del grupo que consiste en: HIS3, LEU2, URA3, ADE2, TRP1, LYS2, LYS5; y los genes reporteros de contra-selección se seleccionan del grupo que consiste en: URA3, TRP1, LYS2, LYS5, CYH2, CAN1, GAL1, mazF.
22. Célula huésped según la reivindicación 21 donde el gen reportero de selección positiva es el gen HIS3, y el gen reportero de contra-selección es el gen URA3
23. Célula huésped según cualquiera de las reivindicaciones 19 a 22 donde las secuencias de reconocimiento para dominios de unión al ADN comprenden los sitios de unión de una proteína seleccionada de entre cualquiera de las siguientes: Gal4, LexA y Acel
24. Célula huésped según cualquiera de las reivindicaciones 19 a 23 donde la secuencia nucleotídica que codifica para un dominio de transactivación comprende los dominios de activación transcripcional de una proteína seleccionada de entre cualquiera de las siguientes: Gal4, VP16 y Ace1.
25. Célula huésped según cualquiera de las reivindicaciones 19 a 24 donde los promotores son promotores constitutivos.
26. Célula huésped según la reivindicación 25 donde los promotores constitutivos se seleccionan de entre cualquiera de la lista que consiste en: ADH1, PGK1, TEF1, TPI1, HXT7, TDH3 y PYK1.
27. Célula huésped según cualquiera de las reivindicaciones 19 a 26 donde la proteína heteróloga es la proteína de SEQ ID NO: 32, y el péptido funcional es el péptido de SEQ ID NO: 12.
28. Célula huésped según cualquiera de las reivindicaciones 19 a 27 donde la primera proteína de fusión es la proteína de SEQ ID NO: 49.
29. Célula huésped según cualquiera de las reivindicaciones 19 a 28 dónde la célula se selecciona del grupo que consiste en: célula de levadura, célula bacteriana y célula de mamífero.
30. Célula huésped según la reivindicación 29 donde la célula de levadura se selecciona del grupo que consiste en: Yarrowia lipolytica, Pichia pastoris y Saccharomyces cerevisiae, preferentemente la célula de levadura pertenece a la especie S. cerevisiae.
31. Célula huésped según cualquiera de las reivindicaciones 19 a 30 dónde la célula es la célula de levadura OVY216.
32. Construcción génica que comprende las secuencias nucleotídicas que codifican para: i) un promotor ii) un dominio de unión al ADN, y iii) la proteína heteróloga capaz de unirse a un péptido funcional localizado en el extremo C-terminal de la proteína de referencia.
33. Construcción génica según la reivindicación 26 donde el promotor es un promotor constitutivo, preferentemente el promotor de ADH1, el dominio de unión al ADN es preferentemente el dominio de unión de la proteína LexA, y la proteína heteróloga es preferentemente la proteína humana TSG101 que comprende la SEQ ID NO: 32.
34. Construcción génica según cualquiera de las reivindicaciones 32 a 33 caracterizada por que es un plásmido, preferentemente el plásmido pRS402- LexA-Tsg101 que comprende la secuencia SEQ ID NO: 30.
35. Construcción génica que comprende las secuencias nucleotídicas que codifican para: i) un promotor ii) un dominio de transactivación y iii) una proteína de referencia que en su extremo carboxilo terminal comprende la secuencia que codifica para el péptido funcional 3xPTAP de SEQ ID NO: 12.
36. Construcción génica según la reivindicación 35 donde el promotor es un promotor constitutivo, preferentemente el promotor de ADH1, el dominio de transactivación es preferentemente el dominio de transactivación del activador transcripcional Gal4, y la proteína de referencia que comprende en su extremo carboxilo terminal la secuencia que codifica para el péptido funcional 3xPTAP de SEQ ID NO: 12.
37. Construcción génica según las reivindicaciones 35 a 36 caracterizada por que es un plásmido, preferentemente el plásmido pACT2-GK-3xPTAP que comprende la secuencia SEQ ID NO: 14.
38. Construcción génica que comprende las secuencias nucleotídicas que codifican para: i) un promotor ii) un dominio de unión al ADN, y iii) una proteína diana a la que se une la proteína de referencia.
39. Construcción génica según la reivindicación 38 donde el promotor es un promotor constitutivo, preferentemente el promotor es el promotor de ADH1, el dominio de unión al ADN es preferentemente el del activador transcripcional Gal4, y la proteína diana.
40. Construcción génica según cualquiera de las reivindicaciones 38 a 39 caracterizada por que es un plásmido, preferentemente el plásmido PGBKT7- GKRP que comprende la secuencia SEQ ID NO: 6.
PCT/ES2017/070298 2016-05-11 2017-05-11 Método de doble híbrido en reverso para la identificación de mutaciones missense WO2017194810A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ESP201630607 2016-05-11
ES201630607A ES2646388B1 (es) 2016-05-11 2016-05-11 Método de doble híbrido en reverso para la identificación de mutaciones missense

Publications (1)

Publication Number Publication Date
WO2017194810A1 true WO2017194810A1 (es) 2017-11-16

Family

ID=60267914

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2017/070298 WO2017194810A1 (es) 2016-05-11 2017-05-11 Método de doble híbrido en reverso para la identificación de mutaciones missense

Country Status (2)

Country Link
ES (1) ES2646388B1 (es)
WO (1) WO2017194810A1 (es)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997023609A1 (en) * 1995-12-21 1997-07-03 Amersham International Plc Improvements relating to assay systems
WO2002072790A2 (en) * 2001-03-14 2002-09-19 Myriad Genetics, Inc Tsg101-gag interaction and use thereof
US20050053913A1 (en) * 1995-04-11 2005-03-10 The Johns Hopkins University, A Maryland Corporation Reverse two-hybrid systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050053913A1 (en) * 1995-04-11 2005-03-10 The Johns Hopkins University, A Maryland Corporation Reverse two-hybrid systems
WO1997023609A1 (en) * 1995-12-21 1997-07-03 Amersham International Plc Improvements relating to assay systems
WO2002072790A2 (en) * 2001-03-14 2002-09-19 Myriad Genetics, Inc Tsg101-gag interaction and use thereof

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
GALAN, M. ET AL.: "Effects of novel maturity-onset diabetes of the young (MODY)-associated mutations on glucokinase activity and protein stability", BIOCHEMICAL JOURNAL, vol. 393, no. Pt 1, 2006, pages 389 - 396, XP055442103, ISSN: 0264-6021 *
INOUYE, C. ET AL.: "Mutational analysis of STE5 in the yeast Saccharomyces cerevisiae: application of a differential interaction trap assay for examining protein-protein interactions", GENETICS, vol. 147, no. 2, 1997, pages 479 - 492, XP055442087 *
KIM, J.Y. ET AL.: "One- plus two-hybrid system, a novel yeast genetic selection for specific missense mutations disrupting protein/protein interactions", MOLECULAR & CELLULAR PROTEOMICS, vol. 6, no. 10, 2007, pages 1727 - 1740, XP055233181, ISSN: 1535-9476 *
PUTHALAKATH, H. ET AL.: "Rapid selection against truncation mutants in yeast reverse two-hybrid screens", BIOTECHNIQUES, vol. 30, no. 5, 2001, pages 984 - 988, XP002969848, ISSN: 0736-6205 *
SHIH, H.M. ET AL.: "A positive genetic selection for disrupting protein-protein interactions: identification of CREB mutations that prevent association with the coactivator CBP", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, vol. 93, no. 24, 1996, pages 13896 - 13901, XP002916531, ISSN: 0027-8424 *
WHITE, M.A.: "The yeast two-hybrid system: forward and reverse", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, vol. 93, no. 19, 1996, pages 10001 - 10003, XP000749721, ISSN: 0027-8424 *

Also Published As

Publication number Publication date
ES2646388A1 (es) 2017-12-13
ES2646388B1 (es) 2018-10-15

Similar Documents

Publication Publication Date Title
Buck et al. Action of a RAP1 carboxy-terminal silencing domain reveals an underlying competition between HMR and telomeres in yeast.
Strubin et al. Yeast and human TFIID with altered DNA-binding specificity for TATA elements
Runge et al. TEL2, an essential gene required for telomere length regulation and telomere position effect in Saccharomyces cerevisiae
Le et al. Two new S‐phase‐specific genes from Saccharomyces cerevisiae
Peciña et al. Targeted stimulation of meiotic recombination
Spingola et al. A yeast intronic splicing enhancer and Nam8p are required for Mer1p-activated splicing
Lutfiyya et al. Two zinc-finger-containing repressors are responsible for glucose repression of SUC2 expression
Siegele et al. Altered promoter recognition by mutant forms of the σ70 subunit of Escherichia coli RNA polymerase
JP2005500841A (ja) オリゴヌクレオチドを用いるインビボ部位指定変異誘発のためのシステム
Kaliappan et al. A novel role for RAD54: this host protein modulates geminiviral DNA replication
AU2016211118A1 (en) Method for inducing targeted meiotic recombinations
Geyer et al. [13] Selection of genetic agents from random peptide aptamer expression libraries
WO2006054766A1 (ja) 耐熱性多頻度dna切断酵素の細胞内活性化によるゲノム再編成の誘発方法
Kilaru et al. Yeast recombination-based cloning as an efficient way of constructing vectors for Zymoseptoria tritici
Garbacz et al. Fidelity consequences of the impaired interaction between DNA polymerase epsilon and the GINS complex
US6048693A (en) Phenotypic assays of cyclin/cyclin-dependent kinase function
Einerhand et al. The upstream region of the FOX3 gene encoding peroxisomal 3-oxoacyl-coenzyme A thiolase in Saccharomyces cerevisiae contains ABF1-and replication protein A-binding sites that participate in its regulation by glucose repression
Mountain et al. The general amino acid control regulates MET4, which encodes a methionine‐pathway‐specific transcriptional activator of Saccharomyces cerevisiae
DOMINGUEZ et al. Structural and functional similarities between the central eukaryotic initiation factor (eIF) 4A-binding domain of mammalian eIF4G and the eIF4A-binding domain of yeast eIF4G
EP0868509A1 (en) Improvements relating to assay systems
ES2646388B1 (es) Método de doble híbrido en reverso para la identificación de mutaciones missense
JPWO2006046694A1 (ja) 誘導可能に発現するエルゴステロール合成酵素を有する酵母を利用した遺伝子のスクリーニング法
Jaszczur et al. Defective interaction between Pol2p and Dpb2p, subunits of DNA polymerase epsilon, contributes to a mutator phenotype in Saccharomyces cerevisiae
Bardhan Complex regulation of sister kinetochore orientation in meiosis-I
Florio et al. A study of biochemical and functional interactions of Htl1p, a putative component of the Saccharomyces cerevisiae, Rsc chromatin-remodeling complex

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17795668

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 17795668

Country of ref document: EP

Kind code of ref document: A1