WO2022043598A1 - PROTEÍNA QUIMÉRICA RELAXASA–Cas - Google Patents

PROTEÍNA QUIMÉRICA RELAXASA–Cas Download PDF

Info

Publication number
WO2022043598A1
WO2022043598A1 PCT/ES2021/070626 ES2021070626W WO2022043598A1 WO 2022043598 A1 WO2022043598 A1 WO 2022043598A1 ES 2021070626 W ES2021070626 W ES 2021070626W WO 2022043598 A1 WO2022043598 A1 WO 2022043598A1
Authority
WO
WIPO (PCT)
Prior art keywords
cas
protein
crispr
relaxase
fusion protein
Prior art date
Application number
PCT/ES2021/070626
Other languages
English (en)
French (fr)
Inventor
Matxalen LLOSA BLAS
Dolores Lucía GUZMÁN HERRADOR
David Bikard
Original Assignee
Universidad De Cantabria
Instituto Pasteur
Consejo Superior De Investigaciones Cientificas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universidad De Cantabria, Instituto Pasteur, Consejo Superior De Investigaciones Cientificas filed Critical Universidad De Cantabria
Publication of WO2022043598A1 publication Critical patent/WO2022043598A1/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)

Definitions

  • the present invention falls within the general field of biotechnology and in particular relates to a relaxase-Cas protein fusion protein and its use for gene editing in different cells.
  • CRISPR-Cas Clustered Regularly/nterspaced Short Palindromic epeats-CRISPR associated proteins
  • CRISPR sequence clusters are made up of spanner sequences, separated by repeat sequences. These spacers encode guide RNAs (gRNAs), which target an exogenous DNA sequence.
  • gRNAs guide RNAs
  • the Cas proteins process these RNAs, which carry the target sequence to the Cas endonuclease, which performs a double-stranded cut in said exogenous DNA sequence. Its main biological function is therefore to defend the host bacteria from external invaders (mobile genetic elements, such as phages or plasmids).
  • CRISPR-Cas systems as a biotechnological tool is based on the introduction of a double-stranded cut in any target sequence of interest.
  • This cut considered by the cell as a danger signal, serves as a recruitment point for cellular repair systems, which can repair this wound by introducing small mutations, or incorporating foreign DNA molecules that introduce the desired information into the recipient genome.
  • site-specific nuclease systems such as Zinc or TALEN, that could be designed to act on specific sequences, but this entailed a laborious and uncertain design process and/or molecular evolution.
  • CRISPR-Cas systems are grouped into two classes (Class I and Class II) 2 , the latter being the most suitable for use as genetic modification systems, since they encode all of them in a single protein (the Cas endonuclease). the necessary functions (recognition and binding to gRNA, recognition and binding to the DNA target sequence, and performance of double-stranded cleavage).
  • Cas9 3 is the most widely used endonuclease
  • other CRISPR systems are increasingly being studied due to the advantages and differences they may have over Cas9, with Casi 2a 4 (also known as Cpf1) being one of the most studied.
  • CRISPR-Cas systems focused on the genetic editing of eukaryotic organisms (for the generation of laboratory models, or for genetic modification for therapeutic purposes), the possibilities they offer have been growing.
  • the applications of CRISPR Cas systems are practically unlimited because we can use coding DNA as a target (allowing, for example, gene modification), RNA (control of "splicing") or promoters (allowing gene regulation).
  • This versatility opens up an enormous field in the application of these systems 5 .
  • the possibility of guiding the endonuclease to a specific site in the genome can be used for localization, mutation, epigenetic modulation, diagnostic tools, chromatin interaction studies, etc.
  • CRISPR-Cas technology is not without limitations that must be overcome for its correct use.
  • the constant improvement focuses on two fundamental aspects: increasing the specificity of the endonuclease for its target (reducing the off-target effect), and improving the delivery system to the recipient cell in vivo, taking into account that both the gRNA and the endonuclease have to be delivered to the cell to be modified.
  • Cas9 There are currently different types of Cas9 that have been designed by introducing certain structural modifications that give them greater specificity, such as SpCas9, H ⁇ F ⁇ Cas9 and HypaCas9.
  • endonucleases with a higher specificity than native such as SnieperCas9.
  • gRNA modifications such as nucleotide addition or nucleotide truncation have been developed.
  • Other strategies are the addition of phosphodiester bonds or the introduction of deoxynucleotides to generate DNA-RNA hybrid guides 9 .
  • Sending DNA is characterized by being a cheap method, simple and stable. An important limitation is size; Most vectors either do not admit large amounts of DNA (such as viral vectors), or their efficiency of entry into the cell decreases greatly as they increase in size (in the case of plasmids), and only the cas9 gene already measures 4.5 Kb about. In eukaryotes, there is the additional requirement for exogenous DNA to enter the nucleus for transcription, which decreases the efficiency of genome editing. In addition, the introduction of exogenous DNA into the cell generates other problems such as the probability of integration of the DNA introduced into the target genome, or the production of protein for longer than necessary, which can lead to toxic effects, increased activity off -target or important immune responses 10 .
  • mRNA is easy to obtain by in vitro transcription. It is a more direct method than DNA, since transcription does not need to occur, and, in addition, the expression is more transient, which reduces the effects of toxicity and off-target. However, mRNA is highly unstable, and along with its transient expression, results in decreased effectiveness.
  • the vector Just as relevant as the delivery format is the method used to introduce it into the target cell (the vector).
  • AAV Adeno-Associated Virus
  • LV lentivirus
  • procanotes the use of bacterial transformation and conjugation as a means of introducing DNA into bacteria has also been explored. The advantages of the latter are that there is no size limitation and it allows in vivo delivery to a large number of hosts (depending on the conjugative system), 12 although it maintains the problems derived from DNA delivery.
  • Type IV Secretion Systems are multiprotein complexes located in bacterial membranes, involved in different processes such as the transfer of effector proteins to a eukaryotic cell during an infection 14 or of nucleoprotein complexes from a donor bacterium to another host bacterium (conjugation) 15 .
  • Bacterial conjugation is a very efficient mechanism for the horizontal transfer of DNA from a donor bacterium to a recipient bacterium through physical contact between the two, giving them high genomic plasticity 15 .
  • relaxase which is the protein responsible for starting and finishing the process, binds to its target (the oriT), cuts the DNA chain to be transferred in a specific area known as the nic site and joins convalent to it forming the relaxase-ssDNA complex (single-stranded DNA), which will be recruited by the T4SS and translocated to the recipient cell, where this relaxase will catalyze the recirculation of the transferred DNA chain 16 .
  • T3SS type 3 bacterial secretion systems
  • protein replacement works defective (also with T3SS) 17 .
  • T4SS type 3 bacterial secretion systems
  • CRISPR-Cas or similar CRISPR-Cas or similar: using the T4SS of Agrobacterium tumefaciens to introduce a plasmid encoding Cas9 into the recipient cell and gRNA 18 , or to introduce zinc finger nucleases (ZFNs).
  • the present invention solves the problems described in the state of the art since it provides a fusion protein between a Cas protein and a conjugative relaxase, which is recognized by the T4SS, in such a way that the Cas protein is translocated through the T4SS to the recipient bacterium.
  • bacterial T4SS act as in vivo delivery systems for Cas proteins.
  • the fusion protein due to its relaxase activity, can covalently bind to a DNA molecule of choice (which must contain an oriT sequence recognized by the fusion relaxase), which can encode both gRNA and DNA for edit the recipient genome.
  • the present invention relates to a fusion protein (hereinafter, fusion protein of the present invention comprising a relaxase protein linked to a Cas protein).
  • fusion protein refers to a protein, peptide or polypeptide that comprises the amino acid sequence of a relaxase or a variant thereof and a Cas protein or a variant thereof, understanding by variant of relaxase protein, any protein with relaxase function, and by variant of CRISPR/Cas protein, any Cas protein with endonuclease function.
  • the relaxase protein is the relaxase TrwC. More particularly, the relaxase is the relaxase TrwC of the conjugative plasmid R388.
  • the Cas protein is the Cas12a protein (also known as Cpf1), more particularly it is the variant AsCas12a originating from the bacterium Addam ococcus sp. BV3L6.
  • AsCas12a, Cpf1 and Cas12a will be used interchangeably.
  • the Cas12a endonuclease binds to the C-terminal end of the relaxase TrwC.
  • the fusion protein of the present invention comprises the amino acid sequence SEQ ID NO: 1 or a sequence with at least 70% identity with the amino acid sequence SEQ ID NO: 1.
  • sequence identity is understood to mean the degree of similarity between two amino acid sequences obtained by aligning the two sequences. The degree of identity is expressed as a percentage and depends on the number of common residues between the aligned sequences. The degree of identity between amino acid sequences is determined by methods well established in the state of the art, such as BLAST.
  • Proteins with at least 70% identity with the amino acid sequence SEQ ID NO: 1 are considered variants of the sequence SEQ ID NO: 1 and are also considered within the present invention. Specifically, a sequence with at least 70, 75, 80, 85, 90, 95, 100% identity with SEQ ID NO: 1. Those sequences analogous, derived or equivalent to the SEQ ID sequence are also considered within the present invention NO: 1, and comprising at least one amino acid residue altered by an addition, substitution, deletion or chemical modification of an amino acid, relative to the fusion protein of the present invention.
  • the present invention relates to a nucleotide sequence (hereinafter nucleotide sequence of the present invention), which encodes the fusion protein of the present invention.
  • nucleotide sequence encoding the fusion protein refers to a sequence of nucleotides, polynucleotides, or nucleic acids, which, under adequate expression control, it is capable of transcribing and translating the amino acid sequence of the protein of the present invention.
  • the nucleotide sequence that codes for the fusion protein comprises a nucleotide sequence according to SEQ ID NO: 2.
  • the present invention relates to an expression vector (hereinafter expression vector of the present invention) comprising the nucleotide sequence of the present invention.
  • the term "vector” refers to a nucleic acid molecule capable of transporting another nucleic acid to which it has been linked, preferably the nucleic acid of the present invention that codes for the fusion protein of the present invention and, it is operably linked to additional nucleotides such as control sequences, which provide for its expression.
  • the vector of the present invention may comprise single-stranded, double-stranded or partially double-stranded nucleic acid molecules; nucleic acid molecules comprising DNA, RNA, or both; and other varieties of polynucleotides known in the state of the art.
  • a plasmid which refers to a circular loop of double-stranded DNA into which additional DNA segments can be inserted.
  • Another type of vector is a viral vector, comprising polynucleotides to be transfected into a host cell.
  • operably linked refers to an arrangement of two or more components, wherein said components are in a relationship that allows them to function in a coordinated manner.
  • the present invention relates to a cell (hereinafter cell of the present invention) comprising the fusion protein of the present invention and/or the nucleic acid of the present invention, and/or the vector of the present invention.
  • the cell of the present invention refers to any type of cell that is susceptible to transformation, transfection, transduction, conjugation and translocation with the nucleic acid of the present invention or with the expression vector comprising said nucleic acid, or with the protein melting of the present invention.
  • the present invention relates to the CRISPR/Cas system (hereinafter, CRISPR/Cas system of the present invention) comprising the fusion protein of the present invention.
  • the CRISPR/Cas system of the present invention comprises
  • the relaxase-Cas fusion protein of the present invention where the relaxase-Cas protein is translocated to a recipient cell through a type IV bacterial secretion system.
  • CRISPR/Cas system refers to the system that comprises the elements involved in the expression and/or activity of the genes associated with CRISPR/Cas, including the nucleotide sequences that code for the guide RNA, nucleotide sequences that encode the relaxase-Cas fusion protein of the present invention.
  • guide RNA refers to a polynucleotide sequence that contains a repeated sequence, specific to each CRISPR system and a spacer sequence with complementarity with the target sequence in such a way that it is capable of hybridizing with it.
  • target sequence refers to any sequence found in the recipient cell, which has a correct protospacer adjacent motif (PAM) and which is capable of hybridizing with the guide sequence.
  • PAM protospacer adjacent motif
  • PAM protospacer adjacent motif
  • complementarity refers to the ability of a nucleic acid to form hydrogen bonds with another nucleic acid sequence in the traditional way, according to Watson and Crick, or in some other way.
  • the percentage of complementarity indicates the percentage of residues in a nucleic acid molecule that can form hydrogen bonds with another nucleic acid molecule, "sufficiently complementary” means that the degree of complementarity is at least 60%, 65%, 70% , 75%, 80%, 85%, 90%, 95%, 97%, 99%, 100%.
  • hybridization refers to a reaction in which one or more polynucleotides react to form a complex that is stabilized through the formation of hydrogen bonds between the bases of the nucleotide residues. Hydrogen bond formation occurs by base pairing according to Watson and Crick, or in any other sequence-specific manner known to one of skill in the art.
  • the type IV bacterial secretion system is that of the conjugative plasmid R388
  • the CRISPR/Cas system of the present invention comprises: a nucleotide sequence that codes for the guide RNA, the relaxase-Cas fusion protein of the present invention where the relaxase-Cas protein is translocated to the recipient cell through T4SS and, in the recipient cell, binds to the nucleotide sequence that codes for the guide RNA and hybridizes with the target DNA.
  • the CRISPR/Cas system of the present invention comprises: a nucleotide sequence that codes for the guide RNA,
  • the relaxase-Cas fusion protein of the present invention recognizes a mobilizable vector oriT sequence containing the nucleotide sequence encoding the guide RNA and translocates said DNA molecule bound to the relaxase-Cas protein via the T4SS of the present invention to the target cell where the guide RNA hybridizes with the target DNA.
  • mobilizable vector any vector which contains an origin of transfer (oriT).
  • OriT is understood as a specific nucleotide sequence, recognized by the relaxase of the conjugative system and necessary for the mobilization of the vector through the conjugative process.
  • the relaxase-Cas fusion protein of the CRISPR/Cas system of the present invention comprises the relaxase TrwC linked to endonuclease Casi 2a. More particularly, it comprises the amino acid sequence SEQ ID NO: 1.
  • the target cell is a eukaryotic cell.
  • the target cell is a prokaryotic cell.
  • the present invention relates to the fusion protein of the present invention, or to the CRISPR/Cas system of the present invention for the in vivo translocation of DNA and/or endonucleases to target cells through the T4SS of the present invention.
  • the present invention relates to the use of the fusion protein of the present invention and/or the nucleic acid of the present invention, and/or the vector of the present invention, for gene editing in cells.
  • for gene editing in eukaryotic cells for gene editing in prokaryotic cells.
  • Figure 1 shows the stability results of the fusion protein by means of Western Blot using an anti-TrwC antibody.
  • Purified TrwC protein was used as a positive control.
  • HEK293T cell lysate was used as negative control (-).
  • Cas12a and TrwC:Cas12a correspond to the cell lysates after transfecting plasmids pY010 and pLG08, respectively, into HEK293T.
  • the expected sizes are shown on the right side of the figure.
  • the upper arrow corresponds to 250 kDa and the lower one to 100 kDa.
  • Figure 2 shows the activity of Cas12a.
  • TrwC:Cas12a shows endonuclease activity in eukaryotes. Agarose gel after treating the samples with the Surveyor Mutation Detection kit. Cas12a activity is measured by the generation of different digestion bands produced by surveyor endonuclease.
  • TrwC:Cas12a shows endonuclease activity in prokaryotes. Number of transformants after coelectroporating plasmid pLG24 (pTET:trwC:cas12a) with different gRNAs under induction (+) and non-induction conditions. Data correspond to the mean of 9 independent experiments. (****, P ⁇ 0.0001).
  • Figure 3 shows the activity of the fusion protein in the recipient bacterium after its translocation by the T4SS by conjugation.
  • TrwC:Cas12a produces an increase in SOS signal in the recipient cell in the presence of a gRNA targeting the bacterial chromosome
  • a) The image shows the conjugation filters after 3 hours of conjugation under induction conditions. In the filter on the right side of the image (with gRNA target) an increase in fluorescence is observed with respect to the left side (without gRNA target).
  • b) The GFP/OD values obtained with the TECAN Infinite M200 Pro after stopping conjugation are shown on the right. (***, P ⁇ 0.0005)
  • Figure 4 shows the alignment of the sacB gene sequence of the different mutants.
  • the image shows an area of the sacB gene alignment, in which 6 sucrose-resistant mutant transconjugants (EcLG1-6) are compared with the MG1655:sacB strain.
  • EcLG1-6 sucrose-resistant mutant transconjugants
  • MG1655:sacB strain At the bottom of the alignment the PAM (underlined) and the spacer used to generate the gRNA are marked.
  • the present invention provides a stable and functional TrwC-Cas12a fusion protein, which is recognized through a bacterial Type IV Secretion System (T4SS) and translocated to a recipient cell, maintaining its activity.
  • T4SS Type IV Secretion System
  • Example 1 Design and construction of the fusion protein of the present invention
  • the Cas12a protein (also known as Cpf1), specifically the variant AsCas12a, is active in both prokaryotic and eucalyptus cells 4 .
  • This protein has a number of important differences with respect to Cas9 (the model protein par excellence), such as the PAM that it recognizes (5'-TTTN-3' instead of 5'-NGG-3') or the type of double cut that it produces on the DNA strand (sticky ends instead of blunt ones).
  • Cas12a has a molecular weight of 127kDa
  • Cas9 has a molecular weight of 163kDa. This difference is important, since when it comes to being translocated through the T4SS, it will be easier to do so with a smaller protein.
  • the conjugative relaxase of this system is a protein that allows the fusion of domains at its C-terminus without affecting its function in conjugation 22 .
  • the appropriate gene was constructed using the isothermal assembly technique 23 , removing the STOP codon from the trwC gene (amplified from plasmid pAA12 22 ) and then placing the cas 2a start codon amplified from plasmid pY010 (addgene number 69982). It should be noted that this gene has been optimized for expression in mammals, and encodes a protein that contains a nuclear signal and a C-terminal histidine tag.
  • Example 2 Stability of the fusion protein of the present invention
  • the stability of the fusion protein was checked by Western blot from HEK293T cell lysates.
  • the fusion gene was placed in a plasmid (pLG08) under the CMV promoter, which allows expression in eucahotas.
  • Plasmid pLG08 was constructed using the Isothemal Assembly cloning method (Gibson et al, 2009). For this, the trwC gene and the pY010 vector were assembled. The trwC sequence of plasmid pAA12 (in it, trwC lacks STOP codon) was amplified by PCR. The pY010 vector was amplified by PCR. The trwC fragment was assembled in front of the Cas12a start codon in pY010, under the control of the CMV promoter.
  • Plasmids pY010 (Cas12a) and pLG08 (TrwC: Cas 12a) were transfected, and a cell lysate was made. Western Blot was then performed using an anti-TrwC antibody ( Figure 1). The results showed that most of the protein was in the expected size for the fusion, indicating that the expected protein was produced, and it was stable.
  • Example 3 Activity of the fusion protein of the present invention
  • the donor bacterium corresponds to the Escherichia coli strain D1210 and the recipient to DH5a.
  • the data correspond to the mean of 4 independent experiments.
  • the plasmid pLG08 was used again.
  • the gRNA was constructed in an expression cassette, under the U6 promoter, targeting the dnmtl gene.
  • the different elements were introduced by transfection into HEK293T cells (ATCC® CRL-3216TM) using the Lipofectamine® 3000 Reagent kit from Invitrogen. The transfections performed are shown in Table 2.
  • genomic DNA was extracted with the GenEluteTM Mammalian Genomic DNA Miniprep Kits (Sigma Aldrich). A PCR was performed amplifying the target area and it was treated with the Surveyor® Mutation Detection Kits (IDT), which detects the formation of indels, small insertions-deletions produced by the non-homologous repair systems of the eukaryotic cell in response to the cuts generated by Cas12a.
  • IDTT Surveyor® Mutation Detection Kits
  • TrwC:Cas12a was capable of generating these indels, just like Cas12a. With this, we show that Cas12a in the fusion protein maintains its activity (Figure 2a).
  • TrwC-Cas12a the endonuclease activity of TrwC-Cas12a in prokaryotic cells was carried out.
  • Most bacteria do not contain a DNA repair system based on non-homologous recombination (NHEJ) so if Cas12a cuts DNA effectively, it will produce double-stranded DNA breaks and the bacteria will die. asking to measure the activity of Cas12a in a decrease of our bacterial population 27 .
  • NHEJ non-homologous recombination
  • plasmid pLG24 was generated, which expresses the trwC:cas12a fusion gene under the control of the pTet promoter, which, in the absence of the anhydrotetracycline (aTc) inducer, is highly repressed, while in the presence of aTc it is highly active, allowing very strict regulation of the amount of TrwC:Cas12a.
  • Plasmid pLG14 is the plasmid on which pLG24 is based. It was constructed by assembling the Cas12a-NLS-3Ha sequence (amplified from plasmid pY010) with the pBBR6 vector, amplified by PCR, leaving the Cas12a gene in pBBR6, downstream of the lactose promoter.
  • Plasmid pLG24 was constructed by assembling four amplicons: The pTET promoter was amplified from plasmid pOSIP-CO-RBS-library-dCas9. The trwC sequence was amplified from pAA12. pLG14 was amplified into two fragments, removing the lactose promoter. The trwC fragment was assembled in front of the cas12a start codon and the pTET sequence was placed upstream of both fragments.
  • gRNAs were also designed that were cloned under the control of the plac promoter (inducible by isopropyl-p-D-1-thiogalactopyranoside, IPTG), whose targets are the lacZ (pLG15) or sacB (pLG19) genes.
  • the plasmids used in the present invention are shown in Table 5.
  • Table 6 shows the detailed construction of the plasmids and
  • Table 7 shows the list of oligonucleotides used in the present invention.
  • Example 4 Activity of TrwC:Cas12a after being translocated by a T4SS
  • One of the problems raised in the state of the art and that has been overcome in the present invention is the recovery of the activity of the fusion protein in the cell. recipient after being translocated through the T4SS.
  • the translocation of substrates through secretion systems entails their total or partial unfolding 28 29 .
  • the activity of proteins after having lost part of their three-dimensional configuration is highly variable and impossible to know a priori. Relaxases are known to recover their functionality in the recipient cell, but what would happen to the endonuclease activity of the TrwC:Cas12a fusion could not be predicted.
  • the SOS signal induction assay proposed by Lun Cui and David Bikard 27 has been adapted. In this work, they demonstrate how the double-stranded cuts produced by Cas9 in the bacterial chromosome generate an activation of the SOS signal in RecA+ strains. To demonstrate this, they generated the plasmid pZA31-sulA-GFP (addgene number: 78493), which has the gene that encodes the green fluorescent protein (GFP) under the control of the promoter of the sulA gene, involved in the SOS response; therefore, its induction due to the cuts produced by Cas translates into GFP production. This assay has been adapted for the detection of TrwC:Cas12a activity in transconjugants.
  • the bacteria used in this assay are shown in Table 3. Basically, the idea is to perform conjugations to strains that have a gRNA with (JacZ) or without (sacB) target on the chromosome of the recipient bacteria.
  • the translocation of TrwC:Cas12a from the donor bacterium would give rise to its endonuclease action on the chromosome in the case of the recipient with the gRNA against lacZ.
  • Recipient bacteria E. coli MG1655 (RecA+)
  • the bacterial cultures grown in stationary phase were diluted 1:20 and the donors were induced with aTc 1 pg/ml and the recipients with IPTG 0.5 mM, for 3 hours.
  • Filter conjugations were then performed, supplementing the conjugation plates with aTc and IPTG.
  • GFP detection was performed directly after 3 hours, on the conjugation plate with the Azure Biosystems c400 plate reader ( Figure 3a). Conjugation was then stopped and GFP (excitation and emission values were 515nm and 475nm respectively) and OD (600nm) fluorescence values were measured using the TECAN infinite M200 Pro ( Figure 3b).
  • the targeted gene was sacB.
  • the expression of sacB in the presence of sucrose causes the bacterium that is expressing it to die 31 . In fact, it is such an effective counterselection that sacB-expressing bacteria only survive in sucrose-supplemented medium if they lose SacB activity by mutation.
  • the sacB gene is used as the target of Casi 2a in the recipient cell, and the transconjugants resulting from conjugation are seeded in medium supplemented with sucrose, if Casi 2a has introduced cuts in the sacB gene, a greater number of mutants resistant to sucrose due to delations produced in the gene by the cut of Casi 2a and subsequent recombinations.
  • the recipient strains used were MG1655 (-sacB) and MG1655::sacB (+sacB). Both strains contain the plasmids pZA31-sulA:gfp 27 and pLG19 (plac:sacBgRNA)
  • the data was compared by testing TrwC in parallel with TrwC:Cas12a.
  • the number of sucrose resistant mutants can be compared when relaxase alone, or the fusion protein, is translocated into the recipient cell (containing the anti-sacB gRNA).
  • transconjugants were selected in medium supplemented with 1% sucrose and without sucrose. In the case of the conjugations in which MG1655 was used as receptor, receptors resistant to 1% sucrose grew in all cases.
  • sucrose-resistant mutants were obtained only in the case of TrwC:Cas12a. These mutants were analyzed by PCR amplifying the sacB region with the oligonucleotides 5'-CTACCGCACTGCTGGCAG-3' (SEQ ID NO: 25) and 5'-GATGCTGTCTTTGACAACAG-3' (SEQ ID NO: 26). In all cases, the amplification of the product of the expected size was obtained, which was used to determine the DNA sequence. In the 6 transconjugants analyzed, delations were observed in the area where the gRNA is directed ( Figure 4).
  • the Cas endonuclease is taken directly to the recipient cell, with the benefits that this brings, such as greater efficiency and speed in the system, without the need for its purification.
  • the risk of off-target activity and toxicity derived from the sustained expression of the endonuclease over time, is reduced.
  • the risk of integrating the DNA into the target genome is also avoided.
  • the fusion protein of the present invention can be used as a genetic modification tool for any bacterium that acts as a conjugative receptor for the R388 plasmid, whose host range includes a wide variety of Gram-negative bacteria such as Escherichia coli or the genus Pseudomonas, Salmonella , Stenotrophomonas or Shigella 32 , and it probably goes much further, since its conjugation to cyanobacteria has also been demonstrated 33 .
  • the fusion protein of the present invention provides a vehicle for the introduction of CRISPR/Cas tools in non-model bacteria, which represent the bulk of our microbiota, whose role in our health is becoming increasingly relevant, and for which conventional genetic tools are generally not valid 34 .
  • Assays demonstrate that the fusion protein of the present invention maintains its site-specific endonuclease activity in human cells and, given that T4SS also mediate protein translocation directly to mammalian cells, it may have potential application in engineering mammalian genetics.
  • Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Ce// 163, 759-771 (2015).

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La presente invención se refiere a la proteína de fusión Relaxasa-Cas12a, al sistema CRISPR/Cas que comprende dicha proteína de fusión y al uso de la proteína de fusión Relaxasa-Cas12a y/o del sistema CRISPR/Cas para la translocación de endonucleasas y/o endonucleasas unidas a moléculas de ADN, a células diana a través del sistema de secreción bacteriano tipo IV, y para la modificación genética de las células diana.

Description

PROTEÍNA QUIMÉRICA RELAXASA-Cas
Campo de la invención
La presente invención se encuadra en el campo general de la biotecnología y en particular se refiere a una proteína de fusión relaxasa-proteína Cas y al uso de la misma para la edición génica de diferentes células.
Estado de la técnica
Los sistemas CRISPR-Cas (del inglés, Clustered Regularly /nterspaced Short Palindromic epeats-CRISPR associated proteins) constituyen un sistema inmune adaptativo en la mayoría de procariotas que confiere resistencia a elementos genéticos externos, y han dado lugar al desarrollo de una revolucionaria herramienta de edición genómica 1. De manera general, estos sistemas se basan en una serie de secuencias de ADN CRISPR y proteínas Cas. Los clústers de secuencias CRISPR están formados por secuencias espadadoras, separadas por secuencias repetidas. Estos espaciadores codifican unos ARNs guía (gARNs), que tienen como diana una secuencia de ADN exógeno. Las proteínas Cas procesan esos ARNs, que llevan hasta la secuencia diana a la endonucleasa Cas, que realiza un corte de doble cadena en dicha secuencia de ADN exógeno. Su principal función biológica es por tanto defender a la bacteria hospedadora de invasores externos (elementos genéticos móviles, como fagos o plásmidos).
El uso de los sistemas CRISPR-Cas como herramienta biotecnológica se basa en la introducción de un corte de doble cadena en cualquier secuencia diana de interés. Este corte, considerado por la célula como una señal de peligro, sirve de punto de reclutamiento de los sistemas de reparación celular, que pueden reparar esa herida introduciendo pequeñas mutaciones, o incorporando moléculas de ADN exógeno que introduzcan la información deseada en el genoma receptor. Existían sistemas de nucleasas sitio-específicas, como las Zinc o las TALEN, que podían ser diseñadas para actuar sobre secuencias específicas, pero ello conllevaba un laborioso e incierto proceso de diseño y/o evolución molecular. Lo que ha convertido a los sistemas CRISPR-Cas en una revolucionaria técnica de edición genética es su sencillez, puesto que basta con proporcionar el gARN adecuado a la endonucleasa Cas, de modo que le guíe a la secuencia diana, donde cortará la doble hebra del ADN 1. De este modo, solo se necesita diseñar un gARN específico para un gen en concreto, seleccionando una secuencia que cuente con la PAM (motivo adyacente de protoespaciador) específica para la unión de la endonucleasa Cas.
Actualmente todos los sistemas CRISPR-Cas están englobados en dos clases (Clase I y Clase II)2, siendo los segundos los más adecuados para su uso como sistemas de modificación genética, debido a que codifican en una sola proteína (la endonucleasa Cas) todas las funciones necesarias (reconocimiento y unión al gARN, reconocimiento y unión a la secuencia diana del ADN, y realización de corte de doble cadena). A pesar de que Cas9 3 es la endonucleasa más utilizada, cada vez más se estudian otros sistemas CRISPR por las ventajas y diferencias que pueden tener sobre Cas9, siendo Casi 2a 4 (también conocida como Cpf1) una de las más estudiadas.
Aunque en un inicio las aplicaciones de los sistemas CRISPR-Cas se centraron en la edición genética de organismos eucariotas (para generación de modelos de laboratorio, o para modificación genética con fines terapéuticos), han ¡do creciendo las posibilidades que ofrecen. Actualmente, las aplicaciones de los sistemas CRISPR Cas son prácticamente ilimitadas debido a que podemos utilizar como diana ADN codificante (permitiendo, por ejemplo, una modificación génica), ARN (control del "splicing") o promotores (permitiendo una regulación génica). Esta versatilidad abre un enorme campo en la aplicación de estos sistemas 5. La posibilidad de guiar la endonucleasa a un sitio específico del genoma puede servir para su localización, mutación, modulación epigenética, herramientas de diagnóstico, estudios de interacción de la cromatina, etc.
Su uso en procariotas cada vez tiene un mayor impacto en diferentes campos, como la ingeniería metabólica, la biología sintética, o la medicina 6. El uso de bacterias para un fin biotecnológico como "fábricas microbianas", cada vez más extendido, requiere de su manipulación genética para mejorar y potenciar el rendimiento. El desarrollo de la tecnología CRISPR-Cas ha supuesto un gran avance en este campo ya que ha facilitado enormemente la manipulación tanto de bacterias modelo como no modelo. Algunos ejemplos son la modificación de Escherichia coli (organismo modelo), especies del género Clostridium (producción de acetona, butanol o etanol), Streptomyces (producción de productos naturales con actividad antimicrobiana) o Bacterias del Ácido Láctico (uso como probióticos). También es muy importante la aplicación de estos sistemas en el campo de la investigación biomédica, para modificar genéticamente o estudiar posibles genes esenciales en patógenos como Mycobacterium tuberculosis, Yersinia pestis o Klebsiella pneumoniae. Otra aplicación de gran importancia es su uso como antimicrobianos de nueva generación, gracias a la elevada especificidad en su secuencia diana, permitiendo la eliminación de una población bacteriana específica o la eliminación de un plásmido en concreto dentro de una población 7. Esta capacidad de eliminar plásmidos de manera específica le otorga un papel sumamente importante en su uso para combatir resistencia a antibióticos 8.
A pesar de su alto grado de eficacia y el enorme impacto que ha supuesto, la tecnología CRISPR-Cas no carece de limitaciones que hay que solventar para un correcto uso. La constante mejora se centra en dos aspectos fundamentales: aumentar la especificidad de la endonucleasa por su diana (disminución del efecto off-target), y mejorar el sistema de envío a la célula receptora in vivo, teniendo en cuenta que tanto el gARN como la endonucleasa tienen que ser enviados a la célula que se quiere modificar.
Por una parte, existe el problema de la actividad de corte de la endonucleasa en secuencias distinta de su diana (efecto off-target), lo que puede acarrear la introducción de mutaciones no deseadas. Aunque este problema puede verse reducido dependiendo del método de envío de la proteína, se han buscado otro tipo de soluciones que lo reduzcan directamente. Para ello, se han centrado todos los esfuerzos en dos direcciones principales. Una consiste en desarrollar métodos de detección de eventos off-target, mediante el desarrollo de programas informáticos como Cas-OFFinder, CCTop o DISCOVER. La segunda consistiría en generar sistemas CRISPR-Cas modificados de alta fidelidad 5. Para ello, se han usado dos abordajes principales: modificar la endonucleasa efectora, o modificar el gARN. Actualmente existen diferentes tipos de Cas9 que han sido diseñadas introduciendo ciertas modificaciones estructurales que le otorgan una mayor especificidad, como es el caso de SpCas9, H¡F¡Cas9 y HypaCas9 Además, se han encontrado en librerías de mutantes de Cas9, endonucleasas con una mayor especificidad que la nativa, como SnieperCas9. Por otro lado, se han desarrollado modificaciones en el gARN como la adición de nucleótidos o el truncamiento de los nucleótidos. Otras estrategias son la adición de enlaces fosfodiester o la introducción de desoxinucleótidos para generar guías híbridos ADN-ARN 9.
Por otro lado, está el problema del envío del sistema. Existen tres posibles formatos de enviar la endonucleasa a la célula: enviando la propia proteína, enviando el ARN mensajero (ARNm), o enviando el gen que la codifica. El envío de ADN se caracteriza por ser un método barato, simple y estable. Una limitación importante es el tamaño; la mayoría de vectores, o bien no admiten grandes cantidades de ADN (como los vectores virales), o baja mucho su eficiencia de entrada a la célula al aumentar de tamaño (caso de los plásmidos), y sólo el gen cas9 ya mide 4.5 Kb aproximadamente. En eucañotas, existe el requerimiento adicional de que el ADN exógeno entre en el núcleo para su transcripción, lo que disminuye la eficiencia de edición genómica. Además, la introducción de ADN exógeno a la célula genera otros problemas como la probabilidad de integración del ADN introducido en el genoma diana, o la producción de proteína durante más tiempo del necesario, lo que puede dar lugar efectos tóxicos, incremento de la actividad off-target o importantes respuestas inmunes 10.
El ARNm es fácil de obtener por transcripción in vitro. Es un método más directo que el ADN, ya que no hace falta que ocurra la transcripción, y, además, la expresión es más transitoria, lo que disminuye los efectos de toxicidad y off-target. Sin embargo, el ARNm es muy inestable, y junto con su expresión transitoria, resulta en una disminución de la efectividad.
Por último, podemos introducir la proteína Cas directamente. En principio es el método más eficiente ya que no hay que transcribir ni traducir el ADN. Además, la expresión es también transitoria lo que disminuye toxicidad y efectos off target. Sin embargo, la purificación de proteínas es un proceso costoso y complejo. Además, el gran tamaño de las proteínas Cas, que además tienen que ser introducidas junto con su ARN guía, dificulta el transporte efectivo de complejos hbonucleoprotéicos (RNPs).
Tan relevante como el formato de envío es el método utilizado para introducirlo en la célula diana (el vector). En eucañotas, los más extendidos son los vectores virales. Consisten en utilizar un virus para introducir el ADN que codifica para la endonucleasa y el gARN mediante transducción. Los más usados son los Virus Adeno-Asociados (AAV) y lentivirus (LV) 11. A pesar de que es uno de los sistemas más utilizado por su facilidad y su posibilidad de utilizarse en ensayos in vivo, tienen las limitaciones ya explicadas por el uso de ADN. En procañotas se ha explorado también el uso de la transformación y la conjugación bacteriana como medio de introducción del ADN en bacterias. Las ventajas de este último son que no hay limitación de tamaño y permite hacer un envío in vivo a un amplio número de huéspedes (dependiendo del sistema conjugativo)12, aunque mantiene los problemas derivados del envío de ADN.
Otras formas de envío se basan en métodos físicos o químicos 13. Dentro de los mecanismos físicos se engloban técnicas como electroporación, transformación o inyección hidrodinámica. Estas técnicas permiten el envío de ADN, ARN o proteína, lo cual les da una gran versatilidad. Han sido muy utilizados en ensayos in vitro o ex vivo, sin embargo, su difícil traslación a ensayos in vivo es una importante limitación en sus usos. Por otro lado, el transporte químico se basa en la modificación o adición de moléculas complementarias al sistema CRISPR-Cas para que éste sea capaz de traspasar las barreras celulares o para protegerlo de la degradación. Algunas formas son la encapsulation lipídica, la unión a nanopartículas como oro o sílice, o la modificación química como la adición de péptidos de penetración celular (CPP). La utilización de estos sistemas está cada vez más extendida en eucariotas, teniendo una gran aplicación en modelos in vivo. Estos mecanismos permiten una protección de los complejos evitando su degradación y permite introducir la proteína Cas directamente. Sin embargo, también tienen una serie de limitaciones como es la obtención y formación de los complejos, la dificultad, en ocasiones, de formar complejos entre el gARN y la proteína Cas, la estabilidad de estos complejos en condiciones fisiológicas, o la dificultad de acumularlos en la célula receptora. En procariotas este tipo de mecanismo no está estudiado prácticamente.
Existe pues la necesidad de proporcionar una herramienta de edición génica basado en el sistema CRISPR/Cas, que solucione todos los problemas descritos anteriormente.
Los Sistemas de Secreción Tipo IV (T4SS, por sus siglas en inglés) son complejos multiproteicos situados en las membranas bacterianas, involucrados en diferentes procesos como la transferencia de proteínas efectoras a una célula eucariota durante una infección 14 o de complejos nucleoproteicos de una bacteria donadora a otra bacteria receptora (conjugación) 15. La conjugación bacteriana es un mecanismo muy eficiente de transferencia horizontal de ADN desde una bacteria donadora a una receptora a través de un contacto físico entre ambas, confiriéndoles una elevada plasticidad genómica 15. Durante la conjugación, la relaxasa, que es la proteína encargada de iniciar y terminar el proceso, se une a su diana (el oriT), corta la cadena de ADN a transferir en una zona en concreto conocida como sitio nic y se une de forma convalente a él formando el complejo relaxasa-ADNmc (ADN monocatenario), que va a ser reclutado por el T4SS y translocado a la célula receptora, donde esta relaxasa catalizará la recirculation de la cadena de ADN transferido 16.
Existen antecedentes del uso de sistemas de secreción bacterianos con fines terapéuticos. Hay estudios preclínicos en los que utilizan sistemas de secreción bacterianos tipo 3 (T3SS) como sistemas de vacunación o inmunoterapia, o trabajos de reemplazamientos de proteínas defectuosas (también con T3SS) 17. El uso de T4SS abre un importante campo ya que no sólo permite la translocación de proteínas, sino también de ADN. En particular, existen diferentes trabajos en los que se ha intentado unir las ventajas de los sistemas de secreción con tecnologías de modificación genética (CRISPR-Cas o similares): utilizando el T4SS de Agrobacterium tumefaciens para introducir un plásmido en la célula receptora codificando Cas9 y el gARN 18, o para introducir nucleasas con dedos de zinc (ZFN). En otro caso, han fusionado una señal reconocida por un T3SS con una nucleasa TALEN 19, y han sido capaces de translocarlo a células eucariotas mediante infección bacteriana. Por último, se ha intentado generar una fusión entre Cas9 y una señal reconocida por el T3SS de Pseudomonas aeruginosa, aunque el resultado ha sido negativo debido a la toxicidad de la fusión generada en la bacteria 20.
Breve descripción de la invención
La presente invención soluciona los problemas descritos en el estado de la técnica puesto que proporciona una proteína de fusión entre una proteína Cas y una relaxasa conjugativa, que es reconocida por el T4SS, de tal modo que la proteína Cas es translocada a través del T4SS a la bacteria receptora. De este modo, los T4SS bacterianos actúan como sistemas de envío ¡n vivo de proteínas Cas. Además, la proteína de fusión, debido a su actividad relaxasa, puede unirse covalentemente a una molécula de ADN de elección (la cual debe contener una secuencia oriT reconocida por la relaxasa de la fusión), que puede codificar tanto el gARN como el ADN para editar el genoma receptor.
Así pues, en un primer aspecto, la presente invención se refiere a una proteína de fusión (de aquí en adelante, proteína de fusión de la presente invención que comprende una proteína relaxasa unida a una proteína Cas).
En la presente invención los términos “proteína de fusión”, “péptido de fusión” o “polipéptido de fusión” se consideran equivalentes y se pueden usar indistintamente, y se refiere a una proteína, péptido o polipéptido que comprende la secuencia aminoacídica de una relaxasa o una vahante de la misma y de una proteína Cas o una vahante de la misma, entendiendo por vahante de la proteína relaxasa, cualquier proteína con función relaxasa, y por vahante de la proteína CRISPR/Cas, cualquier proteína Cas con función endonucleasa .
En una realización particular de la presente invención, la proteína relaxasa es la relaxasa TrwC. Mas en particular, la relaxasa es la relaxasa TrwC del plásmido conjugativo R388. En otra realización particular de la presente invención, la proteína Cas, es la proteína Cas12a, (también conocida como Cpf1), más en particular es la vahante AsCas12a originaria de la bacteria Addam ococcus sp. BV3L6.
En la presente invención el término AsCas12a, Cpf1 y Cas12a se utilizarán indistintamente.
En otra realización particular de la presente invención, la endonucleasa Cas12a se une al extremo C-terminal de la relaxasa TrwC.
En otra realización particular, la proteína de fusión de la presente invención comprende la secuencia aminoacídica SEQ ID NO: 1 o una secuencia con al menos un 70% de identidad con la secuencia aminoacídica SEQ ID NO: 1.
En la presente invención los términos "identidad de secuencia", "identidad", "similitud" e "idéntico", se consideran equivalentes y se pueden usar indistintamente. Se entiende que el término "identidad de secuencia" significa el grado de similitud entre dos secuencias de aminoácidos obtenidas alineando las dos secuencias. El grado de identidad se expresa como porcentaje y depende del número de residuos comunes entre las secuencias alineadas. El grado de identidad entre secuencias de aminoácidos se determina mediante métodos bien establecidos en el estado de la técnica, tales como BLAST.
Las proteínas con al menos un 70% de identidad con la secuencia aminoacídica SEQ ID NO: 1 se consideran vahantes de la secuencia SEQ ID NO: 1 y también se consideran dentro de la presente invención. Concretamente una secuencia con al menos un 70, 75, 80, 85, 90, 95, 100 % de identidad con la SEQ ID NO: 1. Se consideran también dentro la presente invención aquellas secuencias análogas, derivadas o equivalentes a la secuencia SEQ ID NO: 1 , y que comprenden al menos un residuo de aminoácido alterado por una, adición, sustitución, deleción o modificación química de un aminoácido, respecto a la proteína de fusión de la presente invención.
En un segundo aspecto, la presente invención se refiere a una secuencia nucleotídica (de aquí en adelante secuencia nucleotídica de la presente invención), que codifica la proteína de fusión de la presente invención.
En la presente invención el término “secuencia nucleotídica que codifica para la proteína de fusión” se refiere a una secuencia de nucleótidos, polinucleótidos, o ácidos nucleicos, que, bajo un control de expresión adecuado, es capaz de transcribir y traducir la secuencia aminoacídica de la proteína de la presente invención.
En una realización más en particular de la presente invención, la secuencia nucleotídica que codifica para la proteína de fusión comprende una secuencia nucleotídica según la SEQ ID NO: 2.
En otro aspecto, la presente invención se refiere a un vector de expresión (de aquí en adelantes vector de expresión de la presente invención) que comprende la secuencia nucleotídica de la presente invención.
En la presente invención el término “vector” se refiere a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que se ha unido, preferentemente el ácido nucleico de la presente invención que codifica para la proteína de fusión de la presente invención y, está unido operativamente a nucleótidos adicionales tales como secuencias control, que proporcionan su expresión. El vector de la presente invención, puede comprender moléculas de ácido nucleico monocatenarias, bicatenarias o parcialmente bicatenarias; moléculas de ácido nucleico que comprenden ADN, ARN o ambos; y otras variedades de polinucleótidos conocidos en el estado de la técnica. Un tipo de vector es un plásmido, que se refiere a un bucle circular de ADN bicatenario en donde se pueden insertar segmentos de ADN adicionales. Otro tipo de vector es un vector viral, que comprenden polinucleótidos para ser transfectados en una célula huésped.
En la presente invención por “unido operativamente” se refiere a una disposición de dos o más componentes, en donde dichos componentes están en una relación que les permite funcionar de manera coordinada.
En otro aspecto, la presente invención se refiere a una célula (de aquí en adelante célula de la presente invención) que comprende la proteína de fusión de la presente invención y/o el ácido nucleico de la presente invención, y/o el vector de la presente invención. La célula de la presente invención se refiere a cualquier tipo de célula que es susceptible de transformación, transfección, transducción, conjugación y translocación con el ácido nucleico de la presente invención o con el vector de expresión que comprende dicho ácido nucleico, o con la proteína de fusión de la presente invención. En otro aspecto, la presente invención se refiere al sistema CRISPR/Cas (de aquí en adelante, sistema CRISPR/Cas de la presente invención) que comprende la proteína de fusión de la presente invención.
En una realización más en particular, el sistema CRISPR/Cas de la presente invención comprende
- una secuencia nucleotídica que codifica para el ARN guía,
- la proteína de fusión relaxasa-Cas de la presente invención, donde la proteína relaxasa-Cas se transloca a una célula receptora a través de un sistema de secreción bacteriano tipo IV.
En la presente invención por “sistema CRISPR/Cas” se refiere al sistema que comprende los elementos implicados en la expresión y/o actividad de los genes asociados a CRISPR/Cas, incluyendo las secuencias nucleotídicas que codifican para el ARN guía, secuencias nucleotídicas que codifican la proteína de fusión relaxasa-Cas de la presente invención.
En la presente invención por “ARN guía”, se refiere a una secuencia polinucleotídica que contiene una secuencia repetida, específica de cada sistema CRISPR y una secuencia espadadora con complementariedad con la secuencia diana de tal forma que es capaz de hibridar con la misma.
En la presente invención por “secuencia diana” se refiere a cualquier secuencia que se encuentra en la célula receptora, que tiene un motivo adyacente de protoespaciador (PAM, de sus siglas en inglés) correcto y que es capaz de hibridar con la secuencia guía.
En la presente invención por “motivo adyacente de protoespaciador (PAM)” se refiere a la secuencia nucleotídica concreta, situada al lado de la secuencia diana, reconocida por la endonucleasa Cas.
En la presente invención por “complementariedad” se refiere a la capacidad de un ácido nucleico para formar enlaces de hidrógeno con otra secuencia de ácido nucleico de forma tradicional, según Watson and Crick, o de alguna otra manera. El porcentaje de complementariedad indica el porcentaje de residuos en una molécula de ácido nucleico que puede formar enlaces de hidrógeno con otra molécula de ácido nucleico, “suficientemente complementario” significa que el grado de complementariedad es de al menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99%, 100%. En la presente invención por “hibridación” se refiere a una reacción en la que uno o más polinucleótidos reaccionan para formar un complejo que se estabiliza a través de la formación de enlaces de hidrógeno entre las bases de los restos de nucleótidos. La formación de enlaces de hidrógeno se produce mediante el emparejamiento de bases de según Watson and Crick, o de cualquier otra manera específica de secuencias, conocido por un experto en la materia.
En una realización más en particular de la presente invención, el sistema de secreción bacteriano tipo IV es el del plásmido conjugativo R388
En una realización más en particular, el sistema CRISPR/Cas de la presente invención, comprende: una secuencia nucleotídica que codifica para el ARN guía, la proteína de fusión relaxasa- Cas de la presente invención donde la proteína relaxasa-Cas es traslocada a la célula receptora a través del T4SS y, en la célula receptora se une a la secuencia nucleotídica que codifica para el ARN guía e híbrida con el ADN diana.
En una realización más en particular, el sistema CRISPR/Cas de la presente invención, comprende: una secuencia nucleotídica que codifica para el ARN guía,
- la proteína de fusión relaxasa- Cas de la presente invención, donde la proteína relaxasa-Cas reconoce una secuencia oriT de vector movilizadle que contiene la secuencia nucleotídica que codifica para el ARN guía y transloca dicha molécula de ADN unida a la proteína relaxasa-Cas a través del T4SS de la presente invención a la célula diana donde el ARN guía híbrida con el ADN diana.
En la presente invención, por “vector movilizadle” se refiere a cualquier vector el cual contenga un origen de transferencia (oriT). Se entiende por oriT a una secuencia nucleotídica concreta, reconocida por la relaxasa del sistema conjugativo y necesaria para la movilización del vector mediante el proceso conjugativo.
En una realización más en particular de la presente invención, la proteína de fusión relaxasa- Cas del sistema CRISPR/Cas de la presente invención, comprende la relaxasa TrwC unida a la endonucleasa Casi 2a. Más en particular, comprende la secuencia aminoacídica SEQ ID NO: 1.
En una realización particular de la presente invención, la célula diana es una célula eucariota.
En otra realización particular de la presente invención, la célula diana es una célula procariota.
En otro aspecto, la presente invención se refiere a la proteína de fusión de la presente invención, o al sistema CRISPR/Cas de la presente invención para la translocación ¡n vivo, de ADN y/o endonucleasas a células diana a través del T4SS de la presente invención.
En otro aspecto, la presente invención se refiere al uso de la proteína de fusión de la presente invención y/o al ácido nucleico de la presente invención, y/o al vector de la presente invención, para la edición génica en células. En una realización particular, para la edición génica en células eucariotas. En una realización particular, para la edición génica en células procariotas.
Descripción de las figuras
La figura 1 , muestra los resultados de estabilidad de la proteína de fusión, mediante Western Blot utilizando un anticuerpo anti-TrwC. La proteína TrwC purificada se utilizó como control positivo. El lisado celular de HEK293T se usó como control negativo (-). Cas12a y TrwC:Cas12a corresponden con los lisados celulares tras transfectar los plásmidos pY010 y pLG08 respectivamente en HEK293T. Los tamaños esperados se muestran en la parte derecha de la figura. La flecha superior corresponde a 250 kDa y la inferior a 100 kDa.
La figura 2, muestra la actividad de Cas12a. a) TrwC:Cas12a muestra actividad endonucleasa en eucariotas. Gel de agarosa tras tratar las muestras con el Surveyor Mutation Detection kit. La actividad de Cas12a se mide por la generación de diferentes bandas de digestión producidas por la surveyor endonucleasa. b) TrwC:Cas12a muestra actividad endonucleasa en procariotas. Número de transformantes tras coelectroporar el plásmido pLG24 (pTET:trwC:cas12a) con diferentes gARNs en condiciones de inducción (+) y de no inducción. Los datos corresponden a la media 9 experimentos independientes. (****, P<0.0001).
La figura 3 muestra la actividad de la proteína de fusión en la bacteria receptora tras su translocación por el T4SS mediante conjugación. TrwC:Cas12a produce un incremento de la señal SOS en la célula receptora en presencia de un gARN con diana en el cromosoma bacteriano, a) En la imagen se observan los filtros de conjugación tras 3 horas de conjugación en condiciones de inducción. En el filtro de la parte derecha de la imagen (con diana para el gARN) se observa un incremento en la fluorescencia con respecto al de la parte izquierda (sin diana para el gARN). b) En la parte derecha se muestran los valores de GFP/OD obtenidos con el TECAN Infinite M200 Pro tras detener la conjugación. (***, P<0.0005)
La figura 4 muestra el alineamiento de la secuencia del gen sacB de los diferentes mutantes. En la imagen se muestra una zona del alineamiento del gen sacB, en el que se comparan 6 transconjugantes mutantes resistentes a sacarosa (EcLG1-6) con la cepa MG1655:sacB. En la parte inferior del alineamiento se marca la PAM (subrayada) y el espaciador utilizados para generar el gARN.
Descripción detallada de la invención
La presente invención proporciona una proteína de fusión TrwC-Cas12a estable y funcional, que es reconocida a través de un Sistema de Secreción Tipo IV bacteriano (T4SS) y translocada a una célula receptora, manteniendo su actividad.
Ejemplo 1: Diseño y construcción de la proteína de fusión de la presente invención
La proteína Cas12a (también conocida como Cpf1), en concreto la vahante AsCas12a tiene actividad tanto en células procariotas como eucahotas4. Esta proteína tiene una serie de diferencias importantes con respecto a Cas9 (la proteína modelo por excelencia), como la PAM que reconoce (5'-TTTN-3' en lugar de 5'-NGG-3') o el tipo de doble corte que produce en la hebra de ADN (extremos cohesivos en lugar de romos). Además, Cas12a tiene un peso molecular de 127kDa, mientras que Cas9 de 163 kDa. Esta diferencia es importante, ya que a la hora de ser translocadas a través del T4SS, va a ser más sencillo hacerlo con una proteína de menor tamaño.
Con respecto al sistema conjugativo, se utilizó el del plásmido R388, por tratarse de un sistema bien caracterizado y de muy amplio rango de huéspedes 21. La relaxasa conjugativa de este sistema, la proteína TrwC, se trata de una proteína que permite la fusión de dominios en su extremo C terminal sin afectar a su función en la conjugación 22. Para generar la proteína de fusión entre la relaxasa TrwC y la endonucleasa Cas12a, se construyó el gen adecuado mediante la técnica de isothermal assembly 23, eliminando el codón de STOP del gen trwC (amplificado a partir del plásmido pAA12 22) y colocando a continuación el codón de inicio de casi 2a amplificado a partir del plásmido pY010 (addgene número 69982). Hay que hacer notar que ese gen ha sido optimizado para su expresión en mamíferos, y codifica para una proteína que contiene una señal nuclear y una cola de histidinas C- terminal.
Ejemplo 2: Estabilidad de la proteína de fusión de la presente invención
En primer lugar, se comprobó si la proteína de fusión era estable mediante un Western Blot a partir de lisados celulares de HEK293T. Para ello, se emplazó el gen de fusión en un plásmido (pLG08) bajo el promotor CMV, que permite la expresión en eucahotas.
El plásmido pLG08,se construyó mediante el método de clonación Isothemal Assembly (Gibson et al, 2009). Para ello, se ensambló el gen trwC y el vector pY010. Se amplificó por PCR la secuencia de trwC del plásmido pAA12 (en él, trwC carece de codón de STOP). El vector pY010 se amplificó por PCR. El fragmento de trwC fue ensamblado delante del codón de inicio de Cas12a en el pY010, bajo el control del promotor CMV. Se transfectaron los plásmidos pY010 (Cas12a) y pLG08 (TrwC: Cas 12a), y se realizó un lisado celular. A continuación, se realizó el Western Blot utilizando un anticuerpo anti TrwC (Figura 1). Los resultados mostraron como la mayoría de la proteína se encontraba en el tamaño esperado para la fusión, indicando que se producía la proteína esperada, y era estable.
Ejemplo 3: Actividad de la proteína de fusión de la presente invención
A continuación, se realizó una validación funcional de las diferentes partes de la fusión, para comprobar si mantenían las funciones de las proteínas parentales. En primer lugar, se realizaron conjugaciones bacterianas, en las que se complementó un plásmido derivado de R388 carente de una proteína TrwC funcional, con TrwC o con TrwC: Cas 12a. Las frecuencias de conjugación obtenidas en ambos casos fueron muy similares (Tabla 1). Estos datos no solo muestran que TrwC:Cas12a mantiene la actividad de TrwC, sino que, además, la proteína de fusión es reconocida y translocada a través del T4SS a la célula receptora, puesto que se sabe que la relaxasa se requiere en la bacteria receptora para completar el proceso conjugativo24 . . . Complementaci „ . Frecuencia de
Plásmido con T4SS , Relaxasa on conjugación pSU1445 25 p
(R388::Tn 5 tac 7 en trwC)
Figure imgf000015_0001
Tabla 1. Frecuencias de conjugación.
En todos los casos, la bacteria donadora corresponde a la cepa de Escherichia coli D1210 y la receptora a DH5a. Los datos corresponden a la media de 4 experimentos independientes.
Por otra parte, se validó la actividad endonucleasa de Casi 2a en la proteína de fusión, tanto en células eucariotas como en células procariotas (Figura 2).
Para la validación en células eucariotas se utilizó de nuevo el plásmido pLG08. El gARN se construyó en un casete de expresión, bajo el promotor U6, utilizando como diana el gen dnmtl. Los diferentes elementos se introdujeron por transfección a células HEK293T (ATCC® CRL- 3216™) utilizando el kit Lipofectamine® 3000 Reagent de Invitrogen. Las transfecciones realizadas se muestran en la Tabla 2.
Figure imgf000015_0002
Tabla 2. Transfecciones realizadas para determinar la actividad de Cas12a en eucariotas.
Tras tres días, se extrajo el ADN genómico con el kit GenElute™ Mammalian Genomic DNA Miniprep Kits (Sigma Aldrich). Se realizó una PCR amplificando la zona diana y se trató con el kit Surveyor® Mutation Detection Kits (IDT), el cual detecta la formación de indels, pequeñas inserciones-deleciones producidas por los sistemas de reparación no hómologos de la célula eucariota en respuesta a los cortes generados por Cas12a.
Los resultados mostraron que TrwC:Cas12a era capaz de generar estos indels, al igual que Cas12a. Con esto, demostramos que Cas12a en la proteína de fusión mantiene su actividad (Figura 2a).
Por otro lado, se realizó la comprobación de la actividad endonucleasa de TrwC-Cas12a en células procariotas. La mayoría de las bacterias no contienen un sistema de reparación del ADN basado en la recombinación no homologa (NHEJ en inglés) por lo que si Cas12a corta el ADN de forma eficaz, producirá cortes en la doble cadena de ADN y la bacteria morirá, pidiendo medir la actividad de Cas12a en un decrecimiento de nuestra población bacteriana 27. Para estos experimentos se generó el plásmido pLG24 que expresa el gen de fusión trwC:cas12a bajo el control del promotor pTet, el cual, en ausencia del inductor anhidrotetraciclina (aTc) está muy reprimido, mientras que en presencia de aTc es muy activo, permitiendo una regulación muy estricta de la cantidad de TrwC:Cas12a.
El plásmido pLG14 es el plásmido en el que se basa el pLG24. Se construyó ensamblando la secuencia de Cas12a-NLS-3Ha (amplificada del plásmido pY010) con el vector pBBR6, amplificado por PCR, dejando el gen Cas12a en el pBBR6, aguas abajo del promotor lactosa.
El plásmido pLG24 se construyó ensamblando cuatro amplicones: el promotor pTET se amplificó del plásmido pOSIP-CO-RBS-library-dCas9. La secuencia de trwC se amplificó del pAA12. El pLG14 se amplificó en dos fragmentos, eliminando el promotor lactosa. El fragmento de trwC se ensambló delante del codón de inicio de cas12a y la secuencia del pTET se colocó aguas arriba de ambos fragmentos.
Para estos experimentos también se diseñaron dos gARNs que se clonaron bajo el control del promotor plac (inducible por isopropil-p-D-1-tiogalactopiranósido, IPTG), cuyas dianas son los genes lacZ (pLG15) o sacB (pLG19). En la tabla 5 se muestran los plásmidos utilizados en la presente invención. En la tabla 6 se muestra la construcción detallada de los plásmidos y en la tabla 7 se muestra el listado de oligonucleótidos utilizados en la presente invención.
Los experimentos se realizaron coelectroporando en la cepa de Escherichia coli D1210 el plásmido pTet: TrwC: Cas 12a (pLG24) con un gARN contra el gen lacZ (presente en la cepa diana) o contra el gen sacB (no presente en la cepa diana). Los transformantes se seleccionaron en condiciones de inducción (aTc 1ug/ml e IPTG 0.5mM) y de no inducción (Figura 2b). El número de transformantes cayó drásticamente solamente en los casos en los que se coelectroporaron los plásmidos con el gARN cuya diana se encontraba presente en la bacteria (lacZ) y se seleccionó en condiciones de inducción, demostrando la actividad endonucleasa de TrwC:Cas12a también en procañotas.
Ejemplo 4: Actividad de TrwC:Cas12a tras ser translocada por un T4SS
Uno de los problemas planteados en el estado de la técnica y que se han superado en la presente invención, es la recuperación de la actividad de la proteína de fusión en la célula receptora tras ser translocada a través del T4SS. La translocación de sustratos a través de sistemas de secreción conlleva un desplegamiento total o parcial de los mismos28 29. La actividad de las proteínas tras haber perdido parte de su configuración tridimensional es muy variable e imposible de saber a priori. Se sabe que las relaxasas recuperan su funcionalidad en la célula receptora, pero no se podía prever qué ocurriría con la actividad endonucleasa de la fusión TrwC:Cas12a.
Para detectar la actividad Cas12a en las bacterias receptoras, se realizaron dos ensayos distintos: incremento de la señal SOS y selección de mutaciones en sacB.
Para el primer ensayo, se ha adaptado el ensayo de la inducción de la señal SOS propuesto por Lun Cui y David Bikard 27. En este trabajo, demuestran como los cortes de doble cadena producidos por Cas9 en el cromosoma bacteriano generan una activación de la señal SOS en cepas RecA+. Para demostrarlo, generan el plásmido pZA31-sulA-GFP (número en addgene: 78493), que tiene el gen que codifica la proteína fluorescente verde (GFP) bajo el control del promotor del gen sulA, involucrado en la respuesta SOS; por tanto, una inducción de la misma debida a los cortes producidos por Cas se traduce en producción de GFP. Se ha adaptado este ensayo para la detección de la actividad de TrwC:Cas12a en los transconjugantes. Las bacterias utilizadas en este ensayo se muestran en la Tabla 3. Básicamente, la ¡dea es realizar conjugaciones a cepas que tengan un gARN con (JacZ) o sin (sacB) diana en el cromosoma de la bacteria receptora. La translocación de TrwC:Cas12a desde la bacteria donadora daría lugar a su acción endonucleasa en el cromosoma en el caso de la receptora con el gARN contra lacZ.
Figure imgf000017_0001
Tabla 3. Plásmidos utilizados para la detección de la señal SOS en transconjugantes
1 Bacteria donadora: E. coli D1210
2Bacteria receptora: E. coli MG1655 (RecA+) Para las conjugaciones, los cultivos bacterianos crecidos en fase estacionaria se diluyeron 1 :20 y se indujeron, las donadoras con aTc 1 pg/ml y las receptoras con IPTG 0.5 mM, durante 3 horas. A continuación, se realizaron las conjugaciones en filtro, suplementando las placas de conjugación con aTc e IPTG. La detección de GFP se realizó directamente tras 3 horas, sobre la placa de conjugación con el lector de placas Azure Biosystems c400 (Figura 3a). A continuación, se detuvo la conjugación y se midieron los valores de fluorescencia de GFP (los valores de excitación y emisión fueron 515nm y 475nm respectivamente) y de OD (600nm) utilizando el TECAN infinite M200 Pro (Figura 3b).
En los experimentos realizados, se observó un ruido de fondo en la detección de GFP en ausencia de corte por Cas12a, debido a que la propia conjugación induce la señal SOS 30. Por encima de ese ruido, se observó un incremento de GFP específicamente cuando en la cepa receptora estaba presente el gARN y su diana genómica (lacZ), confirmando la actividad Cas12a procedente de la proteína TrwC:Cas12a translocada desde las donadoras.
Para el segundo ensayo de actividad de Casi 2a se seleccionaron cambios en el fenotipo de los transconjugantes. El gen elegido como diana fue sacB. La expresión de sacB en presencia de sacarosa hace que la bacteria que lo esté expresando muera 31. De hecho, es una contraselección tan efectiva, que las bacterias que expresan sacB solo sobreviven en un medio suplementado con sacarosa si pierden la actividad SacB por mutación. No existe bibliografía acerca de los reordenamientos que se puedan producir como consecuencia del corte de Casi 2a en el cromosoma bacteriano, sin embargo, está descrito que cortes por Cas9 en el cromosoma, pueden dar lugar a delaciones producidas por eventos de recombinación entre secuencias homologas o con microhomologías que se encuentren distanciadas en el cromosoma, de una manera recA dependiente 27. De este modo, si se usa como diana de Casi 2a en la célula receptora el gen sacB, y se siembra en medio suplementado con sacarosa los transconjugantes resultantes de la conjugación, si Casi 2a ha introducido cortes en el gen sacB, se encontrará un mayor número de mutantes resistentes a sacarosa debido a las delaciones producidas en el gen por el corte de Casi 2a y posteriores recombinaciones.
Las donadoras y receptoras utilizadas en los experimentos se muestran en la Tabla 4.
Figure imgf000018_0001
Figure imgf000019_0001
Tabla 4. Selección de transconjugantes resistentes a sacarosa. Los datos corresponden a un experimento.
*Las cepas receptoras utilizadas fueron MG1655 (-sacB) y MG1655::sacB (+sacB). Ambas cepas contienen los plásmidos pZA31-sulA:gfp 27 y pLG19 (plac:sacBgRNA)
**Números de transconjugantes en la dilución 0 en placas suplementadas con sacarosa 1 %. » significa incontables (crecimiento continuo).
En este caso, se compararon los datos ensayando de forma paralela TrwC con TrwC:Cas12a. De esta manera, se puede comparar el número de mutantes resistentes a sacarosa cuando se transloque a la célula receptora (que contiene el gARN contra sacB) la relaxasa sola, o la proteína de fusión. Tras realizar los ensayos de conjugación en las condiciones de inducción (¡guales que las explicadas anteriormente) se seleccionaron transconjugantes en medio suplementado con sacarosa al 1 % y sin sacarosa. En el caso de las conjugaciones en las que se usó MG1655 como receptora, en todos los casos crecieron receptoras resistentes a sacarosa 1%. Por el contrario, cuando la cepa utilizada como receptora fue MG1655::sacB, únicamente en el caso de TrwC:Cas12a se obtuvieron mutantes resistentes a sacarosa. Estos mutantes fueron analizados amplificando por PCR la región de sacB con los oligonucleótidos 5'-CTACCGCACTGCTGGCAG-3'(SEQ ID NO: 25) y 5'-GATGCTGTCTTTGACAACAG-3' (SEQ ID NO: 26). En todos los casos se obtuvo la amplificación del producto del tamaño esperado, que fue utilizado para determinar la secuencia de ADN. En los 6 transconjugantes analizados se observaron delaciones en la zona donde el gARN va dirigido (Figura 4). Este resultado mostró de manera inequívoca la actividad de Cas12a en la bacteria receptora, demostrando que la proteína es activa tras ser translocada a través de un T4SS. Por lo tanto, se confirma que, Cas12a se puede tranlocar a través de un T4SS bacteriano uniéndola covalentemente a una relaxasa conjugativa, y que una vez que llega a la bacteria receptora, es capaz de recuperar su actividad de endonucleasa sitio-específica guiada por el gARN adecuado. Los ensayos mostraron que la proteína de fusión de la presente invención, es una proteína de fusión funcional TrwC:Cas12a, que permitió la translocación de la endonucleasa sitio- específica Casi 2a a través de un sistema de secreción bacteriano tipo IV. Con este sistema, se lleva directamente la endonucleasa Cas a la célula receptora, con los beneficios que esto aporta, como son una mayor eficiencia y rapidez en el sistema, sin necesidad de purificación de la misma. Además, al trabajar con proteínas y no con ADN o mARN, se disminuye el riesgo de actividad off-target y toxicidad, derivadas de la expresión sostenida en el tiempo de la endonucleasa. También se evita el riesgo de integración del ADN en el genoma diana.
La proteína de fusión de la presente invención puede ser utilizada como herramienta de modificación genética de cualquier bacteria que actúe como receptora conjugativa del plásmido R388, cuyo rango de huéspedes abarca una gran variedad de bacterias Gram- negativas como Escherichia coli o del género Pseudomonas, Salmonella, Stenotrophomonas o Shigella 32, y probablemente vaya mucho más allá, puesto que también se ha demostrado su conjugación a cianobacterias 33.
La proteína de fusión de la presente invención, proporciona un vehículo de introducción de las herramientas CRISPR/Cas en bacterias no modelo, que representan el grueso de nuestra microbiota, cuyo papel en nuestra salud se está mostrando cada vez más relevante, y para las que las herramientas genéticas convencionales generalmente no son válidas 34. Los ensayos demuestran que la proteína de fusión de la presente invención mantiene su actividad de endonucleasa sitio-específica en células humanas y, habida cuenta que los T4SS también median la translocación de proteínas directamente a células de mamífero, puede tener una posible aplicación en la modificación genética de mamíferos.
Figure imgf000020_0001
Figure imgf000021_0001
Tabla 5: Plásmidos utilizados en la presente invención
Figure imgf000021_0002
Tabla 6: Oligonucleótidos usados
Figure imgf000022_0001
Figure imgf000023_0001
Tabla 7: Construcción detallada de los plásmidos
REFERENCIAS
1. Mougiakos, I., Bosma, E. F., de Vos, W. M., van Kranenburg, R. & van der Oost, J. Next Generation Prokaryotic Engineering: The CRISPR-Cas Toolkit. Trends Biotechnol 34, 575-587 (2016).
2. Makarova, K. S. et al. Evolutionary classification of CRISPR-Cas systems: a burst of class 2 and derived variants. Nature Reviews Microbiology vol. 1867-83 (2020).
3. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science (80-. ). 337, 816-821 (2012).
4. Zetsche, B. et al. Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Ce// 163, 759-771 (2015).
5. Moon, S. Bin, Kim, D. Y., Ko, J. H. & Kim, Y. S. Recent advances in the CRISPR genome editing tool set. Experimental and Molecular Medicine vol. 51 1-11 (2019).
6. Yao, R. et al. CRISPR-Cas9/Cas12a biotechnology and application in bacteria. Synthetic and Systems Biotechnology vol. 3 135-149 (2018).
7. Luo, M. L, Leenay, R. T. & Beisel, C. L. Current and future prospects forCRISPR-based tools in bacteria. Biotechnol. Bioeng. 113, 930-943 (2016).
8. Shabbir, M. A. B. et al. CRISPR-cas system: Biological function in microbes and its use to treat antimicrobial resistant pathogens. Annals of Clinical Microbiology and Antimicrobials vol. 18 21 (2019).
9. Moon, S. Bin, Kim, D. Y., Ko, J. H., Kim, J. S. & Kim, Y. S. Improving CRISPR Genome Editing by Engineering Guide RNAs. Trends in Biotechnology vol. 37 870-881 (2019).
10. Hughes, T. S. et al. Immunogenicity of intrathecal plasmid gene delivery: Cytokine release and effects on transgene expression. J. Gene Med. 11 , 782-790 (2009).
11. Xu, C. L., Rúan, M. Z. C., Mahajan, V. B. & Tsang, S. H. Viral Delivery Systems for CRISPR. Viruses 11, 28 (2019).
12. Hamilton, T. A. et al. Efficient inter-species conjugative transfer of a CRISPR nuclease for targeted bacterial killing. Nat. Commun. 10, 1-9 (2019).
13. Glass, Z., Lee, M., Li, Y. & Xu, Q. Engineering the Delivery System for CRISPR-Based Genome Editing. Trends in Biotechnology vol. 36 173-185 (2018).
14. Llosa, M., Schroder, G. & Dehio, C. New perspectives into bacterial DNA transfer to human cells. Trends in Microbiology vol. 20 355-359 (2012).
15. de la Cruz, F. & Davies, J. Horizontal gene transfer and the origin of species: lessons from bacteria. Trends Microbiol 8, 128-133 (2000).
16. Guzmán-Herrador, D. L. & Llosa, M. The secret life of conjugative relaxases. Plasmid vol. 104 102415 (2019).
17. Walker, B. J., Stan, G.-B. V & Polizzi, K. M. Intracellular delivery of biologic therapeutics by bacterial secretion systems. (2017) doi:10.1017/erm.2017.7.
18. Jiang, W. et al. Demonstration of CRISPR/Cas9/sgRNA-mediated targeted gene modification in Arabidopsis, tobacco, sorghum and rice. doi:10.1093/nar/gkt780.
19. Jia, J. et al. Efficient Gene Editing in Pluripotent Stem Cells by Bacterial Injection of Transcription Activator-Like Effector Nuclease Proteins. Stem Cells Transí. Med. 4, 913-926 (2015).
20. Bai, F., Li, Z., Umezawa, A., Terada, N. & Jin, S. Bacterial type III secretion system as a protein delivery tool for a broad range of biomedical applications. Biotechnology Advances vol. 36482-493 (2018).
21. Datta, N. & Hedges, R. W. Trimethoprim resistance conferred by W plasmids in Enterobacteriaceae. J Gen Microbiol 72, 349-355 (1972).
22. Alperi , A. et al. A translocation motif in relaxase trwc specifically affects recruitment by its conjugative type IV Secretion System. J. Bacterial. 195, 4999-5006 (2013). Gibson, D. G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods 6, 343-345 (2009). Draper, O., César, C. E., Machón, C., De La Cruz, F. & Llosa, M. Site-specific recombinase and integrase activities of a conjugative relaxase in recipient cells. Proc. Natl. Acad. Sci. U. S. A. 102, 16385-16390 (2005). Llosa, M., Bolland, S. & de la Cruz, F. Genetic organization of the conjugal DNA processing region of the IncW plasmid R388. J Mol Biol 235, 448-464. Fernández-González, E. et al. Transfer of R388 derivatives by a pathogenesis- associated type IV secretion system into both bacteria and human cells. J. Bacterio!. 193, 6257-6265 (2011). Cui, L. & Bikard, D. Consequences of Cas9 cleavage in the chromosome of Escherichia coli. Nucleic Acids Res 44, 4243-4251 (2016). Trokter, M. & Waksman, G. Translocation through the Conjugative Type IV Secretion System Requires Unfolding of Its Protein Substrate. (2018) doi: 10.1128/JB.00615-17. Akeda, Y. & Galán, J. E. Chaperone release and unfolding of substrates in type III secretion. Nature 437, 911-915 (2005). Baharoglu, Z., Bikard, D. & Mazel, D. Conjugative DNA Transfer Induces the Bacterial SOS Response and Promotes Antibiotic Resistance Development through Integron Activation. PLoS Genet. 6, e1001165 (2010). Reyrat, J. M., Pelicic, V., Gicquel, B. & Rappuoli, R. Counterselectable markers: Untapped tools for bacterial genetics and pathogenesis. Infection and Immunity vol. 66 4011-4017 (1998). Fernández-López, R. et al. Dynamics of the IncW genetic backbone imply general trends in conjugative plasmid evolution. FEMS Microbiology Reviews vol. 30 942-966 (2006). Encinas, D. et al. Plasmid Conjugation from Proteobacteria as Evidence for the Origin of Xenologous Genes in Cyanobacteria. (2014) doi: 10.1128/JB.01464-13. Waller, M. C., Bober, J. R., Nair, N. U. & Beisel, C. L. Toward a genetic tool development pipeline for host-associated bacteria. Current Opinion in Microbiology vol. 38 156-164 (2017). Vergunst, A. C. et al. VirB/D4-dependent protein translocation from Agrobacterium into plant cells. Science (80-. ). 290, 979-982 (2000). Cui, L. et al. A CRISPRi screen in E. coli reveals sequence-specific toxicity of dCas9. Nat. Commun. 9, 1-10 (2018). Llosa, M., Bolland, S., Grandoso, G. & de la Cruz, F. Conjugation-independent, sitespecific recombination at the oriT of the IncW plasmid R388 mediated by TrwC. J Bacterio! 176, 3210-3217 (1994). Vieira, J. & Messing, J. The pUC plasmids, an M13mp7-derived system for insertion mutagenesis and sequencing with synthetic universal primers. Gene 19, 259-268 (1982). Norrander, J., Kempe, T. & Messing, J. Construction of improved M13 vectors using oligodeoxynucleotide-directed mutagenesis. Gene 26, 101-106 (1983).

Claims

25 REIVINDICACIONES
1. Proteína de fusión que comprende una proteína relaxasa unida a una proteína CRISPR- Cas.
2. Proteína de fusión según la reivindicación 1 , donde la proteína relaxasa es la relaxasa T rwC.
3. Proteína de fusión según cualquiera de las reivindicaciones 1-2, donde la proteína CRISPR- Cas, es la proteína Casi 2a.
4. Proteína de fusión según cualquiera de las reivindicaciones 1-3, donde la endonucleasa Cas12a se une al extremo C-terminal de la relaxasa TrwC.
5. Proteína de fusión según cualquiera de las reivindicaciones 1-4 que comprende la secuencia aminoacídica SEQ ID NO: 1.
6. Secuencia nucleotídica que codifica la proteína de fusión según cualquiera de las reivindicaciones 1-5.
7. Secuencia nucleotídica según la reivindicación 6, que comprende una secuencia nucleotídica según la SEQ ID NO: 2.
8. Vector de expresión que comprende la secuencia nucleotídica según cualquiera de las reivindicaciones 6-7.
9. Célula que comprende una proteína según cualquiera de las reivindicaciones 1-5 y/o un ácido nucleico según cualquiera de las reivindicaciones 6-7, y/o un vector según la reivindicación 8.
10. Sistema CRISPR/Cas que comprende la proteína de fusión según cualquiera de las reivindicaciones 1-5.
11. Sistema CRISPR/Cas según la reivindicación 10 que comprende:
- una secuencia nucleotídica que codifica para el ARN guía,
- una proteína de fusión relaxasa-Cas según cualquiera de las reivindicaciones 1-5, donde la proteína relaxasa-Cas se transloca a una célula receptora a través de un sistema de secreción bacteriano tipo IV.
12. Sistema CRISPR/Cas según la reivindicación 11 , donde la proteína relaxasa-Cas en la célula receptora se une a la secuencia nucleotídica que codifica para el ARN guía donde híbrida con el ADN diana
13. Sistema CRISPR/Cas según cualquiera de las reivindicaciones 10-11 , donde la proteína relaxasa-Cas reconoce una secuencia oriT de un vector movilizadle que comprende la secuencia nucleotídica que codifica para el ARN guía y transloca dicha molécula de ADN unida a la proteína relaxasa-Cas a través de un sistema de secreción bacteriano tipo IV a la célula diana donde el ARN guía híbrida con el ADN diana.
14. Sistema CRISPR/Cas según cualquiera de las reivindicaciones 10-13, que comprende la secuencia aminoacídica SEQ ID NO: 1.
15. Sistema CRISPR/Cas según cualquiera de las reivindicaciones 10-14, donde la célula diana es una célula eucariota.
16. Sistema CRISPR/Cas según cualquiera de las reivindicaciones 10-14, donde la célula dianas es una célula procariota.
17. Uso de una proteína de fusión según cualquiera de las reivindicaciones 1-5, o un sistema CRISPR/Cas según cualquiera de las reivindicaciones 10-16 para la translocación de endonucleasas y/o endonucleasas unidas a moléculas de ADN, a células diana a través del sistema de secreción bacteriano tipo IV.
18. Uso de una proteína de fusión según cualquiera de las reivindicaciones 1-5, y/o un ácido nucleico según cualquiera de las reivindicaciones 6-7, y/o un vector según la reivindicación 8, y/o un sistema CRISPR/Cas según cualquiera de las reivindicaciones 10-16 para la modificación genética de las células diana.
PCT/ES2021/070626 2020-08-28 2021-08-30 PROTEÍNA QUIMÉRICA RELAXASA–Cas WO2022043598A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ESP202030890 2020-08-28
ES202030890A ES2897017B2 (es) 2020-08-28 2020-08-28 PROTEINA QUIMERICA RELAXASA-Cas

Publications (1)

Publication Number Publication Date
WO2022043598A1 true WO2022043598A1 (es) 2022-03-03

Family

ID=80354741

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2021/070626 WO2022043598A1 (es) 2020-08-28 2021-08-30 PROTEÍNA QUIMÉRICA RELAXASA–Cas

Country Status (2)

Country Link
ES (1) ES2897017B2 (es)
WO (1) WO2022043598A1 (es)

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ALI ZAHIR, SHAMI ASHWAG, SEDEEK KHALID, KAMEL RADWA, ALHABSI ABDULRAHMAN, TEHSEEN MUHAMMAD, HASSAN NORHAN, BUTT HAROON, KABABJI AH: "Fusion of the Cas9 endonuclease and the VirD2 relaxase facilitates homology-directed repair for precise genome engineering in rice", COMMUNICATIONS BIOLOGY, vol. 3, no. 1, 1 December 2020 (2020-12-01), pages 1 - 13, XP055910384, DOI: 10.1038/s42003-020-0768-9 *
ALPERI ANABEL, LARREA DELFINA, FERNÁNDEZ-GONZÁLEZ ESTHER, DEHIO CHRISTOPH, ZECHNER ELLEN L., LLOSA MATXALEN: "A Translocation Motif in Relaxase TrwC Specifically Affects Recruitment by Its Conjugative Type IV Secretion System", JOURNAL OF BACTERIOLOGY, vol. 195, no. 22, 24 October 2013 (2013-10-24), US , pages 4999 - 5006, XP055910388, ISSN: 0021-9193, DOI: 10.1128/JB.00367-13 *
FERNANDEZ-GONZALEZ ESTHER; DE PAZ HECTOR D; ALPERI ANABEL; AGUNDEZ LETICIA; FAUSTMANN MARCO; SANGARI FELIX J; DEHIO CHRISTOPH; LLO: "Transfer of R388 Derivatives by a Pathogenesis-Associated Type IV Secretion System into both Bacteria and Human Cells", JOURNAL OF BACTERIOLOGY, vol. 193, no. 22, 1 November 2011 (2011-11-01), US , pages 6257 - 6265, XP008147694, ISSN: 0021-9193, DOI: 10.1128/JB.05905-11 *
GUGLIELMINI JULIEN, NÉRON BERTRAND, ABBY SOPHIE S., GARCILLÁN-BARCIA MARÍA PILAR, LA CRUZ FERNANDO DE, ROCHA EDUARDO P. C.: "Key components of the eight classes of type IV secretion systems involved in bacterial conjugation or protein secretion", NUCLEIC ACIDS RESEARCH, vol. 42, no. 9, 14 May 2014 (2014-05-14), GB , pages 5715 - 5727, XP055910391, ISSN: 0305-1048, DOI: 10.1093/nar/gku194 *
GUZMÁN-HERRADOR DOLORES L., STEINER SAMUEL, ALPERI ANABEL, GONZÁLEZ-PRIETO CORAL, ROY CRAIG R., LLOSA MATXALEN: "DNA Delivery and Genomic Integration into Mammalian Target Cells through Type IV A and B Secretion Systems of Human Pathogens", FRONTIERS IN MICROBIOLOGY, vol. 8, 22 August 2017 (2017-08-22), pages 1 - 12, XP055910390, DOI: 10.3389/fmicb.2017.01503 *

Also Published As

Publication number Publication date
ES2897017B2 (es) 2022-06-30
ES2897017A1 (es) 2022-02-28

Similar Documents

Publication Publication Date Title
US11555181B2 (en) Engineered cascade components and cascade complexes
EP3178935B1 (en) Genome editing using campylobacter jejuni crispr/cas system-derived rgen
US20190323038A1 (en) Bidirectional targeting for genome editing
US7799552B2 (en) Protein and nucleic acid expression systems
EP2796558A1 (en) Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
WO2021238128A1 (zh) 一种基因组编辑系统及方法
US10435716B2 (en) Hybrid proteins and uses thereof
CN116239703A (zh) 一种融合蛋白及含有其的高效特异碱基编辑系统和应用
ES2897017B2 (es) PROTEINA QUIMERICA RELAXASA-Cas
CN109593743A (zh) 新型CRISPR/ScCas12a蛋白及其制备方法
JP2024536135A (ja) CRISPR/Cas挿入の効率を増大させるための阻害剤の使用
CN108148852A (zh) 一种海藻酸裂解酶sha-6基因及应用
AU2022284287A9 (en) Rna-guided casω nucleases and uses thereof in diagnostics and therapy
EP4117714A1 (en) Compositions and methods for modifying a target nucleic acid
JP2018164436A (ja) 植物細胞に遺伝子を導入するための複合体
US20240287500A1 (en) Tools and Methods for Mycoplasma Engineering
WO2023250475A2 (en) Cas exonuclease fusion proteins and associated methods for excision, inversion, and site specific integration
JP2024513967A (ja) 非ウイルス相同性媒介末端結合
Grishin et al. Creation of a protein vector construct including an SSBTne DNA-binding domain and VirD2 nuclear localization signal
CN118374547A (zh) 一种无抗微质粒及其制备方法和应用
AU2002354964A1 (en) Protein and nucleic acid expression systems

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21860618

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21860618

Country of ref document: EP

Kind code of ref document: A1