ES2894882T3 - Procedimiento para inducir recombinaciones meióticas dirigidas - Google Patents

Procedimiento para inducir recombinaciones meióticas dirigidas Download PDF

Info

Publication number
ES2894882T3
ES2894882T3 ES16703283T ES16703283T ES2894882T3 ES 2894882 T3 ES2894882 T3 ES 2894882T3 ES 16703283 T ES16703283 T ES 16703283T ES 16703283 T ES16703283 T ES 16703283T ES 2894882 T3 ES2894882 T3 ES 2894882T3
Authority
ES
Spain
Prior art keywords
spo11
cell
fusion protein
nucleic acid
saccharomyces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16703283T
Other languages
English (en)
Inventor
Giacomo Bastianelli
Alexandre Serero
Alain Nicolas
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Institut Curie
Sorbonne Universite
Meiogenix SAS
Original Assignee
Centre National de la Recherche Scientifique CNRS
Institut Curie
Sorbonne Universite
Meiogenix SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR1550707A external-priority patent/FR3032203B1/fr
Application filed by Centre National de la Recherche Scientifique CNRS, Institut Curie, Sorbonne Universite, Meiogenix SAS filed Critical Centre National de la Recherche Scientifique CNRS
Application granted granted Critical
Publication of ES2894882T3 publication Critical patent/ES2894882T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y599/00Other isomerases (5.99)
    • C12Y599/01Other isomerases (5.99.1)
    • C12Y599/01003DNA topoisomerase (ATP-hydrolysing) (5.99.1.3)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

Procedimiento para inducir recombinaciones meióticas dirigidas en una célula eucariota no humana que comprende - la introducción en dicha célula: a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 de la proteína de fusión y una secuencia complementaria a la región cromosómica objetivo; y - la inducción de la entrada en la profase I de la meiosis de dicha célula.

Description

DESCRIPCIÓN
Procedimiento para inducir recombinaciones meióticas dirigidas
La presente invención se sitúa en el ámbito de los eucariotas, especialmente en el campo de la microbiología. En particular, se refiere a un procedimiento para mejorar o modificar una cepa de levadura mediante la inducción de recombinaciones meióticas dirigidas.
Antecedentes tecnológicos de la invención
Las levaduras hallan aplicación en una gran variedad de campos industriales. Debido a la inocuidad de muchas especies, las levaduras se utilizan particularmente en la industria alimentaria como agente de fermentación en la industria panadera, cervecera, vinícola o en destilerías, o en forma de extractos como elementos nutritivos o agentes saborizantes. También pueden hallar uso en la producción industrial de bioetanol o de moléculas de interés, tales como vitaminas, antibióticos, vacunas, enzimas u hormonas esteroideas, o incluso en procedimientos de degradación de materiales celulósicos.
La diversidad de aplicaciones industriales de las levaduras hace que exista una demanda constante de cepas de levadura que presenten unas características mejoradas o, por lo menos, adaptadas a una nueva utilización o a nuevas condiciones de cultivo.
Con el fin de obtener una cepa que presente una característica particular, el experto en la materia puede utilizar la reproducción sexual cruzando dos cepas parentales que presenten unas características interesantes y seleccionando una cepa híbrida que proporcione la combinación deseada de las características parentales. Sin embargo, este método es aleatorio y la etapa de selección puede llevar mucho tiempo.
De forma alternativa, también puede modificar genéticamente la cepa mediante una técnica de ADN recombinante. Sin embargo, esta modificación puede dificultar su explotación, ya sea por razones legales, sanitarias o de medioambientales.
Una tercera alternativa consiste en provocar un reordenamiento de los alelos paternos y maternos en el genoma, en el transcurso de la recombinación meiótica. La recombinación meiótica es un intercambio de ADN entre cromosomas homólogos durante la meiosis. Se inicia por la formación de roturas de la doble cadena en cualquiera de las cromátidas homólogas, seguido de la reparación de estas roturas, utilizando una cromátida del cromosoma homólogo como molde. Sin embargo, las recombinaciones meióticas tienen el inconveniente de ser aleatorias y no uniformes. En efecto, los sitios de rotura de la doble cadena que causan estas recombinaciones no están distribuidos homogéneamente en el genoma. Se distingue así entre las denominadas regiones cromosómicas "calientes", donde la frecuencia de recombinación es alta, y las denominadas regiones cromosómicas "frías", donde la frecuencia de recombinación puede ser hasta 100 veces menor.
La Spo11 es la proteína que cataliza las roturas de la doble cadena durante la meiosis. Actúa en forma de dímero en cooperación con muchos compañeros. A día de hoy, los factores que determinan la elección de los sitios de rotura de la doble cadena por parte de la Spo11 y sus compañeros son todavía poco comprendidos.
El control de la formación de las roturas de la doble cadena y, por ello, de las recombinaciones meióticas, es crucial para el desarrollo de las técnicas de ingeniería genética. Recientemente se ha demostrado que es posible modificar los sitios de formación de roturas de la doble cadena mediante la fusión de la Spo11 con el dominio de unión al ADN del activador de la transcripción Gal4 (Pecina et al., 2002 Cell, 111, 173-184). La proteína de fusión Gal4-Spo11 permite introducir roturas de la doble cadena en las denominadas regiones cromosómicas "frías", en los sitios de unión al ADN de Gal4.
No obstante, en este último enfoque, la introducción de roturas de la doble cadena está condicionada por la presencia de sitios de unión de Gal4, por lo que es imposible inducir fenómenos de recombinaciones meióticas dirigidas independientemente de los sitios de unión específicos.
Resumen de la invención
El objetivo de la presente invención es proponer un procedimiento que permita inducir recombinaciones meióticas dirigidas en células eucariotas, preferentemente células de levadura o vegetales, en cualquier región del genoma, independientemente de cualquier sitio de unión conocido, y en particular en las denominadas regiones cromosómicas "frías".
Así, según un primer aspecto, la presente invención se refiere a un procedimiento para inducir recombinaciones meióticas dirigidas en una célula eucariota que comprende
- la introducción en dicha célula:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 de la proteína de fusión y una secuencia complementaria a la región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula.
La proteína de fusión puede comprender además una secuencia de señal de localización nuclear.
Preferentemente, el dominio Cas9 de la proteína de fusión es una proteína Cas9 deficiente en la actividad nucleasa.
El ácido nucleico que codifica dicha proteína de fusión puede estar bajo el control de un promotor constitutivo, inducible o específico de la meiosis.
En la célula eucariota pueden introducirse uno o varios ARN guía adicionales dirigidos a otra u otras regiones cromosómicas, o ácidos nucleicos que codifiquen dichos ARN guía adicionales.
Preferentemente, la célula eucariota es una levadura. La entrada en la profase I de la levadura puede inducirse entonces transfiriéndola a un medio de esporulación.
Alternativamente, la célula eucariota es una célula vegetal.
Preferentemente, la introducción de la proteína de fusión, o del ácido nucleico que la codifica, y del o de los ARNg, o del o de los ácidos nucleicos que los codifican, en dicha célula, es simultánea.
Alternativamente, la introducción de la proteína de fusión, o del ácido nucleico que la codifica, y del o de los ARNg, o del o de los ácidos nucleicos que los codifican, en dicha célula es secuencial.
La introducción del ácido nucleico que codifica la proteína de fusión y del o de los ácidos nucleicos que codifican el o los ARNg en dicha célula también puede lograrse cruzando dos células en las que se hayan introducido respectivamente el ácido nucleico que codifica la proteína de fusión y el o los ácidos nucleicos que codifican el o los ARNg.
La presente invención también se refiere a, según un segundo aspecto, una proteína de fusión tal como se define en el procedimiento anterior.
Según un tercer aspecto, la presente invención se refiere además a un ácido nucleico que codifica la proteína de fusión definida anteriormente.
La presente invención se refiere igualmente a, según un cuarto aspecto, un casete de expresión o un vector que comprende un ácido nucleico tal como se define anteriormente.
Preferentemente, el vector es un plásmido que comprende un origen de replicación bacteriana, un casete de expresión que comprende un ácido nucleico como se define anteriormente, uno o varios marcadores de selección y/o una o varias secuencias que permiten la inserción dirigida del vector, del casete de expresión o del ácido nucleico en el genoma de la célula hospedadora. En particular, el plásmido comprende un origen de replicación bacteriana, preferentemente el origen ColE1, un casete de expresión que comprende un ácido nucleico tal como se define anteriormente bajo el control de un promotor, preferentemente el promotor ADH1, un terminador, preferentemente el terminador ADH1, uno o varios marcadores de selección, preferentemente marcadores de resistencia tales como el gen de resistencia a la kanamicina o a la ampicilina, una o varias secuencias que permiten la inserción dirigida del vector, del casete de expresión o del ácido nucleico en el genoma de la célula hospedadora, preferentemente en el locus TRP1 del genoma de la levadura. De manera preferida, el plásmido comprende, o consiste en, una secuencia nucleotídica seleccionada entre la SEQ ID NO: 1 y la SEQ ID NO: 2.
Según un quinto aspecto, la presente invención se refiere igualmente a una célula hospedadora que comprende una proteína de fusión, un ácido nucleico, un casete o un vector tales como se definen anteriormente.
Preferentemente, la célula hospedadora es una célula eucariota, aún más preferentemente una célula de levadura, vegetal, fúngica o una célula animal, y particularmente más preferentemente, la célula hospedadora es una célula vegetal o una célula de levadura.
Preferentemente, la célula hospedadora es una célula de levadura, aún más preferentemente una levadura seleccionada del grupo que consiste en Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus (denominada también Saccharomyces carlsbergensis), y los híbridos obtenidos a partir de al menos una cepa perteneciente a una de estas especies, y particularmente más preferentemente, la célula hospedadora es Saccharomyces cerevisiae.
Alternativamente, la célula hospedadora es una célula vegetal, aún más preferentemente una célula vegetal seleccionada del grupo que consiste en arroz, trigo, soja, maíz, tomate, Arabidopsis thaliana, cebada, colza, algodón, caña de azúcar y remolacha, y particularmente más preferentemente, dicha célula hospedadora es una célula de arroz. La presente invención se refiere también a, en un sexto aspecto, un procedimiento para generar variantes de un organismo eucariota, con la excepción del hombre, que comprende:
- la introducción en una célula de dicho organismo:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 y una secuencia complementaria de una región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula;
- la obtención de la o las células que presentan las recombinaciones deseadas en las regiones cromosómicas objetivo; y
- la génesis de una variante del organismo a partir de dicha célula recombinada.
Preferentemente, el organismo eucariota es una levadura o una planta, aún más preferentemente una levadura, particularmente una cepa de levadura de interés industrial.
En un séptimo aspecto, la presente invención se refiere igualmente a un procedimiento para identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota que comprende: - la introducción en la célula eucariota:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 y una secuencia complementaria de una región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula;
- la obtención de la o las células que presentan las recombinaciones deseadas en las regiones cromosómicas objetivo; y
- el análisis de los genotipos y los fenotipos de las células recombinadas con el fin de identificar o localizar la información genética que codifica la característica de interés.
Preferentemente, la célula eucariota es una levadura o una planta, aún más preferentemente una levadura, particularmente una cepa de levadura de interés industrial.
Preferentemente, la característica de interés es un carácter cuantitativo de interés (QTL).
La presente invención se refiere también a, en un octavo aspecto, un kit que comprende una proteína de fusión, un ácido nucleico, un casete, un vector o una célula hospedadora tales como se definen anteriormente.
En un noveno aspecto, la presente invención se refiere finalmente a la utilización de un kit tal como se define anteriormente para implementar un procedimiento tal como se define anteriormente, en particular para (i) inducir recombinaciones meióticas dirigidas en una célula eucariota, (ii) generar variantes de un organismo eucariota, y/o (iii) identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota.
Breve descripción de los dibujos
Figura 1: Esquema que representa los plásmidos P1 (SEQ ID NO: 1) y P2 (SEQ ID NO: 2) de la fusión SpCas9-Spo11 o SpCas9*-Spo11. P1 y P2 codifican, respectivamente, la expresión de NLS-SpCas9-Spo11 y de NLS-SpCas9*-Spo11 en la levadura. Los bloques negros representan el promotor constitutivo ADH1 (pADH1) y el terminador de ADH1 (tADH1). La flecha indica la dirección de la transcripción bajo el control del promotor ADH1.
Figura 2 : esquema que representa los plásmidos de expresión del ARNg en las células de levadura. (A) Esquema del plásmido que contiene un único casete de expresión del ARNg para dirigirse a una única región del genoma de la levadura. Re indica el sitio de restricción donde se inserta la secuencia determinante de la especificidad del ARNg (SDS) por el procedimiento de Gibson. El promotor y el terminador (Term) dependen de la ARN polimerasa III. La flecha sobre el promotor indica el sentido de la transcripción de la secuencia. El casete de expresión de un ARNg contiene un ARNg flanqueado por un promotor y un terminador. (B) Esquema del plásmido que contiene varios casetes de expresión del ARNg para dirigirse a múltiples regiones del genoma de la levadura (direccionamiento multiplexado). Los diferentes casetes de ARNg se distinguen por su secuencia determinante de su especificidad (SDS). Se introdujeron sucesivamente en el sitio de clonaciones múltiples (SCM) mediante las técnicas clásicas de clonación/ligación.
Figura 3 : esquema que representa el plásmido P1 (SEQ ID NO: 1).
Figura 4 : esquema que representa el plásmido P2 (SEQ ID NO: 2).
Figura 5 : viabilidad de las esporas procedentes de la esporulación de cepas que expresan o no la proteína de fusión SpCas9*-Spo11. Crecimiento de las esporas procedentes de la meiosis de las cepas diploides SPO11/SPO11 (ORD7339), spo 11/spo 11 (AND2822), spo11/spo11 dCAS9-SPO11/0 (AND2820) y spo11/spo11 dCAS9-SPO11/dCAS9-SPO11 (AND2823).
Figura 6 : direccionamiento a las CDB meióticas por parte de la proteína de fusión SpCas9*-Spo11 y un ARN guía específico de la región YCR048W. En el lado derecho del gel, un mapa muestra la posición de los genes (regiones codificantes), flechas grises) y la posición de la sonda. Los cuadrados negros indican los sitios de las CDB naturales. El triángulo negro indica los sitios de CDB objetivo del ARN guía UAS1-YCR048W. El porcentaje de CDB corresponde a la relación entre la intensidad de la señal del fragmento correspondiente con respecto a la señal total del carril.
Figura 7 : direccionamiento a las CDB meióticas por parte de la proteína de fusión SpCas9*-Spo11 y de dos ARN guía específicos de la región YCR048W. En el lado derecho del gel, un mapa muestra la posición de los genes (regiones codificantes), flechas grises) y la posición de la sonda. Los cuadrados negros indican los sitios de las CDB naturales. El triángulo negro indica los sitios de CDB objetivo del ARN guía UAS1-YCR048W. El círculo negro indica los sitios de CDB objetivo del ARN guía UAS2-YCR048W. El porcentaje de CDB corresponde a la relación entre la intensidad de la señal del fragmento correspondiente con respecto a la señal total del carril.
Figura 8 : direccionamiento a las CDB meióticas por parte de la proteína de fusión SpCas9*-Spo11 y un ARN guía específico de la región GAL2. En el lado derecho del gel, un mapa muestra la posición de los genes (regiones codificantes), flechas grises) y la posición de la sonda. El porcentaje de CDB corresponde a la relación entre la intensidad de la señal del fragmento correspondiente con respecto a la señal total del carril.
Figura 9 : direccionamiento a las CDB meióticas por parte de la proteína de fusión SpCas9*-Spo11 y un ARN guía específico de la región SWC3. En el lado derecho del gel, un mapa muestra la posición de los genes (regiones codificantes), flechas grises) y la posición de la sonda (rectángulo sombreado). El porcentaje de CDB corresponde a la relación entre la intensidad de la señal del fragmento correspondiente con respecto a la señal total del carril.
Figura 10: direccionamiento multiplexado a las CDB meióticas por parte de la proteína de fusión SpCas9*-Spo11 y varios ARN guía específicos de la región GAL2. En el lado derecho del gel, un mapa muestra la posición de los genes (regiones codificantes), flechas grises) y la posición de la sonda (rectángulo sombreado). El porcentaje de CDB corresponde a la relación entre la intensidad de la señal del fragmento correspondiente con respecto a la señal total del carril.
Figura 11: estimulación de la recombinación meiótica por parte de la proteína SpCas9*-SPO11 y un ARN guía en la región objetivo GAL2. (A), esquema del ensayo genético que permite la detección de recombinantes en el sitio GAL2. (B), ensayo de recombinación genética en el locus GAL2.
Figura 12: direccionamiento a las CDB meióticas por parte de la proteína SpCas9*-Spo11 y un ARN guía específico de la secuencia codificante del gen PUT4. En el lado derecho del gel, un mapa muestra la posición de los genes (regiones codificantes), flechas grises) y la posición de la sonda (rectángulo sombreado). El porcentaje de CDB corresponde a la relación entre la intensidad de la señal del fragmento correspondiente con respecto a la señal total del carril.
Figura 13: secuencia de los ARNg utilizados. En mayúsculas y minúsculas se indican, respectivamente, la secuencia que determina la especificidad del ARNg (secuencia determinante de la complementariedad, longitud de 20 nucleótidos) y la secuencia que constituye la estructura del ARNg (asa, longitud de 82 nucleótidos).
Figura 14: esquema de la construcción que permite la expresión de la proteína de fusión dCas9-Spo11 en el arroz. pZmUbi y tNOS corresponden, respectivamente, al promotor y al terminador utilizados en esta construcción.
Descripción detallada de la invención
El sistema CRISPR-Cas9 (grupos de repeticiones palindrómicas cortas en intervalos regulares) es un sistema de defensa bacteriano contra ADN exógenos. Este sistema se basa esencialmente en la asociación de una proteína Cas9 y un ARN "guía" (ARNg o ARNsg) responsable de la especificidad del sitio de escisión. Permite la realización de roturas del ADN de cadena doble (CDB) en los sitios objetivo del sistema CRISPR/Cas9. Este sistema ya se ha utilizado para la ingeniería genómica dirigida en células eucariotas (véase, por ejemplo, la solicitud de patente EP2764103), particularmente en células humanas (Cong L et al., 2013, Science 339 (6121): 819-823; Mali P et al., 2013, Science, 339 (6121): 823-826; Cho SW et al., 2013, Nature Biotechnology 31 (3): 230-232), de rata (Li D, et al., 2013, Nature Biotechnology, 31 (8): 681-683; documento WO 2014/089290, de ratones (Wang H et al., 2013, Cell, 153 (4): 910-918), de conejo (Yang D et al., 2014, Journal of Molecular Cell Biology, 6 (1): 97-99), de rana (Nakayama T étal., 2013, Genesis, 51 (12): 835-843), de peces (Hwang WY et al., 2013, Nature Biotechnology, 31 (3): 227-229), de plantas (Shan Q et al., 2013, Nature Biotechnology, 31 (8): 686-688; Jiang W et al., 2013, Nucleic Acids Research, 41 (20): el88), de Drosophila (Yu Z et al., 2013, Genetics, 195 (1): 289-291), de nematodos (Friedland AE et al., 2013, Nature Methods, 10 (8): 741-743), de levadura (DiCarlo J, et al., 2013, Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas Systems. Nucleic Acids Research 41 (7): 4336-4343), y también en células bacterianas (Jiang W et al., 2013, Nature Biotechnology, 31 (3): 233-239). Por el contrario, este sistema no se ha utilizado nunca para el direccionamiento a sitios de recombinación meiótica en ningún organismo.
Los inventores han demostrado que era posible modificar el sistema CRISPR-Cas9 con el fin de inducir recombinaciones meióticas dirigidas en una célula eucariota, y en particular en una levadura. En efecto, demostraron que la expresión combinada de una proteína de fusión Spo11-Cas9 y de uno o varios ARN guía permitía el direccionamiento a la acción de la transesterasa Spo11, que es responsable de las roturas de la doble cadena durante la meiosis. La reparación de estas roturas utilizando una cromátida del cromosoma homólogo como molde indujo los fenómenos de recombinación deseados.
Así, la presente invención se refiere a un procedimiento para inducir recombinaciones meióticas dirigidas en una célula eucariota que comprende
- la introducción en dicha célula:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 de la proteína de fusión y una secuencia complementaria a la región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula.
Tal como se utiliza aquí, la expresión "célula eucariota", se refiere a una célula de levadura, vegetal, fúngica o a una célula animal, en particular a una célula de mamífero, tal como una célula de ratón o de rata, o una célula de insecto. La célula eucariota no es humana.
Según un modo de realización particular, la célula eucariota es una célula de levadura, en particular una levadura de interés industrial. Algunos ejemplos de levaduras de interés comprenden, sin limitación, levaduras del género Saccharomyces sensu stricto, Schizosaccharomyces, Yarrowia, Hansenula, Kluyveromyces, Pichia o Candida, así como los híbridos obtenidos a partir de una cepa perteneciente a uno de estos géneros.
Preferentemente, la levadura de interés pertenece al género Saccharomyces. En particular, puede pertenecer a una especie seleccionada del grupo que consiste en Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus y Saccharomyces pastorianus (denominada también Saccharomyces carlsbergensis), o es un híbrido obtenido a partir de una cepa perteneciente a una de estas especies tales como, por ejemplo, un híbrido S. cerevisiae/S. paradoxus o un híbrido S. cerevisiae/S. uvarum.
Según otro modo de realización particular, la célula eucariota es una célula fúngica, en particular una célula fúngica de interés industrial. Algunos ejemplos de hongos comprenden, sin limitación, células de hongos filamentosos. Los hongos filamentosos incluyen hongos pertenecientes a las subdivisiones Eumycota y Oomycota. Las células de hongos filamentosos pueden seleccionarse del grupo que consiste en células de Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Flumicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Pénicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium o Trametes.
Según otro modo más de realización particular, la célula eucariota es una célula vegetal, en particular una célula vegetal de interés agronómico. Algunos ejemplos de plantas comprenden, sin limitación, arroz, trigo, soja, maíz, tomate, Arabidopsis thaliana, cebada, colza, algodón, caña de azúcar y remolacha. Según un modo preferido, la célula eucariota es una célula de arroz.
Preferentemente, la célula eucariota es heterocigota para el gen o genes objetivo del o de los ARN guía.
Tal como se utiliza aquí, la expresión "proteína de fusión" se refiere a una proteína quimérica que comprende al menos dos dominios procedentes de la combinación de diferentes proteínas o fragmentos de proteínas. El ácido nucleico que codifica esta proteína se obtiene por recombinación de las regiones codificantes de la proteína o del fragmento de proteína de manera que estén en fase y se transcriban en el mismo ARNm. Los diferentes dominios de la proteína de fusión pueden ser directamente adyacentes o estar separados por secuencias conectoras (o conector) que introducen cierta flexibilidad estructural en la construcción.
La proteína de fusión utilizada en la presente invención comprende un dominio Cas9 y un dominio Spo11.
El dominio Cas9 es el dominio de la proteína de fusión que es capaz de interactuar con los ARN guía y dirigir la actividad nucleasa del dominio Spo11 hacia una región cromosómica dada. El dominio Cas9 puede estar constituido por una proteína Cas9 (denominada también Csn1 o Csx12), natural o modificada, o un fragmento de esta proteína capaz de interactuar con los ARN guía. En particular, la proteína Cas9 puede ser modificada para modular su actividad enzimática. Así, la actividad nucleasa de la proteína Cas9 puede ser modificada o inactivada. La proteína Cas9 también puede ser truncada con el fin de eliminar los dominios de la proteína que no son esenciales para las funciones de la proteína de fusión, en particular los dominios de la proteína Cas9 que no son necesarios para la interacción con los ARN guía.
La proteína Cas9 o el fragmento de la misma tal como se utiliza en la presente invención, puede obtenerse a partir de cualquier proteína Cas9 conocida (Makarova et al., 2008, Nat. Rev. Microbiol., 9, págs. 466-477). Algunos ejemplos de proteínas Cas9 utilizables en la presente invención incluyen, sin limitación, las proteínas Cas9 de Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscilatoria sp., Petrotoga mobilis, Thermosipho africanus, o Acaryochloris marina. Otras proteínas Cas9 utilizables en la presente invención se describen también en el artículo de Makarova et al. (Makarova et al., 2008, Nat. Rev. Microbiol., 9, págs. 466-477). Preferentemente, el dominio Cas9 comprende, o consiste en, la proteína Cas9 de Streptococcus pyogenes (número de registro del n Cb I: WP_010922251.1, SEQ ID NO: 8) o un fragmento de la misma capaz de interactuar con los ARN guía.
Según un modo de realización particular, el dominio Cas9 está constituido por una proteína Cas9 completa, preferentemente la proteína Cas9 de Streptococcus pyogenes.
De manera general, las proteínas Cas9 comprenden dos dominios de nucleasas: un dominio relacionado con un dominio RuvC y un dominio relacionado con un dominio HNH. Estos dos dominios cooperan para crear roturas de la cadena doble del ADN (Jinek et al., Science, 337: 816-821). Cada uno de estos dominios de nucleasas puede ser inactivado por deleción, inserción o sustitución recurriendo a técnicas bien conocidas por el experto en la materia, como la mutagénesis dirigida, la mutagénesis por PCR o la síntesis total de genes. Así, el dominio RuvC puede ser inactivado, por ejemplo, por la sustitución D10A, y el dominio HNH puede ser inactivado, por ejemplo, por la sustitución H840A (Jinek et al., Science, 337: 816-821), siendo las posiciones indicadas las de la SEQ iD NO: 8.
En las secuencias peptídicas descritas en este documento, los aminoácidos están representados por su código de una sola letra según la siguiente nomenclatura: C: cisteína; D: ácido aspártico; E: ácido glutámico; F: fenilalanina; G: glicina; H: histidina; I: isoleucina; K: lisina; L: leucina; M: metionina; N: asparagina; P: prolina; Q: glutamina; R: arginina; S: serina; T : treonina; V: valina; W: triptófano e Y: tirosina.
Según un modo de realización, el dominio Cas9 es deficiente en al menos una actividad nucleasa. Este dominio puede obtenerse inactivando al menos uno de los dominios de nucleasa de la proteína Cas9 como se han descrito anteriormente.
Según un modo de realización particular, el dominio Cas9 comprende, o consiste en, una proteína Cas9 o un fragmento de la proteína Cas9, carente de actividad nucleasa (denominada también Cas9* o dCas9). Esta forma catalíticamente inactiva puede obtenerse inactivando los dos dominios de nucleasa de la proteína Cas9, como se ha mencionado anteriormente, por ejemplo, introduciendo las dos mutaciones puntuales que sustituyen el aspartato 10 y la histidina 840 por alaninas.
Según un modo de realización preferido, el dominio Cas9 comprende, o consiste en, una proteína Cas9, preferentemente la proteína Cas9 de Streptococcus pyogenes (spCas9), carente de actividad nucleasa (spCas9*).
Según un modo de realización particular, el dominio Cas9 comprende, o consiste en, la secuencia presentada en la SEQ ID NO: 8, en la que el aspartato de la posición 10 y la histidina de la posición 840 han sido sustituidos por alaninas.
La Spo11 es una proteína relacionada con la subunidad catalítica A de una topoisomerasa de tipo II presente en las arqueas (Bergerat et al., Nature, vol. 386, págs. 414-7). Cataliza las roturas de la doble cadena de ADN que inician las recombinaciones meióticas. Es una proteína muy conservada para la que existen homólogos en todos los eucariotas. La Spo11 es activa en forma de un dímero formado por dos subunidades, cada una de los cuales escinde una cadena de ADN. Aunque es esencial, la Spo11 no actúa sola para generar roturas de la doble cadena durante la meiosis. En la levadura S. cerevisiae, por ejemplo, coopera con las proteínas, Rec102, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 y Spp1, así como con otros compañeros descritos en los artículos de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, págs. 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, págs. 200-211) y Acquaviva et al. (2013 Science, 339, págs. 215-8). No obstante, recientemente se ha demostrado que el direccionamiento de la Spo11 a un sitio dado es suficiente para desencadenar el proceso de recombinación meiótica (Pecina et al., 2002 Cell, 111, 173-184). Cabe señalar que varios homólogos de la proteína Spo11 pueden coexistir en una misma célula, especialmente en las plantas. Preferentemente, la proteína Spo11 es una de las proteínas Spo11 de la célula eucariota de interés.
El dominio Spo11 de la proteína de fusión Cas9-Spo11 es generalmente el dominio responsable de las roturas de la doble cadena. Este dominio puede estar constituido por una proteína Spo11 o un fragmento de la misma capaz de inducir roturas de la doble cadena de ADN.
La proteína Spo11 o el fragmento de la misma tal como se utiliza en la presente invención, puede obtenerse de cualquier proteína Spo11 conocida, tal como la proteína Spo11 de Saccharomyces cerevisiae (Gene ID: 856364, número de registro del NCBI: NP_011841 (SEQ iD NO: 9) Esposito y Esposito, Genetics, 1969, 61, págs. 79-89), las proteínas AtSpo11-1 y AtSpo11-2 de Arabidopsis thaliana (Grélon M. et al., 2001, Embo J., 20, págs. 589-600), la proteína murina mSpo11 (Baudat F et al., Molecular Cell, 2000, 6, págs. 989-998), la proteína Spo11 de C. elegans o incluso la proteína Spo11 de Drosophila meiW68 (McKim et al., 1998, Genes Dev, 12 (18), págs. 2932-42). Por supuesto, estos ejemplos no son limitantes, y puede utilizarse cualquier proteína Spo11 conocida en el procedimiento según la invención.
Según un modo de realización preferido, el dominio Spo11 comprende, o consiste en, una proteína Spo11, preferentemente una proteína Spo11 de Saccharomyces cerevisiae, tal como, por ejemplo, la proteína de la secuencia SEQ ID NO: 9.
Según un modo de realización particular, el dominio Spo11 es deficiente en la actividad nucleasa. En particular, el dominio Spo11 puede comprender, o consistir en, la proteína mutante Spo11-Y135F, una proteína mutante incapaz de inducir roturas de la doble cadena de ADN (Neale MJ, 2002, Molecular Cell, 9, 835-846). La posición indicada es la de la SEQ ID NO: 9.
La capacidad de la proteína de fusión según la invención para inducir roturas de la doble cadena de ADN, puede provenir del dominio Cas9 o del dominio Spo11. Así, la proteína de fusión comprende al menos un dominio, Cas9 o Spo11, que presenta una actividad nucleasa, preferentemente el dominio Spo11.
Según un modo de realización particular, en la misma célula se pueden introducir varias proteínas de fusión según la invención que comprenden diferentes dominios Spo11. En particular, cuando existen varios homólogos de Spo11 en la célula eucariota de interés, las diferentes proteínas de fusión pueden comprender, cada una, un homólogo diferente de Spo11. Como ejemplo, pueden introducirse en la misma célula dos proteínas de fusión según la invención que comprenden, respectivamente, los dominios Spo11 -1 y Spo11 -2 de Arabidopsis thaliana, preferentemente en la misma célula de Arabidopsis thaliana. Como otro ejemplo, una o varias proteínas de fusión según la invención que comprenden los dominios Spo11 -1, Spo 11 -2, Spo11 -3 y/o Spo11 -4 del arroz pueden introducirse en la misma célula, preferentemente en la misma célula del arroz. Se han identificado numerosos homólogos de la Spo11 en diferentes especies, en particular en especies vegetales (Sprink T y Hartung F, Frontiers in Plant Science, 2014, vol. 5, artículo 214, DOI: 10.3389/fpls.2014.00214; Shingu Y et al., BMC Mol Biol, 2012, DOI: 10.1186/1471-2199-13-1). El experto en la materia puede identificar fácilmente los homólogos de la Spo11 en una especie dada, particularmente por medio de técnicas bioinformáticas bien conocidas.
La proteína de fusión según la invención comprende un dominio Spo11 y un dominio Cas9 tal como se han definido anteriormente.
Según un modo de realización, el dominio Spo11 está en el extremo aminoterminal, y el dominio Cas9 en el extremo carboxiterminal de la proteína de fusión. Según otro modo de realización, el dominio Spo11 está en el extremo carboxiterminal y el dominio Cas9 en el extremo aminoterminal de la proteína de fusión.
La proteína de fusión puede comprender igualmente una secuencia de señal de localización nuclear (SFN). Las secuencias SFN son bien conocidas por el experto en la materia, y generalmente comprenden una secuencia corta de aminoácidos básicos. Como ejemplo, la secuencia SFN puede comprender la secuencia PKKKRKV (SEQ ID NO: 3). La secuencia SFN puede estar presente en el extremo aminoterminal, carboxiterminal o en una región interna de la proteína de fusión, preferentemente en el extremo aminoterminal de la proteína de fusión.
La proteína de fusión puede comprender igualmente un dominio de penetración celular adicional, es decir, un dominio que facilita la entrada de la proteína de fusión en la célula. Este tipo de dominio es bien conocido por el experto en la materia y puede comprender, por ejemplo, una secuencia peptídica de penetración derivada de la proteína TAT del VIH-1 tal como GRKKRRQRRRPPQPKKKRKV (SEQ ID NO: 4), derivada de la secuencia TFM del virus de la hepatitis B humana tal como PLSSIFSRIGDPPKKKRKV (SEQ ID NO: 5) o una secuencia peptídica de poliarginina. Este dominio de penetración celular puede estar presente en el extremo aminoterminal, carboxiterminal o estar en el interior de la proteína de fusión, preferentemente en el extremo aminoterminal.
La proteína de fusión puede comprender además una secuencia o secuencias conectoras (conectores) entre los dominios Cas9 y Spo11, y opcionalmente entre estos dominios y los otros dominios de la proteína, tales como la secuencia de señal de localización nuclear o el dominio de penetración celular. La longitud de estas secuencias conectoras es fácilmente ajustable por el experto en la materia. Generalmente, estas secuencias comprenden entre 10 y 20 aminoácidos, preferentemente aproximadamente 15 aminoácidos, y aún más preferentemente 12 aminoácidos. Las secuencias conectoras entre los diferentes dominios pueden tener una longitud idéntica o diferente.
Según un modo de realización particular, la proteína de fusión comprende, o consiste en, sucesivamente, desde el extremo aminoterminal hasta el extremo carboxiterminal: una señal de localización nuclear, una primera secuencia conectora (conector1), un dominio Cas9, una segunda secuencia conectora (conector2) y un dominio Spo11.
Según otro modo de realización particular, la proteína de fusión comprende, o consiste en, sucesivamente, desde el extremo aminoterminal hasta el extremo carboxiterminal: una señal de localización nuclear, una primera secuencia conectora (conector1), un dominio Spo11, una segunda secuencia conectora (conector2) y un dominio Cas9.
La proteína de fusión puede comprender además una etiqueta (o etiqueta) que es una secuencia definida de aminoácidos. En particular, esta etiqueta puede utilizarse con el fin de detectar la expresión de la proteína de fusión, identificar las proteínas que interactúan con la proteína de fusión o caracterizar los sitios de unión de la proteína de fusión en el genoma. La detección de la etiqueta unida a la proteína de fusión puede realizarse con un anticuerpo específico para dicha etiqueta o cualquier otra técnica bien conocida por el experto en la materia. La identificación de las proteínas que interactúan con la proteína de fusión se puede realizar, por ejemplo, mediante técnicas de coinmunoprecipitación. La caracterización de los sitios de unión de la proteína de fusión en el genoma se puede realizar, por ejemplo, mediante técnicas de inmunoprecipitación, de inmunoprecipitación de la cromatina acoplada a una PCR cuantitativa en tiempo real (ChIP-qPCR), de inmunoprecipitación de la cromatina acoplada a técnicas de secuenciación (ChIP-Seq), de cartografiado con la ayuda de oligonucleótidos (cartografiado con oligos) o cualquier otra técnica bien conocida por el experto en la materia.
Esta etiqueta puede estar presente en el extremo aminoterminal de la proteína de fusión, en el extremo carboxiterminal de la proteína de fusión o en una posición no terminal de la proteína de fusión. Preferentemente, la etiqueta está presente en el extremo carboxiterminal de la proteína de fusión. La proteína de fusión puede comprender una o varias etiquetas, idénticas o diferentes.
Las etiquetas, tales como las que se utilizan en la presente invención, puede elegirse entre las numerosas etiquetas bien conocidas por el experto en la materia. En particular, las etiquetas utilizadas en la presente invención pueden ser etiquetas peptídicas y/o etiquetas proteicas. Preferentemente, las etiquetas utilizadas en la presente invención son etiquetas peptídicas. Algunos ejemplos de etiquetas peptídicas utilizables en la presente invención incluyen, sin limitación, las etiquetas formadas por repeticiones de al menos seis histidinas (His), en particular, las etiquetas formadas por seis u ocho histidinas, así como las etiquetas Flag, poliglutamatos, hemaglutinina (HA), calmodulina, Strep, E-tag, myc, V5, Xpress, VSV, S-tag, Avi, SBP, Softag 1, Softag 2, Softag 3, isopetag, SpyTag, tetracisteínas y combinaciones de las mismas. Algunos ejemplos de etiquetas proteicas utilizables en la presente invención incluyen, sin limitación, etiquetas de glutatión-S-transferasa (GST), proteína A de Staphlococcus aureus, Nus A, proteína de unión a la quitina (CBP), tiorredoxina, proteína de unión a la maltosa (MBP), proteínas transportadoras de biotina carboxiladas (BCCP), fragmento constante de inmunoglobulinas (Fc), etiquetas que comprenden una proteína fluorescente, tales como las proteínas GFP (proteína fluorescente verde), RFP (proteína fluorescente roja), CFP (proteína fluorescente cian) o YFP (proteína fluorescente amarilla), y las combinaciones de las mismas.
Según un modo de realización preferido, la proteína de fusión comprende una etiqueta formada por seis histidinas y/o uno o varios motivos Flag, preferentemente tres motivos Flag. Según un modo de realización particular, la proteína de fusión comprende una etiqueta formada por seis histidinas y tres motivos Flag.
De forma alternativa, el dominio Spo11 de la proteína de fusión Cas9-Spo11 puede ser sustituido por uno de los compañeros de Spo11 capaz de reclutar a Spo11, es decir, una proteína que forma un complejo con Spo11 e inducir así la formación de roturas de la doble cadena. Este compañero puede elegirse entre las proteínas citadas en los artículos de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, págs. 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, págs. 200-211) y Acquaviva et al. (2013 Science, 339, págs. 215-8), y más particularmente, en el grupo que consiste en Rec102, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mrell, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 y Spp1. De manera preferida, el compañero que sustituye al dominio Spo11 es Mei4 o Spp1.
Todos los modos de realización descritos para la proteína de fusión Cas9-Spo11 se aplican igualmente a las proteínas de fusión en las que el dominio Spo11 se sustituye por uno de sus compañeros.
La proteína de fusión tal como se describe anteriormente puede ser introducida en la célula en forma proteica, particularmente en su forma madura o en forma de un precursor, preferentemente en su forma madura o en forma de un ácido nucleico que codifica dicha proteína.
Cuando la proteína de fusión se introduce en la célula en forma proteica, se pueden añadir grupos protectores en los extremos carboxiterminal y/o aminoterminal para mejorar la resistencia de la proteína de fusión a las peptidasas. Por ejemplo, el grupo protector en el extremo aminoterminal puede ser una acilación o una acetilación, y el grupo protector en el extremo carboxiterminal puede ser una amidación o una esterificación. La acción de las proteasas puede contrarrestarse igualmente mediante la utilización de aminoácidos de configuración D, la ciclación de la proteína mediante la formación de puentes de disulfuro, de anillos lactámicos o de enlaces entre los extremos aminoterminal y carboxiterminal. La proteína de fusión de la invención puede comprender igualmente enlaces pseudopeptídicos que sustituyen a los enlaces péptidos "clásicos" de CONH y que confieren una mayor resistencia a las peptidasas, tales como CHOH-CH2, NHCO, CH2-O, CH2CH2, CO-CH2, N-N, CH=CH, CH2NH y CH2-S. La proteína de fusión puede comprender igualmente uno o varios aminoácidos que son aminoácidos raros, particularmente hidroxiprolina, hidroxilisina, alohidroxilisina, 6-N-metil-lisina, N-etilglicina, N-metilglicina, N-etilasparagina, aloisoleucina, N-metilisoleucina, N-metilvalina, piroglutamina, ácido aminobutírico; o aminoácidos sintéticos, particularmente ornitina, norleucina, norvalina y ciclohexil-alanina.
La proteína de fusión según la invención puede obtenerse mediante una síntesis química clásica (en fase sólida o en fase líquida homogénea) o mediante una síntesis enzimática (Kullmann W, Enzymatic peptide synthesis, 1987, CRC Press, Florida). También puede obtenerse mediante un método que consiste en cultivar una célula hospedadora que exprese un ácido nucleico que codifique la proteína de fusión y recuperar dicha proteína a partir de esas células o del medio de cultivo.
Tal como se utiliza en la presente solicitud, la expresión "ARN guía" o ''ARNg'' se refiere a una molécula de ARN capaz de interactuar con el dominio Cas9 de la proteína de fusión con el fin de guiarla hacia una región cromosómica objetivo.
Cada ARNg comprende dos regiones:
- una primera región (denominada habitualmente región "SDS"), en el extremo 5' del ARNg, que es complementaria de la región cromosómica objetivo y que imita al ARNcr del sistema CRISPR endógeno, y
- una segunda región (denominada habitualmente región de asa), en el extremo 3' del ARNg, que imita las interacciones de emparejamiento de bases entre el ARNtracr (ARNcr transactivador) y el ARNcr del sistema CRISPR endógeno, y presenta una estructura en horquilla de la doble cadena que termina en una secuencia predominantemente monocatenaria en 3'. Esta segunda región es esencial para la unión del ARNg al dominio Cas9 de la proteína de fusión.
La primera región del ARNg varía según la secuencia cromosómica objetivo. Por el contrario, las regiones de asa de los diferentes ARNg utilizados pueden ser idénticas o diferentes. Según un modo de realización particular, la región de asa comprende, o consiste en, la secuencia de 82 nucleótidos en 3' de las secuencias SEQ ID NO: 10 a 16 (secuencia en minúsculas en la figura 13).
La región "SDS" del ARNg, que es complementaria a la región cromosómica objetivo, comprende generalmente entre 10 y 25 nucleótidos. Preferentemente, esta región tiene una longitud de 19, 20 o 21 nucleótidos, y particularmente preferiblemente de 20 nucleótidos.
La segunda región del ARNg tiene una estructura en horquilla. La longitud de la horquilla puede variar. Preferentemente, el bucle tiene una longitud de 3 a 10 nucleótidos, y el tallo una longitud de 6 a 20 nucleótidos. El tallo puede presentar opcionalmente regiones no emparejadas (que forman protuberancias) de 1 a 10 nucleótidos. Preferentemente, la longitud total de esta región de asa es de 50 a 100 nucleótidos, y particularmente más preferentemente de 82 nucleótidos.
La longitud total de un ARNg es generalmente de 50 a 140 nucleótidos, preferentemente de 80 a 125 nucleótidos, y particularmente más preferentemente de 90 a 110 nucleótidos. Según un modo de realización particular, un ARNg tal como se utiliza en la presente invención tiene una longitud de 102 nucleótidos.
El ARNg se forma preferentemente a partir de una única molécula de ARN que comprende los dos dominios. De forma alternativa, el ARNg puede formarse a partir de dos moléculas de ARN distintas, comprendiendo la primera molécula la región "SDS" y la mitad del tallo de la segunda región, y comprendiendo la segunda molécula la segunda mitad del tallo del ARNg. Así, el emparejamiento de las dos moléculas de ARN por sus secuencias complementarias en el tallo forma un ARNg funcional.
La secuencia y la estructura de los ARNg pueden ser fácilmente definidas por el experto en la materia en función de la región cromosómica objetivo utilizando técnicas bien conocidas (véase, por ejemplo, el artículo de Di Carlo et al., Nucleic Acids Research 2013, 1-8).
En el procedimiento según la invención, se pueden utilizar simultáneamente uno o varios ARNg. Estos diferentes ARNg pueden dirigirse a regiones cromosómicas idénticas o diferentes, preferentemente diferentes.
Los ARNg pueden introducirse en la célula eucariota en forma de moléculas de ARNg maduras, en forma de precursores o en forma de uno o varios ácidos nucleicos que codifican dichos ARNg.
Cuando el o los ARNg se introducen en la célula directamente en forma de moléculas de ARN (maduras o precursoras), estos ARNg pueden contener nucleótidos modificados o modificaciones químicas que permiten, por ejemplo, aumentar su resistencia a las nucleasas, y aumentar así su vida útil en la célula. En particular, pueden comprender al menos un nucleótido modificado o no natural tal como, por ejemplo, un nucleótido que comprende una base modificada, tal como inosina, metil-5-desoxicitidina, dimetilamino-5-desoxiuridina, desoxiuridina, diamino-2,6-purina, bromo-5-desoxiuridina o cualquier otra base modificada que permita la hibridación. Los ARNg utilizados según la invención pueden ser igualmente modificados en el enlace internucleotídico, como por ejemplo, los fosforotioatos, los bifosfonatos o los fosfonatos de alquilo, o en el esqueleto, como por ejemplo, los alfa-oligonucleótidos, la 2'-O-alquil ribosa o los PNA (ácido nucleico peptídico) (Egholm et al., 1992 J. Am. Chem. Soc., 114, 1895-1897).
Los ARNg pueden ser ARN naturales, sintéticos o producidos por técnicas de recombinación. Estos ARNg pueden prepararse mediante cualquier método conocido por el experto en la materia, tal como, por ejemplo, síntesis química, transcripción in vivo o técnicas de amplificación.
Según un modo de realización, el procedimiento comprende la introducción en la célula eucariota de la proteína de fusión y de uno o varios ARNg capaces de dirigir la acción de la proteína de fusión hacia una región cromosómica dada. La proteína y los ARNg pueden introducirse en el citoplasma o en el núcleo de la célula eucariota por cualquier método conocido por el experto en la materia, por ejemplo, por microinyección. En particular, la proteína de fusión puede introducirse en la célula como un elemento de un complejo de proteína-ARN que comprende al menos un ARNg.
Según otro modo de realización, el procedimiento comprende la introducción en la célula eucariota de la proteína de fusión y de uno o varios ácidos nucleicos que codifican uno o varios ARNg.
Según otro modo de realización más, el procedimiento comprende la introducción en la célula eucariota de un ácido nucleico que codifica la proteína de fusión y de uno o varios ARNg.
Según otro modo de realización más, el procedimiento comprende la introducción en la célula eucariota de un ácido nucleico que codifica la proteína de fusión y de uno o varios ácidos nucleicos que codifican uno o varios ARNg.
La proteína de fusión, o el ácido nucleico que codifica la misma, y el o los ARNg, o el o los ácidos nucleicos que codifican los mismos, pueden introducirse simultánea o secuencialmente en la célula.
Alternativamente, y más particularmente con respecto a las células vegetales, el ácido nucleico que codifica la proteína de fusión y el o los ácidos nucleicos que codifican el o los ARNg pueden introducirse en una célula cruzando dos células en las que se han introducido, respectivamente, el ácido nucleico que codifica la proteína de fusión y el o los ácidos nucleicos que codifican el o los ARNg.
Alternativamente, y más particularmente con respecto a las células vegetales, el ácido nucleico que codifica la proteína de fusión y el o los ácidos nucleicos que codifican el o los ARNg pueden introducirse en una célula por mitosis de una célula en la que se han introducido previamente el ácido nucleico que codifica la proteína de fusión y el o los ácidos nucleicos que codifican el o los ARNg.
En los modos de realización donde la proteína de fusión y/o el o los ARNg se introducen en la célula eucariota en forma de un ácido nucleico que codifica dicha proteína y/o dicho o dichos ARNg, la expresión de dichos ácidos nucleicos permite producir la proteína de fusión y/o el o los ARNg en la célula.
En el sentido de la invención, por "ácido nucleico" se entiende cualquier molécula basada en ADN o ARN. Puede tratarse de moléculas sintéticas o semisintéticas, recombinantes, eventualmente amplificadas o clonadas en vectores, modificadas químicamente, que comprenden bases no naturales o nucleótidos modificados que comprenden, por ejemplo, un enlace modificado, una base púrica o pirimidínica modificada o un azúcar modificado. Preferentemente, la utilización de los codones se optimiza según la naturaleza de la célula eucariota.
Los ácidos nucleicos que codifican la proteína de fusión y los que codifican los ARNg pueden colocarse bajo el control de promotores idénticos o diferentes, constitutivos o inducibles, en particular promotores específicos de la meiosis. Según un modo de realización preferido, los ácidos nucleicos se colocan bajo el control de promotores constitutivos, tales como el promotor ADH1 o los promotores pRPR1 y SNR52 dependientes de la ARN polimerasa III, aún más preferentemente el promotor pRPR1.
La naturaleza del promotor puede depender igualmente de la naturaleza de la célula eucariota. Según un modo de realización particular, la célula eucariota es una célula vegetal, preferentemente una célula de arroz, y los ácidos nucleicos se colocan bajo el control de un promotor elegido entre los promotores pZmUbi (promotor de la ubiquitina del maíz) y los promotores U3 y U6 de la polimerasa III. Según un modo de realización preferido, el ácido nucleico que codifica la proteína de fusión se coloca bajo el control del promotor pZmUbi, y los ácidos nucleicos que codifican los ARNg se colocan bajo el control del promotor U3 o U6, preferentemente del promotor U3.
Los ácidos nucleicos que codifican la proteína de fusión y el o los ARNg pueden estar dispuestos en la misma construcción, particularmente en el mismo vector de expresión, o en construcciones distintas. De forma alternativa, los ácidos nucleicos pueden insertarse en el genoma de la célula eucariota en regiones idénticas o distintas. Según un modo de realización preferido, los ácidos nucleicos que codifican la proteína de fusión y el o los ARNg están dispuestos en el mismo vector de expresión.
Los ácidos nucleicos como se han descrito anteriormente pueden introducirse en la célula eucariota por cualquier método conocido por el experto en la materia, en particular por microinyección, transfección, electroporación y biolística.
Opcionalmente, la expresión o la actividad de la proteína Spo11 endógena de la célula eucariota puede suprimirse con el fin de controlar mejor los fenómenos de recombinación meiótica. Esta inactivación puede realizarse por técnicas bien conocidas por el experto en la materia, en particular inactivando el gen que codifica la proteína Spo11 endógena o inhibiendo su expresión por medio de un ARN de interferencia.
Tras la introducción en la célula eucariota de la proteína de fusión y de uno o varios ARNg, o de los ácidos nucleicos que codifican los mismos, el procedimiento según la invención comprende la inducción de la entrada en la profase I de la meiosis de dicha célula.
Esta inducción puede hacerse según diferentes métodos, bien conocidos por el experto en la materia.
Como ejemplo, cuando la célula eucariota es una célula de ratón, la entrada de las células en la profase I de la meiosis puede ser inducida por la adición de ácido retinoico (Bowles J et al., 2006, Sciences, 312 (5773), págs. 596-600).
Cuando la célula eucariota es una célula vegetal, la inducción de la meiosis se hace según un proceso natural. Según un modo de realización particular, tras la transformación de un callo que comprende una o varias células vegetales, una planta se regenera y se coloca en unas condiciones que favorecen la inducción de una fase reproductiva y, por tanto, del proceso de meiosis. Estas condiciones son bien conocidas por el experto en la materia.
Cuando la célula eucariota es una levadura, esta inducción puede realizarse transfiriendo la levadura a un medio de esporulación, en particular, de un medio rico a un medio de esporulación, estando dicho medio de esporulación preferentemente desprovisto de una fuente de carbono fermentable o de nitrógeno, e incubando las levaduras en el medio de esporulación durante un tiempo suficiente para inducir roturas de la doble cadena dependientes de Spo 11. El inicio del ciclo meiótico depende de varias señales: la presencia de los dos alelos de tipo sexual MATa y MATa, la ausencia de una fuente de nitrógeno y de carbono fermentable.
Tal como se utiliza en este documento, la expresión "medio rico" se refiere a un medio de cultivo que comprende una fuente de carbono fermentable y una fuente de nitrógeno, así como todos los nutrientes necesarios para que la levadura pueda multiplicarse por división mitótica. Este medio puede ser elegido fácilmente por el experto en la materia y puede, por ejemplo, ser seleccionado entre el grupo que consiste en el medio YPD (1 % de extracto de levadura, 2 % de bactopeptona y 2 % de glucosa), el medio YPG (1 % de extracto de levadura, 2 % de bactopeptona y 3 % de glicerol) y un medio completo sintético (o medio SC) (Treco y Lundblad, 2001, Curr. Protocol. Mol. Biol., capítulo 13, unidad 13.1).
Tal como se utiliza en este documento, la expresión "medio de esporulación" se refiere a cualquier medio que induzca la entrada en la profase de la meiosis de las células de levadura sin crecimiento vegetativo, en particular, a un medio de cultivo que no comprenda una fuente de carbono fermentable ni una fuente de nitrógeno, sino que comprenda una fuente de carbono metabolizable por la respiración, tal como acetato. Este medio puede ser elegido fácilmente por el experto en la materia y puede, por ejemplo, ser seleccionado entre el grupo que consiste en el medio KAc 1 % (Wu y Lichten, 1994, Science, 263, págs. 515-518), el medio SPM (Kassir y Simchen, 1991, Meth. Enzymol., 194, 94-110) y los medios de esporulación descritos en el artículo de Sherman (Sherman, Meth. Enzymol., 1991, 194, 3-21).
Según un modo de realización preferido, antes de ser incubadas en el medio de esporulación, las células se cultivan durante algunos ciclos de división en un medio de preesporulación para obtener una esporulación eficaz y sincrónica. El medio de preesporulación puede ser fácilmente elegido por el experto en la materia. Este medio puede ser, por ejemplo, el medio SpS (Wu y Lichten, 1994, Science, 263, págs. 515-518).
La elección de los medios (medio rico, medio de preesporulación, medio de esporulación) depende de las características fisiológicas y genéticas de la cepa de levadura, especialmente si esta cepa es auxótrofa para uno o varios compuestos.
Una vez que la célula ha entrado en la profase I de la meiosis, el proceso meiótico puede continuar hasta que se produzcan cuatro células hijas que presenten las recombinaciones deseadas.
De forma alternativa, cuando la célula eucariota es una levadura, y en particular una levadura del género Saccharomyces, las células pueden ser devueltas a unas condiciones de crecimiento con el fin de reanudar un proceso mitótico. Este fenómeno, conocido como "retorno al crecimiento" o "RTG", fue descrito previamente en la solicitud de patente WO 2014/083142 y se produce cuando las células que entraron en meiosis en respuesta a una carencia nutricional vuelven a estar en presencia de una fuente de carbono y de nitrógeno después de la formación de roturas de la doble cadena dependientes de Spo11 pero antes de la primera división de la meiosis (Honigberg y Esposito, Proc. Nat. Acad. Sci USA, 1994, 91, 6559-6563). En estas condiciones, interrumpen su progresión a través de las fases de diferenciación meiótica para reanudar un modo de crecimiento mitótico mientras inducen las recombinaciones deseadas durante la reparación de las roturas de la doble cadena inducidas por Spo11 (Sherman y Roman, Genetics, 1963, 48, 255-261; Esposito y Esposito, Proc. Nat. Acad. Sci, 1974, 71, págs. 3172-3176; Zenvirth et al., Genes to Cells, 1997, 2, págs. 487-498).
El procedimiento puede comprender además la obtención de la célula o células que presentan la o las recombinaciones deseadas.
El procedimiento según la invención puede utilizarse en todas las aplicaciones donde sea deseable mejorar y controlar los fenómenos de recombinación meiótica. En particular, la invención permite asociar, preferentemente, rasgos genéticos de interés. Esta asociación preferente permite, por un lado, reducir el tiempo necesario para su selección, por otra parte, generar combinaciones naturales posibles pero improbables. Finalmente, según el modo de realización elegido, los organismos obtenidos mediante este procedimiento pueden considerarse como organismos no modificados genéticamente (no OGM).
Según otro aspecto, la presente invención se refiere a un procedimiento para generar variantes de un organismo eucariota, con la excepción del hombre, preferentemente una levadura o una planta, aún más preferentemente una levadura, particularmente una cepa de levadura de interés industrial, que comprende
- la introducción en una célula de dicho organismo:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 y una secuencia complementaria de una región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula;
- la obtención de la o las células que presentan las recombinaciones deseadas en las regiones cromosómicas objetivo; y
- la génesis de una variante del organismo a partir de dicha célula recombinada.
En este procedimiento, el término "variante" debe entenderse de forma amplia, se refiere a un organismo que tenga al menos una diferencia genotípica o fenotípica con respecto a los organismos parentales.
Las células recombinantes pueden obtenerse dejando que la meiosis continúe hasta que se obtengan esporas, o, en el caso de la levadura, devolviendo las células a las condiciones de crecimiento tras la inducción de roturas de la doble cadena con el fin de reanudar un proceso mitótico.
Cuando la célula eucariota es una célula vegetal, se puede generar una variante de la planta mediante la fusión de los gametos vegetales, siendo al menos uno de los gametos una célula recombinada por el método según la invención.
La presente invención se refiere igualmente a un procedimiento para identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota, preferentemente una levadura, que comprende:
- la introducción en la célula eucariota:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 y una secuencia complementaria de una región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula;
- la obtención de la o las células que presentan las recombinaciones deseadas en las regiones cromosómicas objetivo; y
- el análisis de los genotipos y los fenotipos de las células recombinadas con el fin de identificar o localizar la información genética que codifica la característica de interés.
Preferentemente, la característica de interés es un carácter cuantitativo de interés (QTL).
Según otro aspecto, la presente invención se refiere a una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 tal como se ha descrito anteriormente.
La presente invención se refiere igualmente a un ácido nucleico que codifica dicha proteína de fusión según la invención.
El ácido nucleico según la invención puede estar en forma de ADN y/o de ARN, de cadena simple o de cadena doble. Según un modo de realización preferido, el ácido nucleico es una molécula de ADN aislada, sintetizada mediante técnicas recombinantes bien conocidas por el experto en la materia. El ácido nucleico según la invención puede derivar de la secuencia de la proteína de fusión según la invención, y el uso de los codones puede adaptarse según la célula hospedadora en la que se vaya a transcribir el ácido nucleico.
La presente invención se refiere además a un casete de expresión que comprende un ácido nucleico según la invención unido operativamente a las secuencias necesarias para su expresión. Particularmente, el ácido nucleico puede estar bajo el control de un promotor que permita su expresión en una célula hospedadora. De manera general, un casete de expresión comprende, o consiste en, un promotor que permita iniciar la transcripción, un ácido nucleico según la invención y un terminador de la transcripción.
La expresión "casete de expresión" se refiere a una construcción de ácido nucleico que comprende una región codificante y una región reguladora, unidos operativamente. La expresión "unido operativamente" indica que los elementos se combinan de tal manera que la expresión de la secuencia codificante está bajo el control del promotor de la transcripción. Normalmente, la secuencia del promotor se coloca antes del gen de interés, a una distancia del mismo compatible con el control de su expresión. Puede haber presentes secuencias de separación entre los elementos reguladores y el gen, siempre que no impidan la expresión. El casete de expresión puede comprender igualmente al menos una secuencia activadora "potenciadora" unida operativamente al promotor.
El experto en la materia dispone de una gran variedad de promotores que pueden utilizarse para la expresión de genes de interés en células u organismos hospedadores. Incluyen promotores constitutivos, así como promotores inducibles que son activados o reprimidos por estímulos físicos o químicos exógenos.
Preferentemente, el ácido nucleico según la invención se coloca bajo el control de un promotor constitutivo o de un promotor específico de la meiosis.
Algunos ejemplos de promotores específicos de la meiosis utilizables el marco de la presente invención comprenden, sin limitación, los promotores endógenos de Spo11, los promotores de los compañeros de Spo11 para la formación de roturas de la doble cadena, el promotor Rec8 (Murakami & Nicolas, 2009, Mol. Cell. Biol, 29, 3500-16) o el promotor Spo13 (Malkova et al., 1996, Genetics, 143, 741-754).
También pueden utilizarse otros promotores inducibles, tales como el promotor estradiol (Carlie & Amon, 2008 Cell, 133, 280-91), el promotor metionina (Care et al., 1999, Molecular Microb 34, 792-798), promotores inducidos por choques térmicos, metales, esteroides, antibióticos y alcohol.
Algunos promotores constitutivos utilizables en el marco de la presente invención son, como ejemplos no limitantes: el promotor de los genes tempranos inmediatos del citomegalovirus (CMV), el promotor del virus símico (SV40), el promotor tardío principal de los adenovirus, el promotor del virus del sarcoma de Rous (RSV), el promotor del virus del tumor mamario de ratón (MMTV), el promotor de la fosfoglicerato cinasa (PGK), el promotor del factor de elongación ED1-alfa, los promotores de la ubiquitina, los promotores de la actina, los promotores de la tubulina, los promotores de las inmunoglobulinas, el promotor de la alcohol deshidrogenasa 1 (ADH1), los promotores dependientes de la ARN polimerasa III, tales como los promotores U6, U3, Hl, 7SL, pRPR1 ("ribonucleasa P ARN 1"), SNR52 (ARN nuclear pequeño 52) o el promotor pZmUbi.
El terminador de la transcripción puede ser elegido fácilmente por el experto en la materia. Preferentemente, este terminador es RPR1t, la secuencia flanqueante en 3' del gen SUP4 de Saccharomyces cerevisiae o el terminador de la nopalina sintasa tNOS.
La presente invención se refiere además a un vector de expresión que comprende un ácido nucleico o un casete de expresión según la invención. Este vector de expresión puede utilizarse para transformar una célula hospedadora y permitir la expresión del ácido nucleico según la invención en dicha célula. Los vectores pueden construirse mediante las técnicas clásicas de biología molecular, bien conocidas por el experto en la materia.
Ventajosamente, el vector de expresión comprende elementos reguladores que permiten la expresión del ácido nucleico según la invención. Estos elementos pueden contener, por ejemplo, promotores de transcripción, activadores de la transcripción, secuencias de terminación, codones de iniciación y de terminación. Los métodos para seleccionar estos elementos en función de la célula hospedadora en la que se desea la expresión son bien conocidos por el experto en la materia.
En un modo de realización particular, el vector de expresión comprende un ácido nucleico que codifica la proteína de fusión de la invención, colocado bajo el control de un promotor constitutivo, preferentemente el promotor ADH1 (pADHI). Igualmente puede comprender una secuencia de terminación, tal como el terminador ADH1 (tADHI).
El vector de expresión puede comprender uno o varios orígenes de replicación, bacteriana o eucariota. En particular, el vector de expresión puede comprender un origen de replicación bacteriana funcional en E. coli, tal como el origen de replicación ColE1. Alternativamente, el vector puede comprender un origen de replicación eucariota, preferentemente funcional en S. cerevisiae.
El vector puede comprender además elementos que permitan la selección en una célula hospedadora bacteriana o eucariota, tales como, por ejemplo, un gen de resistencia a un antibiótico o un gen de selección que complemente el respectivo gen eliminado en el genoma de la célula hospedadora. Dichos elementos son bien conocidos por el experto en la materia y están ampliamente descritos en la bibliografía.
En un modo de realización particular, el vector de expresión comprende uno o varios genes de resistencia a antibióticos, preferentemente un gen de resistencia a la ampicilina, a la kanamicina, a la higromicina, a la geneticina y/o a la nurseotricina.
El vector de expresión puede comprender igualmente una o varias secuencias que permitan la inserción dirigida del vector, del casete de expresión o del ácido nucleico en el genoma de una célula hospedadora. Preferentemente, la inserción se realiza a nivel de un gen cuya inactivación permite la selección de las células hospedadoras que hayan integrado el vector, el casete o el ácido nucleico, tal como el locus TRP1.
El vector puede ser circular o lineal, de cadena simple o doble. Se elige ventajosamente entre plásmidos, fagos, fagémidos, virus, cósmidos y cromosomas artificiales. De manera preferida, el vector es un plásmido.
La presente invención se refiere en particular a un vector, preferentemente a un plásmido, que comprende un origen de replicación bacteriana, preferentemente el origen ColE1, un ácido nucleico tal como se define anteriormente bajo el control de un promotor, preferentemente un promotor constitutivo, tal como el promotor ADH1, un terminador, preferentemente el terminador ADH1, uno o varios marcadores de selección, preferentemente marcadores de resistencia, tales como el gen de resistencia a la kanamicina o a la ampicilina, y una o varias secuencias que permitan la inserción dirigida del vector, del casete de expresión o del ácido nucleico en el genoma de la célula hospedadora, preferentemente en el locus TRP1 del genoma de la levadura.
En un modo de realización particular, el ácido nucleico según la invención portado por el vector codifica una proteína de fusión que comprende una o varias etiquetas, preferentemente que comprende una etiqueta constituida por seis histidinas y/o uno o varios motivos Flag, preferentemente tres motivos Flag. Preferiblemente la o las etiquetas son carboxiterminales.
Según un modo de realización particular, el vector de expresión es el plásmido P1 de la secuencia nucleotídica SEQ ID NO: 1 o el plásmido P2, de la secuencia nucleotídica SEQ ID NO: 2.
La presente invención se refiere igualmente a la utilización de un ácido nucleico, de un casete de expresión o vector de expresión según la invención para transformar o transfectar una célula. La célula hospedadora puede ser transformada/transfectada de forma transitoria o estable, y el ácido nucleico, el casete o vector puede estar contenido dentro de la célula en forma de un episoma o integrado en el genoma de la célula hospedadora.
La presente invención se refiere a una célula hospedadora que comprende una proteína de fusión, un ácido nucleico, un casete o vector de expresión según la invención.
Preferentemente, la célula es una célula eucariota, en particular una célula de levadura, vegetal, un hongo o una célula animal. De manera particularmente preferida, la célula hospedadora es una célula de levadura. La célula hospedadora no es humana.
Según un modo de realización particular, la célula eucariota es una célula de levadura, en particular una levadura de interés industrial. Algunos ejemplos de levaduras de interés comprenden, sin limitación, levaduras del género Saccharomyces sensu stricto, Schizosaccharomyces, Yarrowia, Hansenula, Kluyveromyces, Pichia o Candida, así como los híbridos obtenidos a partir de una cepa perteneciente a uno de estos géneros.
Preferentemente, la levadura de interés pertenece al género Saccharomyces, preferentemente una levadura seleccionada del grupo que consiste en Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus (denominada también Saccharomyces carlsbergensis), y los híbridos obtenidos a partir de al menos una cepa perteneciente a una de estas especies, aún más preferentemente dicha célula hospedadora eucariota es Saccharomyces cerevisiae.
Según otro modo de realización particular, la célula eucariota es una célula fúngica, en particular una célula fúngica de interés industrial. Algunos ejemplos de hongos comprenden, sin limitación, células de hongos filamentosos. Los hongos filamentosos incluyen hongos pertenecientes a las subdivisiones Eumycota y Oomycota. Las células de hongos filamentosos pueden seleccionarse del grupo que consiste en células de Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Flumicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Pénicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium o Trametes.
En otro modo de realización preferido, la célula es una célula vegetal, preferentemente una célula vegetal seleccionada del grupo que consiste en arroz, trigo, soja, maíz, tomate, Arabidopsis thaliana, cebada, colza, algodón, caña de azúcar, remolacha, aún más preferentemente dicha célula hospedadora eucariota es una célula de arroz.
La presente invención se refiere igualmente a la utilización de la proteína de fusión, del ácido nucleico, del casete de expresión o del vector de expresión según la invención para (i) inducir recombinaciones meióticas dirigidas en una célula eucariota, (ii) generar variantes de un organismo eucariota, y/o (iii) identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota.
La presente invención se refiere además a un kit que comprende una proteína de fusión, un ácido nucleico, un casete de expresión o un vector de expresión según la invención, o una célula hospedadora transformada o transfectada con un ácido nucleico, un casete de expresión o un vector de expresión según la invención. Igualmente se refiere a la utilización de dicho kit para implementar un procedimiento según la invención, en particular para (i) inducir recombinaciones meióticas dirigidas en una célula eucariota, (ii) generar variantes de un organismo eucariota, y/o (iii) identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota.
Los procedimientos según la invención pueden ser procedimientos in vitro, in vivo o ex vivo.
Los siguientes ejemplos se presentan con fines ilustrativos y no limitantes.
Ejemplos
1. Diseño, síntesis y clonación de una secuencia nucleotídica que codifica la proteína SpCas9 y su forma SpCas9* que es deficiente en la actividad nucleasa.
El gen SpCas9 que codifica la proteína Cas9 procede de la cepa bacteriana Streptococcus pyogenes. La forma catalíticamente inactiva de SpCas9 (SpCas9*) se distingue de SpCas9 por dos mutaciones puntuales: el aspartato 10 y la histidina 840 han sido sustituidos por alaninas (Asp10->Ala10 e His840->Ala840).
Debido a las variaciones en la frecuencia de utilización de los codones genéticos entre Streptococcus pyogenes y Saccharomyces cerevisiae, las secuencias de los genes SpCas9 y SpCas9* se adaptaron con el fin de optimizar su expresión en la levadura (levadura_optim_SpCas9 y levadura_optim_SpCas9*). Las secuencias de aminoácidos de las dos proteínas no se modificaron.
2. Modificación de las secuencias levadura_optim_SpCas9 y levadura_optim_SpCas9* con el fin de fusionar las proteínas SpCas9 y SpCas9* con la transesterasa meiótica Spo11.
Las etapas de modificación de las secuencias levadura_optim_SpCas9 y levadura_optim_SpCas9* permitieron fusionar las proteínas SpCas9 y SpCas9* con una señal de localización nuclear (NLS) asociada a una secuencia conectora (conector 1) en el aminoterminal y con una segunda secuencia conectora (conector 2) en el extremo carboxiterminal (que separará las proteínas SpCas9 y SpCas9* de la proteína Spo11 en la construcción final). Las secuencias nucleotídicas así obtenidas y que codifican las secuencias proteicas NLS-conector1-SpCas9-conector2 y NLS-conector1-SpCas9*-conector2 se clonaron después en un plásmido integrador, que contiene la forma completa de la proteína Spo11 de Saccharomyces cerevisiae etiquetada con una secuencia que codifica el doble motivo 6xHis-3xFlag en el carboxiterminal y cuya expresión está controlada por el promotor constitutivo pADH1. Las construcciones plasmídicas resultantes, P1 y P2, contenían por tanto la fusión en fase del extremo aminoterminal de NLS-conector1-SpCas9-conector2 y NLS-conector1-SpCas9*-conector2 con la proteína Spo11. Consecuentemente, P1 y P2 permitieron, respectivamente, la expresión constitutiva en la levadura de las proteínas de fusión NLS-SpCas9-Spo11-6xHis-3xFlag (SEQ ID NO: 6) y NLS-SpCas9*-Spo11-6xHis-3xFlag (SEQ ID NO: 7) (figura 1).
3. Modificación de los vectores de expresión de los ARN "guía" únicos y múltiples.
A partir de un plásmido de 2 micrómetros (2 pm) (Farzadfard F et al., 2013, ACS Synth. Biol., 2, págs. 604-613; DiCarlo JE et al., 2013, Nucleic Acids Res., 41 (7), págs. 4336-4343) que contiene la región de asa (82 nucleótidos) de un ARN "guía" (ARNg), colocado bajo el control de un promotor constitutivo dependiente de la ARN polimerasa III, tal como pRPR1 o SNR52, el vector de expresión de un único ARNg de 102 nucleótidos se construyó clonando la secuencia de 20 nucleótidos que determina la especificidad del ARNg (región "SDS") a nivel de un sitio de restricción situado inmediatamente en 5' a la secuencia que codifica la región de asa del vector linealizado, por el procedimiento de ensamblaje de Gibson (figura 2A).
Este vector de expresión presentaba una secuencia que contenía múltiples sitios de restricción únicos (sitios de clonación múltiple (MCS) después del terminador (RPR1t o secuencia flanqueante en 3' de SUP4). También, con el fin de obtener un sistema que permita el direccionamiento multiplexado a los sitios de recombinación meiótica, se introdujeron varios casetes de expresión de ARNg en el vector de expresión a nivel de su MCS. Los casetes de expresión del ARNg están compuestos por un promotor constitutivo dependiente de la ARN polimerasa III (pRPR1 o SNR52), por el ARNg específico y un terminador (RPR1t o la secuencia flanqueante en 3' de SUP4). Estos casetes de expresión del ARNg se clonaron en primer lugar en vectores de expresión de ARNg único (véase anteriormente), después se amplificaron mediante una PCR antes de ser clonados sucesivamente a nivel del sitio de clonaciones múltiples (MCS) del vector de expresión de un único ARNg mediante técnicas clásicas de inserción/ligación (figura 2B). Esta estrategia dio lugar a la concatenación de varios casetes de ARNg en un único vector de expresión.
4. Coexpresión de las proteínas de fusión SpCas9-Spo11 y SpCas9*-Spo11 con los ARNg en la levadura.
Con el fin de introducir las fusiones NLS-SpCas9-Spo11 o NLS-SpCas9*-Spo11 en el locus cromosómico TRP1, las cepas de levadura Saccharomyces cerevisiae se transformaron por choque térmico con los vectores P1 o P2 linealizados. Estas proteínas de fusión, que portan la etiqueta carboxiterminal 3xFlag, se colocaron bajo el control del promotor constitutivo ADH1. Después de la transformación, las células se extendieron en placas de Petri que contenían un medio selectivo (adaptado a los marcadores de selección portados por los plásmidos P1 y P2) con el fin de seleccionar los transformantes que hubieran integrado la fusión en su genoma.
A continuación, el vector de expresión del o de los ARNg se introdujo en cepas diploides de levadura que expresaban las proteínas de fusión NLS-SpCas9-Spo11 o NLS-SpCas9*-Spo11 mediante una transformación por choque térmico. A continuación, las células se extendieron en un medio selectivo para los marcadores de selección de los plásmidos de expresión del o de los ARNg. Los plásmidos de expresión del ARNg contenían un origen de replicación de 2 micrómetros (2 pm) que permitía mantenerlos con un número de copias elevado en cada célula de levadura (50-100 copias/célula).
La formación de roturas meióticas de la doble cadena generadas de forma individual o multiplexada por las proteínas de fusión SpCas9-Spo11 o SpCas9*-Spo11 en los sitios genómicos objetivo de los ARNg únicos o múltiples se detecta a continuación mediante un análisis con la técnica de Southern del ADN genómico extraído de las células diploides cultivadas en medio de esporulación.
5. Complementación de las esporas procedentes de la esporulación de las cepas inactivadas para el gen SPO11 mediante la expresión de la proteína de fusión SpCas9*-Spo11
Los inventores analizaron la viabilidad de las esporas procedentes de la meiosis de las siguientes cepas diploides de Saccharomyces cerevisiae:
- una cepa SPO11/SPO11 (ORD7339) que comprende dos copias del alelo natural del gen SPO11,
- una cepa spo11/spo11 (AND2822) que comprende dos copias del alelo mutado del gen SPO11. Este alelo mutado corresponde al alelo natural en el que se ha insertado un marcador genético que inactiva completamente el gen,
- una cepa spo11/spo11 dCAS9-SPO11/0 (AND2820) que comprende dos copias del alelo mutado del gen SPO11 y una copia del gen que codifica la proteína de fusión SpCas9*-Spo11 integrada en una de las dos copias del cromosoma IV en el locus TRP1, y
- una cepa spo11/spo11 dCAS9-SPO11/dCAS9-SPO11 (AND2823) que comprende dos copias del alelo mutado del gen SPO11 y dos copias del gen que codifica la proteína de fusión SpCas9*-Spo11 integrada en las dos copias del cromosoma IV en el locus TRP1.
Los resultados presentados en la figura 5 muestran que la expresión de la proteína de fusión SpCas9*-Spo11 complementa la inviabilidad de las esporas procedentes de la esporulación de las cepas inactivadas por el gen SPO11.
6. Direccionamiento a las roturas meióticas de la doble cadena por parte de la proteína de fusión SpCas9*-Spo11 y un ARN guía específico de la región YCR048W
El casete de expresión de SpCas9*-Spo11 (dCAS9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). El ARN guía (ARNsg) u As 1 -YCR048W (SEQ ID NO: 10) fue expresado por el plásmido multicopia replicativo (no integrador), tal como se describe en la figura 2A. El gen de fusión portador de la construcción dCAS9-SPO11 se expresó bajo el control del promotor constitutivo ADH1. El ARN guía se expresó bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción dCAS9-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
- SPO11/SPO11 (ORD7304),
- SPO11/SPO11 que expresa el ARN guía (ARNsg) UAS1-YCR48W (ANT2524),
- spo11/spo11 dCAS9-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2527),
- spol 1/spo11 dCAS9-SPO11/0 que expresa el ARN guía (ARNsg) UAS1-YCR48W (ANT2528), y
- spo11/spo11 dCAS9-SPO11/dCAS9-SPO11 que expresa el ARN guía (ARNsg) UAS1-YCR48W (ANT2529).
Las células se recogieron después de la transferencia al medio de esporulación (1 % de Kac) y se extrajeron en los tiempos indicados (horas). Las cepas son homocigotas para la deleción del gen SAE2, lo que inhibe la reparación de las roturas del ADN de cadena doble (CDB). La acumulación de las CDB se detectó mediante la técnica de Southern tras la digestión del ADN genómico con la enzima de restricción Asel. El ADN se sondeó con un fragmento interno en el locus YCR048W. La cuantificación de las bandas se realizó con el programa informático ImageJ.
Los resultados presentados en la figura 6 muestran que la expresión de la construcción SpCas9*-Spo11 (dCAS9-SPO11) indujo roturas meióticas del ADN de cadena doble (CDB) en los sitios naturales de corte de la proteína Spo11 (región YCR043C-YCR048Wdel cromosoma III, (las CDB I a VI, representadas por cuadrados negros en la figura 6), así como en el sitio UAS1 (la CDB VII, triángulo negro) objetivo del ARN guía UAS1-YCR048W y localizado en la región codificante del gen YCR048W.
7. Direccionamiento a las roturas meióticas de la doble cadena por parte de la proteína de fusión SppCas9*-Spo11 y un ARN guía específico de la región YCR048W
El casete de expresión de SpCas9*-Spo11 (dCAS9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). El ARN guía (ARNsg) UAS1-YCR048W o UAS2-YCR048W (SEQ ID NO: 11) fue expresado por el plásmido multicopia replicativo (no integrador), tal como se describe en la figura 2A. El gen de fusión portador de la construcción dCAS9-SPO11 se expresó bajo el control del promotor constitutivo ADH1. El ARN guía se expresó bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción dCAS9-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
- SPO11/SPO11 (ORD7304),
- SPO11/SPO11 que expresa el ARN guía (ARNsg) UAS1-YCR048W (ANT2524),
- SPO11/SPO11 dCAS9-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2518),
- SPO11/SPO11 dCAS9-SPO11/0 que expresa el ARN guía (ARNsg) UAS1-YCR048W (ANT2519),
- SPO11/SPO11 dCAS9-SPO11MCAS9-SPO11 que expresa el ARN guía (ARNsg) UAS1-YCR48W (ANT2522),
- SPO11/SPO11 dCAS9-SPO11/0 que expresa el ARN guía (ARNsg) UAS2-YCR048W (ANT2520),
- SPO11/SPO11 dCAS9-SPO11MCAS9-SPO11 que expresa el ARN guía (ARNsg) UAS2-YCR048W (ANT2523), y
- spo11/spo11 dCAS9-SPO11/0 que expresa el ARN guía (ARNsg) UAS1-YCR048W (ANT2528).
Las células se recogieron después de la transferencia al medio de esporulación (1 % de Kac) y se extrajeron en los tiempos indicados (horas). Las cepas son homocigotas para la deleción del gen SAE2, lo que inhibe la reparación de las roturas del ADN de cadena doble (CDB). La acumulación de las CDB se detectó mediante la técnica de Southern tras la digestión del ADN genómico con las enzimas de restricción Asel y Sud. El ADN se sondeó con un fragmento interno en el locus YCR048W. La cuantificación de las bandas se realizó con el programa informático ImageJ.
Los resultados presentados en la figura 7 indican que la expresión de la construcción dCAS9-SPO11 indujo roturas meióticas del ADN de cadena doble (CDB) en los sitios naturales de corte de la proteína Spo11 (región YCR047C-YCR048W del cromosoma III (las CDB V y VI, representadas por cuadrados), así como en el sitio UAS1-YCR048W (la CDB VII, representada por un triángulo) objetivo del ARN guía UAS1-YCR048W en la región codificante en 5' del gen YCR048W y en el sitio UAS2-YCR048W (la CDB VIII, representada por un círculo) objetivo del ARN guía UAS2-YCR048W en la región codificante en 3' del gen YCR048W. Estos resultados muestran que el direccionamiento es eficaz en las cepas portadoras del gen SPO11 natural o spo11 mutado.
8. Direccionamiento a las roturas meióticas de la doble cadena por parte de la proteína de fusión SppCas9*-Spo11 y un ARN guía específico de la región GAL2
El casete de expresión de SpCas9*-Spo11 (dCAS9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). El ARN guía (ARNsg) u As D/E-GAL2 (SeQ ID NO: 12) fue expresado por el plásmido multicopia replicativo (no integrador), tal como se describe en la figura 2A. El gen de fusión portador de la construcción dCAS9-SPO11 se expresó bajo el control del promotor constitutivo ADH1. El ARN guía se expresó bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción dCAS9-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
- SPO11/SPO11 (ORD7304),
- spo11/spo11 GAL4/GAL4 dCAS9-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2527),
- spo11/spo11 gal4/gal4 dCAS9-SPO11/0que expresa el ARN guía de asa (ANT2536) (ambos alelos del gen GAL4 están mutados y, por tanto, son inactivos),
- spo11/spo11 GAL4/GAL4 dCAS9-SPO11/0 que expresa el ARN guía UAS D/E-GAL2 (ANT2530), y
- spo11/spo11 gal4/gal4 dCAS9-SPO11/0 que expresa el ARN guía UAS D/E-GAL2 (ANT2533).
Las células se recogieron después de la transferencia al medio de esporulación (1 % de Kac) y se extrajeron en los tiempos indicados (horas). Las cepas son homocigotas para la deleción del gen SAE2, lo que inhibe la reparación de las roturas del ADN de cadena doble (CDB). La acumulación de las CDB se detectó mediante la técnica de Southern tras la digestión del ADN genómico con la enzima de restricción Xbal. El ADN se sondeó con la parte terminal del gen GAL2. La cuantificación de las bandas se realizó con el programa informático ImageJ.
Los resultados presentados en la figura 8 muestran que la expresión de la construcción dCAS9-SPO11 indujo roturas meióticas del ADN de cadena doble (CDB) en el sitio UAS D/E del promotor del gen GAL2, objetivo del ARN guía UAS D/E-GAL2.
9. Direccionamiento a las roturas meióticas de la doble cadena por parte de la proteína de fusión SppCas9*Spo11 y un ARN guía específico de la región SWC3
El casete de expresión de SpCAS9*-SPO11 (dCas9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). El ARN guía (ARNsgsw C 3) SWC3 (SEQ ID NO: 13) fue expresado por el plásmido multicopia replicativo (no integrador), como se ha descrito anteriormente (figura 2A). El gen de fusión portador de la construcción SpCAS9*-SPO11 se expresó bajo el control del promotor constitutivo ADH1. El ARN guía se expresó bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción SpCAS9*-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
- SPO11/SPO11 (ORD7304),
- spo11/spo11 SpCAS9*-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2527),
- spo11/spo11 SpCAS9*-SPO11/0 que expresa el ARN guía (ARNsgsw C 3) SWC3 (ANT2564).
Las células se recogieron después de la transferencia al medio de esporulación (1 % de Kac) y se extrajeron en los tiempos indicados (horas). Las cepas son homocigotas para la deleción del gen SAE2, lo que inhibe la reparación de las roturas del ADN de cadena doble (CDB). La acumulación de las CDB se detectó mediante la técnica de Southern tras la digestión del ADN genómico con las enzimas de restricción Pacl y Avril. El ADN se sondeó con un fragmento interno en el locus SPO7. La cuantificación de las bandas se realizó con el programa informático ImageJ.
Los resultados presentados en la figura 9 muestran que la expresión de la construcción SpCAS9*-Spo11 indujo roturas meióticas del ADN de cadena doble (CDB) en los sitios de corte naturales de la proteína Spo11 (región SIN8-SWC3) del cromosoma I, (las CDB I, II y III, representadas por cuadrados negros en la figura 9), así como en el sitio objetivo (las CDB IV, representadas por un círculo) del ARN guía (ARNsgsw C 3) SWC3 y localizado en la región codificante del gen SWC3.
10. Direccionamiento a las roturas meióticas del ADN de cadena doble por parte de la proteína SppCas9*-Spol l y varios ARN guía multiplexados específicos de la región GAL2
El casete de expresión de SpCAS9*-Spo11 (dCas9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). Los ARN guía (ARNsguAS-A) UAS-A (SEQ ID NO: 14), (ARNsgu A s e ) UAS-B (SEQ ID NO: 15) y (ARNsg uas- d/ e) UAS-D/E (SEQ ID NO: 12) fueron expresados individualmente y multiplexados (multi ARNg) por el plásmido multicopia replicativo (no integrativo) como se ha descrito anteriormente (figura 2A). El gen de fusión portador de la construcción SpCAS9*-SPO11 se expresó bajo el control del promotor constitutivo ADH1. Los ARN guía se expresaron bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción SpCAS9*-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
-spo11/spo11 GAL4/GAL4 SpCAS9*-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2527),
- spo11/spo11 GAL4/GAL4 SpCAS9*-SPO11/0 que expresa el ARN guía (ARNsguA s-A) UAS-A (ANT2532),
- spo11/spo11 gal4/gal4 SpCAS9*-SPO11/0 que expresa el ARN guía (ARNsguA s-A) UAS-A (ANT2534),
- spo11/spo11 GAL4/GAL4 SpCAS9*-SPO11/0 que expresa ARN guía (ARNsg uas-d/e) UAS-D/E (ANT2530),
- spo11/spo11 gal4/gal4 SpCAS9*-SPO11/0 que expresa ARN guía (ARNsg uas- d/e) UAS-D/E (ANT2533),
-spo11/spo11 GAL4/GAL4 SpCAS9*-SPO11/0 que expresa los ARN guía multiplexados (ARNsguA s-A) UAS-A, (ARNsg™) UAS-B y (ARNsg uas- d/e) UAS-D/E (multi ARNg) (ANT2551),
-spo11/spo11 gal4/gal4 SpCAS9*-SPO11/0 que expresa los ARN guía multiplexados (ARNsguA s-A) UAS-A, (ARNsg™) UAS-B y (ARNsg uas- d/e) UAS-D/E (multi ARNg) (ANT2552).
Las células se recogieron después de la transferencia al medio de esporulación (1 % de Kac) y se extrajeron en los tiempos indicados (horas). Las cepas son homocigotas para la deleción del gen SAE2, lo que inhibe la reparación de las roturas del ADN de cadena doble (CDB). La acumulación de las CDB se detectó mediante la técnica de Southern tras la digestión del ADN genómico con la enzima de restricción Xbal. El ADN se sondeó con la parte terminal del gen GAL2. La cuantificación de las bandas se realizó con el programa informático ImageJ.
Los resultados presentados en la figura 10 indican que la expresión de la construcción SpCAS9*-Spo11 (dCasO-SPO11) indujo roturas meióticas del ADN de cadena doble (CDB) en los sitios objetivo del promotor del gen GAL2 en el cromosoma XII a través del o de los ARN guía. En particular, la coexpresión de SpCas9*-Spo11 con los ARNsg individuales ARNsguAs-A y ARNsguA s-D /E dio lugar a la generación de las CDB, respectivamente, en los sitios UAS-A y UAS-D/E. De manera interesante, el direccionamiento a SpCas9*-Spo11 mediante la coexpresión del ARNsguA s-A , ARNsgu A s -e y ARNsguAs-D /E dio lugar a la formación de CDB múltiples en los diferentes sitios objetivo.
11. Estimulación de la recombinación meiótica por parte de la proteína SppCas9*-SPO11 y de varios ARN guía multiplexados en la región objetivo GAL2
Con el fin de detectar los entrecruzamientos genéticos inducidos por la expresión de CRISPR/SpCas9*-Spo11, se insertaron los casetes NatMX y HphMX (que confieren resistencia a la nurseotricina y a la higromicina, respectivamente) en trans antes y después del gen GAL2 en células diploides (véase la figura 11 A).
El casete de expresión de SpCAS9*-Spo11 (dCAS9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). El ARN guía (ARNsg uas- d/e) UAS-D/E (SEQ ID NO: 12) fue expresado por el plásmido multicopia replicativo (no integrador), como se ha descrito anteriormente (figura 2A). La expresión multiplexada de los ARN guía (ARNsguA s-A) UAS-A (SEQ ID NO: 14), (ARNsguA s-e) UAS-B (SEQ ID NO: 15) y (ARNsguAs-D/E) UAS-D/E (SEQ ID NO: 12) se realizó a partir del mismo plásmido de expresión de los ARN guía descritos anteriormente (multi ARNg). El gen de fusión portador de la construcción SpCAS9*-SPO11 se expresó bajo el control del promotor constitutivo ADH1. El ARN guía se expresó bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción SpCAS9*-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
- SPO11/SPO11 pEMP46::NatMX/0 tGAL2::KanMX/0 (ANT2527),
- spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2539),
- spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 que expresa el ARN guía (ARNsguAs-D/E) UAS-D/E (ANT2540),
- spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 que expresa los ARN guía multiplexados (ARNsguAS-A) UAS-A, (ARNsguAS-e) UAS-B y (ARNsg uas- d/e) UAS-D/E (multi ARNg) (ANT2557).
Después de la esporulación, se examinaron tétradas compuestas por 4 esporas y se genotiparon las esporas después de la germinación para evaluar la segregación con nurseotricina e higromicina. Se comparó el número de tétradas que mostraban un ditipo parental (P) con las que mostraban un tetratipo (T) y un ditipo no parental (NPD). La distancia genética en centimorgans se determinó según la fórmula cM = 100(T+6NPD)/2(PD+T+NPD). El aumento del número de tetratipos en las células que expresan SpCAS9*-SPO11 (las cepas ANT2540 y ANT 2557) se analizó estadísticamente con la prueba de Fisher calculando el valor de p con respecto a las células que coexpresan SpCAS9*-SPO11 y el ARN guía de asa (cepa ANT2539).
Los resultados presentados en la figura 11B muestran que la expresión de la construcción SpCAS9*-SPO11 (dCAS9-SPO11) estimula la recombinación meiótica en la región GAL2 objetivo.
12. Direccionamiento a las roturas meióticas del ADN de cadena doble por parte de la proteína de fusión SppCas9*-Spo11 y un ARN guía específico de la secuencia codificante del gen PUT4
El casete de expresión de SpCAS9*-Spo11 (dCAS9-SPO11) se integró en el locus cromosómico TRP1 (cromosoma IV). El ARN guía (ARNsgpu4) PUT4 (SEQ ID NO: 16) fue expresado por el plásmido multicopia replicativo (no integrador), como se ha descrito anteriormente (figura 2A). El gen de fusión portador de la construcción SpCAS9*-SPO11 se expresó bajo el control del promotor constitutivo ADH1. El ARN guía se expresó bajo el control del promotor constitutivo RPR1. Las células de levadura se transformaron por el método clásico de electroporación. La integración del casete portador de la construcción SpCAS9*-SPO11 se verificó mediante la técnica de Southern.
Las cepas utilizadas son las siguientes:
- SPO11/SPO11 (ORD7304),
- spo11/spo11 SpCAS9*-SPO11/0 que expresa el ARN guía de asa, es decir, un ARN guía sin la región SDS que es específico para el objetivo cromosómico (ANT2527),
- spo11/spo11 SpCAS9*-SPO11/0 que expresa el ARN guía (ARNsgPUT4) PUT4 (ANT2547).
Las células se recogieron después de la transferencia al medio de esporulación (1 % de Kac) y se extrajeron en los tiempos indicados (horas). Las cepas son homocigotas para la deleción del gen SAE2, lo que inhibe la reparación de las roturas del ADN de cadena doble (CDB). La acumulación de las CDB se detectó mediante la técnica de Southern tras la digestión del ADN genómico con las enzimas de restricción fíamHI y Xhol. El ADN se sondeó con un fragmento interno en el locus CIN1. La cuantificación de las bandas se realizó con el programa informático ImageJ.
Los resultados presentados en la figura 12 muestran que la expresión de la construcción SpCAS9*-SPO11 (dCas9-SPO11) indujo roturas meióticas del ADN de cadena doble (CDB) en los sitios naturales de corte de la proteína Spo11 (región PYK2-PUT4) del cromosoma XV, (las CDB I, II, III y V, representadas por cuadrados negros en la figura 11), así como en el sitio objetivo (las CDB IV, representadas por un triángulo negro) del ARN guía (ARNsgPUT4) PUT4 y localizado en la región codificante del gen PUT4.
13. Conclusión
Los resultados presentados en las figuras 5 a 12 demuestran que:
- la expresión de la proteína de fusión SpCas9*-Spo11 (dCAS9-SPO11) complementa la inviabilidad de las esporas procedentes de la esporulación de las cepas inactivadas para el gen SPO11,
- la expresión de la proteína de fusión SpCas9*-Spo11 (dCAS9-SPO11) indujo la formación de roturas meióticas de la cadena doble en los lugares naturales de las CDB,
- la coexpresión de la proteína de fusión SpCas9*-Spo11 (dCAS9-SPO11) y de un ARNg indujo la formación de roturas meióticas de la cadena doble en los lugares naturales de las CDB y en el sitio objetivo,
- la coexpresión de la proteína de fusión SpCas9*-Spo11 (dCAS9-SPO11) y de los ARNg multiplexados indujo la formación de roturas meióticas de la doble cadena CDB en los diferentes sitios objetivo, y
- el direccionamiento es eficaz tanto en las cepas de fondo genético SPO11 natural como spo11 mutada.
14. Inducción de roturas meióticas de la cadena doble por parte de la proteína de fusión SppCas9*-Spo11 en el arroz
a) Realización del vector de transformación dCas9-SPO11 (véase la figura 14)
Al ser la Cas9 una proteína de origen procariota, los codones utilizados se optimizan en función de la especie vegetal en la que se va a expresar la proteína. Por tanto, los codones de la proteína Cas9 de Streptococcus pyogenes se optimizan para su expresión en el arroz (véase Miao et al., Cell Research, 2013, págs. 1-4). Por otro lado, la proteína Cas9 se inactiva por la mutación de los dos sitios catalíticos RuvC y HNH (Asp10->Ala10 e His840->Ala840). La forma catalíticamente inactiva de SpCas9 se denomina SpCas9* o dCas9.
En primer lugar, se elimina el codón de parada de dCas9 y se añade una secuencia conectora (o conector) en fase en el carboxiterminal de dCas9. La secuencia conectora puede ser una secuencia ya conocida en la bibliografía para su uso en la especie vegetal en cuestión, o una secuencia optimizada. La secuencia conectora CCGGAATTTATGGCCATGGAGGCCCCGGGGATCCGT (SEQ ID NO: 17) utilizada en la levadura también es compatible con una utilización en el arroz.
También se añade una señal de localización nuclear (NLS) en el extremo aminoterminal de dCas9. Opcionalmente, se puede añadir una secuencia conectora entre la NLS y dCas9, tal como, por ejemplo, la secuencia GGTATTCATGGAGTTCCTGCTGCG (SEQ ID NO: 18).
La secuencia de SPO11 se añade entonces en fase en el carboxiterminal de la construcción NLS-dCas9-Conector. Es posible utilizar una secuencia de ADN complementario (ADNc), de ADN genómico (ADNg) o incluso una secuencia de ADN complementario con la adición de algunos intrones. Es posible utilizar la SPO11 -1 y/o la SPO11 -2 del arroz. El terminador de la nopalina sintasa (tNOS), adaptado para el arroz, se añade en fase en la construcción NLS-dCas9-Conector-SPO11.
El promotor de la ubiquitina del maíz pZmUbi1 (Christensen AH et al., 1992, Plant Mol Biol, 18 (4), págs. 675-689, o Christensen AH y Quail PH, 1995, T ransgenic Res, 5 (3), págs. 213-218), es un promotor que permite una expresión ubicua y fuerte en el arroz.
Para realizar una transformación estable de las células de arroz, la transfección se realiza con un vector binario, por ejemplo, el vector binario pCAMBIA5300 portador de un gen de resistencia a la higromicina interrumpido por un intrón del gen de la catalasa. Este gen de resistencia permite seleccionar eficazmente, en un medio selectivo, los individuos que hayan integrado la dCas9-SPO11 en su genoma. Este vector también contiene un gen de resistencia bacteriano a la kanamicina para facilitar las clonaciones y las manipulaciones en hospedadores bacterianos.
b) Realización de la construcción portadora del ARN guía
Con respecto a la región de asa del ARN guía (ARNg), se utiliza la secuencia "natural" de la bacteria S. pyogenes. Para la región "SDS", que determina la especificidad del ARNg, se elige en función de la zona objetivo de interés con la ayuda de programas informáticos de acceso gratuito en Internet (por ejemplo, CRISPR PLANT).
El ARN guía se coloca bajo el control del promotor U3 de la polimerasa III del arroz (véase Miao et al., Cell Research, 2013, págs. 1-4). Alternativamente, se coloca bajo el control del promotor U6.
- Vector binario único
La construcción que comprende el ARN guía colocado bajo el control del promotor U3 se integra en el vector que comprende dCAS9-SPO11.
- Vectores binarios individuales
Con el fin de dirigirse a varias regiones, los ARN guía son portados por un vector individual, un vector binario portador de resistencia a la geneticina (pCAMBIA2300), que permite aplicar una selección doble para la presencia del ADN-T dCas9-SPO11 y del ADN-T del ARNg.
Son posibles varias estrategias de transformación:
cotransformación: a partir de dos vectores binarios, uno portador de dCas9-SPO11 y el otro del (los) ARNg. Se introducen en la misma cepa bacteriana o en dos cepas bacterianas diferentes que se mezclan después, antes del cocultivo con las células vegetales.
transformaciones secuenciales: se producen transformantes estables portadores de la construcción dCas9-SPO11, y sus granos se utilizan para producir callos que se usan después para la transformación con la construcción de ARNg por Agrobacterium o por bombardeo.
transformaciones independientes: Por un lado, se generan plantas portadoras de dCAS9-SPO11 sin guía y, por otro se generan plantas portadoras de los ARNg individuales. A continuación, los transformantes estables se cruzan entre sí para realizar múltiples combinaciones.
c. Transformación del arroz
La transformación del arroz se realiza a partir de callos de embriones de granos maduros, siguiendo el protocolo detallado en Sallaud C et al., 2003, Theor Appl Genet, 106 (8), págs. 1396-1408.
Utilización de la tecnología dCas9-SPO11 para inducir una recombinación dirigida en el fondo natural SPO11 La proteína de fusión dCas9-SPO11 se produce con la proteína SPO11 natural (SPO11-1 o SPO11-2), en su forma de ADNg o ADNc.
- por transformación directa de callos procedentes de semillas F1: los callos se inducen a partir de embriones de semillas F1 maduras obtenidas por castración y fecundación manual entre dos líneas parentales de interés agronómico. Los callos se transforman simultáneamente con el o los ADN-T portadores de dCas9-SPO11 y el (los) ARNg (cotransformación). Los transformantes sin ARNg o con un ARNg dirigido a otra región se utilizan como controles para analizar la eficacia del sistema. El análisis de las recombinaciones se realiza con las plantas F2.
- mediante la transformación individual de los callos de cada progenitor: una línea se transforma de forma estable y homocigota con la construcción dCas9-SPO11 y se cruza con la otra línea portadora del (los) ARNg en inserción heterocigota. Se seleccionan las plantas F1 portadoras de ambas construcciones o únicamente de la construcción dCas9-SPO11. Las recombinaciones en el locus o los loci objetivo se cuantifican en las poblaciones F2 procedentes de ambos tipos de plantas.
Utilización de la tecnología dCas9-SPO11 para inducir una recombinación dirigida en el fondo mutante spo11
Una de las líneas parentales (granos portados por un heterocigoto SPO11/spo11) se transforma con la construcción dCas9-SPO11 y se obtienen plantas homocigotas para el transgén y la mutación spo11 en la generación T1. La segunda línea parental (granos portados por un heterocigoto SPO11/spo11) se transforma con la construcción portadora del o de los ARNg. En la generación T1 se obtienen plantas heterocigotas para la construcción de ARNg y la mutación spo 11. Los dos tipos de plantas se cruzan: se obtienen 4 genotipos de granos F1, todos ellos portadores de la construcción dCas9-SPO11 pero portando o no del ARNg y produciendo o no el SPO11 endógeno. El análisis de las recombinaciones se realiza en las poblaciones F2.

Claims (17)

REIVINDICACIONES
1. Procedimiento para inducir recombinaciones meióticas dirigidas en una célula eucariota no humana que comprende - la introducción en dicha célula:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 de la proteína de fusión y una secuencia complementaria a la región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula.
2. Procedimiento según la reivindicación 1, en el que la proteína de fusión comprende además una secuencia de señal de localización nuclear.
3. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que el dominio Cas9 es una proteína Cas9 deficiente en la actividad nucleasa.
4. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que la expresión del ácido nucleico que codifica dicha proteína de fusión se coloca bajo el control de un promotor constitutivo, inducible o específico de la meiosis.
5. Procedimiento según una cualquiera de las reivindicaciones anteriores, que comprende además la introducción de uno o varios ARN guía adicionales dirigidos a otra u otras diversas regiones cromosómicas, o ácidos nucleicos que codifiquen dichos ARN guía adicionales.
6. Procedimiento según una cualquiera de las reivindicaciones anteriores, en el que la célula es una levadura, y la inducción de la entrada en la profase I se obtiene preferentemente transfiriendo la levadura de un medio rico a un medio de esporulación.
7. Procedimiento según una cualquiera de las reivindicaciones 1 a 5, en el que la célula eucariota es una célula vegetal.
8. Procedimiento según una cualquiera de las reivindicaciones 1 a 7, en el que la introducción de la proteína de fusión, o del ácido nucleico que codifica la misma, y del o de los ARNg, o del o de los ácidos nucleicos que codifican los mismos, en dicha célula, es simultánea o secuencial.
9. Procedimiento según una cualquiera de las reivindicaciones 1 a 7, en el que la introducción del ácido nucleico que codifica la proteína de fusión y del o de los ácidos nucleicos que codifican el o los ARNg en dicha célula se obtiene cruzando dos células en las que se han introducido respectivamente el ácido nucleico que codifica la proteína de fusión y el o los ácidos nucleicos que codifican el o los ARNg.
10. Proteína de fusión tal como se define en una cualquiera de las reivindicaciones 1 a 3.
11. Ácido nucleico que codifica la proteína de fusión según la reivindicación 10.
12. Casete de expresión o vector que comprende un ácido nucleico según la reivindicación 11.
13. Célula hospedadora no humana que comprende una proteína de fusión según la reivindicación 10, un ácido nucleico según la reivindicación 11, un casete o un vector según la reivindicación 12, siendo dicha célula hospedadora preferentemente una célula eucariota, particularmente más preferentemente, una célula de levadura, vegetal, un hongo o una célula animal.
14. Célula hospedadora según la reivindicación 13, en la que dicha célula hospedadora es
- una célula de levadura, preferentemente seleccionada del grupo que consiste en Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus (denominada también Saccharomyces carlsbergensis), y los híbridos obtenidos a partir de al menos una cepa perteneciente a una de estas especies, aún más preferentemente, dicha célula hospedadora es Saccharomyces cerevisiae, o
- una célula vegetal, preferentemente una célula vegetal seleccionada del grupo que consiste en arroz, trigo, soja, maíz, tomate, Arabidopsis thaliana, cebada, colza, algodón, caña de azúcar y remolacha, aún más preferentemente, dicha célula hospedadora es una célula de arroz.
15. Procedimiento para generar variantes de un organismo eucariota, con la excepción del hombre, preferentemente una levadura o una planta, que comprende:
- la introducción en una célula de dicho organismo:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 y una secuencia complementaria de una región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula;
- la obtención de la o las células que presentan las recombinaciones deseadas en las regiones cromosómicas objetivo; y
- la génesis de una variante del organismo a partir de dicha célula recombinada.
16. Procedimiento para identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota no humana, preferentemente una levadura o una planta, que comprende:
- la introducción en la célula eucariota:
a) de una proteína de fusión que comprende un dominio Cas9 y un dominio Spo11 o de un ácido nucleico que codifica dicha proteína de fusión; y
b) de uno o varios ARN guía o de uno o varios ácidos nucleicos que codifican dichos ARN guía, comprendiendo dichos ARN guía una estructura de ARN de unión al dominio Cas9 y una secuencia complementaria de una región cromosómica objetivo; y
- la inducción de la entrada en la profase I de la meiosis de dicha célula;
- la obtención de la o las células que presentan las recombinaciones deseadas en las regiones cromosómicas objetivo; y
- el análisis de los genotipos y los fenotipos de las células recombinadas con el fin de identificar o localizar la información genética que codifica la característica de interés
siendo la característica de interés preferentemente un carácter cuantitativo de interés (QTL).
17. Utilización de un kit que comprende una proteína de fusión según la reivindicación 10, un ácido nucleico según la reivindicación 11, un casete o un vector según la reivindicación 12, o una célula hospedadora según una cualquiera de las reivindicaciones 13 y 14, para implementar un procedimiento según una cualquiera de las reivindicaciones 1 a 9, 15 y 16, en particular para (i) inducir recombinaciones meióticas dirigidas en una célula eucariota no humana, (ii) generar variantes de un organismo eucariota no humano, y/o (iii) identificar o localizar la información genética que codifica una característica de interés en el genoma de una célula eucariota no humana.
ES16703283T 2015-01-29 2016-01-29 Procedimiento para inducir recombinaciones meióticas dirigidas Active ES2894882T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1550707A FR3032203B1 (fr) 2015-01-29 2015-01-29 Procede pour induire des recombinaisons meiotiques ciblees
FR1555725 2015-06-22
PCT/EP2016/052000 WO2016120480A1 (fr) 2015-01-29 2016-01-29 Procede pour induire des recombinaisons meiotiques ciblees

Publications (1)

Publication Number Publication Date
ES2894882T3 true ES2894882T3 (es) 2022-02-16

Family

ID=55310809

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16703283T Active ES2894882T3 (es) 2015-01-29 2016-01-29 Procedimiento para inducir recombinaciones meióticas dirigidas

Country Status (7)

Country Link
US (2) US11248240B2 (es)
EP (2) EP3798302A1 (es)
AU (1) AU2016211118B2 (es)
BR (1) BR112017016045A2 (es)
CA (1) CA2974681A1 (es)
ES (1) ES2894882T3 (es)
WO (1) WO2016120480A1 (es)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
IL258821B (en) 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
CN109804066A (zh) 2016-08-09 2019-05-24 哈佛大学的校长及成员们 可编程cas9-重组酶融合蛋白及其用途
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US10245971B2 (en) * 2017-03-06 2019-04-02 Gates Corporation Motor-generator system
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
GB2575930A (en) 2017-03-23 2020-01-29 Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN107142272A (zh) * 2017-06-05 2017-09-08 南京金斯瑞生物科技有限公司 一种控制大肠杆菌中质粒复制的方法
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
FR3081473A1 (fr) 2018-05-24 2019-11-29 Meiogenix Promoteurs meiotiques et leurs utilisations
WO2020191249A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
WO2021007080A1 (en) * 2019-07-08 2021-01-14 Inscripta, Inc. Increased nucleic acid-guided cell editing via a lexa-rad51 fusion protein
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
FR3110575A1 (fr) * 2020-05-20 2021-11-26 Meiogenix utilisation d’une protéine de fusion pour induire des modifications génétiques par recombinaison méiotique ciblée
FR3110576A1 (fr) * 2020-05-20 2021-11-26 Meiogenix utilisation d’une protéine de fusion déficiente pour l’activité nucléase pour induire des recombinaisons méiotiques
US20230340539A1 (en) * 2020-05-26 2023-10-26 Zymergen Inc. Methods of transient protein and gene expression in cells
WO2022171736A1 (en) * 2021-02-10 2022-08-18 Limagrain Europe Multiplex targeted recombinations for trait introgression applications
WO2023247773A1 (en) 2022-06-24 2023-12-28 Meiogenix Induction of meiotic recombination using a crispr system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7273758B2 (en) 2002-07-19 2007-09-25 Centre National De La Recherche Scientifique Methods for inducing targeted stimulation of meiotic recombination and kits for performing said methods
US7279334B2 (en) * 2003-07-18 2007-10-09 Centre National De La Recherche Scientifique Methods for inducing targeted stimulation of meiotic recombination and kits for performing said methods
FR2998898A1 (fr) 2012-11-30 2014-06-06 Inst Curie Procede d'amelioration de souches de levure
PT3363902T (pt) 2012-12-06 2019-12-19 Sigma Aldrich Co Llc Modificação e regulação de genoma baseadas em crispr
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
MX2015007743A (es) * 2012-12-17 2015-12-07 Harvard College Ingenieria del genoma humano guiada por ácido robonucleico.
CN105025701B (zh) 2012-12-27 2018-09-25 凯津公司 去除植物中遗传连锁的方法
US10975406B2 (en) * 2014-07-18 2021-04-13 Massachusetts Institute Of Technology Directed endonucleases for repeatable nucleic acid cleavage
EP3845655A1 (en) * 2014-10-01 2021-07-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair

Also Published As

Publication number Publication date
BR112017016045A2 (pt) 2018-04-03
AU2016211118A1 (en) 2017-08-10
CA2974681A1 (fr) 2016-08-04
US20220162647A1 (en) 2022-05-26
EP3250688A1 (fr) 2017-12-06
AU2016211118B2 (en) 2022-03-31
EP3250688B1 (fr) 2021-07-28
WO2016120480A1 (fr) 2016-08-04
US11248240B2 (en) 2022-02-15
EP3798302A1 (fr) 2021-03-31
US20180023091A1 (en) 2018-01-25

Similar Documents

Publication Publication Date Title
ES2894882T3 (es) Procedimiento para inducir recombinaciones meióticas dirigidas
JP7379160B2 (ja) CRISPR-Cpf1を使用する誘導性で調整可能な多重ヒト遺伝子制御
US10858662B2 (en) Genome editing with split Cas9 expressed from two vectors
CA3111432A1 (en) Novel crispr enzymes and systems
EP3080275B1 (en) Method of selection of transformed diatoms using nuclease
CN101490267B (zh) 人工植物微染色体
WO2018107103A1 (en) Crispr-systems for modifying a trait of interest in a plant
CN107709562A (zh) 指导rna/cas内切核酸酶系统
US20200291395A1 (en) Novel crispr-associated transposon systems and components
JP2016539653A (ja) 微小藻類のゲノム操作のためのCas9ヌクレアーゼプラットフォーム
US20190144852A1 (en) Combinatorial Metabolic Engineering Using a CRISPR System
US20190352652A1 (en) Crispr-systems for modifying a trait of interest in a plant
AU2021274109A1 (en) Use of a fusion protein for inducing genetic modifications by targeted meiotic recombination
US20230174960A1 (en) Use of a deficient fusion protein for nuclease activity so as to induce meiotic recombinations
WO2023247773A1 (en) Induction of meiotic recombination using a crispr system
FR3032203A1 (fr) Procede pour induire des recombinaisons meiotiques ciblees
CN114835816A (zh) 一种调控植物基因组dna特定区域甲基化水平的方法
Jia et al. Characterization of Arabidopsis thaliana NHEJ mutants