ES2898460T3

ES2898460T3 - Composiciones y procedimientos para la modificación genómica dirigida al sitio

Info

Publication number: ES2898460T3
Application number: ES15755923T
Authority: ES
Inventors: Brent Brower-Toland; Andrei Kouranov; Rosemarie Kuehn; Richard Lawrence; Ervin Nagy; Linda Rymarquis; Veena Veena
Original assignee: Monsanto Technology LLC
Current assignee: Monsanto Technology LLC
Priority date: 2014-02-27
Filing date: 2015-02-27
Publication date: 2022-03-07
Anticipated expiration: 2035-02-27
Also published as: WO2015131101A1; US20240209385A1; EP3110945A4; US11952578B2; US11566254B2; US20220135991A1; US20230212596A1; EP3110945B1; EP3110945A1; CA3194412A1; CA2940217C; US11186843B2; US20170166912A1; CN106232803A; CA2940217A1; EP3971283A1

Abstract

Un constructo de ADN recombinante que comprende un promotor de ARNsn U6 unido operativamente a una secuencia que codifica un ARN de guía única (ARNsg), en el que la secuencia de dicho promotor de ARNsn U6 comprende la SEQ ID NO:200; o un fragmento de la misma, en la que el fragmento tiene al menos 140 pb de longitud y mantiene la actividad del promotor.

Description

DESCRIPCIÓN

Composiciones y procedimientos para la modificación genómica dirigida al sitio

ANTECEDENTES

Campo

La divulgación se refiere al campo de la biotecnología. Más específicamente, la divulgación proporciona un procedimiento de introducción de fragmentos de ADN de doble cadena de extremo romo recombinante en el genoma de una planta mediante la introducción de una rotura de doble cadena en el genoma y de novedosos promotores vegetales beneficiosos para la expresión de, por ejemplo, pequeños ARN no codificadores de proteínas para la modificación del genoma mediada por CRISPR.

Descripción de la técnica relacionada

La recombinación específica del sitio tiene potencial de aplicación en una amplia gama de campos relacionados con la biotecnología. Las meganucleasas, las nucleasas de dedos de zinc (ZFN) y las nucleasas efectoras similares a activadores de la transcripción (TALEN), que contienen un dominio de unión al ADN y un dominio de escisión del ADN, permiten modificar el genoma. Aunque las meganucleasas, las ZFN y las TALEN son eficaces y específicas, estas tecnologías requieren la generación, mediante ingeniería de proteínas, de uno o más componentes para cada sitio genómico elegido para la modificación. Los recientes avances en la aplicación de las repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR) han ilustrado un procedimiento de modificación del genoma que puede ser tan robusto como los sistemas comparables (meganucleasas, ZFNs y TALENs), pero que tiene la ventaja de ser rápido de diseñar.

El sistema de repeticiones palindrómicas cortas agrupadas e intercaladas regularmente (CRISPR) constituye un sistema inmunitario adaptativo en procariotas que se dirige a la escisión endonucleolítica de fagos invasores. El sistema se compone de un componente proteico (Cas) y un ARN guía (ARNg) que dirige la proteína a un locus específico para su corte endonucleolítico. Este sistema ha sido diseñado con éxito para dirigir loci específicos para la escisión endonucleolítica de genomas de mamíferos, pez cebra, drosophila, nematodos, bacterias, levaduras y plantas.

SUMARIO

En un aspecto, la invención proporciona un constructo de ADN recombinante que comprende un promotor de ARNsn U6; unido operativamente a una secuencia que codifica un ARN de guía única (ARNsg), donde la secuencia de dicho promotor de ARNsn comprende la SEQ ID NO: 200 ; o un fragmento de la misma, en la que el fragmento tiene al menos 140 pb de longitud y mantiene la actividad del promotor.

El constructo de ADN recombinante puede comprender además una secuencia que codifica un promotor unido operativamente a una secuencia que codifica un producto génico de la endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR). En ciertas realizaciones de el constructo de ADN recombinante, el producto génico de la endonucleasa Cas puede estar unido operativamente a una secuencia de localización nuclear (NLS). Además, en ciertas realizaciones de el constructo de a Dn recombinante contemplada, la secuencia que codifica dicha endonucleasa Cas puede seleccionarse del grupo que consiste en la SEQ ID NO:27, SEQ ID NO:68, y SEQ ID NO:97, SEQ ID NO:119, y SEQ ID NO:136.

Otro aspecto de la invención proporciona un constructo de ADN recombinante que comprende un promotor de ARNsn U6 "; unido operativamente a una secuencia que especifica un ARN no codificador, donde la secuencia de dicho promotor de ARNsn comprende la SEQ ID NO: 200 o un fragmento de promotor activo del mismo, en el que el fragmento tiene al menos 140 pb de longitud. En algunas realizaciones el a Rn no codificador se selecciona del grupo que consiste en: un microARN (miARN), un precursor de miARN, un ARN de interferencia pequeño (ARNip), un a Rn pequeño (22-26 nt de longitud) y el precursor que lo codifica, un ARNip heterocromático (hc-ARNip) un ARN que interactúa con Piwi (piARN), un ARN de doble cadena con horquilla (hairpin ARNbc), un ARNip de acción trans (ta-ARNip) y un ARNip antisentido de origen natural (nat-ARNip).

Otro aspecto de la invención proporciona una célula que comprende un constructo de ADN recombinante como el descrito anteriormente. En ciertas realizaciones, la célula es una célula vegetal.

La invención proporciona además un procedimiento para introducir una rotura de doble cadena en el genoma de una célula, que comprende introducir en dicha célula: a) al menos un constructo de ADN recombinante de la reivindicación 1; y b) un segundo constructo de ADN recombinante que comprende una secuencia que codifica un promotor unido operativamente a una secuencia que codifica un producto génico de endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR) unido operativamente a una secuencia de localización nuclear (NLS).

En aún otra realización del procedimiento, la secuencia que codifica dicha endonucleasa Cas se selecciona del grupo que consiste en la SEQ ID NO:27, SEQ ID NO:68, y SEQ ID NO:97, SEQ ID NO: 119, y SEQ ID NO: 136.

La invención proporciona además un procedimiento para introducir una rotura de doble cadena en el genoma de una célula, que comprende introducir en dicha célula al menos un constructo de ADN recombinante que comprende un constructo de a Dn recombinante que comprende un promotor de ARNsn U6; unido operativamente a una secuencia que codifica un ARN de guía única (ARNsg), en la que la secuencia de dicho promotor de ARNsn comprende la SEQ ID NO: 200; o un fragmento de promotor activo del mismo, en el que el fragmento tiene una longitud de al menos 140 pb, y que además comprende una secuencia que codifica un promotor unido operativamente a una secuencia que codifica un producto génico de la endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR).

Otro aspecto de la invención proporciona un procedimiento de modificación del genoma que comprende:

a) introducir una rotura de doble cadena en un lugar seleccionado del genoma de una célula vegetal mediante los procedimientos descritos anteriormente y b) introducir en dicha célula vegetal un fragmento de ADN de doble cadena recombinante de extremo romo, en el que dicho fragmento de ADN de doble cadena recombinante de extremo romo se incorpora a dicha rotura de doble cadena mediante la reparación endógena del ADN. El procedimiento puede comprender la modificación del genoma, como la producción de un bloque de enlace modificado, la vinculación de dos o más QTL, la interrupción del enlace de dos o más QTL, la inserción de genes, la sustitución de genes, la conversión de genes, la supresión o interrupción de un gen, la selección de eventos transgénicos, la selección de donantes de rasgos transgénicos, la sustitución de transgenes o la inserción dirigida de al menos un ácido nucleico de interés. En algunas realizaciones del procedimiento, la rotura de doble cadena es introducida por una endonucleasa. En ciertas realizaciones, la endonucleasa puede seleccionarse del grupo que consiste en: una endonucleasa TALEN; una endonucleasa CRISPR; una meganucleasa que comprende un motivo de secuencia "LAGLIDADG", "GIY-YIG", "His-Cys box" o HNH; y una nucleasa de dedo de zinc. En realizaciones particulares, la endonucleasa es una endonucleasa TALEN y los constructos de expresión TALEN se introducen en la célula vegetal, en la que se introducen aproximadamente 0,1 pmol de cada constructo de expresión TALEN en la célula vegetal.

Además, en el procedimiento la célula vegetal puede ser un protoplasto o puede haber sido, o estar siendo, cultivada en un cultivo de células vegetales. En ciertas realizaciones del procedimiento, la célula vegetal se selecciona del grupo que consiste en: una célula vegetal de soja; una célula vegetal de maíz; una célula vegetal de arroz; una célula vegetal de trigo; una célula vegetal de pasto de grama; una célula vegetal de algodón; y una célula vegetal de canola. En otras realizaciones del procedimiento, el fragmento de ADN de doble cadena recombinante de extremo romo no comprende una región de homología con el sitio seleccionado en el genoma.

Se contemplan realizaciones del procedimiento en las que se introduce en dicha célula vegetal entre aproximadamente 0,03 y aproximadamente 0,3 fmol de fragmento de ADN de doble cadena recombinante de extremo romo. En particular, se introduce en dicha célula vegetal aproximadamente 0,15 fmol de fragmento de ADN de doble cadena recombinante de extremo romo. Además, el fragmento de ADN de doble cadena de extremo romo puede comprender en el extremo 5', o en el extremo 3', o en ambos extremos 5' y 3', una región con microhomología a una secuencia que comprende uno o ambos extremos de dicha rotura de doble cadena en el genoma. Algunas realizaciones comprenden un procedimiento en el que la región de microhomología se selecciona entre una secuencia de 1 pb, 2 pb, 3 pb, 4, pb, 5 pb, 6 pb, 7 pb, 8 pb, 9 pb o 10 pb de longitud. En una realización particular del procedimiento, la región de microhomología tiene una longitud de 3 pb.

El procedimiento puede comprender la introducción de una rotura de doble cadena en el paso a) como se ha descrito anteriormente, proporcionando a dicha célula una endonucleasa diseñada para dirigirse a un sitio diana seleccionado en el genoma de dicha célula. Además, la endonucleasa puede ser proporcionada por al menos un constructo de ADN recombinante que codifica la endonucleasa. En una realización, la endonucleasa se proporciona mediante el suministro de un ARNm que codifica la endonucleasa o la endonucleasa a la célula vegetal. En realizaciones particulares La endonucleasa es una endonucleasa CRISPR. Otras realizaciones pueden comprender la introducción de una rotura de doble cadena en el paso a) proporcionando a dicha célula un constructo de ADN recombinante que codifica un promotor enlazado de forma operativa a una secuencia que codifica un producto génico de endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR) y un constructo de ADN recombinante que comprende un promotor U6 enlazado de forma operativa a una secuencia que codifica un ARN de guía única (ARNsg) diseñado para dirigirse a un sitio diana seleccionado en el cromosoma de dicha célula. En realizaciones particulares, el producto génico de la endonucleasa Cas puede estar unido operativamente a al menos una secuencia de localización nuclear (NLS).

La secuencia de dicho promotor U6 comprende la SEQ ID NO: 200 o un fragmento de promotor activo del mismo; en el que el fragmento tiene al menos 140 pb de longitud y comprende una secuencia de terminación de la transcripción.

También se contemplan realizaciones en las que el constructo de ADN recombinante que codifica un promotor enlazado operativamente a una secuencia que codifica un producto génico de endonucleasa Cas asociado a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR), y el constructo de ADN recombinante que comprende un promotor U6 enlazado operativamente a una secuencia que codifica un ARN de guía única (ARNsg) está diseñado para dirigirse a un sitio diana seleccionado en el cromosoma de dicha célula, están en el mismo constructo. Otras realizaciones del procedimiento pueden comprender el uso de un constructo de ADN recombinante que codifica un promotor unido operativamente a una secuencia que codifica un producto génico de la endonucleasa Cas asociado repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR) y el constructo de ADN recombinante que comprende un promotor U6 está unido operativamente a una secuencia que codifica un ARN de guía única (ARNsg) diseñado para dirigirse a un sitio diana seleccionado en el cromosoma de dicha célula están en al menos dos constructos.

Un aspecto todavía adicional de la invención comprende: un procedimiento de modificación del genoma que comprende: a) introducir una rotura de doble cadena en el genoma de una célula vegetal introduciendo una rotura de doble cadena en el genoma de una célula, que comprende introducir en dicha célula a) al menos un constructo de ADN recombinante de la reivindicación 1; y b) un segundo constructo de ADN recombinante que comprende una secuencia que codifica un promotor enlazado operativamente a una secuencia que codifica un producto génico de endonucleasas Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad(CRISPR) enlazado operativamente a una secuencia de localización nuclear (NLS); y b) introducir en dicha célula vegetal un fragmento recombinante de ADN de doble cadena con extremo romo, en el que dicho fragmento recombinante de ADN de doble cadena con extremo romo se incorpora a dicha rotura de doble cadena mediante la reparación endógena del ADN.

Un aspecto adicionañ de la invención comprende un procedimiento de modificación del genoma que comprende: a) introducir una rotura de doble cadena en el genoma de una célula vegetal como se ha descrito anteriormente, y b) introducir en dicha célula vegetal un fragmento de ADN de doble cadena recombinante de extremo romo, en el que dicho fragmento de ADN de doble cadena recombinante de extremo romo se incorpora a dicha rotura de doble cadena mediante la reparación endógena del ADN.

En ciertas realizaciones, el constructo de ADN recombinante comprende además al menos un segundo casete de expresión, en el que la secuencia que codifica el primer ARNsg es distinta de la secuencia que codifica el segundo ARNsg. El constructo de ADN recombinante también puede comprender un constructo en el que el promotor unido operativamente a la secuencia que codifica el primer ARNsg es distinto del promotor unido operativamente a la secuencia que codifica el segundo ARNsg. En ciertas realizaciones, el constructo comprende brazos de homología (HA) flanqueantes a la izquierda y a la derecha, cada uno de los cuales tiene una longitud de aproximadamente 200 1200 pb. En particular, los brazos de homología tienen entre 230 y 1003 pb de longitud.

Aún otro aspecto de la invención comprende un constructo de ADN recombinante que comprende:

a) un primer promotor de ARNsn U6 que comprende la secuencia de la SEQ ID NO: 200 o un fragmento de promotor activo del mismo, en el que el fragmento tiene al menos 140 pb de longitud; unido operativamente a una secuencia que codifica un ARN no codificador, y b) un segundo promotor de ARNsn U6; unido operativamente a una secuencia que codifica un ARN no codificador, en el que el primer promotor de ARNsn y el segundo promotor de ARNsn son diferentes.

En algunas realizaciones de el constructo de ADN recombinante, los ARN no codificadores son ARNsg dirigidos a diferentes sitios diana seleccionados en un cromosoma de una célula vegetal. Los constructos de ADN recombinante pueden comprender además una secuencia que codifica un promotor unido de forma operativa a una secuencia que codifica un producto génico de la endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR).

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Los siguientes dibujos forman parte de la presente memoria descriptiva y se incluyen para demostrar ciertos aspectos de la presente divulgación. La divulgación puede entenderse mejor por referencia a uno o más de estos dibujos en combinación con la descripción detallada de las realizaciones específicas presentadas en el presente documento.

FIG. 1: Alineación de la secuencia de nucleótidos de cuatro genes nativos de ARN nuclear pequeño (ARNsn) de maíz, incluyendo sus promotores putativos de los cromosomas 1, 2, 3 y 8. (A) y (B) El consenso de la secuencia, el porcentaje de conservación y el logo de la secuencia (el tamaño del nucleótido indicado es directamente proporcional a la conservación de la secuencia) se presentan debajo de las alineaciones. (B) La flecha gruesa indica el sitio de inicio de la transcripción; corriente arriba del sitio de inicio de la transcripción hay una "caja TATA", un elemento de secuencia corriente arriba (USE) y elementos promotores específicos de las monocotiledóneas (MSP), cada uno de ellos marcado con cajas de líneas gruesas; el tramo de siete bases de timidina (poli-T) en el extremo 3' es la señal de terminación de la transcripción. Las secuencias de la FIG1.A y la FIG1.B corresponden a lo siguiente: ZmU6_Ch1 representado por la SEQ ID NO:98; ZmU6_Ch2 representado por la SEQ ID NO:99; ZmU6_Ch3 representado por la SEQ ID NO:100; ZmU6_Ch8 representado por la SEQ ID NO:101.

FIG.2: Ilustración de un gen informador GUS (p-glucuronidasa) modificado que alberga una repetición directa de la secuencia codificadora (GUUS) interrumpida por un sitio diana (TS) para la escisión de CRISPR.

FIG. 3: Actividades de GUS detectadas en callos de maíz tras el co-bombardeo de un constructo informador de GUUS junto con constructos CRISPR diseñados para introducir una rotura de doble cadena (DSB) en el sitio genómico diana de Zm7.

FIG. 4: Actividad GUS detectada en callos de maíz tras el co-bombardeo de un constructo informador GUUS junto con constructos CRISPR diseñadas para introducir un DSB en el sitio genómico diana Zm231. Como control negativo se utilizó una diana genómica diferente y una secuencia espaciadora de ARN de guía única (ARNsg), Zm14. También se muestran imágenes de microscopía de fluorescencia de callos representativos que fueron co-bombardeados con un vector de expresión de la proteína verde fluorescente (GFP) con el constructo informador GUUS, el vector de expresión Cas9 y los vectores que contienen los distintos casetes de ARNsg.

FIG. 5: Ilustraciones de (A) el ensayo de integración de oligonucleótidos; (B) el oligonucleótido de extremo romo sin microhomología utilizado para la inserción en un sitio diana genómico del maíz; (C) el oligonucleótido de extremo romo con microhomología utilizado para la inserción en un sitio diana genómico del maíz; (D) perfil de análisis de fragmentos de los amplicones de PCR que abarcan la unión del oligonucleótidocromosoma en las muestras de prueba (panel superior) y de control negativo (panel inferior) del ensayo de integración del oligonucleótido (donde la flecha indica el pico esperado); y (E) secuencias de ADN de las uniones del oligonucleótido-cromosoma en el sitio genómico diana del maíz Zm_L70c que confirman las integraciones tanto de la longitud completa (integración 1; SEQ ID NO:103) y oligonucleótidos truncados (integración 2; SEQ ID NO:104), la secuencia esperada se presenta como SEQ ID NO:102.

FIG. 6: Ilustración de un ARNsg que incluye una secuencia espaciadora complementaria a un sitio diana genómico nativo del maíz y un bucle artificial (5'-CCAAAAGG-3'; SEQ ID NO:105) y su estructura secundaria prevista diseñada para la orientación mediada por Cas9 de Streptococcus thermophilus .

FIG.7: Ilustraciones de (A) la eliminación de genes marcadores seleccionables mediante la actividad CRISPR multiplex tras la integración direccionada del gen de interés (GOI); y (B) un sistema CRISPR/Cas multiplex para evaluar el enlace génico de múltiples genes candidatos a QTL. Donde la probabilidad de probabilidades (LOD) es una medida estadística para el enlace genético; un LOD de 3 significa que es 1000 veces más probable que exista un QTL en el intervalo que no haya ningún QTL.

FIG. 8. Presentación gráfica de los datos que muestran los porcentajes de integración dirigidos (eje Y) detectados a las 24 y 48 horas después de la transformación de protoplastos de maíz utilizando constructos CRISPR dirigidas a una diana cromosómica nativa (Zm7) en el maíz y una valoración del pmol de fragmento de ADN de doble cadena con extremo romo añadido a la mezcla de transfección (eje X). Los controles negativos se realizaron sin añadir constructos de expresión de Cas9.

FIG. 9. Presentación gráfica de la tasa de integración (eje Y) en función de la cantidad (en pmol) de el constructo de expresión de SpCas9 añadida a la mezcla de transfección de protoplastos de maíz (eje X).

FIG. 10. Confirmación de la secuencia de las integraciones dirigidas de fragmentos de ADN de doble cadena de extremo romo en los cromosomas de protoplastos de maíz transformados con CRISPR/Cas9 y constructos de expresión de ARNsg. En todos los paneles 10A, B, C, la secuencia superior es la secuencia esperada de una unión del sitio diana y el fragmento de ADN de doble cadena del extremo romo (secuencia subrayada) incluido en el experimento. 10A. Sitio del cromosoma del maíz Zm7 al que se dirigen los constructos CRISPR/Cas9 y con el fragmento de ADN de doble cadena de extremo romo formado por fragmentos de ADN recocido representados por la SEQ ID NO:115 y la SEQ ID NO:116. 10B. Sitio L70c del cromosoma del maíz al que se dirigen los constructos CRISPR/Cas9 y con el fragmento de ADN de doble cadena de extremo romo sin secuencias de microhomología formado por fragmentos de ADN recocido representados por la SEQ ID NO:45 y la SEQ ID NO:46. 10C. Sitio L70c del cromosoma del maíz al que se dirigen los constructos CRISPR/Cas9 y con un fragmento de ADN de doble cadena de extremo romo con secuencias de microhomología de 3 pb en cada extremo del fragmento de ADN formado por fragmentos de ADN recocidos representados por la Se Q ID NO:121 y la SEQ ID NO:122.

FIG. 11. Presentación gráfica de la tasa de integración (eje Y) en función de la cantidad (en pmol) de constructos de expresión TALEN dirigidas al sitio L70.4 del cromosoma del maíz que se añadieron a la mezcla de transfección de protoplastos de maíz (eje X).

FIG. 12. Representación esquemática de la integración direccionada mediada por NHEJ y HR y de las posiciones de los cebadores de PCR para el cribado de alto rendimiento. La integración direccionada de un fragmento de ADN por unión final no homóloga (NHEJ) se presenta en la FIG. 12A y la integración direccionada de un fragmento de ADN por recombinación homóloga (HR) se presenta en la FIG. 12B.

FIG. 13. Representación esquemática de los constructos utilizadas para la integración homóloga. La flecha del extremo romo del ADN indica la secuencia de 90 pb correspondiente al fragmento de ADN de doble cadena de 90 pb utilizado para los ensayos NHEJ, LHA se refiere al brazo de homología izquierdo, RHA se refiere al brazo de homología derecho, Zm7 se refiere al sitio diana Zm7 dirigido por una CRISPR/Cas9+ARNsg. Se indica la longitud en pb de cada uno de los brazos de homología. A. Esquema del constructo HR-casete para dirigirse al sitio Zm7 del cromosoma del maíz con LHA y RHA de 240 y 230 pb de longitud, respectivamente. B. Esquema del constructo HR-casete para dirigirse al sitio Zm7 del cromosoma del maíz con LHA y RHA de 240 y 1003 pb de longitud, respectivamente.

FIG. 14. Representación esquemática de los constructos utilizadas para la integración homóloga. En la figura, la flecha del extremo romo del ADN indica la secuencia de 90 pb correspondiente al fragmento de ADN de doble cadena de 90 pb utilizado para los ensayos NHEJ, LHA se refiere al brazo de homología izquierdo, RHA se refiere al brazo de homología derecho, L70.4 se refiere al sitio diana L70.4 en el cromosoma del maíz al que se dirige un par TALEN. Se indica la longitud en pb de cada uno de los brazos de homología. A. Esquema del constructo HR-casete para dirigirse al sitio L70.4 del cromosoma del maíz con el LHA y el RHA de 230 pb de longitud. B. Esquema del constructo HR-casete para dirigirse al sitio L70.4 del cromosoma del maíz con LHA y RHA de 1027 pb y 230 pb de longitud, respectivamente.

FIG. 15.15A. Presentación gráfica de los datos que muestran los porcentajes de integración direccionada en protoplastos de maíz transfectados utilizando constructos StCas9 CRISPR dirigidas a los sitios diana cromosómicos nativos del maíz L70e, L70f y L70g. Los controles carecían de un constructo de casete de expresión de StCas9 en la mezcla de transfección. 15B. Alineación de secuencias de la integración esperada del fragmento de ADN de doble cadena y extremo romo en el sitio diana L70f (SEQ ID NO:144) y un ejemplo de integración en el sitio diana con indel de la secuencia del fragmento de ADN (SEQ ID NO:145).

FIG. 16. 16A. Tasas de integración cromosómica utilizando constructos con el promotor U6 del cromosoma 8 del maíz o uno de los tres promotores U6 quiméricos separados que impulsan la expresión de ARNsg en el sistema CRISPR/Cas9 para dirigirse a tres sitios diana cromosómicos diferentes del maíz. La integración de la diana se midió mediante un ensayo ddPCR utilizando sondas MGB TaqMan. 16B. Tasas de integración cromosómica utilizando constructos con el promotor U6 del cromosoma 8 del maíz o uno de los tres promotores U6 quiméricos separados que impulsan la expresión de ARNsg en el sistema CRISPR/Cas9 para dirigirse a tres sitios diana cromosómicos diferentes del maíz. La integración de la diana se midió mediante el ensayo ddPCR utilizando el colorante intercalado EvaGreen®.

FIG. 17. 17A. Esquema de la estrategia de cribado por PCR para detectar la mutación inducida por CRISPR/Cas9 mediante NHEJ en el sitio diana 2 del inhibidor de la invertasa del tomate (TS2), que resulta en la mutación del sitio de la endonucleasa de restricción Sm1I. 17B. Fotografía de los amplicones de la PCR en un gel de agarosa que muestra los amplicones no digeridos y los amplicones digeridos por Sm1I para detectar la mutación inducida por CRISPR/Cas9 en el sitio diana 2 del inhibidor de la invertasa del tomate.

17C. Alineación de secuencias múltiples de amplicones de PCR de la mutación inducida por CRISPR/Cas9 mediante NHEJ en el sitio diana 2 del inhibidor de la invertasa del tomate.

FIG. 18. 18A. Representación gráfica de los datos que muestran los niveles normalizados de ARNm de GUS a partir de ensayos en protoplastos de cotiledones de soja con constructos de expresión recombinante con promotores U6, U3 y 7Sl . 18b . Representación gráfica de los datos que muestran los niveles normalizados de ARNm de GUS a partir de ensayos de protoplastos de hojas de maíz con constructos de expresión recombinante con promotores U6, U3, 7SL, U2 o U5.

FIG. 19. Representación gráfica de los datos de los niveles de expresión de GUS normalizados a partir de ensayos de protoplastos de hojas de maíz con, un constructo de expresión recombinante que codifica 1) un constructo de expresión de GUS 2) un constructo de expresión de Cas9-TALE-AD muerto, y 3) constructos de expresión de ARNsg recombinante con promotores 7SL, U6, U3, U2 o U5.

DESCRIPCIÓN DETALLADA

La divulgación proporciona novedosos promotores de Zea mays y otras plantas, y procedimientos para su uso que incluyen la modificación genética dirigida de un genoma de la planta utilizando la expresión transgénica de un gen, o genes, involucrados en el sistema de repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR) que se encuentra en muchas bacterias. Por ejemplo, la divulgación proporciona, en una realización, constructos de ADN que codifican al menos un casete de expresión que incluye un promotor U6 divulgado en el presente documento y una secuencia que codifica un ARN de guía única (ARNsg). También se proporcionan procedimientos para hacer que un sistema CRISPR modifique un genoma objetivo, así como los complementos genómicos de una planta modificada mediante el uso de dicho sistema. La divulgación proporciona así herramientas y procedimientos que permiten insertar, eliminar o modificar genes, loci, bloques de enlace y cromosomas dentro de una planta.

La divulgación proporciona, en otra realización, constructos de ADN que codifican al menos un casete de expresión que incluye un promotor divulgado en el presente documento y una secuencia que codifica un ARN pequeño no codificador de proteínas (ARNncp). Estos constructos son útiles para dirigir la expresión nuclear de las moléculas de ARNncp.

El sistema CRISPR constituye un sistema inmunitario adaptativo en procariotas que se dirige a la escisión endonucleolítica del ADN y el Ar N del fago invasor (revisado en Westra et al., Annu Rev Genet, 46:311-39, 2012). Se conocen tres tipos de sistemas CRISPR: Tipo I, Tipo II y Tipo III. Los sistemas CRISPR se basan en pequeños ARN para la detección de secuencias específicas y la selección de ácidos nucleicos extraños para su destrucción. Los componentes de los sistemas CRISPR bacterianos son los genes asociados a CRISPR (Cas) y la(s) matriz(s) CRISPR que consiste(n) en secuencias genómicas-objetivo (protoespaciadores) intercaladas con repeticiones palindrómicas cortas. La transcripción de los elementos protoespaciadores/repetidos en moléculas precursoras de ARN CRISPR (ARNpre-cr) va seguida de una escisión enzimática desencadenada por la hibridación entre una molécula de ARN CRISPR trans-activo (ARNtracr) y una repetición palindrómica de ARNpre-cr. Las moléculas ARNcr:ARNtracr resultantes, formadas por una copia del espaciador y una repetición, forman un complejo con una nucleasa Cas. A continuación, el complejo CRISPR/Cas se dirige a secuencias de ADN (protoespaciadoras) complementarias a la secuencia espaciadora del ARNcr, donde este complejo de proteínas ARN-Cas silencia el ADN diana mediante la escisión enzimática de ambas cadenas (rotura de doble cadena; DSB).

El sistema CRISPR nativo de tipo II de las bacterias requiere cuatro componentes moleculares para la escisión direccionada de ADN exógeno: una endonucleasa Cas (por ejemplo, Cas9), la RNasaIII de mantenimiento, el ARN CRISPR (ARNcr) y el ARN CRISPR de acción trans (ARNtrcr). Estos dos últimos componentes forman un complejo de ARNbc y se unen a Cas9 dando lugar a un complejo de endonucleasas de ADN guiadas por ARN. Para las modificaciones dirigidas del genoma en eucariotas, este sistema se simplificó a dos componentes: la endonucleasa Cas9 y un ARNcr-ARNtracr quimérico, llamado ARN guía (ARNg) o, alternativamente, ARN guía único (ARNsg). Los experimentos realizados inicialmente en sistemas eucariotas determinaron que el componente RNasaIII no era necesario para lograr la escisión selectiva del ADN. El sistema mínimo de dos componentes de Cas9 con el ARNsg, como único componente, permite que este sistema CRISPR de modificación selectiva del genoma sea más rentable y flexible que otras plataformas de selección, como las meganucleasas, las nucleasas Zn-finger o las TALE-nucleasas, que requieren la ingeniería de proteínas para la modificación en cada sitio del ADN objetivo. Además, la facilidad de diseño y producción de ARNsgs proporciona al sistema CRISPR varias ventajas para la aplicación de la modificación dirigida del genoma. Por ejemplo, los componentes del complejo CRISPR/Cas (la endonucleasa Cas, el ARNsg y, opcionalmente, el ADN exógeno para la integración en el genoma) diseñados para uno o más sitios genómicos diana pueden multiplexarse en una transformación, o la introducción de los componentes del complejo CRISPR/Cas puede separarse espacial y/o temporalmente.

Estrategias de expresión de los ARNsgs

La divulgación proporciona, en ciertas realizaciones, combinaciones novedosas de promotores y una secuencia que codifica un ARNsg, para permitir la introducción específica de un evento de escisión de ADN de doble cadena en el ADN endógeno (es decir, un genoma). En una realización, un promotor U6 del maíz está unido operativamente a un gen que codifica el ARNsg, con el fin de expresar constitutivamente el ARNsg en las células transformadas. Esto puede ser deseable, por ejemplo, cuando los transcritos de ARNsg resultantes son retenidos en el núcleo y, por tanto, estarán localizados de forma óptima dentro de la célula para guiar los procesos nucleares. Esto también puede ser deseable, por ejemplo, cuando la actividad de la CRISPR es baja o la frecuencia de encontrar y escindir el sitio diana es baja. También puede ser deseable cuando no se conoce un promotor para un tipo de célula específico, como la línea germinal, para una determinada especie de interés.

Un promotor quimérico que comprende la totalidad o una parte de cualquiera de los promotores U6 proporcionados en el presente documento puede utilizarse para expresar un ARNsg. Por ejemplo, la porción 5' del promotor U6 del cromosoma 1 del maíz (SEQ ID NO:1), que incluye un elemento MSP, unido operativamente a la porción 3' del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7), que incluye un elemento USE y una caja TATA (SEQ ID NO:17), clonados corriente arriba de un ARNsg, puede utilizarse para inducir la escisión mediada por CRISPR bajo diferentes condiciones ambientales.

Se pueden utilizar múltiples promotores U6 con una secuencia diferente para minimizar los problemas de estabilidad del vector, que se asocian típicamente con las repeticiones de la secuencia. Además, las regiones altamente repetitivas en los cromosomas pueden provocar inestabilidad y silenciamiento genético. Por lo tanto, el uso de múltiples promotores U6 (u otros divulgados) en el sistema CRISPR/Cas de modificación de genes dirigidos puede facilitar el apilamiento de vectores de múltiples casetes de ARNsg en el misomo constructo de transformación, en el que los diferentes niveles de transcripción de ARNsg deben ser optimizados para la orientación eficiente de un solo sitio diana. Los promotores U6 quiméricos pueden dar lugar a versiones nuevas y funcionales con niveles de expresión mejorados o modificados de otro modo, y se han diseñado cuatro promotores U6 quiméricos de maíz (SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19 y SEQ ID NO:20).

Los promotores U6 divulgados también pueden impulsar la expresión de otros ARN no codificadores de proteínas (ARNncp). Ejemplos no limitantes de ARN pequeños no codificadores de proteínas incluyen un microARN (miARN), un precursor de miARN, un ARN de interferencia corta (ARNip), un ARN pequeño (de 22 a 26 nt de longitud) y el precursor que lo codifica, un ARNip heterocromático (hc-ARNip), un ARN que interactúa con Piwi (ARNpi), un ARN de doble cadena con horquilla (ARNbc con horquilla), un ARNip transactivo (ARNip ta) y un ARNip antisentido de origen natural (ARNip nat).

Estrategias de expresión de los genes asociados a Cas

La divulgación proporciona promotores novedosos para su uso en la escisión mediada por CRISPR específica de la secuencia o dirigida a la secuencia para la reproducción molecular, proporcionando la transcripción de, por ejemplo, un ARNsg que incluye una secuencia espaciadora utilizada para dirigir una secuencia protoespaciadora dentro de un sitio genómico diana para la escisión por endonucleasas por al menos una proteína Cas, donde el sitio genómico diana es nativo o transgénico. Además, los sistemas CRISPR pueden personalizarse para catalizar la escisión en uno o más sitios genómicos diana. En ciertas realizaciones, dicho sistema CRISPR personalizado tendría propiedades que lo harían susceptible de ser modificado genéticamente, de manera que el reconocimiento, la unión y/o la actividad catalítica de la(s) proteína(s) Cas del sistema podrían ser manipulados.

Un aspecto de la presente divulgación es introducir en una célula vegetal un vector de expresión que comprende uno o más casetes que codifican un promotor de maíz U6, de la SEQ ID No: 200 , unido operativamente a un ARNsg, que incluye una copia de una secuencia espaciadora complementaria a una secuencia protoespaciadora dentro de un sitio genómico diana, y un vector de expresión que codifica un gen asociado a Cas para modificar la célula vegetal de forma que la célula vegetal, o una planta compuesta por dichas células, presente posteriormente un rasgo beneficioso. En un ejemplo no limitante, el rasgo es un rasgo como la mejora del rendimiento, la resistencia al estrés biótico o abiótico, la tolerancia a los herbicidas u otras mejoras en el rendimiento agronómico. La capacidad de generar dicha célula vegetal derivada depende de la introducción del sistema CRISPR utilizando los vectores y casetes de transformación descritos en el presente documento.

El vector de expresión que codifica un gen asociado a Cas puede comprender un promotor. En ciertas realizaciones, el promotor es un promotor constitutivo, un promotor específico de tejido, un promotor regulado por el desarrollo o un promotor regulado por el ciclo celular. Algunos promotores contemplados incluyen los que sólo se expresan en la línea germinal o en las células reproductoras, entre otros. Estos promotores regulados por el desarrollo tienen la ventaja de limitar la expresión del sistema CRISPR sólo a las células en las que se hereda el ADN en las siguientes generaciones. Por lo tanto, una modificación genética mediada por ADNbces decir, la escisión del ADNbc cromosómico o episómico) se limita únicamente a las células que participan en la transmisión de su genoma de una generación a otra. Esto podría ser útil si una expresión más amplia del sistema CRISPR fuera genotóxica o tuviera otros efectos no deseados. Ejemplos de tales promotores incluyen los promotores de los genes que codifican ligasas de ADN, recombinasas, replicasas, etc.

Las endonucleasas son enzimas que escinden el enlace fosfodiéster dentro de una cadena de polinucleótidos. Los ejemplos de endonucleasas que escinden sólo en secuencias de nucleótidos específicas son bien conocidos en la técnica y pueden incluir, por ejemplo, endonucleasas de restricción. Sin embargo, la necesidad de la ingeniería genómica selectiva como alternativa a la reproducción clásica de plantas requiere herramientas altamente personalizables para la edición del genoma. El sistema inmunitario adaptativo procariota de tipo II asociado a CRISPR ofrece esa alternativa. Como tal, los constructos de ADN proporcionadas en este documento pueden reconocer una secuencia de nucleótidos específica de interés dentro de un genoma huésped objetivo y permitir la mutación o la integración en ese sitio. En una realización particular, los constructos de ADN contienen uno o más promotores U6 de maíz, o quimeras de los mismos, que expresan altos niveles de una secuencia que codifica un ARNsg. Un constructo de ADN que expresa un ARNsg que dirige un producto génico asociado a Cas con actividad de endonucleasa a una secuencia genómica específica, de manera que la secuencia genómica específica se escinde y produce una rotura de doble cadena que se repara mediante una vía de reparación de rotura de doble cadena, que puede incluir, por ejemplo, la unión de extremos no homólogos, la recombinación homóloga, el recocido de la cadena dependiente de la síntesis (SDSA), el recocido de la cadena simple (SSA), o una combinación de los mismos, interrumpiendo así el locus nativo, puede ser particularmente útil.

En una realización, un sistema CRISPR comprende al menos un gen asociado a Cas que codifica una endonucleasa CRISPR y un ARNsg que comprende una copia de una secuencia espaciadora complementaria a una secuencia protoespaciadora dentro de un sitio diana genómico endógeno.

En realizaciones particulares, un gen asociado a Cas puede incluir cualquier endonucleasa del sistema CRISPR de tipo II. Dicho producto génico asociado a Cas tendría propiedades que lo harían susceptible de ser modificado genéticamente, de manera que su actividad nucleasa y su reconocimiento y unión de ARNcr, ARNtracr y/o ARNsg podrían ser manipulados.

La presente divulgación también prevé el uso de la escisión de ADN de doble cadena mediada por CRISPR para alterar genéticamente la expresión y/o la actividad de un gen o producto génico de interés de manera específica para un tejido o tipo de célula con el fin de mejorar la productividad o proporcionar otro rasgo beneficioso, en el que el ácido nucleico de interés puede ser de naturaleza endógena o transgénica. Así, en una realización, un sistema CRISPR está diseñado para mediar la interrupción en sitios específicos en un gen de interés. Los genes de interés son aquellos para los que se desea alterar el nivel de expresión/la actividad proteica. Estos eventos de escisión del ADN pueden producirse en las secuencias codificadores o en los elementos reguladores dentro del gen.

La presente divulgación prevé la introducción de un sistema CRISPR de tipo II en una célula. Los genes ejemplares asociados a Cas de tipo II incluyen secuencias de nucleótidos naturales y modificadas genéticamente ( es decir, modificadas, incluyendo codones optimizados) que codifican polipéptidos con actividad nucleasa como Cas9 de Streptococcus pyogenes, Streptococcus thermophilus o Bradyrhizobium sp.

El gen asociado a CRISPR catalíticamente activo (por ejemplo, la endonucleasa Cas9) puede ser introducido en una célula diana o producido por una célula diana. Para ello, se pueden utilizar varios procedimientos, tal y como se describe en el presente documento.

Expresión transitoria de CRISPRs

En algunas realizaciones, el ARNsg y/o el gen asociado a Cas se introduce transitoriamente en una célula. En ciertas realizaciones, el ARNsg y/o el gen asociado a Cas introducidos se proporcionan en cantidad suficiente para modificar la célula, pero no persisten después de que haya pasado un periodo de tiempo contemplado o después de una o más divisiones celulares. En tales realizaciones, no se necesitan más pasos para eliminar o segregar el ARNsg y/o el gen asociado a Cas de la célula modificada. En otras realizaciones de la presente divulgación, los fragmentos de ADN de doble cadena también se introducen transitoriamente en una célula junto con el ARNsg y/o el gen asociado a Cas. En tales realizaciones, los fragmentos de ADN de doble cadena introducidos se proporcionan en cantidad suficiente para modificar la célula, pero no persisten después de que haya transcurrido un período de tiempo contemplado o después de una o más divisiones celulares.

En otra realización, el ARNm que codifica el gen asociado a Cas se introduce en una célula. En tales realizaciones, el ARNm se traduce para producir la endonucleasa del sistema CRISPR de tipo II en cantidad suficiente para modificar la célula (en presencia de al menos un ARNsg) pero no persiste después de que haya transcurrido un periodo de tiempo contemplado o después de una o más divisiones celulares. En tales realizaciones, no se necesitan más pasos para eliminar o segregar el gen asociado a Cas de la célula modificada.

En una realización de esta divulgación, un producto génico asociado a Cas catalíticamente activo se prepara in vitro antes de introducirlo en una célula, incluyendo una célula procariota o eucariota. El procedimiento de preparación de un producto génico asociado a Cas depende de su tipo y propiedades y sería conocido por un experto en la materia. Por ejemplo, si el producto génico asociado a Cas es una nucleasa de ADN monomérica de gran tamaño, la forma activa del producto génico asociado a Cas puede producirse mediante expresión bacteriana, traducción in vitro , a través de células de levadura, en células de insectos, o mediante otras técnicas de producción de proteínas descritas en la técnica. Tras la expresión, el producto génico asociado a Cas se aísla, se repliega si es necesario, se purifica y, opcionalmente, se trata para eliminar cualquier etiqueta de purificación, como una etiqueta His. Una vez obtenidos los productos génicos asociados a Cas crudos, parcialmente purificados o más completamente purificados, la proteína puede introducirse, por ejemplo, en una célula vegetal mediante electroporación, por bombardeo con partículas recubiertas de productos génicos asociados a Cas, por transfección química o por algún otro medio de transporte a través de una membrana celular. Los procedimientos para introducir ácidos nucleicos en células bacterianas y animales son igualmente bien conocidos en la técnica. La proteína también se puede suministrar mediante nanopartículas, que pueden suministrar una combinación de proteína activa y ácido nucleico. Una vez que se ha introducido una cantidad suficiente del producto génico asociado a Cas para que esté presente una cantidad efectiva de actividad nucleasa in vivo , junto con el ARNsg apropiado, se escinden las secuencias protoespaciadoras dentro de los sitios diana episomales o genómicos. También se reconoce que un experto en la materia podría crear un producto génico asociado a Cas que sea inactivo pero que se active in vivo por la maquinaria de procesamiento nativa; dicho producto génico asociado a Cas también se contempla en la presente divulgación.

En otra realización, se crea un constructo que expresará transitoriamente un ARNsg y/o un gen asociado a Cas y se introduce en una célula. En otra realización, el vector producirá cantidades suficientes de los ARNsg y/o del gen asociado a Cas para que el sitio o sitios diana episomales o genómicos deseados sean modificados efectivamente por la escisión mediada por CRISPR. Por ejemplo, la divulgación contempla la preparación de un vector que pueda ser bombardeado, electroporado, transfectado químicamente o transportado por algún otro medio a través de la membrana de la célula vegetal. Este vector podría tener varias propiedades útiles. Por ejemplo, en una realización, el vector puede replicarse en un huésped bacteriano de manera que el vector pueda producirse y purificarse en cantidades suficientes para la expresión transitoria. En otra realización, el vector puede codificar un gen de resistencia a fármacos para permitir la selección del vector en un huésped, o el vector también puede comprender un casete de expresión para proporcionar la expresión del ARNsg y/o del gen asociado a Cas en una planta. En otra realización, el casete de expresión podría contener una región promotora, una región no traducida de 5', un intrón opcional para ayudar a la expresión, un sitio de clonación múltiple para permitir la introducción fácil de una secuencia que codifique ARNsgs y/o un gen asociado a Cas, y una UTR de 3'. Los promotores en el casete de expresión serían promotores U6 de Zea mays- En otras realizaciones, los promotores serían promotores U6 quiméricos de Zea mays. En algunas realizaciones, puede ser beneficioso incluir sitios de restricción únicos en uno o en cada extremo del casete de expresión para permitir la producción y el aislamiento de un casete de expresión lineal, que puede estar libre de otros elementos del vector. Las regiones líderes no traducidas, en ciertas realizaciones, pueden ser regiones no traducidas derivadas de plantas. El uso de un intrón, que puede ser de origen vegetal, se contempla cuando el casete de expresión se transforma o transfecta en una célula monocotiledónea.

En otras realizaciones, uno o más elementos del vector incluyen un espaciador complementario a un protoespaciador contenido en un sitio diana episomal o genómico. Esto facilita la modificación mediada por CRISPR dentro del casete de expresión, permitiendo la eliminación y/o inserción de elementos como promotores y transgenes.

En otro enfoque, se puede introducir un vector de expresión transitorio en una célula utilizando un huésped de vector bacteriano o viral. Por ejemplo, Agrobacterium es uno de esos vectores bacterianos que pueden utilizarse para introducir un vector de expresión transitoria en una célula huésped. Cuando se utiliza un sistema huésped bacteriano, viral o de otro tipo, el vector de expresión transitoria está contenido en el sistema huésped. Por ejemplo, si se utiliza el sistema de hospedaje Agrobacterium , el casete de expresión transitoria se flanquearía con uno o más bordes de ADN-T y se clonaría en un vector binario. Se han identificado muchos sistemas de vectores de este tipo en el arte (revisado en Hellens et al., 2000).

En las realizaciones en las que el ARNsg y/o el gen asociado a Cas se introducen transitoriamente en cantidades suficientes para modificar una célula, puede emplearse un procedimiento de selección de la célula modificada. En uno de estos procedimientos, una segunda molécula de ácido nucleico que contiene un marcador seleccionable se cointroduce con el ARNsg transitorio y/o el gen asociado a Cas. En esta realización, el marcador cointroducido puede ser parte de una estrategia molecular para introducir el marcador en un sitio diana. Por ejemplo, el marcador cointroducido puede utilizarse para interrumpir un gen diana mediante su inserción entre sitios genómicos diana. En otra realización, el ácido nucleico cointroducido puede utilizarse para producir una proteína marcadora visual de manera que las células transfectadas puedan ser clasificadas o aisladas por algún otro medio. En otra realización, el marcador cointroducido puede integrarse aleatoriamente o ser dirigido a través de un segundo complejo de ARNsg:proteína Cas para integrarse en un sitio independiente del sitio genómico diana primario. En otra realización, la molécula cointroducida puede dirigirse a un locus específico a través de una vía de reparación de rotura de doble cadena, que puede incluir, por ejemplo, la unión final no homóloga, la recombinación homóloga, el recocido de cadena dependiente de la síntesis (SDSA), el recocido de cadena simple (SSA), o una combinación de los mismos, en el sitio o sitios genómicos diana. En las realizaciones anteriores, el marcador cointroducido puede usarse para identificar o seleccionar las células que probablemente han sido expuestas al ARNsg y/o al gen asociado a Cas y, por lo tanto, es probable que hayan sido modificadas por la CRISPR.

Expresión estable de CRISPRs

En otra realización, un vector de expresión CRISPR se transforma de forma estable en una célula para escindir una secuencia de ADN en o cerca de un sitio genómico diana en el genoma del huésped con un ARNsg y un producto génico asociado a Cas codificado dentro del vector. En esta realización, el diseño del vector de transformación proporciona flexibilidad para cuándo y bajo qué condiciones se expresa el ARNsg y/o el gen asociado a Cas. Además, el vector de transformación puede diseñarse para incluir un marcador seleccionable o visible que proporcione un medio para aislar o seleccionar eficazmente las líneas celulares que contienen y/o han sido modificadas por la CRISPR.

Los sistemas de transformación celular se han descrito en el arte y las descripciones incluyen una variedad de vectores de transformación. Por ejemplo, para las transformaciones de plantas, dos procedimientos principales son la transformación mediada por Agrobacterium y la transformación mediada por bombardeo de partículas (es decir, biolística). En ambos casos, la CRISPR se introduce a través de un casete de expresión. El casete puede contener uno o más de los siguientes elementos: un elemento promotor que puede utilizarse para expresar el ARNsg y/o el gen asociado a Cas; una región no traducida 5' para mejorar la expresión; un elemento intrón para mejorar aún más la expresión en ciertos tipos de células, como las células monocotiledóneas; un sitio de clonación múltiple para proporcionar sitios de restricción convenientes para insertar las secuencias del ARNsg y/o del gen asociado a Cas y otros elementos deseados; y una región no traducida 3' para proporcionar una terminación eficiente de la transcripción expresada. En particular, los promotores en el casete de expresión serían promotores U6 de Zea mays. En aún otras realizaciones, los promotores serían promotores quiméricos U6 de Zea mays.

Para el bombardeo de partículas o con transformación de protoplastos, el casete de expresión puede ser un fragmento lineal aislado o puede ser parte de un constructo más grande que podría contener elementos de replicación bacteriana, marcadores seleccionables bacterianos u otros elementos. El ARNsg y/o el/los casete(s) de expresión génica asociado(s) a Cas puede(n) estar físicamente unido(s) a un casete marcador o puede(n) estar mezclado(s) con una segunda molécula de ácido nucleico que codifica(n) un casete marcador. El casete marcador está compuesto por los elementos necesarios para expresar un marcador visual o seleccionable que permite una selección eficaz de las células transformadas. En el caso de la transformación mediada por Agrobacterium, el casete de expresión puede estar adyacente o entre los bordes de ADN-T flanqueantes y estar contenido en un vector binario. En otra realización, el casete de expresión puede estar fuera del ADN-T. La presencia del casete de expresión en una célula puede manipularse mediante un régimen de selección positivo o negativo. Además, un casete marcador seleccionable también puede estar dentro o adyacente a los mismos bordes de ADN-T o puede estar en otro lugar dentro de un segundo ADN-T en el vector binario (por ejemplo, un sistema de 2 ADN-T).

En otra realización, las células que han sido modificadas por una CRISPR, ya sea de forma transitoria o estable, se llevan adelante junto con las células no modificadas. Las células pueden subdividirse en líneas independientes derivadas de clones o pueden utilizarse para regenerar plantas derivadas independientemente. Las plantas individuales o las poblaciones clonales regeneradas a partir de dichas células pueden utilizarse para generar líneas derivadas de forma independiente. En cualquiera de estas etapas se puede emplear un ensayo molecular para cribar células, plantas o líneas que hayan sido modificadas. Las células, plantas o líneas que han sido modificadas siguen propagándose y las células, plantas o líneas no modificadas se descartan. En estas realizaciones, la presencia de una CRISPR activa en una célula es esencial para garantizar la eficacia del proceso global.

Procedimientos de transformación

Los procedimientos para transformar o transfectar una célula son bien conocidos en la técnica. Los procedimientos para la transformación de plantas utilizando Agrobacterium o partículas recubiertas de ADN son bien conocidos en la técnica y se incorporan al presente documento. Se considera que los procedimientos adecuados para la transformación de células huésped para su uso con la presente divulgación incluyen prácticamente cualquier procedimiento por el que se pueda introducir ADN en una célula, por ejemplo, mediante la transformación mediada por Agrobacterium (Patente de EE.UU. n° 5.563.055 5,591,616 5,693,512 5,824,877 5,981,840 y 6,384,301) y por aceleración de partículas recubiertas de ADN (Patente de EE.UU. n° 5.015.580 5,550,318 5,538,880 6,160,208 6,399,861 y 6,403,865), etc. Mediante la aplicación de técnicas como éstas, las células de prácticamente cualquier especie pueden transformarse de forma estable.

Se han descrito diversos procedimientos para seleccionar células transformadas. Por ejemplo, se podría utilizar un marcador de resistencia a fármacos como una proteína fosfotransferasa de neomicina para conferir resistencia a la kanamicina o utilizar la 5-enolpiruvil shikimato fosfato sintasa para conferir tolerancia al glifosato. En otra realización, se utiliza una carotenoide sintasa para crear un pigmento naranja que pueda ser identificado visualmente. Cada uno de estos tres enfoques ejemplares puede utilizarse eficazmente para aislar una célula o planta o un tejido de la misma que haya sido transformado y/o modificado por una CRISPR.

Cuando una secuencia de ácido nucleico que codifica un marcador seleccionable o que se puede cribar se inserta en un sitio genómico diana, el marcador puede utilizarse para detectar la presencia o ausencia de una CRISPR o su actividad. Esto puede ser útil una vez que una célula ha sido modificada por una CRISPR, y se desea recuperar una célula modificada genéticamente que ya no contiene la CRISPR, o una planta regenerada a partir de dicha célula modificada. En otras realizaciones, el marcador puede diseñarse intencionadamente para integrarse en el sitio genómico diana, de forma que pueda utilizarse para seguir una célula modificada independientemente de la CRISPR. El marcador puede ser un gen que proporcione un fenotipo visualmente detectable, por ejemplo en la semilla, para permitir una rápida identificación de las semillas que llevan o no un casete de expresión CRISPR.

Esta divulgación proporciona un medio para regenerar una planta a partir de una célula con una rotura de doble cadena reparada dentro de una secuencia protoespaciadora en un sitio genómico diana. El regenerante puede utilizarse para propagar más plantas.

La divulgación proporciona además novedosos vectores de transformación de plantas y casetes de expresión que incluyen novedosos promotores U6, y combinaciones de los mismos, con gen(es) asociado(s) a CRISPR y casetes de expresión de ARNsg. La divulgación proporciona además procedimientos para obtener una célula vegetal, una planta entera y una semilla o embrión que han sido modificados específicamente utilizando la escisión mediada por CRISPR.

Direccionamiento utilizando oligonucleótidos de extremo romo

En ciertas realizaciones, el sistema CRISPR/Cas9 puede utilizarse para direccionar la inserción de un fragmento de ADN de doble cadena de extremo romo en un sitio genómico de interés. La actividad de la endonucleasa mediada por CRISPR puede introducir una rotura de doble cadena (DSB) en el protoespaciador del sitio genómico diana seleccionado y la reparación del ADN, como la reparación del ADN de unión de extremos no homólogos impulsada por la microhomología, da lugar a la inserción del fragmento de ADN de doble cadena de extremo romo en el DSB. Se pueden diseñar fragmentos de ADN de doble cadena de extremos romos con 1-10 pb de microhomología, tanto en el extremo 5' como en el 3' del fragmento de ADN, que corresponden a la secuencia de flanqueo 5' y 3' en el sitio de corte del protoespaciador en el sitio genómico diana.

Uso de CRISPRs personalizadas en la reproducción molecular

En algunas realizaciones, el conocimiento del genoma se utiliza para la alteración genética dirigida de un genoma. Al menos un ARNsg puede ser diseñado para dirigirse a al menos una región de un genoma para interrumpir esa región del genoma. Este aspecto de la divulgación puede ser especialmente útil para las alteraciones genéticas. La planta resultante podría tener un fenotipo modificado u otra propiedad en función del gen o genes que se hayan alterado. Los alelos mutantes previamente caracterizados o los transgenes introducidos pueden ser objeto de modificaciones mediadas por CRISPR, lo que permite crear mutantes o líneas transgénicas mejoradas.

En otra realización, un gen dirigido a la supresión o disrupción puede ser un transgén que fue introducido previamente en la planta o célula diana. Esto tiene la ventaja de permitir la introducción de una versión mejorada de un transgén o de permitir la interrupción de una secuencia codificadora de un marcador seleccionable. En otra realización, un gen dirigido a la disrupción mediante CRISPR es al menos un transgén que se introdujo en el mismo vector o casete de expresión que otro(s) transgén de interés, y reside en el mismo locus que otro transgén. Los expertos en la materia entienden que este tipo de modificación mediada por CRISPR puede dar lugar a la supresión o inserción de secuencias adicionales. Por lo tanto, en ciertas realizaciones puede ser preferible generar una pluralidad de plantas o células en las que se ha producido una deleción, y cribar tales plantas o células utilizando técnicas estándar para identificar plantas o células específicas que tengan alteraciones mínimas en sus genomas tras la modificación mediada por CRISPR. Tales cribados pueden utilizar información genotípica y/o fenotípica. En tales realizaciones, se puede interrumpir un transgén específico dejando intactos los transgenes restantes. Esto evita tener que crear una nueva línea transgénica que contenga los transgenes deseados sin el transgén no deseado.

En otro aspecto, la presente divulgación incluye procedimientos para insertar un fragmento de ADN de interés en un sitio específico del genoma de una planta, en el que el fragmento de ADN de interés es del genoma de la planta o es heterólogo con respecto a la planta. Esta divulgación permite seleccionar o apuntar a una región particular del genoma para el apilamiento de ácidos nucleicos (es decir, transgénicos)(es decir, mega-locus). Una región objetivo del genoma puede, por lo tanto, mostrar la vinculación de al menos un transgén con un haplotipo de interés asociado con al menos un rasgo fenotípico, y también puede dar lugar al desarrollo de un bloque de vinculación para facilitar el apilamiento de transgenes y la integración de rasgos transgénicos, y/o el desarrollo de un bloque de vinculación al tiempo que permite la integración de rasgos convencionales.

Uso de CRISPRs personalizadas en la integración de rasgos

La inserción dirigida, en al menos un sitio genómico protoespaciador, de fragmentos de ADN de interés, a través de la escisión mediada por CRISPR permite la integración direccionada de múltiples ácidos nucleicos de interés (es decir, una pila de rasgos) que se añadirán al genoma de una planta en el mismo sitio o en sitios diferentes. Los sitios para la integración direccionada pueden seleccionarse con base en el conocimiento del valor de reproducción subyacente, el rendimiento del transgén en ese lugar, la tasa de recombinación subyacente en ese lugar, los transgenes existentes en ese bloque de enlace u otros factores. Una vez montada la planta apilada, puede utilizarse como donante de rasgos para los cruces con el germoplasma que se está adelantando en un proceso de reproducción o ser adelantada directamente en el proceso de reproducción.

La presente divulgación incluye procedimientos para insertar al menos un ácido nucleico de interés en al menos un sitio, donde el ácido nucleico de interés es del genoma de una planta, como un QTL o alelo, o es de origen transgénico. Una región objetivo del genoma puede, por lo tanto, mostrar la vinculación de al menos un transgén a un haplotipo de interés asociado con al menos un rasgo fenotípico (como se describe en la publicación de la solicitud de patente de EE.UU. n° 2006/0282911), el desarrollo de un bloque de enlace para facilitar el apilamiento de transgenes y la integración de rasgos transgénicos, el desarrollo de un bloque de enlace para facilitar el apilamiento de QTL o haplotipos y la integración de rasgos convencionales, etc.

En otra realización de esta divulgación, se pueden utilizar múltiples ARNsgs únicos para modificar múltiples alelos en loci específicos dentro de un bloque de enlace contenido en un cromosoma haciendo uso del conocimiento de la información de la secuencia genómica y la capacidad de diseñar ARNsgs personalizados como se describe en la técnica. Se diseña o se crea, según sea necesario, un ARNsg que sea específico para, o que pueda dirigirse a, un sitio genómico diana que se encuentre corriente arriba del locus que contiene el alelo no diana. También se diseña o se crea un segundo ARNsg que es específico para, o puede dirigirse a, un sitio genómico diana que está corriente abajo del locus objetivo que contiene el alelo no objetivo. Los ARNsgs pueden diseñarse de forma que complementen regiones genómicas en las que no hay homología con el locus no objetivo que contiene el alelo objetivo. Ambos ARNsgs pueden ser introducidos en una célula utilizando uno de los procedimientos descritos anteriormente.

La capacidad de ejecutar la integración direccionada depende de la acción del complejo ARNsg:proteína Cas y de la actividad endonucleasa del producto génico asociado a Cas. Esta ventaja proporciona procedimientos para la ingeniería de plantas de interés, incluyendo una planta o célula, que comprende al menos una modificación genómica.

Un ARNsg personalizado puede utilizarse en un sistema CRISPR para generar al menos un donante de rasgos para crear un evento de modificación genómica personalizado que luego se cruza en al menos una segunda planta de interés, incluyendo una planta, en la que el suministro de CRlSPR puede acoplarse con el ARNsg de interés para ser utilizado para la edición del genoma. En otros aspectos, una o más plantas de interés se transforman directamente con el sistema CRISPR y al menos un fragmento de ADN de doble cadena de interés para la inserción dirigida. Se reconoce que este procedimiento puede ejecutarse en varios tipos de células, tejidos y desarrollo, incluidos los gametos de las plantas. Además, se prevé que uno o más de los elementos descritos en el presente documento puedan combinarse con el uso de promotores específicos para células, tejidos, partes de la planta y/o etapas de desarrollo concretas, como un promotor específico de la meiosis.

Además, la divulgación contempla el direccionamiewnto de un elemento transgénico ya existente dentro de un genoma para su eliminación o disrupción. Esto permite, por ejemplo, introducir una versión mejorada de un transgén, o permite la eliminación de marcadores seleccionables. En otra realización, un gen dirigido a la disrupción mediante la escisión mediada por CRISPR es al menos un transgén que se introdujo en el mismo vector o casete de expresión que otro(s) transgén(es) de interés, y reside en el mismo locus que otro transgén.

En un aspecto, la divulgación proporciona así un procedimiento para modificar un locus de interés en una célula que comprende (a) identificar al menos un locus de interés dentro de una secuencia de ADN; (b) crear una secuencia de nucleótidos modificada, en el locus de interés o próxima a él, que incluya una secuencia protoespaciadora dentro de un sitio genómico diana para un primer ARNsg según la divulgación; (c) introducir en al menos una célula el ARNsg y el gen asociado a Cas, donde el ARNsg y/o el gen asociado a Cas se expresan de forma transitoria o estable; (d) ensayar la célula para una modificación mediada por CRISPR en el ADN que compone o flanquea el locus de interés; y (e) identificar la célula o una célula progenitora de la misma que comprende una modificación en dicho locus de interés.

Otro aspecto proporciona un procedimiento para modificar múltiples loci de interés en una célula que comprende (a) identificar múltiples loci de interés dentro de un genoma; (b) identificar múltiples sitios protoespaciadores genómicos dentro de cada locus de interés; (c) introducir en al menos una célula múltiples ARNsg y al menos un gen asociado a Cas de acuerdo con la divulgación, en la que la célula comprende los sitios protoespaciadores genómicos y el ARNsg y el gen asociado a Cas se expresan de forma transitoria o estable y crean un locus modificado, o loci, que incluye al menos un evento de escisión mediado por CRISPR; (d) ensayar la célula para detectar modificaciones mediadas por CRISPR en el ADN que compone o flanquea cada locus de interés; y (e) identificar una célula o una célula progenitora de la misma que comprende una secuencia de nucleótidos modificada en dicho loci de interés.

La divulgación contempla además la modificación secuencial de un locus de interés, mediante dos o más ARNsgs y gen(es) asociado(s) a Cas según la divulgación. Los genes u otras secuencias añadidas por la acción de dicha primera modificación genómica mediada por CRISPR pueden conservarse, modificarse adicionalmente o eliminarse por la acción de una segunda modificación genómica mediada por CRISPR.

La presente invención incluye así un procedimiento para modificar un locus de interés en una planta de cultivo como el maíz ( cereal, Zea mays), la soja (Glycine max) , el algodón (Gossypium hirsutum; Gossypium sp.), el cacahuete (Arachis hypogaea), la cebada (Hordeum vulgare), la avena (Avena sativa), la hierba de los huertos (Dactylis glomerata), el arroz (Oryza sativa , incluidas las variedades indica y japónica), el sorgo (Sorghum bicolor), la caña de azúcar (Saccharumsp. ), la festuca alta (Festuca arundinacea), las especies de pasto de grama (por ejemplo , las especies: Agrostis stolonifera, Poa pratensis, Stenotaphrum secundatum); trigo (Triticum aestivum); alfalfa (Medicago sativa); miembros del género Brassica , incluyendo brócoli, col, zanahoria, coliflor, col china; pepino, judía seca, berenjena, tabaco, hinojo, judías de jardín, calabaza, puerro, lechuga, melón, okra, cebolla, guisante, pimiento, calabaza, rábano, espinaca, calabaza, maíz dulce, tomate, sandía, plantas ornamentales y otros cultivos de frutas, hortalizas, tubérculos, semillas oleaginosas y raíces, en los que los cultivos de semillas oleaginosas incluyen la soja, la canola, la colza, la palma aceitera, el girasol, el olivo, el maíz, la semilla de algodón, el cacahuete, la semilla de lino, el cártamo y el coco.

La modificación del genoma puede comprender un bloque de enlace modificado, el enlace de dos o más QTL, la interrupción del enlace de dos o más QTL, la inserción de genes, la sustitución de genes, la conversión de genes, la supresión o la interrupción de un gen, la selección de eventos transgénicos, la selección de donantes de rasgos transgénicos, la sustitución de transgenes o la inserción dirigida de al menos un ácido nucleico de interés.

Definiciones

Las definiciones y los procedimientos proporcionados definen la presente divulgación y guían a los expertos en la materia en la práctica de la presente divulgación. A menos que se indique lo contrario, los términos deben entenderse de acuerdo con el uso convencional de los expertos en la materia. Las definiciones de los términos más comunes en biología molecular también pueden encontrarse en Alberts et al., Molecular Biology of The Cell, 5a edición, Garland Science Publishing, Inc: Nueva York, 2007 Rieger et al., Glossary of Genetics: Classical and Molecular, 5a edición, Springer-Verlag: Nueva York, 1991 King et al, A Dictionary of Genetics, 6a ed., Oxford University Press: Nueva York, 2247y Lewin, Genes IX, Oxford University Press: Nueva York, 2007. Se utiliza la nomenclatura de las bases de ADN establecida en 37 CFR § 1.822.

Tal y como se utiliza en el presente documento, "genes asociados a CRISPR" se refiere a secuencias de ácido nucleico que codifican componentes polipeptídicos de sistemas asociados a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR). Los ejemplos incluyen, pero no se limitan a, Cas3 y Cas9, que codifican endonucleasas de los sistemas CRISPR tipo I y tipo II, respectivamente.

Tal como se utiliza en el presente documento, "ARN de guía única (ARNsg)" se refiere a una molécula de ARN monocatenario híbrido fusionado ARNcr:ARNtracr codificado por un elemento de ADN personalizable que, generalmente, comprende una copia de una secuencia espaciadora que es complementaria a la secuencia protoespaciadora del sitio genómico diana, y un dominio de unión para una endonucleasa asociada-Cas del complejo CRISPR.

Tal y como se utiliza en el presente documento, "sitio diana genómico" se refiere a un protoespaciador y a un motivo adyacente al protoespaciador (PAM) situados en un genoma huésped seleccionado para la mutación dirigida y/o la rotura de doble cadena.

Tal y como se utiliza aquí, "protoespaciador" se refiere a una secuencia corta de ADN (12 a 40 pb) que puede ser objeto de mutación, y/o rotura de doble cadena, mediada por la escisión enzimática con una endonucleasa del sistema CRISPR guiada por el emparejamiento de bases complementarias con la secuencia espaciadora en el ARNcr o ARNsg.

Tal y como se utiliza en el presente documento, el "motivo adyacente al protoespaciador (PAM)" incluye una secuencia de 3 a 8 pb inmediatamente adyacente a la secuencia del protoespaciador en el sitio genómico diana.

Tal como se utiliza aquí, la "microhomología" se refiere a la presencia de la misma secuencia corta (de 1 a 10 pb) de bases en diferentes moléculas de polinucleótidos.

Tal y como se utiliza en este documento, "optimizado para el codón" se refiere a una secuencia de polinucleótidos que ha sido modificada para explotar el sesgo de uso del codón de una planta en particular. La secuencia polinucleotídica modificada sigue codificando el mismo polipéptido, o uno sustancialmente similar, que la secuencia original, pero utiliza tripletes de nucleótidos de codones que se encuentran con mayor frecuencia en una planta en particular.

Tal y como se utiliza en el presente documento, "ARN no codificador de proteínas (ARNncp)" se refiere a un ARN no codificador (ARNnc) que es un pequeño ARN precursor no codificador de proteínas, o un ARN no codificador de proteínas totalmente procesado, que son moléculas de ARN funcionales que no se traducen en una proteína.

Tal como se utiliza aquí, el término "quimérico" se refiere al producto de la fusión de porciones de dos o más moléculas de polinucleótidos diferentes, o a un elemento de expresión genética producido mediante la manipulación de elementos conocidos u otras moléculas de polinucleótidos. Los novedosos elementos reguladores quiméricos pueden diseñarse o crearse por varios procedimientos. En una realización de la presente divulgación, se puede producir un promotor quimérico fusionando la porción 5' de un promotor U6 del cromosoma 1 del maíz, que incluye al menos un elemento promotor específico de monocotiledóneas (MSP), con la porción 3' del promotor U6 del cromosoma 8 del maíz, que incluye un elemento de secuencia corriente arriba (USE) y una caja TATA. El promotor quimérico resultante puede tener novedosas propiedades de expresión en relación con el primer o segundo promotor.

Tal y como se utiliza en el presente documento, "promotor" se refiere a una secuencia de ácido nucleico situada corriente arriba o 5' de un codón de inicio de la traducción de un marco de lectura abierto (o región de codificación de proteínas) de un gen y que está implicada en el reconocimiento y la unión de la ARN polimerasa I, II o III y otras proteínas (factores de transcripción de acción trans) para iniciar la transcripción. Un "promotor vegetal" es un promotor nativo o no nativo que es funcional en las células vegetales. Los promotores constitutivos son funcionales en la mayoría o en todos los tejidos de una planta durante su desarrollo. Los promotores específicos de tejido, órgano o célula se expresan única o predominantemente en un tejido, órgano o tipo de célula concreto, respectivamente. En lugar de expresarse "específicamente" en un determinado tejido, parte de la planta o tipo de célula, un promotor puede mostrar una expresión "mejorada", es decir, un mayor nivel de expresión, en un tipo de célula, tejido o parte de la planta en comparación con otras partes de la planta. Los promotores regulados temporalmente son funcionales sólo o predominantemente durante ciertos períodos del desarrollo de la planta o en ciertos momentos del día, como en el caso de los genes asociados al ritmo circadiano, por ejemplo. Los promotores inducibles expresan selectivamente una secuencia de ADN operable en respuesta a la presencia de un estímulo endógeno o exógeno, por ejemplo mediante compuestos químicos (inductores químicos) o en respuesta a señales ambientales, hormonales, químicas y/o de desarrollo. Los promotores inducibles o regulados incluyen, por ejemplo, promotores regulados por la luz, el calor, el estrés, la inundación o la sequía, las fitohormonas, las heridas o los productos químicos como el etanol, el jasmonato, el ácido salicílico o los fitoprotectores.

Tal como se utiliza en el presente documento, un "casete de expresión" se refiere a una secuencia de polinucleótidos que comprende al menos una primera secuencia de polinucleótidos capaz de iniciar la transcripción de una segunda secuencia de polinucleótidos vinculada operativamente y, opcionalmente, una secuencia de terminación de la transcripción vinculada operativamente a la segunda secuencia de polinucleótidos.

Una secuencia palindrómica es una secuencia de ácido nucleico que es la misma si se lee de 5' a 3' en una cadena o de 3' a 5' en la cadena complementaria con la que forma una doble hélice. Se dice que una secuencia de nucleótidos es un palíndromo si es igual a su complemento inverso. Una secuencia palindrómica puede formar una horquilla.

En algunas realizaciones, los números que expresan cantidades de ingredientes, propiedades como el peso molecular, condiciones de reacción, y así sucesivamente., utilizados para describir y reivindicar ciertas realizaciones de la presente divulgación deben entenderse modificados en algunos casos por el término "aproximadamente". En algunas realizaciones, el término "aproximadamente" se utiliza para indicar que un valor incluye la desviación estándar de la media para el dispositivo o procedimiento que se emplea para determinar el valor. En algunas realizaciones, los parámetros numéricos expuestos en la descripción escrita y en las reivindicaciones adjuntas son aproximaciones que pueden variar en función de las propiedades deseadas que se pretenden obtener con una realización concreta. En algunas realizaciones, los parámetros numéricos deben ser interpretados a la luz del número de dígitos significativos reportados y aplicando técnicas ordinarias de redondeo. A pesar de que los rangos numéricos y los parámetros que establecen el amplio alcance de algunas realizaciones de la presente divulgación son aproximaciones, los valores numéricos establecidos en los ejemplos específicos se informan con la mayor precisión posible. Los valores numéricos presentados en algunas realizaciones de la presente divulgación pueden contener ciertos errores resultantes necesariamente de la desviación estándar encontrada en sus respectivas mediciones de prueba. La citación de los rangos de valores en el presente documento sólo pretende servir como procedimiento abreviado para referirse individualmente a cada valor separado que cae dentro del intervalo. A menos que se indique lo contrario, cada valor individual se incorpora a la memoria descriptiva como si se citara individualmente en ella.

En algunas realizaciones, los términos "un" y "una, uno" y "el, la" y referencias similares utilizadas en el contexto de la descripción de una realización particular (especialmente en el contexto de algunas de las siguientes reivindicaciones) pueden interpretarse para cubrir tanto el singular como el plural, a menos que se indique específicamente lo contrario. En algunas realizaciones, el término "o", tal como se utiliza en el presente documento, incluidas las reivindicaciones, se utiliza para significar "y/o", a menos que se indique explícitamente que se refiere a las alternativas solamente o que las alternativas son mutuamente excluyentes.

Los términos "comprender", "tener" e "incluir" son verbos de enlace abiertos. Cualquier forma o tiempo de uno o más de estos verbos, como "comprende", "que comprende", "tiene", "que tiene", "incluye" y "que incluye", también son abiertos. Por ejemplo, cualquier procedimiento que "comprenda", "tenga" o "incluya" uno o más pasos no se limita a poseer sólo esos pasos y puede abarcar también otros pasos no enumerados. Del mismo modo, cualquier composición o dispositivo que "comprenda", "tenga" o "incluya" una o más características no se limita a poseer sólo esas características y puede abarcar otras características no enumeradas.

Todos los procedimientos descritos en el presente documento pueden realizarse en cualquier orden adecuado, a menos que se indique lo contrario en el presente documento o se contradiga claramente por el contexto.

EJEMPLOS

Los siguientes ejemplos se incluyen para demostrar las realizaciones de la divulgación.

Ejemplo 1

Identificación de promotores para expresar el ARNsg (Sólo para referencia)

Para permitir la ingeniería genómica en el maíz, la soja y el tomate utilizando el sistema de direccionamiento génico basado en CRISPR, se identificaron novedosos promotores U6 nativos de estos tres genomas. Tras la búsqueda por BLAST del gen U6 altamente conservado en los genomas del maíz, la soja y el tomate, se seleccionaron 200-600 pb de secuencia corriente arriba de estos genes U6 putativos para comprobar la función del promotor (Tabla 1). Se identificaron cuatro promotores U6 del genoma del maíz B73, uno en el cromosoma 1 (SEQ ID NO:1), otro en el cromosoma 2 (SEQ ID NO:3), otro en el cromosoma 3 (SEQ ID NO:5) y otro en el cromosoma 8 (SEQ iD NO:7). Se compiló una alineación de secuencias múltiples de estos cuatro promotores U6 del maíz y de los correspondientes genes U6, como se muestra en la FIG. 1A y B. Para cada uno de estos promotores U6 del maíz, los motivos conservados del promotor U6 (por ejemplo, la caja TATA, el elemento de secuencia corriente arriba (USE) y los elementos del promotor específico de monocotiledóneas (MSP) (Connelly, Mol. Cell Biol. 14:5910-5919, 1994) están presentes (FIG. 1B). Una nucleobase de guanina que sigue a los tractos poli-T se conservó entre estos cuatro genes, y puede tener un papel importante en la transcripción. El consenso de la secuencia, el porcentaje de conservación y el logo de la secuencia (el tamaño del nucleótido indicado es directamente proporcional a la conservación de la secuencia) se presentan debajo del alineamiento (FIG. 1). Basándose en la alineación de secuencias múltiples, los motivos conservados de estos promotores U6 se encontraban dentro de los 140 pb proximales al sitio de inicio de la transcripción. Basándose en la proximidad de estos motivos conservados del promotor U6, se seleccionaron 200 pb de la secuencia proximal corriente arriba del sitio de inicio de la transcripción para cada uno de los promotores U6 del cromosoma del maíz, el cromosoma 1 (SEQ ID NO:2), el cromosoma 2 (s Eq ID NO:4), el cromosoma 3 (SEQ ID NO:6) y el cromosoma 8 (SEQ ID NO:8) para probar la actividad eficiente del promotor en los casetes de expresión de ARNsg.

Además de los cuatro promotores U6 del maíz, se diseñaron promotores U6 quiméricos. Se diseñaron cuatro promotores quiméricos de maíz U6 utilizando diferentes combinaciones de los promotores U6 de maíz de los cromosomas 1, 2 y 8, siendo cada promotor quimérico de 397 pb de longitud. Los puntos de rotura de las quimeras se determinaron de forma que los elementos conservados (por ejemplo, USE, MSP y caja TATA) de diferentes orígenes cromosómicos se mezclaran en los nuevos promotores U6 quiméricos, pero conservaran su espaciado relativo respecto a los promotores U6 nativos del maíz. Por ejemplo, el extremo 5' del promotor U6, incluyendo MSP y USE, se derivó de un cromosoma, mientras que el extremo 3', incluyendo la caja TATA y uno o más elementos MSP, se derivó de un segundo cromosoma. Aunque el promotor U6 del maíz del cromosoma 2 no era un promotor muy fuerte en su forma nativa, incluía más de un elemento MSP. En consecuencia, las quimeras que incluyen principalmente la secuencia del cromosoma 1 y/o 8 pueden incluir también uno o más elementos MSP del cromosoma 2. En concreto, la porción 5' de la quimera 1 (SEQ ID NO:17) deriva del promotor U6 del cromosoma 1 del maíz (SEQ ID NO:1), incluyendo un elemento MSP, y la porción 3' de esta quimera deriva del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7), incluyendo un elemento USE y una caja TATA. Del mismo modo, la porción 5' de la quimera 2 (SEQ ID NO:18) se deriva del promotor U6 del cromosoma 1 del maíz (SEQ ID NO:1), incluyendo un elemento MSP, y la porción 3' de esta quimera se deriva del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7), incluyendo un segundo elemento MSP, un elemento USE y una caja TATA. La porción 5' de la quimera 3 (SEQ ID n O:19) se deriva del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7), incluyendo un elemento MSP, y la porción 3' de esta quimera se deriva del promotor U6 del cromosoma 1 del maíz (SEQ ID NO:1), incluyendo un segundo elemento MSP, un elemento USE y una caja TATA. Además, para la quimera 3, hay una supresión de 3 pb que comienza en el pb 100 de la SEQ ID NO:7, y el extremo 5' de la quimera comienza con 5'-AAG-3'. La quimera 4 (SEQ ID NO:20) se derivó del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7), incluyendo el elemento MSP, el elemento USE y la caja TATA. Sin embargo, esta quimera también incluye dos elementos MSP adicionales (para un total de 3 elementos MSP) derivados del promotor U6 de los cromosomas del maíz 1 y 2.

Tabla 1. Promotores U6 de maíz (Zea mays), tomate (Solanum lycopersicum) y soja (Glycine max), su origen cromosómico y su longitud.

Ejemplo 2 (Sólo como referencia)

Identificación de genes Cas9 para permitir la ingeniería del genoma en plantas

La secuencia de Cas9 de S. pyogenes (SEQ ID NO:28 es la secuencia polipeptídica de Cas9 con NLS, y SEQ ID NO:96 es la secuencia polipeptídica de Cas9 sin NLS) se utilizó para el direcionamiento dirigido al sitio mediado por CRISPR de un constructo informador en embriones de maíz inmaduros. Para la expresión, se diseñó la secuencia de nucleótidos de Cas9 optimizada para el codón en un vector de expresión capaz de expresarse en una planta. Este vector de expresión de Cas9 contenía un promotor 35S que impulsaba la expresión del marco de lectura abierto de Cas9, una secuencia NLS incorporada en el extremo 3' de la región codificador de Cas9 y una secuencia de terminación de la transcripción Nos (SEQ ID NO:29).

Una proteína Cas9 (SEQ ID NO:26), y una versión optimizada en codones de la secuencia de nucleótidos que codifica la misma (SEQ ID NO:27), fueron identificadas a partir de la bacteria Bradyrhizobium , relacionada con las plantas, y pueden ser útiles para aumentar la solidez de la modificación del genoma mediada por CRISPR/Cas en las plantas. Una proteína Cas9 (SEQ ID NO:69) y una versión optimizada de codones para monocotiledóneas (SEQ ID NO:68), fueron identificadas a partir de Streptococcus thermophilus , y pueden ser útiles para aumentar la robustez de la modificación del genoma mediada por CRISPR/Cas en las plantas. También se pueden identificar otros genes Cas9 de bacterias relacionadas con las plantas ( por ejemplo, bacterias simbióticas o patógenas).

Ejemplo 3 (Sólo como referencia)

Diseño de casetes de ARN de guía única

Se diseñó un conjunto de casetes de expresión de ARN de guía única (ARNsg) para direccionar un protoespaciador en un sitio genómico de maíz denominado Zm7 (5'-GCCGGCCAGc At TTGa Aa CATGG-3', SEQ ID NO:22). Los diferentes casetes de expresión incluían uno de los promotores U6 de 397 pb del maíz: cromosoma 1 (SEQ ID NO:30), cromosoma 2 (SEQ ID NO:32), cromosoma 3 (SEQ ID NO:34), o el cromosoma 8 (SEQ ID NO:36); o uno de los promotores U6 de 200 pb del maíz: cromosoma 1 (SEQ ID NO:31), cromosoma 2 (SEQ ID NO:33), cromosoma 3 (SEQ ID NO:35), o cromosoma 8 (SEQ ID NO:37). Cada casete de expresión también contenía, i) el terminador U6 poli-T conservado en cada uno de los cuatro genes U6 del maíz; ii) un ARNsg que incluía una copia de la secuencia espadadora 5-GCCGGCCAGCATTTGAAACA-3' (SEQ ID NO:23) correspondiente al protoespaciador del sitio diana genómico Zm7 (SEQ ID NO:22); y iii) el dominio 3' conservado de un ARNsg que proporciona el dominio de unión a la endonucleasa Cas, y que termina con el tracto poli-T de U6 (SEQ ID NO:21).

De forma similar, se diseñó un conjunto de casetes de ARNsg con uno de los cuatro promotores U6 de 397 pb del maíz (SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, o SEQ ID NO:36; véase la Tabla 2), y la secuencia espaciadora del ARNsg complementaria al protoespaciador del sitio diana del genoma del maíz denominado Zm231 (SEQ ID NO:24). La Tabla 3 enumera los correspondientes SEQ ID NOs para las secuencias de ADN y ARN de los ARNsgs que contienen los sitios diana Zm7, Zm231 y Zml4. Se diseñó un casete de ARNsg de control negativo con el promotor U6 de 397 pb del cromosoma 8 del maíz (SEQ ID NO:36) y la secuencia espaciadora del ARNsg complementaria al protoespaciador del sitio diana del genoma del maíz denominado Zml4 (SEQ ID NO:24). Este casete de ARNsg de control negativo se diseñó con una secuencia espaciadora del ARNsg que no es complementaria con la secuencia protoespaciadora del sitio genómico diana del maíz Zm231. La inclusión de un ARNsg que comprenda la secuencia espaciadora complementaria al sitio genómico diana del maíz Zml4 no dará lugar a la escisión mediada por CRISPR/Cas de la secuencia protoespaciadora del sitio protoespaciador diana del maíz Zm231. Estos casetes de ARNsg de Zm231 y Zml4 están representados por la SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41 y SEQ ID NO:42 (Tabla 2). Cada uno de estos casetes de ARNsg también contiene en el extremo 3' de la secuencia de ARNsg un tracto poli-T de U6.

Tabla 2. Casetes con los promotores U6 de maíz (Zea mays) indicados y ARNsg que contienen espaciadores complementarios a la secuencia protoespaciadora de los sitios diana genómicos de maíz indicados.

Tabla 3. Secuencias de ADN y ARN de los ARNsg de Streptococcus pyogenes que contienen secuencias espaciadoras complementarias a la secuencia protoespaciadora de los sitios diana del genoma del maíz Zm7, Zm231 y Zm14.

Ejemplo 4 (Sólo como referencia)

Actividad de CRISPR en el maíz - Ensayo informador GUS modificado

Para determinar la actividad de la eficacia del direccionamiento genético mediado por CRISPR/Cas en el maíz, se utilizó un sistema para la expresión transitoria de un gen informador en embriones inmaduros de maíz. Además de los casetes de ARNsg descritos anteriormente, el diseño incorporó un casete de expresión que contenía la endonucleasa Cas9 de Streptococcus pyogenes (SEQ ID NO:28) que contenía una secuencia de señal de localización nuclear (NLS) y estaba optimizado en cuanto a codones para su expresión en el maíz.

El constructo del gen informador para estos experimentos era un casete que contenía una secuencia codificadora de p-glucuronidasa (GUS) modificada con un sitio genómico diana de maíz (protoespaciador y PAM) para la escisión CRISPR dirigida (por ejemplo, el Zm7 (SEQ ID NO:22), Zm231 (SEQ ID NO:44) o Zm14 (SEQ ID NO:43)) diseñado en el gen informador y rodeado por una repetición directa interna de la secuencia codificadora de GUS (FIG. 2). Cuando se coordina con los vectores de expresión de los componentes CRISPR, si el sistema CRISPR escinde la secuencia del protoespaciador, la vía endógena de la planta de recocido de una sola cadena (SSA) de reparación del ADN por recombinación homóloga reconstituirá un gen GUS funcional. Estos constructos modificados del informador GUS se denominaron GU-Zm7-US, GU-Zm231-US, o GU-Zm14-US, en referencia al sitio genómico del maíz insertado en el gen GUS, Zm7, Zm231 y Zm14, respectivamente. Uno de los casetes del gen informador GUS modificado fue co-delegado con vectores de expresión para los otros componentes CRISPR (por ejemplo, uno de los casetes ARNsg) y el casete de expresión que codifica la endonucleasa Cas9 (SEQ ID NO:28). Los casetes de expresión se mezclaron y recubrieron con partículas de oro de 0,6 pM utilizando protocolos estándar. A continuación, se bombardearon embriones inmaduros de maíz de 3 días de edad con estas partículas de oro preparadas. Los embriones se mantuvieron en cultivo durante 3-5 días después del bombardeo y luego se procesaron para la tinción histoquímica utilizando X-Gluc (5-bromo-4-cloro-3-indolil glucurónido) y protocolos de laboratorio estándar.

Si la actividad de la endonucleasa Cas9 mediada por CRISPR se produce en el sitio del protoespaciador en el constructo del gen informador modificado, entonces la actividad GUS se detecta como focos azules utilizando tinción histoquímica y X-Gluc (FIGs. 3 y 4).

Se diseñaron casetes de expresión separados para contener uno de los cuatro promotores U6 del maíz (de los cromosomas 1, 2, 3 y 8) que impulsan la expresión de un ARNsg que contiene una secuencia espaciadora complementaria al protoespaciador del sitio genómico diana Zm7 del maíz (FIG. 3). Para preparar las muestras para el ensayo de expresión, se recubrieron partículas de oro de 0,6 pM con 0,6 pmol de una de los constructos de Zm7-ARNsg y 0,3 pmol de cada una de de los otros constructos (casete de expresión de Cas9 y el constructo informador modificado por Zm7 (GU-Zm7-US)). Una vez preparadas las partículas de oro recubiertas, se utilizó 1/4 de la mezcla para bombardear embriones de maíz inmaduros de 3 días de edad, utilizando protocolos estándar. Se bombardearon más de 50 callos de maíz inmaduros para cada conjunto de constructos evaluados, y la tinción se realizó 5 días después del bombardeo. Tras la tinción, se tomaron fotografías de callos representativos (vista general de varios callos y un primer plano de un solo callo) (FIG. 3). El constructo informador modificado GU-Zm7-US fue diseñada para contener el sitio genómico diana de Zm7 (SEQ ID NO:22), y el ARNsg fue diseñado para contener una copia del espaciador de Zm7 (SEQ ID NO:23). El espaciador Zm7-ARNsg se incorporó a casetes de expresión con uno de los cuatro promotores U6 de maíz de 397 pb del cromosoma 1 (SEQ ID NO:30), del cromosoma 2 (SEQ ID NO:32), del cromosoma 3 (SEQ ID NO:34) o del cromosoma 8 (SEQ ID NO:36). Los controles negativos utilizados en la transformación incluyeron el constructo informador modificado GU-Zm7-US con el sitio diana genómico de Zm7 y: (1) que carecen tanto del casete de expresión de la endonucleasa Cas9 como del casete de expresión del Zm7-ARNsg; o (2) que carecen únicamente del casete de expresión del Zm7-ARNsg (FIG. 3). En ambos controles no se detectaron sectores azules, lo que indica que no se había producido la escisión mediada por CRISPR de el constructo informador modificado. Los resultados de la evaluación de los cuatro promotores diferentes de 397 pb del maíz U6 para impulsar la expresión del casete Zm7-ARNsg mostraron que, si bien los cuatro promotores de 397 pb del maíz U6 funcionaron (es decir, se detectaron sectores azules en los callos), la eficacia de los diferentes promotores varió (como lo demuestra el tamaño y el número de sectores azules en los callos). El promotor U6 del cromosoma 8 del maíz fue el más eficaz, seguido del promotor U6 del cromosoma 1. Los promotores U6 de los cromosomas 2 y 3 mostraron una eficacia similar entre sí (Chr 8 > Chr 1 > Chr2 “ Chr3).

La especificidad del sistema CRISPR/Cas9 en este sistema de expresión de maíz se evaluó probando los desajustes entre la secuencia protoespaciadora dentro del sitio genómico diana en el constructo del gen informador GUUS modificado y la secuencia espaciadora incluida en los constructos de ARNsg variables (FIG. 4). Al igual que en el experimento descrito anteriormente, se recubrieron partículas de oro de 0,6 pM con uno o más constructos; 0,3 pmol del constructo informador individual GUUS modificado (GUUS), 0,16 pmol del casete de expresión de la endonucleasa Cas9, 0,3 pmol de los casetes individuales de ARNsg y 0,03 pmol de un constructo de control de transformación que expresaba la proteína verde fluorescente (GFP) (FIG. 4). Una vez preparadas las partículas de oro recubiertas, se utilizó 1/4 de la mezcla para bombardear embriones de maíz inmaduros de 3 días de edad utilizando protocolos estándar. Se bombardearon más de 50 callos de maíz inmaduros para cada conjunto de constructos evaluados. Los tejidos se mantuvieron en cultivo durante 3 días después del bombardeo. La determinación de la expresión de GFP mediante microscopía de fluorescencia se realizó el día 1 y de nuevo el día 3 para validar el bombardeo uniforme y la transformación. Después de la microscopía de fluorescencia del día 3, se procesaron los callos para la tinción con X-Gluc y se tomaron micrografías fluorescentes y luminosas de callos representativos (FIG. 4). La tinción fluorescente de todos los callos indicó una buena transformación.

Los controles negativos utilizados en la transformación incluían el constructo informador modificado GU-Zm231-US con el sitio genómico diana de Zm231 (1) que carecía tanto del casete de expresión de la endonucleasa Cas9 como de cualquier casete de expresión de ARNsg; o (2) que tenía un casete de expresión de Zm231-ARNsg con un promotor U6 de maíz del cromosoma 8, pero que carecía del casete de expresión de la endonucleasa Cas9 (FIG. 4). Ambos controles no mostraron sectores azules detectados con la tinción de X-Gluc, lo que indica que no se había producido la escisión mediada por CRISPR de el constructo informador modificado (FIG. 4).

La especificidad del sistema CRISPR/Cas9 también se evaluó utilizando controles que incluían una falta de coincidencia entre el sitio protoespaciador en el constructo informador GUUS modificado y la secuencia espaciadora del ARNsg. Específicamente, la falta de coincidenciafue entre el constructo informador modificado GU-Zm231-US con el sitio genómico diana Zm231 y (1) el casete de expresión de ARNsg con el espaciador Zm14 y un promotor U6 de maíz del cromosoma 8; o (2) el casete de expresión de ARNsg con la secuencia espaciadora Zm231 y un promotor U6 de maíz del cromosoma 8 (FIG. 4).

Finalmente, los promotores U6 de maíz de 397 pb (cromosoma 1, 2, 3 y 8) se utilizaron cada uno para generar casetes de expresión de ARNsg con el sitio genómico diana de Zm231. Cada uno de ellos fue co-transformado con el constructo informador modificado GU-Zm231-US hecho con el sitio genómico diana de Zm231. Los resultados indicaron que cuando la secuencia espaciadora del ARNsg y el sitio genómico diana de el constructo informador no coincidían, se detectaba muy poca actividad GUS. Por el contrario, cuando la secuencia del espaciador del ARNsg y el sitio genómico diana del constructo informador coincidían, se detectaban muchos focos azules grandes (FIG. 4). El promotor U6 del cromosoma 8 del maíz puede tener una mayor eficacia (basándose en la suposición de que la eficacia se correlaciona con los focos azules que eran más numerosos, de mayor tamaño y de intensidad de tinción más oscura), seguido del promotor U6 del cromosoma 1 del maíz. Los promotores U6 de los cromosomas 2 y 3 del maíz mostraron una eficacia similar entre sí (Chr 8 > Chr 1 > Chr2 “ Chr3).

El ARNsg dirigido por el promotor U6 del cromosoma 8 del maíz mostró consistentemente una alta actividad. Estos hallazgos sugieren que los diferentes promotores U6 del maíz tienen actividades diferentes, y destacan además la utilidad del promotor U6 derivado del cromosoma 8 del maíz en el sistema CRISPR/Cas de modificación direccionada del genoma.

Ejemplo 5 (Sólo como referencia)

Integración de oligonucleótidos de extremo romo

Se evaluó la eficacia del sistema CRISPR/Cas9 en cuanto a la inserción de un fragmento de ADN de doble cadena con extremo romo en uno de los tres sitios genómicos diana, identificados como Zm_L70a (SEQ ID NO:47), Zm_L70c (SEQ ID NO:59) y Zm_L70d (SEQ ID NO:61) dentro del genoma del maíz. Cada uno de estos tres sitios genómicos diana es único en el genoma del maíz. Si los componentes de CRISPR son capaces de ejercer una actividad endonucleasa e introducen una rotura de doble cadena (DSB) en el protoespaciador del sitio genómico diana seleccionado, entonces el sistema de reparación de ADN de unión de extremos no homólogos de maíz endógeno insertará el fragmento de ADN de doble cadena de extremo romo en el DSB.

Los oligonucleótidos complementarios se pre-recocieron para formar fragmentos de ADN de doble cadena de extremo romos, y éstos se co-transformaron con los constructos CRISPR en protoplastos de maíz (FIG. 5A). Los pares de oligonucleótidos se diseñaron para (1) no contener regiones de microhomología (véase la FIG. 5B), o (2) contienen en cada extremo (5' y 3') una microhomología de 3 pb con la correspondiente secuencia de flanqueo 5' y 3' en el sitio de corte del protoespaciador en el sitio genómico diana (FIG. 5C). Las secuencias de microhomología pueden promover la integración de fragmentos de ADN de doble cadena a través de un mecanismo de unión de extremos no homólogos impulsado por la microhomología en el sitio genómico diana. Las dos secuencias del par de oligonucleótidos sin secuencia microhomológica fueron SEQ ID NO:45 y SEQ ID NO:46. Los tres pares de oligonucleótidos, cada uno de los cuales contiene microhomología con su respectivo sitio genómico diana, fueron recocidos en combinaciones de pares de los siguientes oligonucleótidos: (1) SeQ ID NO:62 y SEQ ID NO:63 (microhomología con Zm_L70a); (2) SEQ ID NO:64 y SEQ ID NO:65 (microhomología con Zm_L70c); y (3) SEQ ID No :66 y SEQ ID NO:67 (microhomología con Zm_L70d) para formar fragmentos de ADN de doble cadena de extremo romo.

Para estos ensayos de integración de fragmentos de ADN de doble cadena de extremo romo, los constructos CRISPR utilizadas incluían el casete de expresión de la endonucleasa Cas9 descrito anteriormente, y uno de los tres casetes de expresión de ARNsg. Cada uno de los tres casetes de expresión de ARNsg estaba dirigido por la versión de 397 pb del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7) y contenía la secuencia espaciadora correspondiente a los sitios genómicos diana: Zm_L70a (SEQ ID NO:48), Zm_L70c (SEQ ID NO:58) y Zm_L70d (SEQ ID NO:60). Las diferentes combinaciones de los componentes CRISPR y los oligonucleótidos para estos ensayos se mezclaron como sigue: 0,6 pmol del casete de expresión de Cas9, 1,6 pmol de uno de los casetes de expresión de ARNsg, y 35 pmol del par de oligonucleótidos pre-recocidos, y, utilizando un protocolo estándar mediado por PEG, se transformaron en alícuotas de suspensiones de protoplastos de hojas de maíz que contenían unas 320.000 células. Dos días después, se recolectaron protoplastos de maíz y se analizó la inserción del fragmento de ADN de doble cadena de extremo romo en el sitio diana genómico particular de L70, al que apuntaba el ARNsg único seleccionado en cada caso (Tabla 4). El control negativo fue la omisión del casete de expresión de Cas9 durante la transformación del protoplasto de maíz.

Para detectar la inserción del fragmento de ADN de doble cadena del extremo romo en el cromosoma del maíz, se extrajo el ADN y se realizó una amplificación térmica de alto rendimiento (PCR) con múltiples pares de cebadores (Tabla 5). Dado que el fragmento de ADN de doble cadena de extremo romo puede insertarse en el ADN cromosómico escindido por c RiSPR en cualquier orientación, se diseñaron cebadores para una cadena del fragmento de ADN de doble cadena de extremo romo y para ambas regiones genómicas flanqueantes, con cada par de cebadores abarcando la unión del sitio de inserción. Los amplicones de la PCR se separaron en una plataforma de análisis de fragmentos (analizador de ADN ABI3730) de Life Technologies (Grand Island, NY). Esta plataforma, que es más sensible que los procedimientos de electroforesis en gel y tiene una resolución de un solo bp, confirmó si los amplicones se originaban en la plantilla de interés y si eran específicos para las condiciones de tratamiento experimental.

Tabla 4. Secuencias de ADN y ARN del ARNsg de Streptococcus pyogenes que contienen secuencias espaciadoras complementarias a la secuencia protoespaciadora de los sitios diana genómicos del maíz L70a, L70c, L70d.

Un perfil de análisis de fragmentos representativo se muestra en la FIG. 5D (Experimento T3, Tabla 5). La amplificación del ADN extraído de protoplastos de maíz transformados con Cas9, ARNsg que contiene secuencias espaciadoras complementarias a la secuencia protoespaciadora del sitio genómico diana del maíz Zm_L70c (SEQ ID NO:83), y el fragmento de ADN de doble cadena sin microhomología, utilizando cebadores en el sitio genómico diana Zm_L70c (SEQ ID NO:49, cebador específico para el fragmento de ADN de doble cadena insertado, y SEQ ID NO:55, cebador específico para el ADN genómico flanqueante) reveló un pico principal del tamaño esperado y varios picos adicionales de tamaños similares (flecha) (FIG. 5D, panel superior). Por el contrario, no se observaron productos de amplificación en el ADN extraído de las transformaciones de control negativo (FIG. 5D, panel inferior). Este perfil de PCR era consistente con roturas de doble cadena reparadas erróneamente por unión final no homóloga, lo que resultaba en la introducción de indels cortos en el lugar de la reparación.

Para confirmar que el fragmento de ADN de doble cadena de extremo romo se incorporó en el sitio genómico diana, los amplicones de la PCR se clonaron y secuenciaron (Tabla 5). Los controles negativos que carecen de proteínas Cas9 no produjeron productos de PCR. Siete de los diez experimentos mostraron el patrón esperado: un producto PCR positivo del tamaño esperado para las muestras de prueba, y ningún producto PCR para las muestras de control. Los siete experimentos que mostraron un producto de PCR positivo incluían experimentos que demostraban integraciones que se producían tanto para fragmentos de ADN de doble cadena de extremo romo con y sin microhomología. En los experimentos T1 y T7 no se detectaron las integraciones dirigidas ni en las muestras de prueba ni en las de control. Los productos de la PCR de seis de los experimentos se clonaron y secuenciaron, confirmando las uniones esperadas entre fragmentos de ADN y cromosomas para la integración de fragmentos de ADN de doble cadena de extremo romo. Los resultados de la secuenciación mostraron la presencia tanto de fragmentos de ADN de longitud completa como de fragmentos de ADN truncados (indels) presentes en el lugar de integración del fragmento de ADN de doble cadena de extremo romo (véase, por ejemplo, la FIG. 5E, Experimento T1). Las secuencias eran coherentes con el análisis de los fragmentos (FIG. 5D) y demostró que CRISPR/Cas9 puede dirigirse a loci cromosómicos nativos, de secuencia específica, para su escisión en protoplastos de maíz. Estos resultados también demostraron el éxito de la integración de fragmentos de ADN de doble cadena con y sin regiones de microhomología.

Ejemplo 6 (Sólo como referencia)

Modificación direccionada del genoma con genes del complejo CRISPR/Cas9 de Streptococcus thermophilus

Puede ser deseable lograr la modificación del genoma mediada por CRISPR de algunas plantas (por ejemplo, plantas de cultivo) con genes del complejo CRISPR derivados de Streptococcus thermophilus en lugar de S. pyogenes. Los inventores han desarrollado un casete de expresión que codifica una secuencia de nucleótidos optimizada para el codón con dos señales de localización nuclear (NLS) (SEQ ID NO:136) de la proteína Cas9 de S. thermophilus (SEQ ID NO:69). El StCas9 fue diseñado para codificar tanto una señal de localización nuclear (NLS) N-terminal como C-terminal (Se Q ID NO:120) en la posición de aminoácidos 2-11 y 1133-1142 (SEQ ID NO:135). Además, el casete de expresión de ADN (SEQ ID NO:136) incluía un intrón en la posición nucleotídica 507-695. Se ha diseñado una serie de ARN de guía única (ARNsg) de S. thermophilus . El ARNsg de S. thermophilus se diseñó para unir el ARNcr nativo de S. thermophilus con un bucle de tallo (5'-CCAAAAGG-3'; SEQ ID NO:105), y para contener la secuencia espaciadora complementaria al protoespaciador de los sitios diana del genoma del maíz seleccionados de Zm_L70e (SEQ ID NO:72), Zm_L70f (SEQ ID:73), Zm_L70g (SEQ ID NO:74), o Zm_L70h (SEQ ID NO:75). Los siete nucleótidos en el extremo 3' de cada uno de estos sitios genómicos diana representan el motivo adyacente al protoespaciador específico de S. thermophilus (PAM, 5'-NNAGAAW-3'; SEQ ID No :106). FIG. 6 muestra la estructura secundaria prevista de este ARNsg de S. thermophilus (SEQ ID NO:70) con una copia de la secuencia espaciadora (SEQ ID NO:71) complementaria a la secuencia protoespaciadora del sitio genómico diana del maíz Zm_L70h (SEQ ID NO:75) y el enlazador de bucle de tallo (5'-CCAAAAGG-3'; SEQ ID NO:105). La Tabla 6 enumera los correspondientes SEQ ID NOs para las secuencias de ADN y ARN que codifican los ARNsgs de S. thermophilus que contienen secuencias espaciadoras complementarias a la secuencia protoespaciadora de los sitios diana del genoma del maíz Zm_L70e, Zm_L70f, Zm_L70g y Zm_L70h.

Tabla 6. Secuencias de ADN y ARN del ARNsg de Streptococcus thermophilus que contienen secuencias espaciadoras complementarias a la secuencia protoespaciadora de los sitios diana del genoma del maíz Zm_L70e,

Zm_L70f, Zm_L70g y Zm_L70h.

El ensayo para la modificación del genoma mediada por Cas9 de S. thermophilus fue esencialmente como se describe en el ejemplo 5. En concreto, se transfectaron 320.000 protoplastos de maíz con 0,8 pmol del constructo de expresión de S. thermophilus Cas9 (SEQ ID NO:136), y 16 pmol de uno de los constructos de expresión de ARNsg impulsado por la versión de 397 pb del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7) que contiene la secuencia espaciadora correspondiente a los sitios genómicos diana: el constructo de ARNsg para el sitio L70e (SEQ ID NO:107), el constructo de ARNsg para el sitio L70f (SEQ ID NO:108, y el constructo de ARNsg para el sitio L70g (SEQ iD NO:109), y 50 pmol de un fragmento de ADN de doble cadena de extremo romo pre-recocido codificado por la SEQ ID NO:115 y SEQ ID NO:116. Para comprobar la eficacia de la transformación, se incluyeron 2,5 ug de un constructo que codifica la proteína verde fluorescente (GFP). En el momento de la recolección, se recogió una alícuota de los protoplastos transfectados para calcular la frecuencia de transfección en el sistema de imágenes PE Operetta® (PerkinElmer, Waltham, MA), que calcula la proporción de células positivas a la GFP por el total de células. La omisión del casete de expresión de StCas9 durante la transformación de protoplastos de maíz sirvió como control negativo. Los protoplastos se recolectaron 48 horas después de la transfección y se analizaron para la inserción del fragmento de ADN de doble cadena de extremo romo en el sitio genómico diana L70e, o L70f, o L70g mediante un análisis cuantitativo de PCR de alto rendimiento utilizando un sistema BioRad QX200™ Droplet Digital™ PCR (ddPCR™) (BioRad, Hercules, CA) y sondas TaqMan®. Para determinar el porcentaje de integración de la diana, se utilizó un conjunto de cebadores y sondas TaqMan con el sistema ddPCR para detectar el número de copias de la plantilla de una unión del fragmento de ADN de doble cadena de extremo romo insertado en el sitio cromosómico diana. Los cebadores específicos de la unión y la sonda para los sitios cromosómicos del maíz L70e, L70f, L70g y L70h se indican en la Tabla 7. Para normalizar la cantidad de ADN en la alícuota del protoplasto transfectado, se utilizó el sistema ddPCR con un segundo conjunto de cebadores TaqMan y una sonda (cebadores codificados por la SEQ ID NO:132 y SEQ ID NO:134; sonda codificada por la SEQ ID NO:133) para determinar el número de copias de la plantilla de un sitio único en el genoma del maíz y fuera del sitio diana. El cálculo de la tasa de integración de la diana fue el número de copias de la plantilla específica del lugar de la diana dividido por el número de copias de la plantilla específica del genoma del maíz dividido por la frecuencia de transformación determinada por los recuentos de células positivas a la GFP frente al total de células utilizando el sistema de imágenes PE Operetta® (PerkinElmer, Waltham, MA). Los puntos de datos presentados en el gráfico se determinaron promediando cuatro réplicas biológicas. Los resultados se presentan en la FIG. 15 y muestran que el porcentaje de integración para cada uno de los sitios L70e, L70f y L70g fue mayor que el control correspondiente.

Los amplicones de PCR correspondientes a las uniones dirigidas de los experimentos con protoplastos se secuenciaron para confirmar la integración de los fragmentos de ADN de doble cadena de extremo romo en los sitios diana seleccionados. La FIG. 15B muestra una alineación de la integración esperada del fragmento de ADN de doble cadena de extremo romo en el sitio diana L70f (SEQ ID NO: 144) y un ejemplo de integración del sitio diana (SEQ ID NO: 145) con supresión de parte de la secuencia del fragmento de ADN. Aunque estos resultados de secuenciación muestran indels, los resultados confirman que el fragmento de ADN se integró en el sitio diana L70f.

Tabla 7. SEQ ID NOs para los cebadores y sondas para la amplificación por PCR de la unión en los sitios diana del maíz con el fragmento de ADN insertado.

Ejemplo 7 (Sólo como referencia)

Direccionamiento a múltiples sitios genómicos únicos mediante la multiplexación de ARNsg

Una ventaja clave del sistema CRISPR, en comparación con otras plataformas de ingeniería genómica, es que múltiples ARNsgs dirigidos a sitios diana genómicos separados y únicos pueden ser suministrados como componentes individuales para efectuar el direccionamiento. Alternativamente, se pueden multiplexar (es decir, apilar) múltiples ARNsgs dirigidos a sitios genómicos únicos y separados en un solo vector de expresión para efectuar el direccionamiento. Un ejemplo de una aplicación que puede requerir múltiples escisiones endonucleolíticas direccionadas incluye la eliminación del gen marcador de un evento transgénico (FIG. 7A). El sistema CRISPR puede utilizarse para eliminar el marcador seleccionable del inserto transgénico, dejando atrás el gen de interés.

Otro ejemplo de una aplicación en la que un sistema CRISPR/Cas de este tipo puede ser útil es cuando hay un requisito de múltiples escisiones endonucleolíticas direccionadas, como cuando la identificación de los genes causales detrás de un rasgo cuantitativo se ve obstaculizada por la falta de recombinaciones meióticas en las regiones QTL que separarían los genes candidatos entre sí. Esto puede evitarse mediante la transformación con varios constructos CRISPR direccionados a los genes de interés simultáneamente. Estos constructos eliminarían los genes candidatos mediante mutaciones de desplazamiento de marco o los eliminarían por deleción. Tales transformaciones también pueden dar lugar a combinaciones aleatorias de loci intactos y mutantes que permitirían la identificación de genes casuales (FIG. 7B).

Ejemplo 8 (Sólo como referencia)

Tasas de integración en función de la concentración del fragmento de ADN del extremo romo y del tiempo

El sistema de protoplastos de maíz, esencialmente como se describe en el Ejemplo 5, se utilizó para determinar la concentración óptima del fragmento de ADN de doble cadena de extremo romo que debía incluirse en la mezcla del ensayo para lograr el mayor porcentaje de integración del direccionamiento. Para estos ensayos, el constructo de expresión que codifica el Cas9 de S. pyogenes se modificó para incluir un intrón desde la posición 469-657 en la región de codificación (SEQ ID NO:119). Además, la secuencia de la proteína (SEQ ID NO:118) contenía dos secuencias NLS (SEQ ID NO:120), una en el extremo amino-terminal (aminoácidos 2 a 11 de la SEQ ID NO:118) y otra en el extremo carboxi-terminal (aminoácidos 1379 a 1388 de la s Eq ID NO:118).

Para el ensayo, se transfectaron 320.000 protoplastos de maíz con 0,8 pmol del constructo de expresión de S. pyogenes Cas9 (SEQ ID NO:119) y 1,6 pmol del constructo de expresión de ARNsg impulsado por la versión de 397 pb del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7) que contiene la secuencia espaciadora correspondiente a los sitios genómicos diana: Zm7 (SEQ ID NO:23), y un fragmento de ADN de doble cadena de extremo romo pre recocido (SEQ ID NO:115 y SEQ ID NO:116) a 1, 5, 10, 25, 50 y 100 pmol. Para la eficiencia de la transformación, se incluyeron 2,5 ug de un constructo que codifica la proteína verde fluorescente (GFP) y se determinó el número de protoplastos positivos a la GFP por cada 320.000 protoplastos de maíz. La omisión del casete de expresión de Cas9 durante la transformación de protoplastos de maíz sirvió como control negativo. Los protoplastos se recolectaron a las 24 y 48 horas después de la transfección y se analizó la inserción del fragmento de ADN de doble cadena de extremo romo en el sitio genómico diana de Zm7 mediante un análisis cuantitativo de PCR de alto rendimiento utilizando un sistema BioRad QX200™ Droplet Digital™ PCR (ddPCR™) (BioRad, Hércules, CA) y sondas Taqman®. Para determinar el porcentaje de integración objetivo, se utilizó un conjunto de cebadores Taqman (representados por la SEQ ID NO:137 y la SEQ ID NO:143) y una sonda (representada por la SEQ ID NO:138) con el sistema de ddPCR para detectar el número de copias de plantilla de una unión del fragmento de ADN de doble cadena de extremo romo insertado en el sitio diana Zm7 cromosómico. Para normalizar la cantidad de ADN en la alícuota del protoplasto transfectado, se utilizó el sistema ddPCR con un segundo conjunto de cebadores Taqman y una sonda (cebadores codificados por la SEQ ID NO:132 y SEQ ID NO:134; sonda codificada por la SEQ ID NO:133) para determinar el número de copias de la plantilla de un sitio único en el genoma del maíz y fuera del sitio diana. El cálculo de la tasa de integración de la diana fue el número de copias de la plantilla específica del lugar de la diana dividido por el número de copias de la plantilla específica del genoma del maíz dividido por la frecuencia de transformación determinada por los recuentos de células positivas a la GFP frente al total de células utilizando el sistema de imágenes PE Operetta (PerkinElmer, Waltham, Ma ). Los puntos de datos presentados en el gráfico se determinaron promediando cuatro réplicas biológicas. Los resultados se presentan en la FIG. 8 y muestran que el pico de la tasa de integración porcentual dirigida se obtuvo con 50 pmol del fragmento de ADN de doble cadena de extremo romo y una incubación de 48 horas.

Ejemplo 9 (Sólo como referencia)

Tasas de integración en función de la concentración de la endonucleasa Cas9

El sistema de protoplastos de maíz, esencialmente como se describe en el Ejemplo 8, se utilizó para establecer la concentración óptima de los constructos de expresión que codifican S. pyogenes Cas9 incluidas en la mezcla de transfección de protoplastos para lograr el mayor porcentaje de integración direccionada con los fragmentos de ADN de doble cadena de extremo romo. Para estos ensayos, el constructo de expresión que codifica la Cas9 modificada de S. pyogenes fue la descrita en el ejemplo 8. Para el ensayo, se transfectaron 320.000 protoplastos de maíz con 0,1 pmol o 0,4 pmol o 0,8 pmol o 1,6 pmol de el constructo de expresión de S. pyogenes Cas9 (SEQ ID NO:119), y 1,6 pmol del constructo de expresión de ARNsg impulsado por la versión de 397 pb del promotor U6 del cromosoma 8 del maíz (SEQ ID NO:7) que contiene la secuencia espaciadora correspondiente al sitio genómico diana Zm7 (SEQ ID NO:23), 50 pmol del fragmento de ADN de doble cadena de extremo romo pre-recocido (SEQ ID NO: 115 y SEQ ID NO: 116), y un constructo que codifica GFP. Los protoplastos de maíz se recolectaron 48 horas después de la transfección y el porcentaje de integración direccionada se evaluó como se describe en el ejemplo 8 utilizando el sistema ddPCR y las sondas Taqman. Los resultados del análisis de la titulación de el constructo de expresión de Cas9 se presentan en la FIG. 9 mostrando un incremento lineal en la tasa de integración direccionada en todo el intervalo de concentración de pmol de el constructo de expresión probada.

Ejemplo 10 (Sólo como referencia)

Confirmación de la secuencia de inserción de los fragmentos de ADN de doble cadena de extremo romo

Los amplicones de PCR correspondientes a las uniones direccionadas de los experimentos con protoplastos detallados en el Ejemplo 5 y el Ejemplo 8 se secuenciaron para confirmar la integración de los fragmentos de ADN de doble cadena de extremo romo en el sitio diana seleccionado, Zm7 o L70c.

Para el sitio Zm7 del cromosoma del maíz al que se dirigen los constructos CRISPR/Cas9 y con el fragmento de ADN de doble cadena de extremo romo formado por oligonucleótidos recocidos codificados por la SEQ ID NO:115 y SEQ ID NO:116 (véase el Ejemplo 8), los amplicones de PCR se purificaron en gel de agarosa y se secuenciaron. La secuencia esperada se presenta como SEQ ID NO:123, como se muestra en la FIG. 10A. Los resultados de la secuenciación muestran al menos un evento con una inserción perfecta de pares de bases del fragmento de ADN de doble cadena del extremo romo en el sitio diana (SEQ ID NO:124). Los resultados también muestran eventos con deleciones cortas en el cromosoma o en el lado de la inserción de ADN de la unión, como se indica con SEQ ID NO:125 (ver FIG.10A).

Para el sitio L70c del cromosoma del maíz al que se dirigen los constructos CRISPR/Cas9 y con el fragmento de ADN de doble cadena de extremo romo sin secuencias de microhomología formado por oligonucleótidos recocidos codificados por la SEQ ID NO:45 y SEQ ID NO:46 (véase el Ejemplo 5), los amplicones de PCR se purificaron en gel de agarosa y se secuenciaron. La secuencia esperada se presenta como SEQ ID NO:126, como se muestra en la FIG. 10B. Los resultados de la secuenciación muestran al menos un evento que se detectó con una inserción perfecta de pares de bases del fragmento de ADN de doble cadena del extremo romo en el sitio diana (SEQ ID NO:127). Los resultados también muestran un ejemplo de eventos con deleciones cortas en el cromosoma o en el lado del inserto de ADN de la unión, como se indica con la SEQ ID NO:128 (véase la FIG. 10B).

Para el sitio L70c del cromosoma del maíz al que se dirigen los constructos CRISPR/Cas9 y con un fragmento de ADN de doble cadena de extremo romo con secuencias de microhomología de 3 pb en cada extremo del fragmento de ADN formado por oligonucleótidos recocidos codificados por la SEQ ID NO:121 y SEQ ID NO:122 (véase el Ejemplo 5), los amplicones de PCR se purificaron en gel de agarosa y se secuenciaron. La secuencia esperada se presenta como SEQ ID NO:129, como se muestra en la FIG. 10C. Los resultados de la secuenciación muestran al menos un evento que se detectó con una inserción perfecta de pares de bases en la unión del fragmento de ADN de doble cadena del extremo romo en el sitio diana (SEQ ID NO:130). Los resultados también muestran un ejemplo de eventos con deleciones cortas en el cromosoma o en el lado del inserto de ADN de la unión (SEQ ID NO:131) y/o en el propio inserto de ADN (SEQ ID NO:130 y SEQ ID NO:131), como se indica (véase la FIG. 10C).

Estos resultados indican que los fragmentos de ADN de doble cadena de extremo romo se incorporan a una rotura de doble cadena (DSB) en un sitio diana creado por un sistema CRISPR/Cas9. Los fragmentos de ADN se incorporan mediante la unión de extremos no homólogos (NHEJ), un mecanismo de reparación del ADN propenso a errores que cura la mayoría de las roturas somáticas de doble cadena en la naturaleza. En consonancia con el mecanismo de reparación NHEJ endógeno, los resultados muestran que se incorporaron fragmentos de ADN de doble cadena de extremo romo con deleciones cortas en el DSB creado con los componentes CRISPR/Cas9, como se ilustra al comparar la SEQ ID NO:123 y la SEQ ID NO: 125 (FIG. 10A), y comparando la SEQ ID NO:126 y la SEQ ID NO:128 (FIG. 10B), y comparando la SEQ ID NO:129 y la SeQ ID n O:131 (FIG. 10C) (con este último par también hubo una deleción de 2bp interna al fragmento de ADN insertado). Se incorporaron fragmentos de ADN de doble cadena de extremo romo de manera perfecta en el DSB creado con los componentes CRISPR/Cas9, como se ilustra al comparar la SEQ ID NO:123 y la SEQ ID NO:124 (FIG. 10A), y comparando la SEQ ID NO:126 y la SEQ ID NO:127 (FIG. 10B), y comparando la s Eq ID NO:129 y la s Eq ID NO:130 (FIG, 10C) (aunque en este último par había una deleción de 2 pb interna al fragmento de ADN insertado).

Ejemplo 11 (Sólo como referencia)

Tasas de integración en función de la concentración de la endonucleasa TALEN

El sistema de protoplastos de maíz, esencialmente como se describe en el Ejemplo 8, se utilizó para establecer la concentración óptima de constructos de expresión que codifican un par de endonucleasas TALEN necesarias en la mezcla de transfección para lograr la tas de integración de direccionamiento porcentual más alta de fragmentos de ADN de doble cadena de extremo romo.

Para estos ensayos se probó un par de constructos de expresión con casetes de codificación TALEN. El sitio de orientación en el cromosoma del maíz para el par TALEN fue L70.4. Para el ensayo TALEN se utilizaron 0, 0,01, 0,02, 0,05, 0,1, 0,2 y 0,4 pmol de cada una de los constructos que contenían los casetes de codificación TALEN en la transformación de protoplastos de maíz. También se incluyeron 50 pmol de fragmento de ADN de doble cadena de extremo romo pre-recocido (SEQ ID NO:115 y SEQ ID n O:116) y 2,5 ug de el constructo que codifica la GFP. Los protoplastos de maíz se recolectaron 48 horas después de la transfección y el porcentaje de integración direccionada se evaluó mediante un análisis de PCR de alto rendimiento, esencialmente como se describe en los ejemplos anteriores. Los resultados del análisis de la titulación del constructo de expresión TALEN se presentan en la FIG. 11 mostrando que el porcentaje de integración direccionada se estabiliza en aproximadamente 0,1 pmol de cada una de los constructos de expresión TALEN incluidos en la reacción de transfección.

Ejemplo 12 (Sólo como referencia)

Integración direccionada por recombinación homóloga - CRISPR/Cas9

La modificación del genoma mediante la integración direccionada de una secuencia de ADN introducida deseada se producirá en sitios de rotura de doble cadena (DSB) en un cromosoma. La integración de la secuencia de ADN está mediada por mecanismos de unión de extremos no homólogos (NHEJ) o de recombinación homóloga que utilizan los mecanismos de reparación del ADN de la célula huésped. Los DSB en sitios específicos del genoma de la célula huésped pueden lograrse utilizando una endonucleasa como una meganucleasa de ingeniería, un TALEN de ingeniería o un sistema CRISPR/Cas9.

En la FIG. 12 se presenta una representación esquemática de un procedimiento de prueba de alto rendimiento (HTP) de NHEJ e integración direccionada mediada por HR. La integración direccionada de un fragmento de ADN por unión de extremo no homóloga (NHEJ) se presenta en la FIG. 12A y la integración direccionada de un fragmento de ADN por recombinación homóloga (HR) se presenta en la FIG. 12B. Para la RH, se introduce en la célula huésped un constructo de ADN recombinante que contiene un casete con el fragmento de ADN flanqueado por brazos de homología izquierdo y derecho (HA-Izquierdo y HA-Derecho, respectivamente). Tras la integración direccionada NHEJ o HR, el análisis HTP PCR con cebadores (indicados por el par de flechas cortas en la FIG. 12A y 12B) diseñados para detectar un evento dirigido en el que un cebador es interno al fragmento de ADN insertado y un segundo cebador está situado en la región cromosómica flanqueante.

El sistema de protoplastos de maíz descrito en los ejemplos anteriores se utilizó para determinar las tasas de integración direccionada mediada por recombinación homóloga (HR). El sitio diana Zm7 fue dirigido por una nucleasa CRISPR/Cas9 y el ARNsg para dirigir el sitio Zm7 del maíz, como se describe en el Ejemplo 8. Además de los constructos que codifican los casetes CRISPR/Cas9 y ARNsg, se incluyó un constructo que contenía un casete para la recombinación homóloga con una concentración de 4 ug o 6 ug. Como se ha descrito anteriormente, también se transfectó un constructo que codifica GFP y el porcentaje de células positivas a GFP se utilizó en el cálculo de la tasa de integración direccionada. Los controles no contenían el constructo que codifica la endonucleasa SpCas9.

Los constructos de ADN recombinante que contienen casetes para la recombinación homóloga se diseñaron para tener la secuencia de 90 pb correspondiente al fragmento de ADN de doble cadena de extremo romo de 90 pb utilizado para los ensayos de NHEJ (codificado por las secuencias SEQ ID NO:115 y SEQ ID NO:116) flanqueado por brazos de homología (HA) izquierdo y derecho. El HA-izquierdo se diseña a partir de la secuencia que flanquea el lado 5' del sitio de rotura de doble cadena (DSB) para la integración direccionada. E1 HA derecho está diseñado como la secuenciación que flanquea el lado 3' del sitio para la rotura de doble cadena (DSB) para la integración direccionada. Para el sitio Zm7, el HA izquierdo tenía una longitud de 240 pb, y se incluyeron dos secuencias separadas de HA derecho, una de 230 pb y otra de 1003 pb de longitud (véanse las FIGs. 13A y 13B, respectivamente).

Los protoplastos se transfectaron y se recolectaron 48 horas después y se analizaron para la integración mediante PCR de alto rendimiento con un cebador diseñado para la región de la secuencia del fragmento de ADN (codificado por las secuencias SEQ ID NO:115 y SEQ ID NO:116) y un cebador en la región cromosómica que flanquea el brazo de homología izquierdo. El tamaño del amplicón de PCR esperado con el éxito del RH utilizando los constructos de focalización de Zm7 (FIG. 13A y 13B) fue de 411 pb. En la PCR cuantitativa convencional (qPCR), los amplicones de más de 160 pb no pueden medirse cuantitativamente, por lo que no se recomienda su uso. El presente experimento demostró claramente que también se pueden utilizar amplicones de PCR significativamente más largos en el sistema ddPCR, lo que abre una serie de nuevas oportunidades en la biología cuantitativa.

La tasa de recombinación mediada por HR para el sitio cromosómico de maíz Zm7 se presenta en la Tabla 8 y en la FIG. 15. Cuando el HA izquierdo y el HA derecho eran de 240 pb y 230 pb, respectivamente, y el constructo con el casete de brazo de homología estaba a una concentración de 4 ug o 6 ug, no hubo una diferencia estadísticamente significativa en el porcentaje de integración entre la muestra de prueba y el control. Cuando e1HA izquierdo era de 240 pb y el HA derecho era de 1003 pb (indicado por SL en la Tabla 8), y el constructo con el casete de brazo homológico estaba a una concentración de 4 ug no había una diferencia estadísticamente significativa en el porcentaje de integración entre la muestra de prueba y el control. Por el contrario, cuando e1HA izquierdo era de 240 pb y e1HA derecho de 1003 pb (indicados por SL en la Tabla 8), y el constructo con el casete de brazo de homología estaba a una concentración de 6 ug hubo una diferencia estadísticamente significativa (p<0,05) en la tasa de integración porcentual entre la muestra de prueba y el control. Este resultado muestra que la integración direccionada puede lograrse mediante el mecanismo de RH en los sitios de DSB que son objetivo del sistema CRISPR/Cas9 en un genoma de maíz.

Tabla 8. Tasas de integración mediadas por HR en protoplastos de maíz con DSB mediado por un sistema CRISPR/Cas9 en el sitio cromosómico Zm7.

Ejemplo 13 (Sólo como referencia)

Integración direccionada por recombinación homóloga - TALEN

El sistema de protoplastos de maíz descrito en los ejemplos anteriores se utilizó para determinar las tasas de integración direccionada mediada por recombinación homóloga (HR). El sitio diana L70.4 se direccionó mediante un par de constructos de ADN recombinante que codifican un par TALEN dirigido a la diana del sitio L70.4 del maíz, como se describe en el Ejemplo 11. Además de los constructos que codifican los casetes TALEN, se incluyó un constructo que contenía un casete de recombinación homóloga a una concentración de 4 ug o de 6 ug. Como se ha descrito anteriormente, también se transfectó uun constructo que codifica GFP y el porcentaje de células positivas a GFP se utilizó en el cálculo de la tasa de integración direccionada. Los controles no contenían los constructos que codifican los TALEN.

Los constructos de ADN recombinante que contienen casetes para la recombinación homóloga se diseñaron para tener la secuencia de 90 pb correspondiente al fragmento de ADN de doble cadena de extremo romo de 90 pb utilizado para los ensayos de NHEj (codificado por las secuencias SEQ ID NO:115 y SEQ ID NO:116) flanqueado por brazos de homología (HA) izquierdo y derecho. El HA-izquierdo se diseña a partir de la secuencia que flanquea el lado 5' del sitio de rotura de doble cadena (DSB) para la integración direccionada. E1 HA derecho está diseñado como la secuenciación que flanquea el lado 3' del sitio para la rotura de doble cadena (DSB) para la integración direccionada. Para el sitio L70.4, el HA derecho tenía una longitud de 230 pb, y se incluyeron dos secuencias separadas de HA izquierdo, una de 230 pb y otra de 1,027 pb de longitud (véanse las FIGs. 14Ay 14B, respectivamente).

Los protoplastos se transfectaron y se recolectaron 48 horas más tarde y se analizó la integración mediante PCR cuantitativa de alto rendimiento utilizando el sistema ddPCR y sondas Taqman con un cebador diseñado para la región de la secuencia del fragmento de ADN (codificado por las secuencias SEQ ID NO:115y SEQ ID NO:116) y un cebador en la región cromosómica que flanquea el brazo homólogo izquierdo. El tamaño del amplicón de la PCR esperado con el éxito de la HR utilizando el constructo de orientación L70.4 de la FIG. 14A era de 383 pb. El tamaño del amplicón de la PCR esperado con el éxito de la HR utilizando el constructo de orientación L70.4 de la FIG. 14B era de 1208 pb.

La tasa de recombinación mediada por HR para el sitio cromosómico de maíz L70.4 con dos constructos de ADN plantilla separados se presenta en la Tabla 9. Cuando el HA-izquierdo y e1 HA-derecho eran ambos de 230 pb (indicados por SS en la Tabla 9), y el constructo con el casete del brazo de homología estaba a una concentración de 4 ug hubo una diferencia estadísticamente significativa (p<0,05) en el porcentaje de integración entre la muestra de prueba y el control. Cuando el HA-izquierdo y el HA-derecho tenían ambos 230 pb (indicados por SS en la Tabla 9), y el constructo con el casete del brazo de homología estaba a una concentración de 6 ug no había una diferencia estadísticamente significativa en el porcentaje de integración entre la muestra de prueba y el control. Cuando e1HA izquierdo era de 1027 pb y el HA derecho de 230 pb (indicado por LS en la Tabla 9), y el constructo con el casete de brazo de homología estaba a una concentración de 4 ug o 6 ug no había una diferencia estadísticamente significativa en el porcentaje de integración entre la muestra de prueba y el control. Este resultado muestra que la integración direccionada puede lograrse mediante el mecanismo de HR en sitios de DSB que son direccionados por TALENs dirigidos a un sitio específico en el genoma del maíz.

Tabla 9. Índices de integración mediada por HR en protoplastos de maíz con DSB mediada por TALENs en el sitio cromosómico L70.4.

Ejemplo 14 (Sólo como referencia)

Direccionamiento en el genoma del maíz con promotores U6 quiméricos

Se determinó que los promotores U6 quiméricos eran eficaces para impulsar la expresión de los constructos de ARNsg y dar lugar a la integración direccionada de fragmentos de ADN de doble cadena de extremo romo en sitios preseleccionados en los cromosomas del maíz. Estos experimentos se llevaron a cabo utilizando el ensayo de corte cuantitativo de cromosomas en protoplastos de maíz, como se describe en el ejemplo 5 y en el ejemplo 6. Los promotores U6 incorporados en los constructos de ARNsg fueron: a) el promotor U6 de 397 pb del cromosoma 8 del maíz codificado por la SEQ ID NO:7, b) el promotor U6 quimérico ch1:ch8 de 397 pb codificado por la SEQ ID NO:18, b) el promotor U6 quimérico de 397 pb ch8:ch1 codificado por la SEQ ID NO:19, y c) el promotor U6 quimérico de 397 pb ch8:ch2:ch1:ch8 codificado por la SEQ ID NO:20. Los sitios diana cromosómicos del maíz fueron L70a, L70c y L70d, como se describe en el ejemplo 5. El sistema CRISPR/Cas9 empleó un casete de expresión con el Cas9 de S. pyogenes modificado para contener dos secuencias NLS y un intrón y codificado por la SEQ ID NO:119. El fragmento de ADN de doble cadena de extremo romo estaba codificado por la SeQ ID NO:115 y SEQ ID NO:116.

En un ensayo, 48 horas después de la transfección de los protoplastos de maíz con los componentes del sistema CRISPR/Cas9, el ensayo cuantitativo se realizó con sondas TaqMan. Los resultados (véase la FIG. 16A) indican que la tasa de integración en el sitio diana L70a con el constructo de ARNsg que contiene el promotor ch8 U6 o el constructo de ARNsg que contiene el promotor quimérico chl:ch8 U6 dio lugar a una tasa de integración equivalente. La tasa de integración en el sitio diana L70c, el constructo de ARNsg que contiene el promotor quimérico ch8:chl U6 dio lugar a cerca del doble de la tasa de integración objetivo en comparación con el constructo de ARNsg que contiene el promotor ch8 U6. La tasa de integración direccionada en el sitio diana L70d, el constructo de ARNsg que contiene el promotor ch8 U6 tuvo una tasa de integración direccionada más alta en comparación con el constructo de ARNsg que contiene el promotor quimérico ch8:ch2:ch1:ch8 U6.

En otro ensayo, 48 horas después de la transfección de los protoplastos de maíz con los componentes del sistema CRISPR/Cas9, se realizó el ensayo cuantitativo con el colorante intercalante EvaGreen® (BioRad, Hercules, CA). Los resultados (véase la FIG. 16B) indican que la tasa de integración direccionada con el constructo de ARNsg que contiene el promotor ch8 U6 fue casi la misma que la tasa de integración direccionada en el sitio diana L70a con el constructo de ARNsg que contiene el promotor quimérico ch1:ch8 U6, y en el sitio diana L70c con el constructo de ARNsg que contiene el promotor quimérico ch8:ch1 U6, y en el sitio diana L70d con el constructo de ARNsg que contiene el promotor quimérico ch8:ch2:ch1:ch8 U6. Estos datos indican que la tasa de integración direccionada detectada por el colorante intercalado EvaGreen fue aproximadamente diez veces mayor en comparación con las tasas de integración dirigidas detectadas utilizando sondas MGB TaqMan. Esta discrepancia se debe principalmente a las diferencias en la química de los ensayos. El ensayo TaqMan utiliza sólo dos cebadores y una sonda interna, de los cuales uno de los cebadores y la sonda se encuentran en la secuencia del fragmento de ADN insertado. Lamentablemente, el fragmento de ADN de doble cadena de extremo romo utilizado en la transfección suele sufrir la degradación de las exonucleasas endógenas en los protoplastos, lo que da lugar a integraciones de fragmentos de ADN con sitios truncados donde se une la sonda TaqMan. Estos eventos de integración truncados no son detectables por el ensayo TaqMan. Por otro lado, el sitio de unión para el cebador TaqMan situado dentro de la secuencia del fragmento de ADN insertado está localizado más internamente en el fragmento de ADN insertado y permanece intacto incluso en la mayoría de los fragmentos de ADN insertados truncados. Dado que el ensayo con el colorante intercalado Evagreen no requiere la sonda interna, y sólo los cebadores TaqMan, este ensayo no se ve afectado por las degradaciones de oligo y, por tanto, puede detectar muchas más integraciones que el ensayo TaqMan. Por lo demás, los dos procedimientos de medición del porcentaje de integración direccionada mostraron patrones similares en los tres sitios cromosómicos de destino y en los tres promotores U6 quiméricos diferentes que impulsan la expresión del ARNsg.

Estos resultados muestran que la tasa de integración direccionada en el sitio cromosómico de maíz L70c cuando el constructo de ARNsg contiene el promotor quimérico Ch8::Ch1 fue de ligera a significativamente mayor en comparación con la tasa de integración direccionada cuando el constructo de ARNsg contiene el promotor U6 ch8 (FIGs. 16Ay 16B). Estos resultados también muestran que la tasa de integración direccionada en el sitio cromosómico de maíz L70a cuando el constructo de ARNsg contiene el promotor quimérico Ch1::Ch8 es aproximadamente equivalente en comparación con la tasa de integración direccionada cuando el constructo de ARNsg contiene el promotor U6 ch8 (FIGs. 16A y 16B). Por último, estos resultados muestran que la tasa de integración direccionada en el sitio cromosómico L70d cuando el constructo de ARNsg contiene el promotor quimérico ch8:ch2:ch1:ch8 fue menor en comparación con la tasa de integración direccionada cuando el constructo de ARNsg contiene el promotor ch8 U6 (FIGs. 16A y 16B). En conclusión, al menos dos de los tres promotores quiméricos eran tan buenos o mejores que el mejor promotor no quimérico del maíz. Estos tendrán utilidad en los experimentos de direccionamiento múltiple, donde la diversidad de elementos de expresión es indispensable.

Ejemplo 15 (Sólo como referencia)

Mutación direccionada al inhibidor de la invertasa del tomate

El sistema CRISPR/Cas9 se utilizó para eliminar el gen inhibidor de la invertasa apoplástica del tomate (INVINH1) mediante la introducción de mutaciones puntuales de cambio de marco direccionadas tras la reparación imperfecta de las roturas de doble cadena direccionadas por NHEJ. En un estudio anterior, la eliminación de este gen mediante ARNi mostró un elevado contenido de azúcar en el fruto y un mayor peso de las semillas (Jin et al. Plant Cell 21:2072-2089, 2009). La reducción o eliminación de la actividad inhibidora de la invertasa mediante mutagénesis direccionada o interferencia de ARN es útil para mejorar el rendimiento y/o los rasgos de calidad también en otras especies de cultivos (Braun et al. J Exp Bot65: 1713-1735, 2014).

Para estos experimentos, se transfectaron protoplastos de tomate con un constructo de expresión que contenía un casete que codificaba el SpCas9 con un NLS en el Terminal C (SEQ ID NO:28), y un constructo de expresión que codificaba un casete de ARNsg en el que la expresión estaba impulsada por uno de los 4 promotores U6 de tomate: el promotor 1 codificado por la SEQ ID NO:146 (que es un fragmento de la SEQ ID NO:10), el promotor 2 codificado por la SEQ ID NO:147 (que es un fragmento de la SEQ ID NO:11), el promotor 3 codificado por la SEQ ID NO:148 (que es un fragmento de la SEQ ID NO:9), o el promotor 4 codificado por la SEQ ID n O:149. Los ARNsg se direccionaron a un sitio inhibidor de la invertasa (sitio 1) sin un sitio SmlI o a un sitio (etiquetado como sitio 2) en el gen inhibidor de la invertasa con un sitio de endonucleasa de restricción SmlI. El ARNsg del sitio 2 está codificado por la SEQ ID NO:150. El sitio de escisión CRISPR/Cas9 dentro del sitio diana 2 contiene un sitio de endonucleasa de restricción SmlI. Tras la rotura de doble cadena inducida por CRISPR/Cas9 en el sitio diana 2, la reparación NHEJ dará lugar a indels en este sitio, eliminando así el sitio de la endonucleasa de restricción SmlI. Esta mutación del sitio SmlI se aprovechó durante el cribado de eventos direccionados amplificando un amplicón de 380 pb (SEQ ID NO:159) y sometiendo el amplicón de PCR a la digestión con SmlI. Si el sitio SmlI no estuviera mutado, el amplicón se digeriría en dos fragmentos de 181 pb y 199 pb. Si el sitio SmlI estuviera mutado, el amplicón de la PCR no sería digerido. Este esquema de PCR se ilustra en la FIG. 17A.

Se transfectaron protoplastos de tomate con el sistema CRISPR/Cas9 direccionado el inhibidor de la invertasa del tomate y se recolectaron 48 horas después y se extrajo el ADN genómico. El control negativo para el sistema CRISPR/Cas9 fue la omisión del constructo de expresión que codifica la endonucleasa Cas9. Un control negativo para el sitio diana fue el uso de un ARNsg para el sitio 1, y no se espera que el sitio SmlI sea mutado con este ARNsg. La amplificación por PCR se realizó con los cebadores SEQ ID NO:157 y SEQ ID NO:158 y los amplicones de PCR resultantes fueron sin digerir o digeridos con SmlI. Las reacciones se realizaron en geles de agarosa y los resultados se muestran en la FIG. 17B. Los controles negativos de ARNsg al sitio diana 1 y la omisión de la endonucleasa Cas9 sólo dieron lugar a amplicones de PCR con el sitio SmlI intacto. Cuando el ARNsg era para el sitio diana 2, el sitio SmlI estaba mutado cuando el casete de ARNsg contenía el promotor U6 de tomate 1, o el promotor U6 de tomate 2, o el promotor U6 de tomate 3, tal y como evidencian los amplicones de PCR de longitud completa (véase la FIG. 17B, flechas que muestran amplicones sin un sitio SmlI). El constructo de ARNsg dirigida al sitio 2 y con el promotor U64 aparentemente no mostró el direccionamiento.

Para confirmar que los amplicones de PCR sin un sitio SmlI se debían efectivamente a la mutación NHEJ inducida por CRISPR/Cas9, estos amplicones aparentemente mutados se purificaron en gel y se agruparon, y luego se secuenciaron. La alineación de la secuencia múltiple en la FIG. 17C muestra que estos amplicones de PCR sin sitio SmlI eran del sitio diana 2 del inhibidor de la invertasa del tomate y contenían indels, consistentes con la mutación inducida por CRISPR/Cas9. En concreto, en el alineamiento de la secuencia múltiple, la SEQ ID NO:151 representa una región del amplicón de la PCR (SEQ ID NO:159) sin una mutación. Los SEQ ID NOs:152 y 153 ilustran indels donde hubo una inserción de 1 bp en el sitio de escisión. La SEQ ID NO:154 ilustra un indel con una deleción de 3 pb en el sitio de escisión. La SEQ ID NO:155 ilustra un indel con una deleción de 4 pb en el sitio de escisión. La SEQ ID NO:156 ilustra un indel con una deleción de 6 pb en el sitio de escisión. En conclusión, estos resultados indican que el sistema CRISPR/Cas9 que utiliza el promotor U6 del tomate 1 (SEQ ID NO:146), o el promotor U6 del tomate 2 (SEQ ID NO:147), o el promotor U6 del tomate 3 (SEQ ID NO:148) para impulsar el ARNsg induce la mutación en el sitio diana del gen inhibidor de la invertasa del tomate 2.

Ejemplo 16

Promotores para impulsar la expresión del ARNsg

Para identificar y seleccionar promotores adicionales que serían útiles para impulsar la expresión de ARNsgs a partir de casetes de expresión introducidos en dicotiledóneas y monocotiledóneas, los promotores de la ARN polimerasa II (Pol II) y la ARN polimerasa III (Pol III) (SEQ ID NOs: 160-201 y SEQ ID NOs:247 - 283) se identificaron comparando la secuencia que codifica el ARN nuclear pequeño (ARNsn) U6, U3, U5, U2 y 7SL con los genomas de la soja y el maíz utilizando BLAST (ver Tabla 10). A partir de las regiones de este alineamiento bioinformático, se utilizaron 200 o más nucleótidos inmediatamente corriente arriba del extremo 5' de la región codificador del respectivo ARNsn para probarlos como promotores putativos para impulsar la expresión del ARNsg a partir de casetes de expresión introducidos en las células vegetales.

Tabla 10. SEQ ID NO de la secuencia promotora putativa corriente arriba de los genes ARNsn y la fuente (tomate o soja o maíz).

continuación

continuación

Ejemplo 17

Ensayo de nivel de transcripción de ARN normalizado

Para evaluar la eficacia de los promotores enumerados en la Tabla 10 para impulsar la expresión de ARNsg, se generó una serie de constructos que contenían un casete que codificaba uno de los promotores putativos (SEQ ID NO:154, y SEQ ID NOs:160 - 201) enlazado de forma operativa a un fragmento de 221 pb de un marco de lectura abierto de beta-glucuronidasa (GUS) y a un terminador poli(T)7 para los promotores Pol III (7SL, U6 y U3) o a la secuencia 5'-ACAATTCAAAAGTTTTAT-3' (SEQ ID NO:237) para los promotores Pol II U2 y U5 (Tabla 10). Los constructos recombinantes (0,5 pmol) que contienen las fusiones del fragmento promotor-GUS se transfectaron en protoplastos de cotiledones de soja (Se Q ID NO:202-217) o en protoplastos de hojas de maíz (SEQ ID NO: 218-236) junto con 300 ng de un plásmido que sirve de control de transformación que codifica la Renilla Luciferase (RLUC) expresada mediante el promotor CaMV. Los protoplastos transfectados se recolectaron 18 horas después de latransfección y los niveles de ARN se midieron mediante ensayos TaqMan utilizando una sonda y cebadores complementarios al fragmento GUS. Los controles internos utilizados para normalizar el ensayo TaqMan incluyeron (1) un par de cebadores/sonda 18S para controlar la concentración de ARN y (2) la luminiscencia RLUc como control de transformación.

En protoplastos de cotiledones de soja, todos los promotores probados dieron lugar a niveles normalizados de ARNm de GUS significativamente más altos que el control (sin constructo de GUS) (prueba t de Student ANOVA de una vía, valor p<0,05) (FIG. 18A). El nivel más bajo de ARNm GUS normalizado fue con el constructo (SEQ ID NO:210) que contiene el promotor U3a (SEQ ID NO:167). El nivel más alto de ARNm GUS normalizado fue con el constructo (SEQ ID NO:210) que contiene el promotor 7SL_CR10 (SEQ ID NO:174). El nivel de ARNm de GUS normalizado con todos los promotores examinados con este ensayo osciló entre 11 y 31 veces los niveles de expresión que el control negativo sin ADN. Ninguna clase de promotores (U6, U3 o 7SL) funcionó mejor que la otra, aunque los promotores U3 se encontraban en general en el intervalo inferior de expresión observado en el experimento. Los promotores U3 han sido utilizados con éxito por Liang et al. (J. Genetics and Genomics 41:63-68, 2014) para impulsar ARNsgs en el maíz. Así, aunque estos datos indican que los promotores U3 pueden ser inferiores a los U6 o 7SL, siguen siendo candidatos viables para impulsar la expresión de ARNsg en la soja. Estos datos sugieren que cualquiera de los promotores U6, U3 o 7SL identificados aquí serían buenos candidatos para hacer constructos de expresión recombinante para dirigir la expresión de ARNsg en células vegetales. En los protoplastos de hojas de maíz, todos los promotores ensayados dieron lugar a niveles normalizados de ARNm de GUS significativamente más elevados en comparación con el control (prueba t de Student ANOVA de una vía, valor p<0,05), con valores que oscilan entre 26 y 141 veces más de expresión que el control negativo (FIG. 18B). El constructo del promotor U6Chr08 (SEQ ID n O:235) dio lugar a los niveles normalizados más altos de expresión de ARNm GUS, y el constructo del promotor U2ARNsn_I (SEQ ID NO:227) dio lugar a los más bajos, con una diferencia de aproximadamente 5,5 veces en los niveles normalizados de expresión de ARNm GUS entre ellos. El constructo promotora U2ARNsn_P (SEQ ID NO:226) también destacó por tener altos niveles normalizados de expresión de ARNm de GUS. Todos los promotores restantes se encontraban dentro del mismo intervalo relativo, con menos de 2 veces de diferencia entre ellos (FIG. 18B). Estos datos sugieren que cualquiera de los promotores U6, U3, 7S1, U2 o U5, identificados aquí, serían buenos candidatos para hacer constructos de expresión recombinante para impulsar la expresión del ARNsg en las células vegetales.

Ejemplo 18

Ensayo de expresión de GUS para la expresión de ARNsg

Para determinar cómo la diferencia en los niveles de expresión del ARNsg impacta en la actividad de Cas9, se utilizó un ensayo que se basó en la activación de la transcripción desde un promotor mínimo corriente arriba del marco de lectura abierto de GUS en un constructo informador transfectado en protoplastos de hojas de maíz. Para este ensayo, se mutó una nucleasa Cas9 de S. thermophilus en las posiciones de aminoácidos D9A y H599A de la secuencia nativa de la proteína, creando así una Cas9 sin actividad endonucleasa de escisión (también denominada "Cas9 muerta"). Además, esta Cas9 muerta se modificó para codificar un dominio NLS (SEQ ID NO:120) en las posiciones de aminoácidos 2-11 de la SEQ ID NO:239 y un dominio de activación de una proteína TALE en las posiciones de aminoácidos 1135 - 1471 de la SEQ ID n O:239. La secuencia polinucleotídica de la Cas9 muerta, representada por la SEQ ID NO:238, incluía un intrón en las posiciones 507 - 695. Se construyó un constructo informador en el que el gen informador uidA (GUS) fue impulsado por un promotor CaMV mínimo con tres sitios de unión de ARNsg adyacentes (SEQ ID No :240) en las posiciones nucleotídicas 80-98, 117-135 y 154-172 de la secuencia SEQ ID n O:246. También se construyó un conjunto de ARNsg (basado en el ARNsg de Cong et al. 2013 Science 339:819) que consistían en uno de los promotores de cada clase de genes ARNsn, a saber, U6, 7SL, U2, U5 y U3 (Tabla 11) y que dirigirían el Cas9-TALE-AD muerto a uno o más de los sitios de unión del ARNsg del constructo informador de GUS. Los promotores U6 y 7SL normalmente inician la transcripción en una G, y los promotores U2, U5 y U3 normalmente inician la transcripción en una A. Para asegurar el correcto inicio de la transcripción del ARNsg, para los constructos con un promotor U6 o 7SL, se insertó una G entre el promotor y la secuencia espaciadora. Para los constructos con un promotor U2, U5 o U3, se insertó una A entre el promotor y la secuencia espaciadora. Cuando el complejo Cas9-TALE-AD y ARNsg muerto se une al constructo informador GUS, el dominio de activación TALE funciona como un factor de transcripción que activa el promotor mínimo CaMV, lo que da lugar a una mayor expresión del transcrito GUS y, en última instancia, a mayores niveles de expresión de la proteína GUS.

Tabla 11. SEQ ID NO correspondiente a los constructos de expresión de ARNsg.

Para el ensayo, se transfectaron protoplastos de hojas de maíz con 0,8 pmol del casete de expresión de Cas9-TALE-AD muerto, 0,5 pmol del casete de expresión de GUS, 1,6 pmol de uno de los casetes de expresión de ARNsg, 650 ng del casete de expresión de luciferasa y 300 ng del casete de expresión de Renilla Luciferase (RLUC). Los protoplastos transfectados se recolectaron 18 horas después y se midió la actividad GUS utilizando el ensayo fluorimétrico de 4-metilumbeliferil-beta-D-glucurónido (MUG, Sigma, St. Louis, MO), y se midió la actividad de la luciferasa y la RLUC y se utilizó como control para normalizar en relación con los controles de transfección. La actividad de GUS es una lectura de la frecuencia con la que el Cas9-TALE-AD muerto se une al plásmido informador. Cada clase de promotor de ARNsn que impulsa el ARNsg dio una mayor actividad GUS normalizada en comparación con el control (FIG. 19). El U3CR08b (U3_8B en la FIG. 19) dio lugar a la mayor actividad GUS normalizada, aproximadamente 10 veces más que el control. Los dos promotores 7SLCR07 y U6Chr08 dieron aproximadamente la misma actividad GUS normalizada de aproximadamente 4X sobre el control. Los dos promotores U2ARNsn_I (Us_I en la FIG. 19) y U5ARNsn_E (U5_e en la FIG. 19) estaban cada uno en o ligeramente por encima de 2X sobre el control para la actividad GUS normalizada. Estos resultados indican que los promotores ARNsn 7SL, U6, U3, U2 y U5 pueden ser de buenos a excelentes candidatos para su uso en constructos de expresión de ARNsg para el sistema CRISPR/Cas9 útiles en la modificación del genoma.

Las diferencias en la expresión normalizada de GUS observadas mediante el ensayo de Cas9-TALE-AD muerto no reflejan los niveles normalizados de ARNm de GUS mostrados en el ensayo de protoplastos de hojas de maíz detallado en el Ejemplo 17.

Claims

REIVINDICACIONES

1. Un constructo de ADN recombinante que comprende un promotor de ARNsn U6 unido operativamente a una secuencia que codifica un ARN de guía única (ARNsg), en el que la secuencia de dicho promotor de ARNsn U6 comprende la SEQ ID NO:200; o un fragmento de la misma, en la que el fragmento tiene al menos 140 pb de longitud y mantiene la actividad del promotor.

2. El constructo de ADN recombinante de la reivindicación 1, que comprende además una secuencia que codifica un promotor operativamente unido a una secuencia que codifica un producto génico de la endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR).

3. Un constructo de ADN recombinante que comprende un promotor de ARNsn U6 unido operativamente a una secuencia que especifica un ARN no codificador, en la que la secuencia de dicho promotor de ARNsn comprende la SEQ ID NO:200, o un fragmento de la misma, en la que el fragmento tiene al menos 140 pb de longitud y mantiene la actividad del promotor.

4. El constructo de ADN recombinante de la reivindicación 3, en el que el ARN no codificador se selecciona del grupo que consiste en: un microARN (miARN), un precursor de miARN, un ARN de interferencia pequeño (ARNip), un a Rn pequeño (22-26 nt de longitud) y el precursor que lo codifica, un ARNip heterocromático (hc-ARNip) un ARN que interactúa con Piwi (piARN), un ARN de doble cadena con horquilla (hairpin ARNbc), un ARNip de acción trans (ta-ARNip) y un ARNip antisentido de origen natural (nat-ARNip).

5. Una célula que comprende el constructo de ADN recombinante de la reivindicación 1.

6. Un procedimiento para introducir una rotura de doble cadena en el genoma de una célula, que comprende introducir en dicha célula

a) al menos un constructo de ADN recombinante de la reivindicación 1; y

b) un segundo constructo de ADN recombinante que comprende una secuencia que codifica un promotor unido operativamente a una secuencia que codifica un producto génico de la endonucleasa Cas asociada a repeticiones palindrómicas cortas agrupadas interespaciadas con regularidad (CRISPR) unido operativamente a una secuencia de localización nuclear (NLS).

7. Un procedimiento para introducir una rotura de doble cadena en el genoma de una célula, que comprende introducir en dicha célula al menos un constructo de ADN recombinante de la reivindicación 2.

8. Un procedimiento de modificación del genoma que comprende:

a) introducir una rotura de doble cadena en un sitio seleccionado del genoma de una célula vegetal mediante el procedimiento según la reivindicación 6 o la reivindicación 7, y

b) introducir en dicha célula vegetal un fragmento de ADN de doble cadena recombinante de extremo romo, en el que dicho fragmento de ADN de doble cadena recombinante de extremo romo se incorpora a dicha rotura de doble cadena mediante la reparación endógena del ADN.

9. El procedimiento de la reivindicación 8, en el que la modificación del genoma comprende un bloque de enlace modificado, la vinculación de dos o más QTL, la interrupción del enlace de dos o más QTL, la inserción de genes, la sustitución de genes, la conversión de genes, la supresión o la interrupción de un gen, la selección de eventos transgénicos, la selección de donantes de rasgos transgénicos, la sustitución de transgenes o la inserción direccionada de al menos un ácido nucleico de interés.

10. El procedimiento de la reivindicación 8, en el que la rotura de doble cadena es introducida por una endonucleasa.

11. El procedimiento de la reivindicación 8, en el que el fragmento de ADN de doble cadena recombinante de extremo romo no comprende una región de homología con el sitio seleccionado en el genoma.

12. El procedimiento de la reivindicación 8, en el que se introduce en dicha célula vegetal entre 0,03 y 0,3 fmol aproximadamente de fragmento de ADN de doble cadena recombinante de extremo romo.

13. Un constructo de ADN recombinante que comprende:

a) un primer promotor de ARNsn U6 unido operativamente a una secuencia que codifica un ARN no codificador, en el que la secuencia de dicho promotor de ARNsn U6 comprende la SEQ ID NO:200; o un fragmento de la misma, en la que el fragmento tiene al menos 140 pb de longitud y mantiene la actividad del promotor, y b) un segundo promotor de ARNsn U6 unido operativamente a una secuencia que codifica un ARN no codificador, en el que el primer promotor de ARNsn U6 y el segundo promotor de ARNsn U6 son diferentes.