ES2965134T3

ES2965134T3 - Ratones que contienen mutaciones que resultan en la expresión de fibrilina-1 truncada en C

Info

Publication number: ES2965134T3
Application number: ES17754528T
Authority: ES
Inventors: Charleen Hunt; Jason Mastaitis; Guochun Gong; Ka-Man Venus Lai; Jesper Gromada; Aris Economides
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2016-07-29
Filing date: 2017-07-28
Publication date: 2024-04-11
Anticipated expiration: 2037-07-28
Also published as: WO2018023014A1; CN109803530A; US11730150B2; EP3490373B1; EP3490373A1; IL264434A; US20200107527A1; CA3031206A1; JP2019523009A; EP3490373C0; RU2721125C1; US20180027782A1; AU2017302657A1; SG11201901305YA; MX2019001211A; BR112019001783A2; KR20190041476A; US10548302B2

Abstract

Se proporcionan animales no humanos que comprenden una mutación en el gen Fbnl para modelar el síndrome progeroide neonatal con lipodistrofia congénita (NPSCL). También se proporcionan métodos para fabricar dichos modelos animales no humanos. Los modelos animales no humanos se pueden usar para detectar compuestos en busca de actividad para inhibir o reducir NPSCL o mejorar síntomas similares a NPSCL o para detectar compuestos en busca de actividad potencialmente dañina para promover o exacerbar NPSCL, así como para proporcionar información sobre el mecanismo de NPSCL y dianas terapéuticas y diagnósticas potencialmente nuevas. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Ratones que contienen mutaciones que resultan en la expresión de fibrilina-1 truncada en C

Esta solicitud reivindica la prioridad de Solicitud de EE. UU. NO. 62/368,924, presentada el 29 de julio de 2016.

Antecedentes

Se han identificado clínicamente más de 3000 mutaciones en el gen de Fibrilina-1 (FBN1) en humanos. Estas mutaciones se han asociado con una variedad de afecciones, que incluyen fibrilinopatías tipo I, síndrome de Marfan, síndrome de MASS, síndrome de ectopia del cristalino aislada, aneurismas de la aorta torácica, síndrome de Weill-Marchesani, displasia geleofísica y acromítrica, síndrome de piel rígida y síndrome progeroide neonatal con lipodistrofia congénita (NPSCL). Los mamíferos transgénicos no humanos actualmente disponibles, modificados genéticamente para tener mutaciones de FBN1 no reflejan adecuadamente los síntomas del NPSCL.

Takenouchi Toshiki et al. (2013) American Journal of Medical Genetics,, páginas 721-724 describen una lipodistrofia congénita severa y una apariencia progeroide: Mutación en el penúltimo exón del FBN1 que provoca un fenotipo reconocible.

Graul-Neumann et al. (2010) doi:10.1002/ajmg.a.33690 describen el síndrome de Marfan con lipodistrofia neonatal similar al síndrome progeroide asociada con una nueva mutación del desplazamiento del marco de lectura en el extremo 3' del gen Fbn1.

El documento WO 2015/084625 describe métodos y composiciones que se relacionan con aumentar o disminuir el peso mediante al disminuir la masa adiposa en individuos que lo necesitan. Estos métodos y composiciones se refieren a proporcionar una cantidad eficaz de la hormona asprosina para aumentar la masa adiposa en un individuo con masa adiposa insuficiente, y a proporcionar un anticuerpo o inhibidor de asprosina en un individuo con obesidad o diabetes para reducir la masa adiposa.

Resumen

El alcance de la invención reivindicada se define por las reivindicaciones.

En un primer aspecto de la invención, se proporciona un ratón cuyo genoma comprende un gen de fibrilina-1 (Fbn1) endógeno que comprende una mutación en el penúltimo exón del gen Fbn1 endógeno, en el que el ratón es heterocigoto para la mutación, en el que la mutación da como resultado la interrupción o ablación del producto de escisión de terminal C de asprosina de profibrilina-1, en el que la expresión del gen Fbn1 endógeno da como resultado una proteína Fbn1 truncada en el extremo de terminal C, y en el que el ratón exhibe uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del tejido adiposo blanco normalizado por el peso corporal, disminución del tejido adiposo blanco en combinación con preservación del tejido adiposo marrón normalizado por el peso corporal, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis, y en el que la disminución o el aumento se compara con un ratón de tipo silvestre de control.

Se proporcionan métodos y composiciones para modelar el síndrome progeroide neonatal con lipodistrofia congénita. En un aspecto, la divulgación proporciona un mamífero no humano cuyo genoma comprende un gen de fibrilina-1 (Fbn1) que comprende una mutación, mediante la cual la expresión del gen da como resultado una proteína Fbn1 truncada en el extremo de terminal C que dispone al mamífero no humano a desarrollar uno o más síntomas similares a la lipodistrofia congénita del síndrome progeroide neonatal. Opcionalmente, el mamífero no humano es heterocigoto para la mutación. Opcionalmente, el gen Fbn1 incluye un promotor de Fbn1 endógeno del mamífero no humano. Opcionalmente, la mutación es una mutación por desplazamiento del marco de lectura.

En algunos ratones, la mutación da como resultado un codón de terminación prematura. Opcionalmente, el codón de terminación prematura está en el penúltimo o último exón del gen Fbn1. Opcionalmente, el codón de terminación prematura está en el exón final o está a menos de aproximadamente 55 pares de bases en dirección ascendente de la última unión exón-exón en el gen Fbn1. Opcionalmente, el codón de terminación prematura está a menos de aproximadamente 55 pares de bases en dirección ascendente de la última unión exón-exón en el gen Fbn1. Opcionalmente, el codón de terminación prematura está en el exón final o está a menos de aproximadamente 20 pares de bases en dirección ascendente de la última unión exón-exón en el gen Fbn1. Opcionalmente, la mutación es una mutación en el sitio de empalme que da como resultado que se omita el penúltimo exón. Opcionalmente, la mutación da como resultado un codón de terminación prematura en el último exón codificante.

En algunos ratones, la mutación interrumpe una secuencia de reconocimiento de aminoácidos básicos para las proproteínas convertasas de la familia de las furinas. En algunos mamíferos no humanos, la mutación resulta en la ablación del producto de escisión del terminal C de la asprosina de la profibrilina-1. En algunos ratones, la mutación resulta en la interrupción del producto de escisión del terminal C de asprosina de la profibrilina-1. En algunos ratones, el codón de terminación prematura da como resultado que la proteína codificada tenga un terminal C cargado positivamente.

En algunos ratones, la proteína codificada (es decir, la proteína Fbn1 truncada en el extremo de terminal C) se trunca en una posición correspondiente a una posición entre los aminoácidos 2700 y 2790, entre los aminoácidos 2710 y 2780, entre los aminoácidos 2720 y 2770, entre los aminoácidos 2720 y 2770, entre los aminoácidos 2730 y 2760, o entre los aminoácidos 2737 y 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737, al aminoácido 2738 o al aminoácido 2755 en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30.

En algunos ratones, la proteína codificada (es decir, la proteína Fbn1 truncada en el extremo de terminal C) tiene un terminal C que consiste en la secuencia establecida en la SEQ ID NO: 8, 42 o 43. En algunos ratones, la proteína codificada tiene un terminal C que consiste en la secuencia establecida en la SEQ ID NO: 8, 42, 43, 45, 46 o 47. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 43. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 43 o 46. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2738 en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 8. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2738 en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 8 o 45. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2755 en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 42. Opcionalmente, la proteína codificada se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2755 en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 42 o 47.

En el ratón de la invención, el gen Fbn1 comprende una mutación en el penúltimo exón. Opcionalmente, el penúltimo exón del gen Fbn1 comprende mutaciones correspondientes a las mutaciones en la SEQ ID NO: 26, 27 o 28 en relación con la secuencia de penúltimos exones del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 25 cuando el penúltimo exón está alineado óptimamente con la SEQ ID NO: 26, 27 o 28.

En algunos ratones, la proteína codificada por el gen Fbn1 mutado consiste en la secuencia establecida en la SEQ ID NO: 31, 32 o 33. En ratones, la mutación comprende una inserción o supresión en el exón 64 del gen Fbn1 de ratón endógeno que provoca un desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 3' del exón 64 o en el extremo 5' del exón 65. Opcionalmente, la mutación comprende una inserción en el exón 64 que provoca un desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 5' del exón 65. Opcionalmente, la inserción está entre las posiciones correspondientes a las posiciones 8179 y 8180 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8241 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20. Opcionalmente, la mutación comprende una inserción o supresión en el exón 64 que provoca un desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 3' del exón 64. Opcionalmente, la mutación comprende una inserción entre las posiciones correspondientes a las posiciones 8209 y 8210 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8214 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20. Opcionalmente, la mutación comprende una supresión que comienza en una posición correspondiente a la posición 8161 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8214 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20. Opcionalmente, la proteína Fbn1 truncada en el extremo de terminal C tiene un terminal C cargado positivamente.

En los ratones de la invención, los síntomas comprenden uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis. En algunos ratones, los síntomas comprenden uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del tejido adiposo blanco normalizado por el peso corporal, disminución del tejido adiposo blanco en combinación con tejido adiposo marrón conservado normalizado por el peso corporal, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis. Opcionalmente, el ratón tiene uno o más de los siguientes: tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Opcionalmente, el mamífero no humano tiene uno o más de los siguientes: aumento en la tasa metabólica, sensibilidad mejorada a la insulina, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Opcionalmente, los síntomas comprenden al menos uno de disminución de la masa grasa y disminución del porcentaje de grasa corporal y al menos uno de tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Opcionalmente, los síntomas comprenden disminución de la masa grasa, disminución del porcentaje de grasa corporal, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Opcionalmente, los síntomas comprenden disminución del tejido adiposo blanco normalizado por el peso corporal y al menos uno de sensibilidad mejorada a la insulina, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Opcionalmente, los síntomas comprenden una disminución del tejido adiposo blanco normalizado por el peso corporal y una sensibilidad a la insulina mejorada.

En otro aspecto, la divulgación proporciona un método para producir cualquiera de los ratones descritos en el presente documento, que comprende: (a) poner en contacto el genoma de una célula pluripotente de ratón que no es un embrión en estadio unicelular con: (i) una proteína Cas9; y (ii) un primer ARN guía que se hibrida con una primera secuencia de reconocimiento de ARN guía dentro de un locus genómico diana en el gen Fbn1, en el que el gen Fbn1 se modifica para comprender la mutación que da como resultado un truncamiento de terminal C de la proteína codificada; (b) introducir la célula pluripotente de ratón modificada en un embrión huésped; y (c) implantar el embrión huésped en una madre sustituta para producir un ratón de generación F0 genéticamente modificado en el que el gen Fbn1 se modifica para comprender la mutación que da como resultado un truncamiento de terminal C de la proteína codificada, en la que la mutación produce síntomas similares a la lipodistrofia congénita en el ratón de la generación F0. Opcionalmente, la célula pluripotente es una célula madre embrionaria (ES).

En algunos métodos, la etapa (a) comprende además poner en contacto el genoma de la célula pluripotente de mamífero no humano con un segundo ARN guía que se hibrida con una segunda secuencia de reconocimiento de ARN guía dentro del locus genómico diana en el gen Fbn1. En algunos métodos, el método comprende además seleccionar una célula pluripotente de ratón modificada después de la etapa (a) y antes de la etapa (b), en la que la célula pluripotente de ratón modificada es heterocigota para la mutación que da como resultado un truncamiento de terminal C de la proteína codificada.

En algunos métodos, la etapa de poner en contacto (a) comprende además poner en contacto el genoma con una plantilla de reparación exógena que comprende un brazo de homología 5' que se hibrida con una secuencia diana 5' en el locus genómico diana y un brazo de homología 3' que se hibrida con una secuencia diana 3' en el locus genómico diana. Opcionalmente, la plantilla de reparación exógena comprende además un inserto de ácido nucleico flanqueado por el brazo de homología 5' y el brazo de homología 3'. Opcionalmente, el inserto de ácido nucleico es homólogo u ortólogo del locus genómico diana. Opcionalmente, la plantilla de reparación exógena tiene entre aproximadamente 50 nucleótidos a aproximadamente 1 kb de longitud. Opcionalmente, la plantilla de reparación exógena tiene entre aproximadamente 80 nucleótidos a aproximadamente 200 nucleótidos de longitud. Opcionalmente, la plantilla de reparación exógena es un oligodesoxinucleótido de cadena sencilla.

En otro aspecto, la divulgación proporciona un método para realizar cualquiera de los ratones descritos en el presente documento, que comprende: (a) poner en contacto el genoma de un embrión en estadio unicelular de ratón con: (i) una proteína Cas9; y (ii) un primer ARN guía que se hibrida con una primera secuencia de reconocimiento de ARN guía dentro de un locus genómico diana en el gen Fbn1, en el que el gen Fbn1 se modifica para comprender la mutación que da como resultado un truncamiento de terminal C de la proteína codificada; y (b) implantar el embrión en estadio unicelular de ratón modificado en una madre sustituta para producir un ratón de generación F0 genéticamente modificado en el que el gen Fbn1 se modifica para comprender la mutación que da como resultado un truncamiento de terminal C de la proteína codificada, en la que la mutación produce síntomas similares a la lipodistrofia congénita en el ratón de la generación F0.

En algunos métodos, la etapa (a) comprende además poner en contacto el genoma del embrión de ratón en estadio unicelular con un segundo ARN guía que se hibrida con una segunda secuencia de reconocimiento de ARN guía dentro del locus genómico diana en el gen Fbn1. En algunos métodos, el método comprende además seleccionar un embrión en estadio unicelular de ratón modificado después de la etapa (a) y antes de la etapa (b), en el que el embrión en estadio unicelular de ratón modificado es heterocigoto para la mutación que da como resultado un truncamiento de terminal C de la proteína codificada.

En otro aspecto, la divulgación proporciona un método para cribar un compuesto en cuanto a actividad para mejorar síntomas similares a lipodistrofia congénita, que comprende: (a) poner en contacto cualquier ratón sujeto descrito anteriormente con el compuesto; y (b) determinar la presencia de síntomas similares a lipodistrofia congénita del ratón sujeto con respecto a un ratón de control que no entró en contacto con el compuesto, en el que el ratón de control comprende al misma mutación de Fbn1 como el ratón sujeto; por lo cual la actividad para mejorar los síntomas similares a la lipodistrofia congénita se identifica por la disminución de la aparición de síntomas similares a la lipodistrofia congénita en el ratón sujeto en comparación con el ratón de control.

En algunos métodos, los síntomas comprenden uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis. Opcionalmente, los síntomas comprenden al menos uno de disminución de la masa grasa y disminución del porcentaje de grasa corporal. Opcionalmente, los síntomas comprenden disminución de la masa grasa y disminución del porcentaje de grasa corporal. En algunos métodos, los síntomas comprenden uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del tejido adiposo blanco normalizado por el peso corporal, disminución del tejido adiposo blanco en combinación con tejido adiposo marrón conservado normalizado por el peso corporal, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis. Opcionalmente, los síntomas comprenden una disminución del tejido adiposo blanco normalizado por el peso corporal.

Breve descripción de las figuras

La Figura 1 muestra la secuencia de nucleótidos (y la secuencia de aminoácidos codificada) de una región en el penúltimo exón del gen Fbn1 humano de tipo silvestre y las secuencias de nucleótidos y aminoácidos de las regiones correspondientes en una variante del gen FBN1 humano mutante asociada con el síndrome progeroide neonatal con lipodistrofia congénita, un gen de Fbn1 de ratón de tipo silvestre y una variante MAID 8501 del gen Fbn1 de ratón modificado genéticamente. La barra diagonal en las secuencias de aminoácidos entre “R” y “S” indica el sitio de escisión de furina.

La Figura 2 muestra el porcentaje de supervivencia de los ratones fundadores F0 macho y hembra heterocigotos u homocigotos para la variante MAID 8501 del gen Fbn1 del ratón modificado genéticamente.

La Figura 3 muestra la secuencia de nucleótidos (y la secuencia de aminoácidos codificada) de una región en el penúltimo exón del gen Fbn1 humano de tipo silvestre y las secuencias de nucleótidos y aminoácidos de las regiones correspondientes en una variante del gen FBN1 humano mutante asociada con el síndrome progeroide neonatal con lipodistrofia congénita, un gen Fbn1 de ratón de tipo silvestre y una variante MAID 8502 del gen Fbn1 de ratón modificado genéticamente. La Figura 3 también muestra la secuencia de aminoácidos codificada de una región en el penúltimo exón del gen Fbn1 de ratón para la variante MAID 8502 esperada y la variante MAID 8520 que se generó. La barra diagonal en las secuencias de aminoácidos entre “R” y “S” indica el sitio de escisión de furina.

La Figura 4 muestra la ingesta semanal de alimentos normalizada por el peso corporal para ratones macho de tipo silvestre y ratones heterocigotos de generación F1 para la variante MAID 8520 del gen Fbn1 de ratón modificado genéticamente.

La Figura 5 muestra ratones machos F1 de tipo silvestre de 3 meses de edad y ratones machos F1 de 3 meses de edad heterocigotos para la variante MAID 8520 del gen Fbn1 de ratón modificado genéticamente.

La Figura 6 muestra los pesos corporales de los ratones F1 por edad, que incluyen los ratones machos de tipo silvestre, ratones hembras de tipo silvestre y ratones machos y hembras heterocigotos para la variante MAID 8520 del gen Fbn1 de ratón modificado genéticamente.

Las Figuras 7A-7E muestran esqueletos de ratones hembra de tipo silvestre (Figuras 7A y 7B) y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 (Figuras 7C-7E) que muestra imágenes uCT de cifosis espinal.

Las Figuras 8A-8C muestran ensayos relacionados con el peso corporal y la masa grasa. La Figura 8A muestra el peso corporal de ratones de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con una dieta para criar animales obesos al 21 % o una dieta alta en grasa al 60 %. La Figura 8B muestra la masa grasa (gramos de masa grasa y porcentaje de masa grasa) de ratones de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con una dieta para criar animales obesos al 21 % o una dieta alta en grasa al 60 % según lo medido por ECHOMRI™. La Figura 8C muestra la masa magra (gramos de masa magra y porcentaje de masa magra) de ratones de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con una dieta para criar animales obesos al 21 % o una dieta alta en grasa al 60 % según lo medido por ECHOMRI™. Todos los ratones tenían 31 semanas de edad. Los ratones estaban siguiendo una dieta alta en grasa al 60 % durante 22 semanas en el momento del escaneo. Los asteriscos indican p< 0.0001 mediante la prueba t no apareada.

Las Figuras 9A-9C muestran ensayos relacionados con la homeostasis de la glucosa en ratones macho. La Figura 9A muestra el peso corporal de ratones machos de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 9B muestra glucosa en ayunas durante la noche para ratones machos de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 9C muestra tolerancia oral a la glucosa en ratones machos de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar.

Las Figuras 9D-9F muestran ensayos relacionados con la homeostasis de la glucosa en ratones hembra. La Figura 9D muestra el peso corporal de ratones hembra de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 9E muestra la glucosa en ayunas durante la noche para ratones hembra de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 9F muestra la tolerancia oral a la glucosa en ratones hembra de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar.

Las Figuras 10A-10C muestran ensayos relacionados con los lípidos circulantes en ratones macho. La Figura 10A muestra los niveles de colesterol en suero de ratones macho de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 10B muestra los niveles de triglicéridos para ratones machos de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 10C muestra niveles de ácidos grasos no esterificados (NEFA-C) para ratones macho de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar.

Las Figuras 10D-10F muestran ensayos relacionados con los lípidos circulantes en ratones hembra. La Figura 10D muestra los niveles de colesterol en suero de ratones hembra de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 10E muestra los niveles de triglicéridos para ratones hembra de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar. La Figura 10F muestra niveles de ácidos grasos no esterificados (NEFA-C) para ratones hembra de tipo silvestre y ratones heterocigotos con la variante MAID 8520 del gen Fbn1 con dieta de alimento estándar.

Las Figuras 11A-11G muestran los pesos del hígado terminal y de la almohadilla grasa en relación con los pesos corporales. La Figura 11A muestra el peso corporal de ratones heterocigotos con la variante MAID 8520 del gen Fbn1 hembra de 34 semanas con dieta de alimento estándar. Las Figuras 11B-11D muestran los pesos del hígado fresco, el tejido adiposo marrón (BAT) y el tejido adiposo blanco visceral (WAT) para cada grupo. Las Figuras 11E-11G muestran esos pesos como un porcentaje del peso corporal.

Las Figuras 12A-12H muestran datos de la jaula metabólica de un sistema Columbia Instruments Oxymax CLAMS de ratones heterocigotos con la variante MAID 8520 del gen Fbn1 hembras sometidos a una dieta alta en grasas al 60 % durante 12 semanas.

Las Figuras 13A-13D muestran una prueba de tolerancia a la insulina de ratones heterocigotos con la variante MAID 8520 del gen Fbn1 hembras sometidos a una dieta alta en grasas al 60 % durante 20 semanas.

Definiciones

Los términos “proteína”, “polipéptido” y “péptido”, utilizados indistintamente en el presente documento, incluyen formas poliméricas de aminoácidos de cualquier longitud, que incluyen aminoácidos codificados y no codificados y aminoácidos derivatizados o modificados química o bioquímicamente. Los términos también incluyen polímeros que han sido modificados, tales como polipéptidos que tienen cadenas principales de péptidos modificadas.

Se dice que las proteínas tienen un “terminal N” y un “terminal C”. El término “terminal N” se refiere al inicio de una proteína o polipéptido, terminado por un aminoácido con un grupo amino libre (-NH2). El término “terminal C” se refiere al extremo de una cadena de aminoácidos (proteína o polipéptido), terminado por un grupo carboxilo libre (-COOH).

Los términos “ácido nucleico” y “polinucleótido”, utilizados indistintamente en el presente documento, incluyen formas poliméricas de nucleótidos de cualquier longitud, que incluyen ribonucleótidos, desoxirribonucleótidos o análogos o versiones modificadas de los mismos. Incluyen ADN o ARN de cadena sencilla, de cadena doble y de múltiples cadenas, ADN genómico, ADNc, híbridos de ADN-ARN y polímeros que comprenden bases purínicas, bases pirimidínicas u otras o bases de nucleótidos naturales, modificadas químicamente, modificadas bioquímicamente, no naturales o derivatizadas.

Se dice que los ácidos nucleicos tienen “extremos 5'” y “extremos 3'” porque los mononucleótidos reaccionan para formar oligonucleótidos de tal manera que el fosfato 5' de un anillo de pentosa de mononucleótido se adhiere al oxígeno 3' de su vecino en una dirección a través de un ligamiento de fosfodiéster. Un extremo de un oligonucleótido se denomina “extremo 5'” si su fosfato 5' no está ligado al oxígeno 3' de un anillo de pentosa de mononucleótido. Un extremo de un oligonucleótido se denomina “extremo 3'” si su oxígeno 3' no está ligado a un fosfato 5' de otro anillo de pentosa de mononucleótido. También se puede decir que una secuencia de ácidos nucleicos, incluso si es interna a un oligonucleótido más grande, tiene extremos 5' y 3'. En una molécula de ADN lineal o circular, los elementos discretos se denominan “en dirección ascendente” o 5' de los elementos “en dirección descendente” o 3'.

El término “tipo silvestre” incluye entidades que tienen una estructura y/o actividad como la que se encuentra en un estado o contexto normal (en contraste con un estado o contexto mutante, enfermo, alterado, etc.). Los genes y polipéptidos de tipo silvestre a menudo existen en múltiples formas diferentes (por ejemplo, alelos).

El término “aislado” con respecto a proteínas y ácidos nucleicos incluye proteínas y ácidos nucleicos que están relativamente purificados con respecto a otros componentes bacterianos, virales o celulares que normalmente pueden estar presentes en el lugar, hasta y que incluyen una preparación sustancialmente pura de la proteína y el polinucleótido. El término “aislado” también incluye proteínas y ácidos nucleicos que no tienen contrapartes de origen natural, que han sido sintetizados químicamente y, por tanto, sustancialmente no contaminados por otras proteínas o ácidos nucleicos, o que han sido separados o purificados de la mayoría de otros componentes celulares con los que se acompañan naturalmente (por ejemplo, otras proteínas celulares, polinucleótidos o componentes celulares).

Las moléculas o secuencias “exógenas” incluyen moléculas o secuencias que normalmente no están presentes en una célula en esa forma. La presencia normal incluye la presencia con respecto al estadio de desarrollo particular y las condiciones ambientales de la célula. Una molécula o secuencia exógena, por ejemplo, puede incluir una versión mutada de una secuencia endógena correspondiente dentro de la célula, tal como una versión humanizada de la secuencia endógena, o puede incluir una secuencia correspondiente a una secuencia endógena dentro de la célula pero en una forma diferente (es decir, no dentro de un cromosoma). Por el contrario, las moléculas o secuencias endógenas incluyen moléculas o secuencias que normalmente están presentes en esa forma en una célula particular en un estadio de desarrollo particular bajo condiciones ambientales particulares.

La “optimización de codones” generalmente incluye un proceso de modificación de una secuencia de ácidos nucleicos para una expresión potenciada en células huésped particulares al reemplazar al menos un codón de la secuencia nativa con un codón que se utiliza con más frecuencia o más frecuentemente en los genes de la célula huésped mientras que se mantiene la secuencia de aminoácidos nativa. Por ejemplo, un polinucleótido que codifica una proteína Cas9 se puede modificar para sustituir los codones que tienen una mayor frecuencia de uso en una célula procariótica o eucariota determinada, que incluyen una célula bacteriana, una célula de levadura, una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster o cualquier otra célula huésped, en comparación con la secuencia de ácidos nucleicos de origen natural. Las tablas de uso de codones están disponibles, por ejemplo, en la “Base de Datos de Uso de Codones”. Estas tablas se pueden adaptar de varias maneras. Véase, Nakamura et al. (2000) Nucleic Acids Research 28:292. También se encuentran disponibles algoritmos informáticos para la optimización de codones de una secuencia particular para su expresión en un huésped particular (véase, por ejemplo, Gene Forge).

El término “ locus” se refiere a una ubicación específica de un gen (o secuencia significativa), secuencia de ADN, secuencia que codifica un polipéptido o posición en un cromosoma del genoma de un organismo. Por ejemplo, un “ locus de Fbn1” se puede referir a la ubicación específica de un gen Fbn1, una secuencia de ADN de Fbn1, una secuencia que codifica Fbn1 o una posición de Fbn1 en un cromosoma del genoma de un organismo que se ha identificado en cuanto a dónde reside dicha secuencia. Un “ locus de Fbn1” puede comprender un elemento regulador de un gen Fbn1, que incluye, por ejemplo, un potenciador, un promotor, UTR 5' y/o 3', o una combinación de los mismos.

El término “gen” se refiere a una secuencia de ADN en un cromosoma que codifica un producto (por ejemplo, un producto de ARN y/o un producto de polipéptidos) e incluye la región codificante interrumpida con intrones no codificantes y la secuencia ubicada adyacente a la región codificante en ambos extremos 5' y 3' de tal manera que el gen corresponda al ARNm de longitud completa (que incluye las secuencias no traducidas 5' y 3'). El término “gen” también incluye otras secuencias no codificantes que incluyen secuencias reguladoras (por ejemplo, promotores, potenciadores y sitios de unión de factores de transcripción), señales de poliadenilación, sitios internos de entrada a ribosomas, silenciadores, secuencias aislantes y regiones de adhesión a matriz. Estas secuencias pueden estar cerca de la región codificante del gen (por ejemplo, dentro de 10 kb) o en sitios distantes, e influyen en el nivel o tasa de transcripción y traducción del gen.

El término “alelo” se refiere a una forma variante de un gen. Algunos genes tienen una variedad de formas diferentes, que se ubican en la misma posición, o locus genético, en un cromosoma. Un organismo diploide tiene dos alelos en cada locus genético. Cada par de alelos representa el genotipo de un locus genético específico. Los genotipos se describen como homocigotos si hay dos alelos idénticos en un locus particular y como heterocigotos si los difieren dos alelos.

Un “promotor” es una región reguladora del ADN que usualmente comprende una caja TATA capaz de dirigir la ARN polimerasa II para iniciar la síntesis de ARN en el sitio de inicio de la transcripción apropiado para una secuencia de polinucleótidos particular. Un promotor puede comprender adicionalmente otras regiones que influyen en la tasa de inicio de la transcripción. Las secuencias promotoras divulgadas en el presente documento modulan la transcripción de un polinucleótido ligado operativamente.

“Ligamiento operable” o estar “ ligado operativamente” incluye yuxtaposición de dos o más componentes (por ejemplo, un promotor y otro elemento de secuencia) de tal manera que ambos componentes funcionen normalmente y permitan la posibilidad de que al menos uno de los componentes pueda mediar una función que sea ejercida sobre al menos uno de los otros componentes. Por ejemplo, un promotor se puede ligar operativamente a una secuencia codificante si el promotor controla el nivel de transcripción de la secuencia codificante en respuesta a la presencia o ausencia de uno o más factores reguladores de la transcripción. El ligamiento operable puede incluir que dichas secuencias sean contiguas entre sí o que actúen en trans (por ejemplo, una secuencia reguladora puede actuar a distancia para controlar la transcripción de la secuencia codificante).

“Complementariedad” de los ácidos nucleicos significa que una secuencia de nucleótidos en una cadena de ácidos nucleicos, debido a la orientación de sus grupos de nucleobases, forma enlaces de hidrógeno con otra secuencia en una cadena de ácidos nucleicos opuesta. Las bases complementarias en el ADN son normalmente A con T y C con G. En el ARN, con normalmente C con G y U con A. La complementariedad puede ser perfecta o sustancial/suficiente. La complementariedad perfecta entre dos ácidos nucleicos significa que los dos ácidos nucleicos pueden formar un dúplex en el que cada base del dúplex está unida a una base complementaria mediante el emparejamiento Watson-Crick. Complementaria “sustancial” o “suficiente” significa que una secuencia en una cadena no es completa y/o perfectamente complementaria a una secuencia en una cadena opuesta, pero que ocurre una unión suficiente entre las bases de las dos cadenas para formar un complejo híbrido estable en el conjunto de condiciones de hibridación (por ejemplo, concentración de sal y temperatura). Dichas condiciones se pueden predecir al utilizar las secuencias y cálculos matemáticos estándar para predecir la Tm (temperatura de fusión) de las cadenas hibridadas, o mediante la determinación empírica de la Tm al utilizar métodos de rutina. Tm incluye la temperatura a la que una población de complejos de hibridación formados entre dos cadenas de ácidos nucleicos se desnaturaliza en un 50 % (es decir, una población de moléculas de ácido nucleico de cadena doble se disocia a la mitad en cadenas sencillas). A una temperatura por debajo de la Tm, se favorece la formación de un complejo de hibridación, mientras que a una temperatura por encima de la Tm, se favorece la fusión o separación de las cadenas en el complejo de hibridación. La Tm se puede estimar para un ácido nucleico que tiene un contenido de G+C conocido en una solución acuosa de NaCl 1 M al utilizar, por ejemplo, Tm = 81.5+0.41 (% de G+C), aunque otros cálculos de Tm conocidos tienen en cuenta las características estructurales del ácido nucleico.

“Condición de hibridación” incluye el entorno acumulativo en el que una cadena de ácidos nucleicos se une a una segunda cadena de ácidos nucleicos mediante interacciones de cadenas complementarias y enlaces de hidrógeno para producir un complejo de hibridación. Dichas condiciones incluyen los componentes químicos y sus concentraciones (por ejemplo, sales, agentes quelantes, formamida) de una solución acuosa u orgánica que contiene los ácidos nucleicos, y la temperatura de la mezcla. Otros factores, tales como la duración del tiempo de incubación o las dimensiones de la cámara de reacción, pueden contribuir al medio ambiente. Véase, por ejemplo, Sambrook et al., Molecular Cloning, A Laboratary Manual, 2.sup.nd ed., pp. 1.90-1.91, 9.47-9.51, 11.47-11.57 (Cold Spring Harbar Laboratary Press, Cold Spring Harbar, N.Y, 1989).

La hibridación requiere que los dos ácidos nucleicos contengan secuencias complementarias, aunque es posible que no coincidan las bases. Las condiciones apropiadas para la hibridación entre dos ácidos nucleicos dependen de la longitud de los ácidos nucleicos y del grado de complementación, variables bien conocidas en la técnica. Cuanto mayor sea el grado de complementación entre dos secuencias de nucleótidos, mayor será el valor de la temperatura de fusión (Tm) para híbridos de ácidos nucleicos que tienen esas secuencias. Para las hibridaciones entre ácidos nucleicos con tramos cortos de complementariedad (por ejemplo, complementariedad de más de 35 o menos, 30 o menos, 25 o menos, 22 o menos, 20 o menos, o 18 o menos nucleótidos), la posición de los emparejamientos erróneos se vuelve importante (véase Sambrook et al., supra, 11.7-11.8). Normalmente, la longitud de un ácido nucleico hibridable es de al menos aproximadamente 10 nucleótidos. Las longitudes mínimas ilustrativas para un ácido nucleico hibridable incluyen al menos aproximadamente 15 nucleótidos, al menos aproximadamente 20 nucleótidos, al menos aproximadamente 22 nucleótidos, al menos aproximadamente 25 nucleótidos y al menos aproximadamente 30 nucleótidos. Además, la temperatura y la concentración de sal de la solución de lavado se pueden ajustar según sea necesario de acuerdo con factores tales como la longitud de la región de complementación y el grado de complementación.

No es necesario que la secuencia del polinucleótido sea 100%complementaria a la de su ácido nucleico diana para que sea específicamente hibridable. Más aún, un polinucleótido se puede hibridar sobre uno o más segmentos de tal manera que los segmentos intermedios o adyacentes no estén involucrados en el evento de hibridación (por ejemplo, una estructura en bucle o una estructura en horquilla). Un polinucleótido (por ejemplo, ARNg) puede comprender al menos un 70%, al menos un 80%, al menos un 90%, al menos un 95%, al menos un 99% o un 100% de complementariedad de secuencia con una región diana dentro de la secuencia de ácidos nucleicos diana para a los que se dirigen. Por ejemplo, un ARNg en el que 18 de 20 nucleótidos son complementarios a una región diana y, por lo tanto, se hibridarían específicamente, representaría un 90 % de complementariedad. En este ejemplo, los nucleótidos no complementarios restantes se pueden agrupar o intercalar con nucleótidos complementarios y no necesitan ser contiguos entre sí ni con nucleótidos complementarios.

El porcentaje de complementariedad entre tramos particulares de secuencias de ácidos nucleicos dentro de ácidos nucleicos se puede determinar de forma rutinaria utilizando programas BLAST (herramientas básicas de búsqueda de alineación local) y programas PowerBLAST conocidos en la técnica (Altschul et al. (1990) J. Mol. Biol. 215:403-410; Zhang and Madden (1997) Genome Res. 7:649-656) o al utilizar el programa Gap (Wisconsin Sequence Analysis Package, Versión 8 para Unix, Genetics Computer Group, University Research Park, Madison Wis.), utilizando las configuraciones predeterminadas, que utilizan el algoritmo de Smith and Waterman (Adv. Appl. Math., 1981, 2, 482 489).

Los métodos y composiciones proporcionados en el presente documento emplean una variedad de componentes diferentes. Se reconoce a lo largo de la descripción que algunos componentes pueden tener variantes y fragmentos activos. Dichos componentes incluyen, por ejemplo, proteínas Cas9, ARNs CRISPR, ARNtracr y ARN guía. La actividad biológica para cada uno de estos componentes se describe en otra parte del presente documento.

“ Identidad de secuencia” o “ identidad” en el contexto de dos polinucleótidos o secuencias de polipéptidos hace referencia a los residuos en las dos secuencias que son iguales cuando se alinean para una máxima correspondencia en una ventana de comparación especificada. Cuando se utiliza el porcentaje de identidad de secuencia en referencia a proteínas, se reconoce que las posiciones de los residuos que no son idénticas a menudo difieren mediante sustituciones de aminoácidos conservadoras, donde los residuos de aminoácidos se sustituyen por otros residuos de aminoácidos con propiedades químicas similares (por ejemplo, carga o hidrofobicidad) y por lo tanto no cambian las propiedades funcionales de la molécula. Cuando las secuencias difieren en sustituciones conservadoras, el porcentaje de identidad de secuencia se puede ajustar hacia arriba para corregir la naturaleza conservadora de la sustitución. Se dice que las secuencias que difieren mediante dichas sustituciones conservadoras tienen “similitud de secuencia” o “similitud”. Los medios para realizar este ajuste son bien conocidos por aquellos expertos en la técnica. Normalmente, esto implica calificar una sustitución conservadora como una discrepancia parcial en lugar de completa, aumentando de esta manera el porcentaje de identidad de secuencia. Por lo tanto, por ejemplo, cuando a un aminoácido idéntico se le asigna una puntuación de 1 y a una sustitución no conservadora se le asigna una puntuación de cero, a una sustitución conservadora se le asigna una puntuación entre cero y 1. La puntuación de las sustituciones conservadoras se calcula, por ejemplo, tal como se implementa en el programa PC/GENE (Intelligenetics, Mountain View, California).

“Porcentaje de identidad de secuencia” incluye el valor determinado al comparar dos secuencias óptimamente alineadas a lo largo de una ventana de comparación, en la que la porción de la secuencia de polinucleótidos en la ventana de comparación puede comprender adiciones o supresiones (es decir, espacios) en comparación con la secuencia de referencia (que no comprende adiciones ni supresiones) para una alineación óptima de las dos secuencias. El porcentaje se calcula al determinar el número de posiciones en las que aparece la base de ácido nucleico o el residuo de aminoácidos idéntico en ambas secuencias para producir el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes por el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia.

A menos que se indique lo contrario, los valores de identidad/similitud de secuencia incluyen el valor obtenido utilizando GAP Versión 10 utilizando los siguientes parámetros: % de identidad y % de similitud para una secuencia de nucleótidos utilizando un Peso de GAP de 50 y un Peso de Longitud de 3, y la matriz de puntuación nwsgapdna.cmp; % de identidad y % de similitud para una secuencia de aminoácidos utilizando un Peso de GAP de 8 y un Peso de Longitud de 2, y la matriz de puntuación BLOSUM62; o cualquier programa equivalente del mismo. “Programa equivalente” incluye cualquier programa de comparación de secuencias que, para dos secuencias cualesquiera en cuestión, genere una alineación que tiene coincidencias idénticas de residuos de nucleótidos o aminoácidos y un porcentaje de identidad de secuencia idéntico en comparación con la alineación correspondiente generada por GAP Versión 10.

El término “ identidad sustancial” como se utiliza en el presente documento para referirse a epítopos compartidos incluye secuencias que contienen residuos idénticos en posiciones correspondientes. Por ejemplo, se puede considerar que dos secuencias son sustancialmente idénticas si al menos el 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, el 98 %, el 99 % o más de sus residuos correspondientes son idénticos sobre un tramo relevante de residuos. El tramo relevante puede ser, por ejemplo, una secuencia completa o puede tener al menos 5, 10, 15 o más residuos.

El término “sustitución conservadora de aminoácidos” se refiere a la sustitución de un aminoácido que normalmente está presente en la secuencia por un aminoácido diferente de tamaño, carga o polaridad similar. Ejemplos de sustituciones conservadoras incluyen la sustitución de un residuo no polar (hidrófobo) tal como isoleucina, valina o leucina por otro residuo no polar. Asimismo, ejemplos de sustituciones conservadoras incluyen la sustitución de un residuo polar (hidrófilo) por otro, tal como entre arginina y lisina, entre glutamina y asparagina, o entre glicina y serina. Adicionalmente, la sustitución de un residuo básico tal como lisina, arginina o histidina por otro, o la sustitución de un residuo ácido tal como ácido aspártico o ácido glutámico por otro residuo ácido son ejemplos adicionales de sustituciones conservadoras. Ejemplos de sustituciones no conservadoras incluyen la sustitución de un residuo de aminoácidos no polares (hidrófobo) tal como isoleucina, valina, leucina, alanina o metionina por un residuo polar (hidrófilo) tal como cisteína, glutamina, ácido glutámico o lisina y /o un residuo polar para un residuo no polar. Las categorizaciones típicas de aminoácidos se resumen a continuación.

Una secuencia “homóloga” (por ejemplo, secuencia de ácidos nucleicos) incluye una secuencia que es idéntica o sustancialmente similar a una secuencia de referencia conocida, de tal manera que sea, por ejemplo, al menos 50 %, al menos 55 %, al menos 60 %, al menos 65 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99 % o 100 % idéntica a la secuencia de referencia conocida. Las secuencias homólogas pueden incluir, por ejemplo, secuencias ortólogas y secuencias parálogas. Los genes homólogos, por ejemplo, normalmente descienden de una secuencia de ADN ancestral común, ya sea a través de un evento de especiación (genes ortólogos) o un evento de duplicación genética (genes parálogos). Los genes “ortólogos” incluyen genes de diferentes especies que evolucionaron a partir de un gen ancestral común mediante especiación. Los ortólogos normalmente conservan la misma función en el curso de la evolución. Los genes “parálogos” incluyen genes relacionados por duplicación dentro de un genoma. Los parálogos pueden desarrollar nuevas funciones en el curso de la evolución.

El término“in vitro’’incluye ambientes artificiales y procesos o reacciones que ocurren dentro de un ambiente artificial (por ejemplo, un tubo de ensayo). El término“in vivo"incluye ambientes naturales (por ejemplo, una célula, organismo o cuerpo) y procesos o reacciones que ocurren dentro de un ambiente natural. El término“ex-vivo"incluye células que han sido extraídas del cuerpo de un individuo y procesos o reacciones que ocurren dentro de dichas células.

Las composiciones o métodos “que comprenden” o “que incluyen” uno o más elementos enumerados pueden incluir otros elementos no mencionados específicamente. Por ejemplo, una composición que “comprende” o “ incluye” una proteína puede contener la proteína sola o en combinación con otros ingredientes.

La designación de un rango de valores incluye todos los números enteros dentro del rango o que lo definen, y todos los subrangos definidos por números enteros dentro del rango.

A menos que se desprenda lo contrario del contexto, el término “aproximadamente” abarca valores dentro de un margen estándar de error de medición (por ejemplo, EEM) de un valor establecido.

Las formas singulares de los artículos “un”, “una” y “el” incluyen referencias en plural a menos que el contexto indique claramente lo contrario. Por ejemplo, el término “una proteína Cas9” o “al menos una proteína Cas9” puede incluir una pluralidad de proteínas Cas9, que incluyen mezclas de las mismas.

Medias estadísticamente significativas p <0.05.

Descripción detallada

I. Descripción general

La presente divulgación proporciona ratones que comprenden una mutación en el gen Fbn1 para modelar el síndrome progeroide neonatal con lipodistrofia congénita (NPSCL). También se proporcionan métodos para fabricar dichos modelos de ratón. Los modelos de ratón se pueden utilizar para cribar compuestos en busca de actividad para inhibir o reducir NPSCL o mejorar síntomas similares a NPSCL o para cribar compuestos en busca de actividad potencialmente dañina para promover o exacerbar NPSCL, así como para proporcionar información sobre el mecanismo de NPSCL y dianas terapéuticas y de diagnóstico potencialmente nuevas.

II. Modelos de ratón de síndrome progeroide neonatal con lipodistrofia congénita

En el presente documento se proporcionan ratones que comprenden una mutación en el gen Fbn1. Dichos ratones modelan el síndrome progeroide neonatal con lipodistrofia congénita (NPSCL) y exhiben síntomas similares a NPSCL (por ejemplo, síntomas similares a lipodistrofia congénita).

A. Síndrome progeroide neonatal con lipodistrofia congénita (NPSCL).

El síndrome progeroide neonatal (SNP) se caracteriza por una lipodistrofia parcial congénita que afecta predominantemente a la cara y las extremidades. O'Neill et al. (2007) Am. J. Med. Gen. A. 143A: 1421-1430. También se conoce como síndrome progeroide neonatal con lipodistrofia congénita (NPSCL), síndrome marfanoide-progeroide o síndrome marfanoide-progeroide-lipodistrofia (MPL). Se caracteriza por una delgadez extrema congénita debido a una reducción del tejido adiposo subcutáneo, afectando predominantemente a la cara y las extremidades. Véase Hou et al. (2009) Pediatrics and Neonatology 50:102-109 y O'Neill et al. (2007) Am. J. Med. Gen. A. 143A: 1421-1430. El fenotipo normalmente es evidente al nacer, e incluso antes del nacimiento como retraso del crecimiento intrauterino, con piel delgada y vasculatura prominente debido a la escasez de grasa subcutánea. O'Neill et al. (2007). Los pacientes muestran un índice de masa corporal (IMC) varias desviaciones estándar por debajo de lo normal para la edad, en todas las edades. O'Neill et al. (2007). Aunque los pacientes con NPS parecen progeroides, debido a los rasgos dismórficos faciales y la reducción de la grasa subcutánea, no tienen los rasgos habituales de la verdadera progeria, tales como cataratas, encanecimiento prematuro del cabello o resistencia a la insulina. O'Neill et al. (2007). Los pacientes pueden tener niveles normales de glucosa e insulina en plasma en ayunas, lo que sugiere que tienen una sensibilidad a la insulina y un manejo de la glucosa normales. O'Neill et al. (2007).

Las características cardinales de los pacientes con NPSCL incluyen: (1) lipodistrofia congénita; (2) nacimiento prematuro con un crecimiento lineal acelerado desproporcionado al aumento de peso; y (3) una apariencia progeroide con rasgos faciales distintos. Véase, por ejemplo, Takenouchi et al. (2013) Am. J. Med. Genet. Part A 161A:3057-3062. Jacquinet et al. informan que el fenotipo marfanoide-progeroide incluye lo siguiente: retraso del crecimiento intrauterino y/o parto prematuro, apariencia facial senil y disminución de la grasa subcutánea al nacer, y características marfanoideas progresivas. Con el tiempo pueden aparecer dilatación de la raíz aórtica, cristalino ectópico y ectasia dural. Los hitos del desarrollo y la inteligencia parecen ser normales. Jacquinet et al. (2014) Eur. J. Med. Genet.

57(5):203-234.

El fenotipo observado en pacientes humanos con NPSCL, a diferencia de muchos síndromes lipodistróficos, es un perfil metabólico normal en términos de homeostasis de la glucosa y lípidos circulantes a pesar de no tener tejido adiposo visceral. Los pacientes humanos con NPSCL tienen una homeostasis normal de la glucosa a pesar de la pérdida de tejido adiposo blanco.

Los modelos de ratón divulgados en el presente documento exhiben síntomas similares a NPSCL (por ejemplo, síntomas similares a lipodistrofia congénita). Dichos síntomas pueden incluir, por ejemplo, uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del tejido adiposo blanco (por ejemplo, normalizado por el peso corporal), disminución del tejido adiposo blanco en combinación con preservación del tejido adiposo marrón. tejido adiposo (por ejemplo, normalizado por el peso corporal), disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis. Dichos síntomas pueden incluir, por ejemplo, uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis. Dichos síntomas se pueden combinar con uno o más de los siguientes: aumento de la tasa metabólica, sensibilidad a la insulina mejorada, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Alternativamente, dichos síntomas pueden estar en combinación con uno o más de los siguientes: tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Por ejemplo, los síntomas pueden comprender al menos uno de disminución de la masa grasa y disminución del porcentaje de grasa corporal y al menos uno de tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Alternativamente, los síntomas pueden comprender disminución de la masa grasa, disminución del porcentaje de grasa corporal, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero. Otros fenotipos posibles incluyen uno o más de disminución del peso del hígado, disminución del peso del tejido adiposo marrón (BAT), disminución del peso del tejido adiposo blanco visceral (WAT), disminución del peso del<w>A<t>normalizado al peso corporal, tasa metabólica elevada normalizada al peso corporal, aumento del gasto de energía, tolerancia a la glucosa mejorada y sensibilidad a la insulina mejorada con una dieta alta en grasas. Por ejemplo, los síntomas pueden comprender disminución del tejido adiposo blanco (por ejemplo, en combinación con tejido adiposo marrón conservado) normalizado por el peso corporal en combinación con al menos uno de tasa metabólica mejorada, sensibilidad a la insulina mejorada, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles de ácidos grasos no esterificados en suero normales. Por ejemplo, los síntomas pueden comprender una disminución del tejido adiposo blanco (por ejemplo, en combinación con tejido adiposo marrón conservado) normalizado por el peso corporal en combinación con una sensibilidad a la insulina mejorada.

La disminución o el aumento pueden ser estadísticamente significativos. Por ejemplo, la disminución o aumento puede ser de al menos aproximadamente un 1 %, al menos aproximadamente un 2 %, al menos aproximadamente un 3 %, al menos aproximadamente un 4%, al menos aproximadamente un 5%, al menos aproximadamente un 10%, al menos aproximadamente un 15 %, al menos aproximadamente el 20 %, al menos aproximadamente el 30 %, al menos aproximadamente el 40 %, al menos aproximadamente el 50 %, al menos aproximadamente el 60 %, al menos aproximadamente el 70 %, al menos aproximadamente el 80 %, al menos aproximadamente el 90 %, o 100 % en comparación con un ratón de tipo silvestre de control.

B. MutacionesdeFbn1

NPSCL se asocia con mutaciones en el genFNB1en humanos. Véase, por ejemplo, Takenouchi et al. (2013) Am. J. Med. Genet. Part A 161A:3057-3062; Graul-Neumann et al. (2010) Am. J. Med. Genet. A. 152A(11):2749-2755; Goldblatt et al. (2011) Am. J. Med. Genet. A 155A(4):717-720; Horn and Robinson (2011) Am. J. Med. Genet. A.

155A(4);721-724; Jacquinet et al. (2014) Eur. J. Med. Genet. 57(5):203-234; y Romere et al. (2016) Cell 165(3):566-579. El FBN1 es un gen de 230 kb con 65 exones codificantes (66 exones en total) que codifican la glicoproteína estructural fibrilina-1, un componente principal de las microfibrillas en la matriz extracelular elástica y no elástica. La profibrilina-1 se traduce como una proproteína de 2871 aminoácidos de longitud, que se escinde en el terminal C mediante la proteasa furina. Esto genera un producto de escisión de terminal C de 140 aminoácidos de longitud (es decir, asprosina), además de fibrilina-1 madura (un componente de la matriz extracelular). A una secuencia de fibrilina-1 humana de ejemplo se le asigna el No. de acceso UniProt P35555.

Se han identificado clínicamente más de 3000 mutaciones en el genFNB1.Véase, por ejemplo, Wang et al. (2016) Forensic Science International 261:e1-e4 y www.umd/be/FBNl/. Estas mutaciones se han asociado con una variedad de afecciones, que incluyen fibrilinopatías tipo I, síndrome de Marfan, síndrome MASS, síndrome de ectopia del cristalino aislada, aneurismas de la aorta torácica, síndrome de Weill-Marchesani, displasia geleofísica y acromítrica, síndrome de piel rígida y síndrome progeroide neonatal con lipodistrofia congénita. Véase, por ejemplo, Davis and Summers (2012) Mol. Genet. Metab. 107(4):635-647. El más común de ellos es el síndrome de Marfan, autosómico dominante, que comprende manifestaciones oculares, cardiovasculares y esqueléticas. Véase Loeys et al. (2010) J. Med. Genet. 47(7):476-485 y Jacquinet et al. (2014) Eur. J. Med. Genet. 57(5):203-234. Las mutaciones en el síndrome de Marfan clásico se encuentran dispersas por todo el genFNB1con relación genotipo-fenotipo limitada. Véase, por ejemplo, Faivre et al. (2007) Am. J. Hum. Genet. 81(3):454-466 y Jacquinet et al. (2014) Eur. J. Med. Genet. 57(5):203-234.

Los modelos de ratón de NPSCL divulgados en el presente documento comprenden una mutación en el gen Fbn1 que produce síntomas similares a NPSCL (por ejemplo, síntomas similares a lipodistrofia congénita) en el ratón. Las mutaciones están en el gen Fbn1 endógeno en el ratón.

El ratón es heterocigoto para la mutación. La mutación da como resultado un truncamiento de terminal C de la proteína codificada. Por ejemplo, la mutación puede provocar un desplazamiento del marco de lectura. Una mutación por desplazamiento del marco de lectura es un cambio de secuencia entre el codón de inicio de la traducción (codón de inicio) y el codón de terminación (codón de parada) en el que, en comparación con una secuencia de referencia, la traducción se desplaza a otro marco. Por ejemplo, el marco de lectura puede desplazar un nucleótido en la dirección 5' (desplazamiento del marco de lectura -1) o un nucleótido en la dirección 3' (desplazamiento del marco de lectura 1). Una proteína codificada por un gen con una mutación de desplazamiento del marco de lectura será idéntica a la proteína codificada por el gen de tipo silvestre desde el terminal N hasta la mutación de desplazamiento del marco de lectura, pero diferente más allá de ese punto. Estos desplazamientos de marco de lectura pueden dar como resultado un codón de terminación prematura. Dichos codones prematuros se pueden encontrar, por ejemplo, en el penúltimo exón o en el último exón. Opcionalmente, el codón de terminación prematura está a menos de aproximadamente 100 pares de bases en dirección ascendente o menos de aproximadamente 55 pares de bases en dirección ascendente de la última unión exón-exón. Por ejemplo, el codón de terminación prematura puede tener menos de aproximadamente 100 pares de bases, 90 pares de bases, 80 pares de bases, 70 pares de bases, 60 pares de bases, 55 pares de bases, 50 pares de bases, 40 pares de bases, 30 pares de bases, 25 pares de bases, o 20 pares de bases en dirección ascendente de la última unión exón-exón dentro del penúltimo exón codificante. Alternativamente, el codón de terminación prematura puede estar en el último exón codificante (por ejemplo, como resultado de una mutación en el sitio de empalme que da como resultado la omisión del penúltimo exón codificante). Opcionalmente, el codón de terminación prematura está dentro del último exón codificante (por ejemplo, exón 65 del Fbn1 de ratón) o está en el penúltimo exón (por ejemplo, exón 64 del Fbn1deratón), en el que si el codón de terminación prematura está en el penúltimo exón, está a menos de aproximadamente 55 pares de bases (por ejemplo, menos de aproximadamente 20 pares de bases, tal como 19 pares de bases) en dirección ascendente de la última unión exónexón. Opcionalmente, si el codón prematuro está dentro del último exón codificante, tiene menos de aproximadamente 100 pares de base, 90 pares de base, 80 pares de base, 70 pares de base, 60 pares de base, 55 pares de base, 50 pares de base, 40 pares de base, 30 pares de base, 25 pares de base, 20 pares de base, 15 pares de base, o 10 pares de base (por ejemplo, 9 pares de base) en dirección descendente de la última unión exón-exón. Opcionalmente, el codón de terminación prematura está entre las posiciones correspondientes a las posiciones 8150 y 8300, 8160 y 8290, 8170 y 8280, 8180 y 8270, 8190 y 8260, 8200 y 8250, 8210 y 8300, 8210 y 8290, 8210 y 8280, 8210 y 8270, 8210 y 8260, 8210 y 8250, 8200 y 8300, 8200 y 8290, 8200 y 8280, 8200 y 8270, 8200 y 8260, 8200 y 8250, 8150 y 8245, 8160 y 8245, 8170 y 8245, 8180 y 8245, 8190 y 8245, 8200 y 8245, 8150 y 8250, 8160 y 8250, 8170 y 8250, 8180 y 8250, 8190 y 8250, 8200 y 8250, o 8210 y 8245 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20.

El codón de terminación prematura puede dar como resultado una proteína truncada con un terminal C cargado positivamente. Entre los 20 aminoácidos comunes, cinco tienen una cadena lateral que se puede cargar. A pH = 7, dos están cargados negativamente (ácido aspártico (Asp, D) y ácido glutámico (Glu, E)) y tres están cargados positivamente (lisina (Lys, K), arginina (Arg, R) e histidina. (His, H)). En algunos casos, el codón de terminación prematura puede dar como resultado una proteína truncada con un terminal C extremadamente cargado positivamente (por ejemplo, ETEKHKRN (SEQ ID NO: 34)). Alternativamente, el codón de terminación prematura puede dar como resultado una proteína truncada con un terminal C menos cargado positivamente (por ejemplo, ISLRQKPM (SEQ ID NO: 35)).

Opcionalmente, la mutación interrumpe una secuencia de reconocimiento de aminoácidos básicos para las proproteínas convertasas de la familia de las furinas (RGRKRR (SEQ ID NO: 36)). Por ejemplo, la mutación puede dar como resultado una proteína truncada en dirección ascendente de la secuencia de reconocimiento de furina, puede mutar la secuencia de reconocimiento de furina o puede dar como resultado un desplazamiento del marco de lectura en dirección ascendente de la secuencia de reconocimiento de furina. Opcionalmente, la mutación está dentro de los 100 pares de bases de la secuencia de reconocimiento de aminoácidos básicos para las proproteínas convertasas de la familia de las furinas. Por ejemplo, la mutación puede estar dentro de aproximadamente 90 pares de bases, 80 pares de bases, 70 pares de bases, 60 pares de bases, 50 pares de bases, 40 pares de bases o 30 pares de bases de la secuencia de reconocimiento de furina. Como ejemplo, dichas mutaciones pueden incluir inserciones o supresiones de nucleótidos que dan como resultado un desplazamiento del marco de lectura en el penúltimo exón o en el último exón. Como otro ejemplo, dichas mutaciones pueden incluir mutaciones en el sitio de empalme del donante que dan como resultado que la omisión del penúltimo exón y un desplazamiento del marco de lectura posterior que da como resultado un codón de terminación prematura en el último exón.

La mutación da como resultado la interrupción o ablación (por ejemplo, ablación heterocigota) del producto de escisión de terminal C (es decir, asprosina) de la profibrilina-1. La interrupción o ablación del producto de escisión de terminal C puede resultar, por ejemplo, de la interrupción de la secuencia de reconocimiento de aminoácidos básicos para las proproteína convertasas de la familia de las furinas. Alternativamente, la interrupción o ablación del producto de escisión de terminal C puede resultar, por ejemplo, de la mutación que crea un codón de terminación prematura de tal manera que el producto de escisión C-terminal se trunca. La alteración de la asprosina da como resultado una disminución de la producción de asprosina o una producción de asprosina con actividad disminuida. En algunos ratones, el gen Fbn1 comprende una mutación en el penúltimo exón. Por ejemplo, el penúltimo exón del gen Fbn1 puede comprender mutaciones correspondientes a las mutaciones en la SEQ ID NO: 26, 27 o 28 (los penúltimos exones de los alelos MAID 8501, 8520 y 8502, respectivamente) en relación con el penúltimo exón del Fbn1 de ratón de tipo silvestre (SEQ ID NO: 25) cuando el penúltimo exón está alineado óptimamente con la SEQ ID NO: 26, 27 o 28.

En algunos ratones, la proteína Fbn1 codificada por el gen Fbn1 mutado se trunca en una posición correspondiente a una posición entre los aminoácidos 2710 y 2780, entre los aminoácidos 2720 y 2770, entre los aminoácidos 2730 y 2760, o entre los aminoácidos 2737 y 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la s Eq ID NO: 30. Por ejemplo, la proteína codificada se puede truncar de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737, al aminoácido 2738 o al aminoácido 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30. Asimismo, la proteína codificada se puede truncar de tal manera que el último aminoácido esté en una posición correspondiente al último aminoácido de las proteínas Fbn1 truncadas codificadas por las variantes de Fbn1 MAID 8501, 8502 y 8520 descritas en el presente documento.

Como otro ejemplo, la proteína codificada puede tener un terminal C que consiste en la secuencia establecida en la SEQ ID NO: 8, 42 o 43, o la proteína codificada puede tener un terminal C correspondiente al terminal C de las proteínas codificadas por las variantes de Fbn1 MAlD 8501, 8502 y 8520 descritas en el presente documento. Por ejemplo, la proteína codificada se puede truncar de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 43. Como otro ejemplo, la proteína codificada se puede truncar de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2738 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 8. Como otro ejemplo, la proteína codificada se puede truncar de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína codificada está alineada de manera óptima con la SEQ ID NO: 30, y el terminal C de la proteína codificada consiste en la secuencia establecida en la SEQ ID NO: 42. Las proteínas Fbn1 truncadas de ejemplo incluyen la SEQ ID NO: 31, 32 y 33.

Un gen Fbn1 se refiere a cualquier gen conocido que codifica una proteína Fbn1, tal como se describe en las bases de datos Swiss-Prot y GenBank, y que incluye las variantes de estas proteínas como se describe en dichas bases de datos o que tienen de otro modo al menos 95, 96, 97, 98 o 99 % de identidad con secuencias de tipo silvestre, que incluyen híbridos de dichos genes, y que incluyen cualquier dicho gen o híbrido de dichos genes modificado por una mutación para producir síntomas similares a NPSCL (por ejemplo, síntomas similares a lipodistrofia congénita) como se describe adicionalmente en el presente documento. Si hay variaciones presentes distintas de los residuos mutados para producir síntomas similares a NPSCL, las variaciones preferiblemente no afectan a las secuencias codificantes o, si afectan a las secuencias codificantes, preferiblemente lo hacen al introducir sustituciones conservadoras.

En algunos de los ratones divulgados en este documento, el gen Fbn1 endógeno se muta para producir síntomas similares a los del NPSCL. A las secuencias de fibrilina-1 de ratón de ejemplo se les asigna el No. de Acceso NM_007993.2 o el No. de Acceso UniProt Q61554. El gen Fbn1 de ratón se encuentra en el brazo largo del cromosoma 15 en 15q15-q21.1. Megenis et al. (1991) Genomics 11:346-351. Como gen FBN1 humano, hay un gen muy grande que está muy fragmentado en 65 exones. Pereira et al. (1993) Hum. Mol. Genet. 2:961-968.

Dichas mutaciones en el gen Fbn1 endógeno puede corresponder con mutaciones identificadas en el gen FBN1 humano en pacientes diagnosticados con NPSCL como se divulga en otra parte del presente documento. Un residuo (por ejemplo, nucleótido o aminoácido) en un gen Fbn1 endógeno (o proteína) se puede que corresponde con un residuo en el genFNB1humano alineando de manera óptima las dos secuencias para obtener la máxima correspondencia en una ventana de comparación específica (por ejemplo, la secuencia codificante de Fbn1), en la que la porción de la secuencia de polinucleótidos (o aminoácidos) en la ventana de comparación puede comprender adiciones o supresiones (es decir, espacios) en comparación con la secuencia de referencia (que no comprende adiciones o supresiones) para una alineación óptima de la dos secuencias (véase, por ejemplo, discusión en otra parte del presente documento con respecto a la identidad de secuencia y la complementariedad). Dos residuos corresponden si están ubicados en la misma posición cuando están óptimamente alineados.

Un ejemplo específico de una mutación en un gen Fbn1 de ratón que produce síntomas similares a NPSCL es c.8207_8208inslbp (secuencia de referencia NM_007993.2 o secuencia de referencia SEQ ID NO: 20). Algunos ratones divulgados en el presente documento comprenden un gen Fbn1 con una mutación correspondiente a c.8207_8208ins1bp en NM_007993.2 o SEQ ID NO: 20 cuando el gen Fbn1 alineado óptimamente con NM_007933.2 o SEQ ID NO: 20. Un ejemplo específico de mutaciones dentro de una secuencia del gen Fbn1 de ratón que puede producir síntomas similares a NPSCL son las mutaciones en la SEQ ID NO: 21, 22 o 23 en relación con la SEQ ID NO: 20 (ADNc de Fbn1 de WT de ratón), o las mutaciones en la SEQ ID NO: 26, 27 o 28 en relación con la SEQ ID NO: 25 (penúltimo exón del ADNc de WT Fbn1). Ejemplos específicos de proteínas Fbn1 de ratón mutadas que pueden producir síntomas similares a NPSCL son las SEQ<i>D NOS: 31, 32 y 33.

Preferiblemente, la mutación está entre c.8100 y c.8300 o c.8150 y c.8250 en las posiciones correspondientes en una secuencia Fbn1 de ratón cuando está óptimamente alineada con la secuencia de FBN1 humana. Las mutaciones de ejemplo en el gen Fbn1 humano incluyen inserciones o supresiones de nucleótidos que resultan en un desplazamiento del marco de lectura. Véase, por ejemplo, Takenouchi et al. (2013) Am. J. Med. Genet. Part A 161A:3057-3062; Graul-Neumann et al. (2010) Am. J. Med. Genet. A. 152A(l 1):2749-2755; y Goldblatt et al. (2011) Am. J. Med. Genet. A 155A(4):717-720. Un ejemplo de dicha mutación en el gen FBN1 humano es c.8155_8156del. Esta es una supresión de dos pares de bases en el exón 64 codificante (el penúltimo exón), lo que provoca un desplazamiento del marco de lectura con un codón de terminación prematura posterior de 17 codones en dirección descendente de p.Lys2719. Véase, por ejemplo, Graul-Neumann et al. (2010) Am. J. Med. Genet. A. 152A(l 1):2749-2755. Otro ejemplo de dicha mutación en el gen FBN1 humano que da como resultado un desplazamiento del marco de lectura que resulta en el mismo codón de terminación prematura es c.8156_8175del. Véase, por ejemplo, Goldblatt et al. (2011) Am. J. Med. Genet. A 155A(4):717-720. Todavía otro ejemplo de dicha mutación genFNB1humano que resulta un desplazamiento del marco de lectura que resulta en el mismo codón de terminación prematura es c.8175_8182del. Véase, por ejemplo, Takenouchi et al. (2013) Am. J. Med. Genet. Part A 161A:3057-3062. Otro ejemplo de dicha mutación en el gen<f>B<n>1 humano que resulta de un codón de terminación prematura en el exón 64 codificante es c.8206_8207insA. Véase, por ejemplo, Romere et al. (2016) Cell 165(3):566-579. Los ratones descritos en el presente documento pueden comprender un gen Fbn1 con mutaciones correspondientes a cualquiera de estas mutaciones cuando la secuencia del Fbn1 está óptimamente alineada con el genFNB1humano correspondiente a la secuencia de ADNc establecida en el No. de Acceso NM_000138.3.

Otras mutaciones de ejemplo en el genFNB1humano incluyen mutaciones en el sitio de empalme del donante que resultan en la omisión del penúltimo exón (exón 64) y un desplazamiento del marco de lectura posterior que resulta en un codón de terminación prematura en el último exón (exón 65). Véase, por ejemplo, Horn and Robinson (2011) Am. J. Med. Genet. A. 155A(4):721-724 y Jacquinet et al. (2014) Eur. J. Med. Genet. 57(5):203-234. Un ejemplo de dicha mutación en el gen FBN1 humano es c.8226 1G>A. Véase, por ejemplo, Jacquinet et al. (2014) Eur. J. Med. Genet. 57(5):203-234.. Otro ejemplo de dicha mutación en el gen FBN1 humano es c.8226+1G>T. Véase, por ejemplo, Horn and Robinson (2011) Am. J. Med. Genet. A. 155A(4):721-724 y Romere et al. (2016) Cell 165(3):566-579. Estas mutaciones afectan el sitio del donante de empalme del intrón 64, cambiando el dinucleótido GT altamente conservado y provocan la omisión del exón codificante 64 y la producción de un ARNm estable que debería permitir la síntesis de una profibrilina-1 truncada en la que está alterado el sitio de escisión de furina de terminal C. La omisión del exón 64 da como resultado un desplazamiento del marco de lectura al comienzo del exón codificante 65 y la generación de un codón de terminación prematura en el noveno codón en dirección descendente.

Los ratones descritos en el presente documento pueden comprender un gen Fbn1 con mutaciones correspondientes a cualquiera de estas mutaciones cuando la secuencia del gen Fbn1 está óptimamente alineada con la secuencia del gen FBN1 humana correspondiente a la secuencia de ADNc establecida en el No. de Acceso NM_000138.3. Asimismo, los ratones descritos en el presente documento pueden comprender un gen Fbn1 con mutaciones tales que el gen Fbn1 mutante codifica una proteína Fbn1 correspondiente a cualquiera de las proteínas FBN1 humanas codificadas por cualesquiera de los genesFNB1mutantes descritos en el presente documento. De manera similar, la proteína codificada se puede truncar de tal manera que el último aminoácido esté en una posición correspondiente al último aminoácido de las proteínas Fbn1 truncadas codificadas por cualquiera de los genesFNB1humanos mutantes. gen descritos en el presente documento, y/o pueden tener un terminal C idéntico al terminal C de las proteínas Fbn1 truncadas codificadas por cualquiera de los genes FNB1 humanos mutantes descritos en el presente documento.

Ciertos alelos de Fbn1 mutantes de ejemplo son alelos Fbn1deratón mutantes. Por ejemplo, la mutación en el alelo Fbn1 de ratón mutante puede comprender una inserción o supresión en el penúltimo exón (exón 64) que provoca un desplazamiento del marco de lectura -1 y da como resultado un codón de terminación prematura en el extremo 3' del penúltimo exón (exón 64) o en el extremo 5' del exón final (exón 65) de Fbn1.

Como ejemplo, la mutación puede comprender una inserción o una supresión en el exón 64 que provoca un desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 5' del exón 65, como en el alelo MAID 8520 descrito en el Ejemplo 2 y se establece en la<s>E<q>ID NO: 22. Opcionalmente, la inserción o supresión está en dirección ascendente de una posición correspondiente a la posición 8241 (por ejemplo, una inserción entre las posiciones correspondientes a las posiciones 8179 y 8180) en la secuencia codificante de Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8241 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20.

Como otro ejemplo, la mutación puede comprender una inserción o supresión en el penúltimo exón (exón 64) que provoca un desplazamiento del marco de lectura -1 y da como resultado un codón de terminación prematura en el extremo 3' del penúltimo exón (exón 64), como en el Alelo MAID 8501 descrito en el Ejemplo 1 y establecido en la SEQ ID NO: 21 o el alelo MAID 8502 descrito en el Ejemplo 2 y establecido en la SEQ iD NO: 23. Opcionalmente, la inserción o supresión está en dirección ascendente de una posición correspondiente a la posición 8214 (por ejemplo, una inserción entre las posiciones correspondientes a las posiciones 8209 y 8210, o una inserción que comienza en una posición correspondiente a la posición 8161) en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la s Eq ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8214 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20.

Un alelo Fbn1 de ratón mutante de ejemplo es el alelo MAID 8501 descrito en el Ejemplo 1 y establecido en la SEQ ID NO: 21. La proteína codificada por el alelo MAID 8501 se establece en la SEQ ID NO: 31. Utilizando NM_007993.2 como secuencia de referencia, la mutación en este alelo Fbn1 mutante es c.8213_8214delinsACT. Esta mutación, que se creó al insertar una A entre c.8212 y 8213 y realizar una sustitución G>T en c.8214, da como resultado un codón de terminación prematura en el penúltimo exón (exón 64) de Fbn1, 19 nucleótidos en dirección ascendente del límite entre los exones 64 y 65. La mutación se encuentra dentro de los últimos 50 nucleótidos (los últimos 24 nucleótidos) del penúltimo exón y se predice que escapará de la desintegración mediada por ARNm sin sentido (NMD), lo que lleva a la expresión de una proteína profibrilina truncada mutante.

Otro alelo de ratón de ejemplo es el alelo MAID 8502 descrito en el Ejemplo 2 y establecido en la SEQ ID NO: 23. La proteína codificada por el alelo MAID 8502 se establece en la SEQ ID NO: 33. Este es un alelo Fbn1 mutante correspondiente al alelo Fbn1 humano c.8155_8156del, que tiene una supresión de dos pares de bases en el exón codificante 64 (el penúltimo exón) provocando un desplazamiento del marco de lectura con un codón de terminación prematura posterior de 17 codones en dirección descendente de p.Lys2719. En el alelo MAID 8502, la supresión de dos pares de bases es 71 nucleótidos en dirección ascendente del límite entre los exones 64 y 65. La mutación da como resultado un codón de terminación prematura en el penúltimo exón (exón 64) del Fbn1 de ratón, 19 nucleótidos en dirección ascendente del límite entre los exones 64 y 65.

Otro alelo de ratón de ejemplo es el alelo MAID 8520 descrito en el Ejemplo 2 y establecido en la SEQ ID NO: 22. La proteína codificada por el alelo MAID 8520 se establece en la SEQ ID n O: 32. Utilizando NM_007993.2 como secuencia de referencia, la mutación en este alelo Fbn1 mutante es 8179_8180insAGGCGGCCCAGAGCCACCTGCCAGC. Esta mutación se creó mediante una inserción de 25 pb (secuencia insertada establecida en la SEQ ID NO: 44) en el penúltimo exón (exón 64), 54 nucleótidos en dirección ascendente del límite entre los exones 64 y 65. Esto resulta en un desplazamiento del marco de lectura en el penúltimo exón (exón 64) del Fbn1 de ratón. La mutación da como resultado un codón de terminación prematura en el exón final (exón 65) del Fbn1 de ratón, 9 nucleótidos en dirección descendente del límite entre los exones 64 y 65.

Cada uno de los alelos Fbn1 de ratón de ejemplo anteriores Los dan como resultado una mutación por desplazamiento del marco de lectura en el penúltimo exón (exón 64) del gen Fbn1 de ratón.. Cada mutación de desplazamiento del marco de lectura da como resultado un codón de terminación prematura dentro del extremo 3' del penúltimo exón (exón 64) o del extremo 5' del exón final (exón 65) del gen Fbn1 de ratón. Debido a que cada mutación da como resultado un codón de terminación prematura, cada mutación interrumpe o elimina el producto de escisión de terminal C (es decir, asprosina) de la profibrilina-1 porque el producto de escisión C-terminal, si se produce, necesariamente también se truncará. Además, cada uno de los alelos Fbn1 de ratón de ejemplo anteriores dan como resultado un terminal C cargado positivamente debido a una mayor cantidad de lisinas, argininas e histidinas en relación con los ácidos aspárticos y ácidos glutámicos. Los últimos 14 aminoácidos de las proteínas Fbn1 codificadas por los alelos MAID 8501, MAID 8502 y MAID 8520, se establecen en las SEQ ID NOS: 45, 46 y 47, respectivamente.

C. Ratones

Se utilizan ratones como un modelo de NPSCL como se describe en el divulga documento.

Los ratones empleados en los modelos animales no humanos divulgados en el presente documento pueden ser de cualquier cepa, que incluyen, por ejemplo, una cepa 129, una cepa C57BL/6, una cepa BALB/c, una cepa Swiss Webster, una mezcla de cepas 129 y C57BL/6, una mezcla de cepas BALB/c y C57BL/6, una mezcla de cepas 129 y BALB/c, y una mezcla de cepas BALB/c, C57BL/6 y 129. Por ejemplo, un ratón puede ser al menos parcialmente de una cepa BALB/c (por ejemplo, al menos aproximadamente un 25 %, al menos aproximadamente un 50 %, al menos aproximadamente un 75 % derivado de una cepa BALB/c, o aproximadamente un 25 %, aproximadamente 50 %, aproximadamente 75 %, o aproximadamente 100 % derivado de una cepa BALB/c). En un ejemplo, los ratones tienen una cepa que comprende 50 % de BALB/c, 25 % de C57BL/6 y 25 % de 129. Alternativamente, los ratones pueden comprender una cepa o combinación de cepas que excluye BALB/c.

Ejemplos de 129 cepas incluyen 129P1, 129P2, 129P3, 129X1, 129S1 (por ejemplo, 129S1/SV, 129S1/Sv1m), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1 y 129T2. Véase, por ejemplo, Festing et al. (1999) Mammalian Genome 10(8):836. Los ejemplos de cepas C57BL incluyen C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr y C57BL/O1a. Los ratones empleados en los modelos animales no humanos proporcionados en el presente documento también pueden ser de una mezcla de una cepa 129 anteriormente mencionada y una cepa C57BL/6 anteriormente mencionada (por ejemplo, 50% de 129 y 50% de C57BL/6). Asimismo, los ratones empleados en los modelos animales no humanos proporcionados en el presente documento pueden ser de una mezcla de las cepas 129 anteriormente mencionadas o una mezcla de las cepas BL/6 anteriormente mencionadas (por ejemplo, la cepa 129S6 (129/SvEvTac)).

II. Generación de modelos de ratón de síndrome progeroide neonatal con lipodistrofia congénita

A. Generación de mutaciones de Fbn1 en las células

Se proporcionan varios métodos para modificar un gen Fbn1 en un genoma dentro de una célula (por ejemplo, una célula pluripotente o un embrión en estadio unicelular) a través del uso de agentes de nucleasas y/o plantillas de reparación exógenas. Los métodos pueden ocurririn vitro, ex vivo,oin vivo.El agente de nucleasa se puede utilizar solo o en combinación con una plantilla de reparación exógena. Alternativamente, la plantilla de reparación exógena se puede utilizar sola o en combinación con un agente de nucleasa.

La reparación en respuesta a rupturas de cadena doble (DSBs) se produce principalmente a través de dos rutas de reparación del ADN conservadas: unión de extremos no homólogos (NHEJ) y recombinación homóloga (HR). Véase Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897. NHEJ incluye la reparación de rupturas de cadena doble en un ácido nucleico mediante la ligación directa de los extremos de la ruptura entre sí o con una secuencia exógena sin la necesidad de una plantilla homóloga. La ligadura de secuencias no contiguas mediante NHEJ a menudo puede dar lugar a supresiones, inserciones o translocaciones cerca del sitio de la ruptura de la cadena doble.

La reparación de un ácido nucleico diana (por ejemplo, el gen Fbn1) mediada por una plantilla de reparación exógena puede incluir cualquier proceso de intercambio de información genética entre los dos polinucleótidos. Por ejemplo, NHEJ también puede dar como resultado la integración dirigida de una plantilla de reparación exógena a través de la ligadura directa de los extremos rotos con los extremos de la plantilla de reparación exógena (es decir, captura basada en NHEJ). Dicha integración dirigida mediada por NHEJ se puede preferir para la inserción de una plantilla de reparación exógena cuando las rutas de reparación dirigida por homología (HDR) no son fácilmente utilizables (por ejemplo, en células que no se dividen, células primarias y células que realizan pobremente la reparación del ADN basada en homología). Además, a diferencia de la reparación dirigida por homología, no se necesita conocimiento sobre grandes regiones de identidad de secuencia que flanquean el sitio de escisión (más allá de los salientes creados por la escisión mediada por Cas), lo que puede ser beneficioso cuando se intenta la inserción dirigida en organismos que tienen genomas para los cuales existe un conocimiento limitado de la secuencia genómica. La integración puede proceder a través de la ligadura de extremos romos entre la plantilla de reparación exógena y la secuencia genómica escindida, o a través de la ligadura de extremos adhesivos (es decir, que tienen salientes 5' o 3') utilizando una plantilla de reparación exógena que está flanqueada por salientes que son compatibles con los generados por la proteína Cas en la secuencia genómica escindida. Véase, por ejemplo, los documentos US 2011/020722, WO 2014/033644, WO 2014/089290, y Maresca et al. (2013) Genome Res. 23(3):539-546. Si se ligan extremos romos, puede ser necesaria la resección de la diana y/o del donante para generar regiones de microhomología necesarias para la unión de fragmentos, lo que puede crear alteraciones no deseadas en la secuencia diana.

La reparación también puede ocurrir mediante reparación dirigida por homología (HDR) o recombinación homóloga (HR). La HDR o HR incluye una forma de reparación de ácidos nucleicos que puede requerir homología de secuencia de nucleótidos, utiliza una molécula “donante” como plantilla para la reparación de una molécula “diana” (es decir, la que experimentó la ruptura de la cadena doble) y conduce a la transferencia de información genética del donante a la diana. Sin desear quedar limitado a ninguna teoría particular, dicha transferencia puede implicar la corrección de errores de coincidencia del ADN heterodúplex que se forma entre la diana rota y el donante, y/o la hibridación de cadenas dependiente de la síntesis, en el que el donante se utiliza para resintetizar la información genética que formará parte del objetivo y/o procesos relacionados. En algunos casos, el polinucleótido donante, una porción del polinucleótido donante, una copia del polinucleótido donante o una porción de una copia del polinucleótido donante se integra en el ADN diana. Véase Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) PLOS ONE 7:e45768: 1 9; and Wang et al. (2013) Nat Biotechnol. 31:530-532.

Las modificaciones genéticas dirigidas a un gen Fbn1 en un genoma se puede generar al poner en contacto una célula con una plantilla de reparación exógena que comprende un brazo de homología 5' que se hibrida con una secuencia diana 5' en un locus genómico diana dentro del gen Fbn1 y un brazo de homología 3' que se hibrida con una secuencia diana 3' en el locus genómico diana dentro del gen Fbn1. La plantilla de reparación exógena se puede recombinar con el locus genómico diana para generar la modificación genética dirigida al gen Fbn1. Dichos métodos pueden dar lugar, por ejemplo, a un gen Fbn1 modificado para comprender una mutación que da como resultado un truncamiento de terminal C de la proteína codificada. En otros lugares del presente documento se divulgan ejemplos de plantillas de reparación exógenas.

Las modificaciones genéticas dirigidas a un gen Fbn1 en un genoma también se puede generar al poner en contacto una célula con un agente de nucleasa que induce una o más mellas o rupturas de cadena doble en una secuencia de reconocimiento en un locus genómico diana dentro del gen Fbn1. Dichos métodos pueden resultar, por ejemplo, en un gen Fbn1 modificado para comprender una mutación que da como resultado un truncamiento de terminal C de la proteína codificada. Ejemplos y variaciones de agentes de nucleasas que se pueden utilizar en los métodos se describen en otra parte del presente documento.

Por ejemplo, las modificaciones genéticas dirigidas a un gen Fbn1 en un genoma se puede generar al poner en contacto una célula con una proteína Cas y uno o más ARNs guía que se hibridan con una o más secuencias de reconocimiento de ARN guía dentro de un locus genómico diana en el gen Fbn1. Por ejemplo, dichos métodos pueden comprender poner en contacto una célula con una proteína Cas y un ARN guía que se hibrida con una secuencia de reconocimiento de ARN guía dentro del gen Fbn1. La proteína Cas y el ARN guía forman un complejo y la proteína Cas escinde la secuencia de reconocimiento del ARN guía. La escisión por la proteína Cas9 puede crear una ruptura de cadena doble o una ruptura de cadena sencilla (por ejemplo, si la proteína Cas9 es una nickasa). Dichos métodos pueden resultar, por ejemplo, en un gen Fbn1 modificado para comprender una mutación que da como resultado un truncamiento de terminal C de la proteína codificada. Ejemplos y variaciones de proteínas Cas9 y ARNs guía que se pueden utilizar en los métodos se describen en otra parte del presente documento.

Opcionalmente, la célula se puede poner en contacto además con uno o más ARN guía adicionales que se hibridan con secuencias de reconocimiento de ARN guía adicionales dentro del locus genómico diana en el gen Fbn1. Al poner en contacto el cigoto con uno o más ARN guía adicionales (por ejemplo, un segundo ARN guía que se hibrida con una segunda secuencia de reconocimiento de ARN guía), escisión por la proteína Cas puede crear dos o más rupturas de cadena doble o dos o más rupturas de cadena sencilla (por ejemplo, si la proteína Cas es una nickasa).

Opcionalmente, la célula se puede poner en contacto adicionalmente con una o más plantillas de reparación exógenas que se recombinan con el locus genómico diana en el gen Fbn1 para generar una modificación genética dirigida. Ejemplos y variaciones de plantillas de reparación exógenas que se pueden utilizar en los métodos se divulgan en otra parte del presente documento.

La proteína Cas, los ARN guía y la(s) plantilla(s) de reparación exógena(s) se pueden introducir en la célula de cualquier forma y por cualquier medio como se describe en otra parte del presente documento, y toda o parte de la proteína Cas, los ARN guía, y la(s) plantilla(s) de reparación exógena(s) se pueden introducir simultánea o secuencialmente en cualquier combinación.

En algunos de dichos métodos, la reparación del ácido nucleico diana (por ejemplo, el gen Fbn1) por la plantilla de reparación exógena se produce a través de reparación dirigida por homología (HDR). La reparación dirigida por homología puede ocurrir cuando la proteína Cas escinde ambas cadenas de ADN en el gen Fbn1 para crear una ruptura de cadena doble, cuando la proteína Cas es una nickasa que escinde una cadena de ADN en el ácido nucleico objetivo para crear una ruptura de cadena sencilla, o cuando las nickasas Cas se utilizan para crear una ruptura de cadena doble formada por dos mellas desplazadas. En dichos métodos, la plantilla de reparación exógena comprende brazos de homología 5' y 3' correspondientes a secuencias diana 5' y 3'. La(s) secuencia(s) de reconocimiento de ARN guía o sitio(s) de escisión pueden ser adyacentes a la secuencia diana 5', adyacente a la secuencia diana 3', adyacente tanto a la secuencia diana 5' como a la secuencia diana 3', o no adyacente ni la secuencia diana 5' ni la secuencia diana 3'. Opcionalmente, la plantilla de reparación exógena puede comprender además un inserto de ácido nucleico flanqueado por los brazos de homología 5' y 3', y el inserto de ácido nucleico se inserta entre las secuencias diana 5' y 3'. Por ejemplo, el inserto de ácido nucleico puede comprender una o más modificaciones cuando se compara con la secuencia Fbn1 del animal no humano de tipo silvestre, o puede comprender todo o parte de una secuencia codificante del FBN1 humano que comprende una o más modificaciones cuando se compara con la secuencia de FBN1 humana de tipo silvestre. Si no está presente ningún inserto de ácido nucleico, la plantilla de reparación exógena puede funcionar para suprimir la secuencia genómica entre las secuencias diana 5' y 3'. Se divulgan ejemplos de plantillas de reparación exógenas en otros lugares del presente documento.

Alternativamente, la reparación del gen Fbn1 mediado por la plantilla de reparación exógena puede ocurrir mediante ligadura mediada por unión de extremos no homólogos (NHEJ). En dichos métodos, al menos un extremo de la plantilla de reparación exógena comprende una región de cadena sencilla corta que es complementaria de al menos un saliente creado por escisión mediada por Cas en el gen Fbn1. El extremo complementario en la plantilla de reparación exógena puede flanquear un inserto de ácido nucleico. Por ejemplo, cada extremo de la plantilla de reparación exógena puede comprender una región de cadena sencilla corta que es complementaria a un saliente creado por escisión mediada por Cas en el gen Fbn1, y estas regiones complementarias en la plantilla de reparación exógena pueden flanquear un inserto de ácido nucleico. Por ejemplo, el inserto de ácido nucleico puede comprender una o más modificaciones cuando se compara con la secuencia del Fbn1 de animal no humano de tipo silvestre, o puede comprender todo o parte de una secuencia codificante de FBN1 humana que comprende una o más modificaciones cuando se compara con la secuencia FBN1 humana de tipo silvestre.

Se pueden crear salientes (es decir, extremos escalonados) mediante la resección de los extremos romos de una ruptura de cadena doble creada por escisión mediada por Cas. Dicha resección puede generar las regiones de microhomología necesarias para la unión de los fragmentos, pero esto puede crear alteraciones no deseadas o incontrolables en el gen Fbn1. Alternativamente, dichos salientes se pueden crear al utilizar nickasas Cas emparejadas. Por ejemplo, la célula se puede poner en contacto con la primera y segunda nickasas que escinden cadenas opuestas de ADN, por lo cual el genoma se modifica a través de un mellado doble. Esto se puede lograr al poner en contacto una célula con una primera proteína Cas nickasa, un primer ARN guía que se hibrida con una primera secuencia de reconocimiento de ARN guía dentro del locus genómico diana en el gen Fbn1, una segunda proteína Cas nickasa y un segundo ARN guía que se hibrida con una segunda secuencia de reconocimiento de ARN guía dentro del locus genómico diana en el gen Fbn1. La primera proteína Cas y el primer ARN guía forman un primer complejo, y la segunda proteína Cas y el segundo ARN guía forman un segundo complejo. La primera proteína nickasa Cas escinde una primera cadena de ADN genómico dentro de la primera secuencia de reconocimiento de ARN guía, la segunda proteína nickasa Cas escinde una segunda cadena de ADN genómico dentro de la segunda secuencia de reconocimiento de ARN guía y, opcionalmente, la plantilla de reparación exógena se recombina con el locus genómico diana en el gen Fbn1 para generar la modificación genética dirigida.

La primera nickasa puede escindir una primera cadena de ADN genómico (es decir, la cadena complementaria) y la segunda nickasa puede escindir una segunda cadena de ADN genómico (es decir, la cadena no complementaria). La primera y segunda nickasas se pueden crear, por ejemplo, al mutar un residuo catalítico en el dominio RuvC (por ejemplo, la mutación D10A descrita en otro lugar en el presente documento) de Cas9 o mutando un residuo catalítico en el dominio HNH (por ejemplo, la mutación H840A descrita en otro lugar en el presente documento) de Cas9. En dichos métodos, se puede emplear el doble mellado para crear una ruptura de cadena doble que tiene extremos escalonados (es decir, salientes). La primera y segunda secuencias de reconocimiento de ARN guía se pueden posicionar para crear un sitio de escisión de tal manera que las mellas creadas por la primera y segunda nickasas en la primera y segunda cadenas de ADN creen una ruptura de cadena doble. Los salientes se crean cuando se desplazan las mellas dentro de la primera y segunda secuencias de reconocimiento de ARN CRISPR. La ventana de desplazamiento puede ser de, por ejemplo, al menos aproximadamente 5 pb, 10 pb, 20 pb, 30 pb, 40 pb, 50 pb, 60 pb, 70 pb, 80 pb, 90 pb, 100 pb o más. Véase, por ejemplo, Ran et al. (2013) Cell 154:1380-1389; Mali et al. (2013) Nat. Biotech.31:833-838; y Shen et al. (2014) Nat. Methods 11:399-404

B. Agentes de nucleasas

Cualquier agente de nucleasa que induzca una mella o ruptura de cadena doble en una secuencia de reconocimiento deseada se puede utilizar en los métodos y composiciones divulgados en el presente documento. Se puede emplear un agente de nucleasa natural o nativo siempre que el agente de nucleasa induzca una mella o ruptura de cadena doble en una secuencia de reconocimiento deseada. Alternativamente, se puede emplear un agente de nucleasa modificado o modificado genéticamente. Un “agente de nucleasa modificado genéticamente” incluye una nucleasa que se modifica genéticamente (modificada o derivada) de su forma nativa para reconocer e inducir específicamente una mella o ruptura de cadena doble en la secuencia de reconocimiento deseada. Por lo tanto, un agente de nucleasa modificado genéticamente se puede derivar de un agente de nucleasa nativo de origen natural o puede crearse o sintetizarse artificialmente. La nucleasa modificada genéticamente puede inducir una mella o ruptura de cadena doble en una secuencia de reconocimiento, por ejemplo, en la que la secuencia de reconocimiento no es una secuencia que habría sido reconocida por un agente de nucleasa nativo (no modificado o no modificado genéticamente). La modificación del agente de nucleasa puede ser tan pequeña como un aminoácido en un agente de escisión de proteínas o un nucleótido en un agente de escisión de ácidos nucleicos. A la producción de una mella o ruptura de cadena doble en una secuencia de reconocimiento u otro ADN se le puede denominar en el presente documento “cortar” o “escindir” la secuencia de reconocimiento u otro ADN.

También se proporcionan variantes activas y fragmentos de agentes de nucleasa (es decir, un agente de nucleasa modificado genéticamente). Dichas variantes activas pueden comprender al menos el 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con el agente de nucleasa nativo, en el que las variantes activas retienen la capacidad de cortar en una secuencia de reconocimiento deseada y, por tanto, retienen la actividad inductora de mella o ruptura de cadena doble. Por ejemplo, cualquiera de los agentes de nucleasa descritos en el presente documento se puede modificar a partir de una secuencia de endonucleasa nativa y modificarse genéticamente para reconocer e inducir una mella o ruptura de cadena doble en una secuencia de reconocimiento que no fue reconocida por el agente de nucleasa nativo. Por lo tanto, algunas nucleasas modificadas genéticamente tienen una especificidad para inducir una mella o ruptura de cadena doble en una secuencia de reconocimiento que es diferente de la correspondiente secuencia de reconocimiento del agente de nucleasa nativo. Se conocen ensayos para determinar la actividad inductora de mella o ruptura de cadena doble y generalmente miden la actividad general y la especificidad de la endonucleasa sobre sustratos de ADN que contienen la secuencia de reconocimiento.

El término “secuencia de reconocimiento para un agente de nucleasa” incluye una secuencia de ADN en la que un agente de nucleasa induce una mella o ruptura de cadena doble. La secuencia de reconocimiento de un agente de nucleasa puede ser endógena (o nativa) a la célula o la secuencia de reconocimiento puede ser exógena a la célula. Una secuencia de reconocimiento que es exógena a la célula no se produce de forma natural en el genoma de la célula. La secuencia de reconocimiento también puede ser exógena a los polinucleótidos de interés que se desea posicionar en el locus diana. En algunos casos, la secuencia de reconocimiento está presente sólo una vez en el genoma de la célula huésped.

También se proporcionan variantes activas y fragmentos de las secuencias de reconocimiento ejemplificadas. Dichas variantes activas pueden comprender al menos el 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con respecto a la secuencia de reconocimiento dada, en la que las variantes activas conservan la actividad biológica y, por lo tanto, son capaces de ser reconocidas y escindidas por un agente de nucleasa de una manera específica de secuencia. Se conocen en la técnica ensayos para medir la ruptura de cadena doble de una secuencia de reconocimiento mediante un agente de nucleasa (por ejemplo, ensayo qPCR TAQMAN®, Frendewey et al. (2010) Methods in Enzymology 476:295-307).

La longitud de la secuencia de reconocimiento puede variar, e incluye, por ejemplo, secuencias de reconocimiento que tienen aproximadamente 30-36 pb para un par de nucleasas con dedos de zinc (ZFN) (es decir, aproximadamente 15 18 pb para cada ZFN), aproximadamente 36 pb para una Nucleasa Efectora Similar a un Activador de la Transcripción (TALEN), o aproximadamente 20 pb para un ARN guía CRISPR/Cas9.

La secuencia de reconocimiento del agente de nucleasa se puede posicionar en cualquier lugar dentro o cerca del locus genómico diana. La secuencia de reconocimiento se puede ubicar dentro de una región codificante de un gen (por ejemplo, la gen Fbn1), o dentro de regiones reguladoras que influyen en la expresión del gen. Una secuencia de reconocimiento del agente de nucleasa se puede ubicar en un intrón, un exón, un promotor, un potenciador, una región reguladora o cualquier región codificante no proteica.

Un tipo de agente de nucleasa que se puede emplear en los diversos métodos y composiciones divulgados en el presente documento es una Nucleasa Efectora Similar a un Activador de la Transcripción (TALEN). Las nucleasas efectoras TAL son una clase de nucleasas de secuencia específica que se pueden utilizar para realizar rupturas de cadena doble en secuencias diana específicas en el genoma de un organismo procariótico o eucariota. Las nucleasas efectoras TAL se crean al fusionar un efector similar a un activador de la transcripción (TAL) nativo o modificado genéticamente, o una parte funcional del mismo, al dominio catalítico de una endonucleasa tal comoFokI.El exclusivo dominio modular de unión al ADN efector TAL permite el diseño de proteínas con potencialmente cualquier especificidad de reconocimiento de ADN determinada. Por lo tanto, los dominios de unión al ADN de las nucleasas efectoras TAL se pueden modificar genéticamente para reconocer sitios diana de ADN específicos y, por lo tanto, utilizar para realizar rupturas de cadena doble en secuencias diana deseadas. Véase los documentos WO 2010/079430; Morbitzer et al. (2010) Proc. Natl. Acad. Sci. U.S.A. 107(50:21617-21622; Scholze & Boch (2010) Virulence 1:428-432; Christian et al. (2010) Genetics 186:757-761; Li et al. (2011) Nucleic Acids Res. 39(1):359-372; y Miller et al. (2011) Nature Biotechnology 29: 143-148.

Se divulgan ejemplos de nucleasas TAL adecuadas y métodos para preparar nucleasas TAL adecuadas, por ejemplo, en los documentos US 2011/0239315 A1, US 2011/0269234 A1, US 2011/0145940 A1, US 2003/0232410 A1, US 2005/0208489 A1, US 2005/0026157 A1, US 2005/0064474 A1, US 2006/0188987 A1, y US 2006/0063231 A1. En diversos ejemplos, se modifican genéticamente nucleasas efectoras TAL que cortan en o cerca de una secuencia de ácidos nucleicos diana en, por ejemplo, un locus genómico de interés, en el que la secuencia de ácidos nucleicos diana está en o cerca de una secuencia que se va a modificar por una plantilla de reparación exógena. Las nucleasas TAL adecuadas para uso con los diversos métodos y composiciones proporcionadas en el presente documento incluyen aquellas que se diseñan específicamente para unirse a secuencias de ácido nucleico diana o cerca de ellas para ser modificadas mediante plantillas de reparación exógenas como se describe en otra parte del presente documento.

En algunos TALEN, cada monómero de TALEN comprende 33-35 repeticiones de TAL que reconocen un solo par de bases a través de dos residuos hipervariables. En algunos TALEN, el agente de nucleasa es una proteína quimérica que comprende un dominio de unión al ADN basado en repeticiones de TAL ligado operativamente a una nucleasa independiente tal como una endonucleasa FokI. Por ejemplo, el agente de nucleasa puede comprender un primer dominio de unión a ADN basado en repeticiones de TAL y un segundo dominio de unión a ADN basado en repeticiones de TAL, en el que cada uno del primero y segundo dominios de unión a ADN basados en repeticiones de TAL está operativamente ligado a una nucleasa FokI, en la que el primer y el segundo dominio de unión a ADN basado en repeticiones de TAL reconocen dos secuencias de ADN diana contiguas en cada cadena de la secuencia de ADN diana separadas por una secuencia separadora de longitud variable (12-20 pb), y en la que la Las subunidades de nucleasa FokI se dimerizan para crear una nucleasa activa que rompe una cadena doble en una secuencia diana.

Otro ejemplo de un agente de nucleasa que se puede emplear en los diversos métodos y composiciones divulgados en el presente documento es una nucleasa con dedos de zinc (ZFN). En algunas ZFNs, cada monómero de la ZFN comprende tres o más dominios de unión a ADN basados en dedos de zinc, en los que cada dominio de unión a ADN basado en dedos de zinc se une a un subsitio de 3 pb. En otras ZFN, la ZFN es una proteína quimérica que comprende un dominio de unión a ADN basado en dedos de zinc ligado operativamente a una nucleasa independiente tal como una endonucleasa FokI. Por ejemplo, el agente de nucleasa puede comprender una primera ZFN y una segunda ZFN, en el que cada una de la primera ZFN y la segunda ZFN está operativamente unida a una subunidad de nucleasa FokI, en la que la primera y la segunda ZFN reconocen dos secuencias de ADN diana contiguas en cada cadena de la secuencia de a Dn diana separada por aproximadamente un separador de 5-7 pb, y en el que las subunidades de nucleasa FokI se dimerizan para crear una nucleasa activa que rompe la cadena doble. Véase, por ejemplo, los documentos US 2006/0246567; US 2008/0182332; US 2002/0081614; US 2003/0021776; WO 2002/057308 A2; US 2013/0123484; US 2010/0291048; WO 2011/017293 A2; y Gaj et al. (2013) Trends in Biotechnology 31(7):397-405.

Otro tipo de agente de nucleasa que se puede emplear en los diversos métodos y composiciones divulgados en el presente documento es una meganucleasa. Las meganucleasas se han clasificado en cuatro familias en base a motivos de secuencia conservados: las familias de cajas LAGLIDADG, GIY-YIG, H-N-H y His-Cys. Estos motivos participan en la coordinación de iones metálicos y en la hidrólisis de enlaces fosfodiéster. Las meganucleasas se destacan por sus largas secuencias de reconocimiento y por tolerar algunos polimorfismos de secuencia en sus sustratos de ADN. Se conocen los dominios, la estructura y la función de las meganucleasas. Véase, por ejemplo, Guhan and Muniyappa (2003) Crit Rev Biochem Mol Biol. 38:199-248; Lucas et al. (2001) Nucleic Acids Res. 29:960-969; Jurica and Stoddard, (1999) Cell Mol Lije Sci 55:1304-1326; Stoddard (2006) Q Rev Biophys 38:49-95; y Moure et al. (2002) Nat Struct Biol 9:764. En algunos ejemplos, se utiliza una variante natural y/o una meganucleasa derivada genéticamente modificada. Se conocen métodos para modificar la cinética, interacciones de cofactores, expresión, condiciones óptimas y/o especificidad de la secuencia de reconocimiento, y se conocen métodos para cribar la actividad. Véase, por ejemplo, Epinat et al., (2003) Nucleic Acids Res. 31:2952-2962; Chevalier et al. (2002) Mol. Cell 10:895-905; Gimble et al. (2003) Mol. Biol. 334:993-1008; Seligman et al. (2002) Nucleic Acids Res. 30:3870-3879; Sussman et al. (2004) J. Mol. Biol. 342:31-41; Rosen et al. (2006) Nucleic Acids Res. 34:4791-4800; Chames et al.

(2005) Nucleic Acids Res. 33:el 78; Smith et al. (2006) Nucleic Acids Res. 34:e149; Gruen et al. (2002) Nucleic Acids Res. 30:e29; Chen y Zhao (2005) Nucleic Acids Res 33:e154; WO 2005/105989; WO 2003/078619; WO 2006/097854; WO 2006/097853; WO 2006/097784; y wo 2004/031346.

Se puede utilizar cualquier meganucleasa, que incluye, por ejemplo, I-SceI, I-SceII, I-SceIII, I- SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbINP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F-SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NcIIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I- PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-MtuI, PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, PI-TliII, o cualquier variante activa o fragmento de los mismos.

Las meganucleasas pueden reconocer, por ejemplo, secuencias de ADN de cadena doble de 12 a 40 pares de bases. En algunos casos, una meganucleasa reconoce una secuencia diana perfectamente coincidente en el genoma.

Algunas meganucleasas son nucleasas dirigidas. Un tipo de nucleasa orientada es una familia LAGLIDADG de nucleasas orientadas que incluye, por ejemplo, I-SceI, I-CreI e I-Dmol.

Los agentes de nucleasa adecuados también incluyen endonucleasas de restricción, que incluyen endonucleasas de tipo I, tipo II, tipo III y tipo IV. Las endonucleasas de restricción de tipo I y tipo III reconocen secuencias de reconocimiento específicas, pero normalmente se escinden en una posición variable del sitio de unión de la nucleasa, que puede estar a cientos de pares de bases del sitio de escisión (secuencia de reconocimiento). En los sistemas de Tipo II, la actividad de restricción es independiente de cualquier actividad metilasa y la escisión ocurre normalmente en sitios específicos dentro o cerca del sitio de unión. La mayoría de las enzimas de tipo II cortan secuencias palindrómicas. Sin embargo, las enzimas de Tipo IIa reconocen secuencias de reconocimiento no palindrómicas y se escinden fuera de la secuencia de reconocimiento, las enzimas de Tipo IIb cortan secuencias dos veces con ambos sitios fuera de la secuencia de reconocimiento, y las enzimas de Tipo IIs reconocen una secuencia de reconocimiento asimétrica y escinden en un lado y en una distancia definida de aproximadamente 1-20 nucleótidos de la secuencia de reconocimiento. Las enzimas de restricción de Tipo IV se dirigen al ADN metilado. Las enzimas de restricción se describen y clasifican con más detalle, por ejemplo, en la base de datos REBASE (página web en rebase.neb.com; Roberts et al. (2003) Nucleic Acids Res. 31:418-420; Roberts et al. (2003) Nucleic Acids Res. 31: 1805-1812; y Belfort et al. (2002) in Mobile DNA Il, pp. 761-783, Eds. Craigie et al., (A<s>M Press, Washington, DC).

Otros agentes de nucleasa adecuados para su uso en los métodos y composiciones descritos en el presente documento incluyen sistemas CRISPR-Cas, que se describen en otra parte del presente documento.

El agente de nucleasa se puede introducir en la célula mediante cualesquier medios conocidos en la técnica. Se puede introducir directamente en la célula un polipéptido que codifica el agente de nucleasa. Alternativamente, se puede introducir en la célula un polinucleótido que codifica el agente de nucleasa. Cuando se introduce en la célula un polinucleótido que codifica el agente de nucleasa, el agente de nucleasa se puede expresar de forma transitoria, condicional o constitutiva dentro de la célula. Por ejemplo, el polinucleótido que codifica el agente de nucleasa puede estar contenido en un casete de expresión y estar ligado operativamente a un promotor condicional, un promotor inducible, un promotor constitutivo o un promotor específico de tejido. Dichos promotores se discuten con más detalle en otra parte del presente documento. Alternativamente, el agente de nucleasa se puede introducir en la célula como un ARNm que codifica un agente de nucleasa.

Un polinucleótido que codifica un agente de nucleasa se puede integrar de manera estable en el genoma de la célula y ligar operativamente a un promotor activo en la célula. Alternativamente, un polinucleótido que codifica un agente de nucleasa puede estar en un vector de direccionamiento o en un vector o un plásmido que está separado del vector de direccionamiento que comprende el polinucleótido insertado.

Cuando el agente de nucleasa se proporciona a la célula a través de la introducción de un polinucleótido que codifica el agente de nucleasa, dicho polinucleótido que codifica un agente de nucleasa se puede modificar para sustituir codones que tengan una mayor frecuencia de uso en la célula de interés, en comparación con la secuencia de polinucleótidos de origen natural que codifica el agente de nucleasa. Por ejemplo, el polinucleótido que codifica el agente de nucleasa se puede modificar para sustituir codones que tengan una mayor frecuencia de uso en una determinada célula procariótica o eucariota de interés, que incluye una célula bacteriana, una célula de levadura, una célula humana, una célula no humana. una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata o cualquier otra célula huésped de interés, cuando se compara con la secuencia de polinucleótidos de origen natural.

C. Sistemas CRISPR-Cas

Los métodos divulgados en el presente documento pueden utilizar sistemas de repeticiones Palindrómicas Cortas Agrupadas Regularmente Intercaladas (CRISPR)/asociados a CRISPR (Cas) o componentes de dichos sistemas para modificar un genoma dentro de una célula. Los sistemas CRISPR-Cas incluyen transcripciones y otros elementos involucrados en la expresión o dirección de la actividad de los genes Cas. Un sistema CRISPR-Cas puede ser un sistema de tipo I, de tipo II o de tipo III. Alternativamente, un sistema CRISPR/Cas puede ser, por ejemplo, un sistema de tipo V (por ejemplo, subtipo V-A o subtipo V-B). Los métodos y composiciones divulgados en el presente documento pueden emplear sistemas CRISPR-Cas al utilizar complejos CRISPR (que comprenden un ARN guía (ARNg) complejado con una proteína Cas) para la escisión de ácidos nucleicos dirigida al sitio.

Los sistemas CRISPR-Cas utilizados en los métodos divulgados en el presente documento no son de origen natural. Un sistema “no de origen natural” incluye cualquier cosa que indique la participación de la mano del hombre, tal como uno o más componentes del sistema que sean alterados o mutados de su estado de origen natural, que esté al menos sustancialmente libre de al menos otro componente con al que están asociados de forma natural en la naturaleza, o que se asocian con al menos otro componente con el que no están asociados de forma natural. Por ejemplo, algunos sistemas CRISPR-Cas emplean complejos CRISPR de origen no natural que comprenden un ARNg y una proteína Cas que no se encuentran juntos de forma natural.

(1) Proteínas Cas

Las proteínas Cas generalmente comprenden al menos un dominio de unión o reconocimiento de ARN que puede interactuar con los ARN guía (ARNg, que se describen con más detalle a continuación). Las proteínas cas también pueden comprender dominios de nucleasa (por ejemplo, dominios DNasa o RNasa), dominios de unión a ADN, dominios de helicasa, dominios de interacción proteína-proteína, dominios de dimerización y otros dominios. Un dominio de nucleasa posee actividad catalítica para la escisión de ácidos nucleicos, que incluye la descomposición de los enlaces covalentes de una molécula de ácido nucleico. La escisión puede producir extremos romos o escalonados, y puede ser de cadena sencilla o de cadena doble. Por ejemplo, una proteína Cas9 de tipo silvestre normalmente creará un producto de escisión romo. Alternativamente, una proteína Cpf1 de tipo silvestre (por ejemplo, FnCpfl) puede dar como resultado un producto de escisión con un saliente 5' de 5 nucleótidos, ocurriendo la escisión después del par de bases 18 de la secuencia de PAM en la cadena no diana y después de la 23 base sobre la cadena dirigida. Una proteína Cas puede tener actividad de escisión completa para crear una ruptura de cadena doble en la gen Fbn1 (por ejemplo, una ruptura de cadena doble con extremos romos), o puede ser una nickasa que crea una ruptura de cadena sencilla en el gen Fbn1.

Ejemplos de proteínas Cas incluyen Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 o Csx12), Cas10, Casl0d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 y Cu1966, y sus homólogos o versiones modificadas.

Preferiblemente, la proteína Cas es una proteína Cas9 o se deriva de una proteína Cas9 de un sistema CRISPR-Cas de tipo II. Las proteínas Cas9 provienen de un sistema CRISPR-Cas de tipo II y normalmente comparten cuatro motivos clave con una arquitectura conservada. Los motivos 1,2 y 4 son motivos similares a RuvC y el motivo 3 es un motivo HNH. Las proteínas Cas9 de ejemplo son deStreptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp, Petrotoga mobilis, Thermosipho africanus,oAcaryochloris marina.Ejemplos adicionales de los miembros de la familia Cas9 se describen en el documento WO 2014/131833. Cas9 de S.pyogenes(al que se le ha asignado el número de acceso de SwissProt Q99ZW2) es una enzima preferida. Cas9 de S.aureus(número de acceso UniProt J7RUA5 asignado) es otra enzima preferida.

Otro ejemplo de proteína Cas es una Cpf1 (CRISPR dePrevotellayfrancisella1) proteína. Cpf1 es una proteína grande (aproximadamente 1300 aminoácidos) que contiene un dominio de nucleasa similar a RuvC homólogo al dominio correspondiente de Cas9 junto con una contraparte del agrupamiento característico rico en arginina de Cas9. Sin embargo, Cpf1 carece del dominio de nucleasa HNH que está presente en las proteínas Cas9, y el dominio similar a RuvC es contiguo en la secuencia de Cpf1, en contraste con Cas9, donde contiene inserciones largas que incluyen el dominio HNH. Véase, por ejemplo, , Zetsche et al. (2015) Cell 163(3):759-771. Las proteínas Cpf1 de ejemplo son deFrancisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacteriumMC20171, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_G w C2_ 44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens,yPorphyromonas macacae.La Cpf1 deFrancisella novicidaU112 (FnCpfl; número de acceso UniProt asignado A0Q7Q2) es una enzima preferida.

Las proteínas Cas pueden ser proteínas de tipo silvestre (es decir, aquellas que se encuentran en la naturaleza), proteínas Cas modificadas (es decir, variantes de la proteína Cas) o fragmentos de proteínas Cas de tipo silvestre o modificadas. Las proteínas Cas también pueden ser variantes activas o fragmentos de proteínas Cas de tipo silvestre o modificadas. Las variantes o fragmentos activos pueden comprender al menos un 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más identidad de secuencia con la proteína Cas de tipo silvestre o modificada o una porción de la misma, en la que las variantes activas retienen la capacidad de cortar en un sitio de escisión deseado y, por lo tanto, retienen la actividad inductora de mellas o de inducción de ruptura de cadena doble. Se conocen ensayos para determinar la actividad inductora de mellas o de ruptura de cadena doble y generalmente miden la actividad general y la especificidad de la proteína Cas sobre sustratos de ADN que contienen el sitio de escisión.

Las proteínas cas pueden modificarse para aumentar o disminuir una o más de la afinidad de unión a ácidos nucleicos, la especificidad de unión a ácidos nucleicos y la actividad enzimática. Las proteínas cas también se pueden modificar para cambiar cualquier otra actividad o propiedad de la proteína, tal como la estabilidad. Por ejemplo, se pueden modificar, suprimir o inactivar uno o más dominios de nucleasa de la proteína Cas, o se puede truncar una proteína Cas para eliminar dominios que no son esenciales para la función de la proteína o para optimizar (por ejemplo, potenciar o reducir) la actividad de la proteína Cas.

Las proteínas cas pueden comprender al menos un dominio de nucleasa, tal como un dominio de ADNasa. Por ejemplo, una proteína Cpf1 de tipo silvestre generalmente comprende un dominio similar a RuvC que escinde ambas cadenas de ADN diana, quizás en una configuración dimérica. Las proteínas cas pueden comprender al menos dos dominios de nucleasa, tales como dominios de ADNasa. Por ejemplo, una proteína Cas9 de tipo silvestre comprende generalmente un dominio de nucleasa similar a RuvC y un dominio de nucleasa similar a HNH. Cada uno de los dominios RuvC y HNH puede cortar una cadena diferente de ADN de cadena doble para realizar una ruptura de cadena doble en el ADN. Véase, por ejemplo, Jinek et al. (2012) Science 337:816-8.

Uno o ambos dominios de nucleasa se pueden suprimir o mutar de tal manera que ya no sean funcionales o tengan una actividad de nucleasa reducida. Si uno de los dominios de nucleasa se suprime o muta, la proteína Cas resultante (por ejemplo, Cas9) se puede denominar nickasa y puede generar una ruptura de cadena sencilla en una secuencia de reconocimiento de ARN guía dentro de un ADN de cadena doble, pero no una ruptura de cadena doble (es decir, puede escindir la cadena complementaria o la cadena no complementaria, pero no ambas). Si ambos dominios de nucleasa se suprimen o mutan, la proteína Cas resultante (por ejemplo, Cas9) tendrá una capacidad reducida para escindir ambas cadenas de un ADN de cadena doble (por ejemplo, una proteína Cas nula de nucleasa). Un ejemplo de una mutación que convierte Cas9 en una nickasa es una mutación D10A (aspartato a alanina en la posición 10 de Cas9) en el dominio RuvC de Cas9 de S.pyogenes.Asimismo, H939A (histidina a alanina en la posición del aminoácido 839) o H840A (histidina a alanina en la posición del aminoácido 840) en el dominio HNH de Cas9 de S.pyogenespuede convertir el Cas9 en una nickasa. Otros ejemplos de mutaciones que convierten Cas9 en una nickasa incluyen las mutaciones correspondientes a Cas9 de S.thermophilus..Véase, por ejemplo, Sapranauskas et al. (2011) Nucleic Acids Research 39:9275-9282 y el documento WO 2013/141680. Dichas mutaciones se pueden generar utilizando métodos como la mutagénesis dirigida al sitio, la mutagénesis mediada por PCR o la síntesis genética total. Se pueden encontrar ejemplos de otras mutaciones que crean nickasas, por ejemplo, en los documento WO 2013/176772 y WO 2013/142578.

Las proteínas cas también se pueden ligar operativamente a polipéptidos heterólogos como proteínas de fusión. Por ejemplo, una proteína Cas se puede fusionar a un dominio de escisión, un dominio de modificación epigenética, un dominio de activación transcripcional o un dominio represor transcripcional. Véase el documento WO 2014/089290. Las proteínas cas también se pueden fusionar a un polipéptido heterólogo proporcionando un aumento o disminución de la estabilidad. El dominio fusionado o polipéptido heterólogo se puede ubicar en el terminal N, el terminal C o internamente dentro de la proteína Cas.

Un ejemplo de una proteína de fusión Cas es una proteína Cas fusionada a un polipéptido heterólogo que proporciona la localización subcelular. Dichos polipéptidos heterólogos pueden incluir, por ejemplo, una o más señales de localización nuclear (NLS) tales como la NLS de SV40 para dirigirse al núcleo, una señal de localización mitocondrial para dirigirse a las mitocondrias, una señal de retención del RE y similares. Véase, por ejemplo,Langeet al.(2007) J. Biol. Chem. 282:5101-5105.Dichas señales de localización subcelular se pueden ubicar en el terminal N, el terminal C o en cualquier lugar dentro de la proteína Cas. Una NLS puede comprender un tramo de aminoácidos básicos y puede ser una secuencia monopartita o una secuencia bipartita.

Las proteínas cas también se pueden ligar operativamente a un dominio de penetración celular. Por ejemplo, el dominio de penetración celular se puede derivar de la proteína TAT del VIH-1, el motivo de penetración celular TLM del virus de la hepatitis B humana, MPG, Pep-1, VP22, un péptido de penetración celular del virus del herpes simple o una secuencia de péptidos de poliarginina. Véase, por ejemplo, el documento WO 2014/089290. El dominio de penetración celular se puede ubicar en el terminal N, el terminal C o en cualquier lugar dentro de la proteína Cas.

Las proteínas cas también se pueden ligar operativamente a un polipéptido heterólogo para facilitar el seguimiento o la purificación, tal como una proteína fluorescente, un indicador de purificación o un indicador de epítopo. Los ejemplos de proteínas fluorescentes incluyen proteínas fluorescentes verdes (por ejemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Verde, Azami Verde Monomérico, CopGFP, AceGFP, ZsGreenl), proteínas fluorescentes amarillas (por ejemplo, YFP, eYFP, Citrina, Venus, YPet, PhiYFP, ZsYellowl), proteínas fluorescentes azules (por ejemplo, eBFP, eBFP2, Azurita, mKalamal, GFPuv, Zafiro, T-zafiro), proteínas fluorescentes cian (por ejemplo, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes rojas (mKate, mKate2, mPlum, monómero DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), proteínas fluorescentes de color naranja (mOrange, mKO, Kusabira-Naranja, Kusabira-Naranja Monomérico, mTangerine, tdTomato) y cualquier otra proteína fluorescente adecuada. Ejemplos de indicadores incluyen glutatión-S-transferasa (GST), proteína de unión a quitina (CBP), proteína de unión a maltosa, tiorredoxina (TRX), poli(NANP), indicador de purificación por afinidad en tándem (TAP), myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, hemaglutinina (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, histidina (His), proteína transportadora de biotina carboxilo (BCCP) y calmodulina.

Las proteínas Cas9 también se pueden unir a plantillas de reparación exógenas o ácidos nucleicos etiquetados. Dicha unión (es decir, ligamiento físico) se puede lograr a través de interacciones covalentes o interacciones no covalentes, y la unión puede ser directa (por ejemplo, a través de fusión directa o conjugación química, que se puede lograr mediante la modificación de residuos de cisteína o lisina en la proteína o modificación de inteína, o se puede lograr a través de uno o más ligadores o moléculas adaptadoras interpuestas tales como estreptavidina o aptámeros. Véase, por ejemplo, Pierce et al. (2005) Mini Rev. Med. Chem. 5(1):41-55; Duckworth et al. (2007) Angew. Chem. Int. Ed. Engl.

46(46):8819-8822; Schaeffer and Dixon (2009) Australian J. Chem. 62(10): 1328-1332; Goodman et al. (2009) Chembiochem. 10(9): 1551-1557; y Khatwani et al. (2012) Bioorg. Med. Chem. 20(14):4532-4539. Las estrategias no covalentes para sintetizar conjugados de proteína y ácido nucleico incluyen los métodos de biotina-estreptavidina y níquel-histidina. Los conjugados covalentes de proteína y ácido nucleico se pueden sintetizar al conectar proteínas y ácidos nucleicos funcionalizados apropiadamente utilizando una amplia variedad de químicas. Algunas de estas químicas implican la adhesión directa del oligonucleótido a un residuo de aminoácidos sobre la superficie de la proteína (por ejemplo, una lisina amina o una cisteína tiol), mientras que otros esquemas más complejos requieren una modificación postraduccional de la proteína o la participación de un catalizador o dominio proteico reactivo. Los métodos para la adhesión covalente de proteínas a ácidos nucleicos pueden incluir, por ejemplo, reticulación química de oligonucleótidos con residuos de lisina o cisteína de proteína, ligación de proteínas expresadas, métodos quimioenzimáticos y el uso de fotoaptámeros. La plantilla de reparación exógena o el ácido nucleico etiquetado se puede unir al terminal C, al terminal N o a una región interna dentro de la proteína Cas9. Preferiblemente, la plantilla de reparación exógena o el ácido nucleico etiquetado está unido al terminal C o al terminal N de la proteína Cas9. Asimismo, la proteína Cas9 se puede unir al extremo 5', al extremo 3' o a una región interna dentro de la plantilla de reparación exógena o ácido nucleico etiquetado. Es decir, la plantilla de reparación exógena o el ácido nucleico marcado se puede unir en cualquier orientación y polaridad. Preferiblemente, la proteína Cas9 está unida al extremo 5' o al extremo 3' de la plantilla de reparación exógena o ácido nucleico etiquetado.

Las proteínas cas se pueden proporcionar en cualquier forma. Por ejemplo, una proteína Cas se puede proporcionar en forma de una proteína, tal como una proteína Cas formando un complejo con un ARNg. Alternativamente, se puede proporcionar una proteína Cas en forma de un ácido nucleico que codifica la proteína Cas, tal como un ARN (por ejemplo, ARN mensajero (ARNm)) o ADN. Opcionalmente, el ácido nucleico que codifica la proteína Cas se puede optimizar con codones para una traducción eficaz en proteína en una célula u organismo particular. Por ejemplo, el ácido nucleico que codifica la proteína Cas se puede modificar para sustituir codones que tienen una mayor frecuencia de uso en una célula bacteriana, una célula de levadura, una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata o cualquier otra célula huésped de interés, en comparación con la secuencia de polinucleótidos de origen natural. Cuando se introduce en la célula un ácido nucleico que codifica la proteína Cas, la proteína Cas se puede expresar de forma transitoria, condicional o constitutiva en la célula.

Los ácidos nucleicos que codifican proteínas Cas se pueden integrar de manera estable en el genoma de la célula y ligarse operativamente a un promotor activo en la célula. Alternativamente, los ácidos nucleicos que codifican proteínas Cas se pueden ligar operativamente a un promotor en una construcción de expresión. Las construcciones de expresión incluyen cualesquier construcciones de ácido nucleico capaces de dirigir la expresión de un gen u otra secuencia de ácidos nucleicos de interés (por ejemplo, un gen Cas) y que puede transferir dicha secuencia de ácidos nucleicos de interés a una célula diana. Por ejemplo, el ácido nucleico que codifica la proteína Cas puede estar en un vector de direccionamiento que comprende un inserto de ácido nucleico y/o un vector que comprende un ADN que codifica un ARNg. Alternativamente, puede estar en un vector o plásmido que esté separado del vector de direccionamiento que comprende el inserto de ácido nucleico y/o separado del vector que comprende el ADN que codifica el ARNg. Los promotores que se pueden utilizar en una construcción de expresión incluyen promotores activos, por ejemplo, en una o más de una célula eucariota, una célula humana, una célula no humana, una célula de mamífero, una célula de mamífero no humana, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster, una célula de conejo, una célula pluripotente, una célula madre embrionaria (ES) o un cigoto. Dichos promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos o promotores específicos de tejido. Opcionalmente, el promotor puede ser un promotor bidireccional que dirige la expresión tanto de una proteína Cas en una dirección como de un ARN guía en la otra dirección. Dichos promotores bidireccionales pueden consistir en (1) un promotor Pol III unidireccional, convencional y completo que contiene 3 elementos de control externos: un elemento de secuencia distal (DSE), un elemento de secuencia proximal (PSE) y una caja TATA; y (2) un segundo promotor Pol III básico que incluye un PSE y una caja TATA fusionados al extremo 5' del DSE en orientación inversa. Por ejemplo, en el promotor H1, el DSE es adyacente al PSE y a la caja TATA, y el promotor se puede volver bidireccional al crear un promotor híbrido en el que la transcripción en la dirección inversa se controla al adjuntar una caja PSE y TATA derivada del promotor de U6. Véase, por ejemplo, el documento US 2016/0074535. El uso de un promotor bidireccional para expresar genes que codifican una proteína Cas y un ARN guía permite simultáneamente la generación de casetes de expresión compactos para facilitar el suministro.

(2) ARN guía

Un “ARN guía” o “ARNg” es una molécula de ARN que se une a una proteína Cas (por ejemplo, la proteína Cas9) y dirige la proteína Cas a una ubicación específica dentro de un ADN diana (por ejemplo, el gen Fbn1). Los ARN guía pueden comprender dos segmentos: un “segmento dirigido al ADN” y un “segmento de unión a proteínas”. “Segmento” incluye una sección o región de una molécula, tal como un tramo contiguo de nucleótidos en un ARN. Algunos ARNg comprenden dos moléculas de ARN separadas: un “ARN activador” (por ejemplo, ARNtracr) y un “ARN diana” (por ejemplo, ARN CRISPR o ARNcr). Otros ARNg son una sola molécula de ARN (polinucleótido de ARN único), que también se puede denominar “ARNg de una sola molécula”, “ARN de guía única” o “ARNg”. Véase, por ejemplo, los documentos WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578, y WO 2014/131833. Para Cas9, por ejemplo, un ARN guía único puede comprender un ARNcr fusionado a un ARNtracr (por ejemplo, mediante un conector). Para Cpf1, por ejemplo, sólo se necesita un ARNcr para lograr la escisión. Los términos “ARN guía” y “ARNg” incluyen tanto ARNg de doble molécula como ARNg de molécula sencilla.

Un ARNg de dos moléculas de ejemplo comprende una molécula similar a ARNcr (“ARN CRISPR” o “ARN diana” o “ARNcr” o “repetición de ARNcr”) y una molécula similar a ARNtracr (“ARN CRISPR de acción trans” o “activador”). Molécula de “ARN” o “ARNtracr” o “andamio”. Un ARNcr comprende tanto el segmento dirigido al ADN (de cadena sencilla) del ARNg como un tramo de nucleótidos que forma la mitad del dúplex del ARNcd del segmento de unión a proteínas del ARNg.

Un ARNtracr correspondiente (ARN activador) comprende un tramo de nucleótidos que forma la otra mitad del dúplex de ARNcd del segmento de unión a proteínas del ARNg. Un tramo de nucleótidos de un ARNcr es complementarios y se hibridan con una serie de nucleótidos de un ARNtracr para formar el dúplex de ARNcd del dominio de unión a proteínas del ARNg. Como tal, se puede decir que cada ARNcr tiene un ARNtracr correspondiente.

El ARNcr y el ARNtracr correspondiente se hibridan para formar un ARNg. En sistemas en los que sólo se necesita un ARNcr, el ARNcr puede ser el ARNg. El ARNcr proporciona adicionalmente el segmento dirigido al ADN de cadena sencilla que se hibrida con una secuencia de reconocimiento de ARN guía. Si se utiliza para la modificación dentro de una célula, la secuencia exacta de una determinada molécula de ARNcr o ARNtracr se puede diseñar para que sea específica de la especie en la que se utilizarán las moléculas de ARN. Véase, por ejemplo, Mali et al. (2013) Science 339:823-826; Jinek et al. (2012) Science 337:816-821; Hwang et al. (2013) Nat. Biotechnol. 31:227-229; Jiang et al. (2013) Nat. Biotechnol. 31:233-239; y Cong et al. (2013) Science 339:819-823.

El segmento dirigido al ADN (ARNcr) de un ARNg determinado comprende una secuencia de nucleótidos que es complementaria a una secuencia (es decir, la secuencia de reconocimiento del ARN guía) en un ADN diana. El segmento de un ARNg dirigido al ADN interactúa con un ADN diana (por ejemplo, el gen Fbn1) de una manera específica de secuencia mediante hibridación (es decir, emparejamiento de bases). Como tal, la secuencia de nucleótidos del segmento dirigido de ADN puede variar y determinar la ubicación dentro del ADN diana con la que interactuarán el ARNg y el ADN diana. El segmento dirigido al ADN de un ARNg en cuestión se puede modificar para hibridar con cualquier secuencia deseada dentro de un ADN diana. Los ARNcr naturales difieren dependiendo del sistema CRISPR-Cas y el organismo, pero a menudo contienen un segmento objetivo de entre 21 a 72 nucleótidos de longitud, flanqueado por dos repeticiones directas (DR) de una longitud de entre 21 a 46 nucleótidos. (véase, por ejemplo, documento WO 2014/131833). En el caso de S.pyogenes,los DR tienen 36 nucleótidos de largo y el segmento objetivo tiene 30 nucleótidos de largo. El DR ubicado en 3' es complementario y se hibrida con el ARNtracr correspondiente, que a su vez se une a la proteína Cas.

El segmento dirigido al ADN puede tener una longitud de al menos aproximadamente 12 nucleótidos, al menos aproximadamente 15 nucleótidos, al menos aproximadamente 17 nucleótidos, al menos aproximadamente 18 nucleótidos, al menos aproximadamente 19 nucleótidos, al menos aproximadamente 20 nucleótidos, al menos aproximadamente 25 nucleótidos, al menos aproximadamente 30 nucleótidos, al menos aproximadamente 35 nucleótidos, o al menos aproximadamente 40 nucleótidos. Dichos segmentos dirigidos de ADN pueden tener una longitud desde aproximadamente 12 nucleótidos hasta aproximadamente 100 nucleótidos, desde aproximadamente 12 nucleótidos hasta aproximadamente 80 nucleótidos, desde aproximadamente 12 nucleótidos hasta aproximadamente 50 nucleótidos, desde aproximadamente 12 nucleótidos hasta aproximadamente 40 nucleótidos, desde aproximadamente 12 nucleótidos hasta aproximadamente 30 nucleótidos, desde aproximadamente 12 nucleótidos hasta aproximadamente 25 nucleótidos, o desde aproximadamente 12 nucleótidos hasta aproximadamente 20 nucleótidos. Por ejemplo, el segmento dirigido de ADN puede ser desde aproximadamente 15 nucleótidos hasta aproximadamente 25 nucleótidos (por ejemplo, desde aproximadamente 17 nucleótidos hasta aproximadamente 20 nucleótidos, o aproximadamente 17 nucleótidos, aproximadamente 18 nucleótidos, aproximadamente 19 nucleótidos, o aproximadamente 20 nucleótidos). Véase, por ejemplo, el documento US 2016/0024523. Para Cas9 de S.pyogenes,un segmento típico dirigido al ADN tiene entre 16 y 20 nucleótidos de longitud o entre 17 y 20 nucleótidos de longitud. Para Cas9 de S.aureus,un segmento típico dirigido al ADN tiene entre 21 y 23 nucleótidos de longitud. Para Cpf1, un segmento típico dirigido al ADN tiene al menos 16 nucleótidos de longitud o al menos 18 nucleótidos de longitud.

Los ARNtracr pueden tener cualquier forma (por ejemplo, ARNtracr de longitud completa o ARNtracr parciales activos) y de longitudes variables. Pueden incluir transcripciones primarias o formularios procesados. Por ejemplo, los ARNtracr (como parte de un ARN guía único o como una molécula separada como parte de un ARNg de dos moléculas) pueden comprender o consistir en toda o una porción de una secuencia de ARNtracr de tipo silvestre (por ejemplo, aproximadamente o más de aproximadamente 20, 26, 32, 45, 48, 54, 63, 67, 85 o más nucleótidos de una secuencia de ARNtracr de tipo silvestre). Ejemplos de secuencias de ARNtracr de tipo silvestre de S.pyogenesincluyen versiones de 171 nucleótidos, 89 nucleótidos, 75 nucleótidos y 65 nucleótidos. Véase, por ejemplo, Deltcheva et al. (2011) Nature 471 :602-607; el documento WO 2014/093661. Los ejemplos de ARNtracr dentro de ARN de guía única (ARNgs) incluyen los segmentos de ARNtracr que se encuentran en las versiones 48, 54, 67 y 85 de ARNgs, donde “+n” indica que hasta el n nucleótido de ARNtracr de tipo silvestre está incluido en el ARNgs. Véase documento US 8,697,359.

El porcentaje de complementariedad entre la secuencia de direccionamiento de ADN y la secuencia de reconocimiento de ARN guía dentro del ADN diana puede ser al menos 60 % (por ejemplo, al menos 65 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 97 %, al menos 98 %, al menos 99 % o 100%). El porcentaje de complementariedad entre la secuencia dirigida al ADN y la secuencia de reconocimiento del ARN guía dentro del ADN diana puede ser al menos del 60 % en aproximadamente 20 nucleótidos contiguos. Como un ejemplo, el porcentaje de complementariedad entre la secuencia dirigida al ADN y la secuencia de reconocimiento del ARN guía dentro del ADN diana es del 100 % sobre los 14 nucleótidos contiguos en el extremo 5' de la secuencia de reconocimiento del ARN guía dentro de la cadena complementaria del ADN diana. y tan solo 0 % sobre el resto. En tal caso, se puede considerar que la secuencia dirigida al ADN tiene una longitud de 14 nucleótidos. Como otro ejemplo, el porcentaje de complementariedad entre la secuencia dirigida al ADN y la secuencia de reconocimiento del ARN guía dentro del ADN diana es del 100 % sobre los siete nucleótidos contiguos en el extremo 5' de la secuencia de reconocimiento del ARN guía dentro de la cadena complementaria del ADN diana. y tan solo 0 % sobre el resto. En tal caso, se puede considerar que la secuencia dirigida al ADN tiene una longitud de 7 nucleótidos. En algunos ARN guía, al menos 17 nucleótidos dentro de la secuencia del ADN diana son complementarios del ADN diana. Por ejemplo, la secuencia dirigida al ADN puede tener una longitud de 20 nucleótidos y puede comprender 1,2 o 3 emparejamientos erróneos con el ADN diana (la secuencia de reconocimiento del ARN guía). Preferiblemente, los emparejamientos erróneos no son adyacentes a una secuencia de motivo adyacente al protoespaciador (PAM) (por ejemplo, los emparejamientos erróneos están en el extremo 5' de la secuencia dirigida al ADN, o los emparejamientos erróneos son al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 o 19 pares de bases de distancia de la secuencia de PAM).

El segmento de unión a proteínas de un ARNg puede comprender dos tramos de nucleótidos que son complementarios entre sí. Los nucleótidos complementarios del segmento de unión a proteínas se hibridan para formar un dúplex de ARN de cadena doble (ARNcd). El segmento de unión a proteínas de un ARNg en cuestión interactúa con una proteína Cas, y el ARNg dirige la proteína Cas unida a una secuencia de nucleótidos específica dentro del ADN diana a través del segmento de unión a proteínas.

Los ARN guía pueden incluir modificaciones o secuencias que proporcionan características deseables adicionales (por ejemplo, estabilidad modificada o regulada; direccionamiento subcelular; seguimiento con una etiqueta fluorescente; un sitio de unión para una proteína o complejo de proteína; y similares). Ejemplos de dichas modificaciones incluyen, por ejemplo, una tapa 5' (por ejemplo, una tapa 7-metilguanilato (m7G)); una cola poliadenilada en 3' (es decir, una cola poli(A) en 3'); una secuencia de riboswitch (por ejemplo, para permitir la estabilidad regulada y/o la accesibilidad regulada por proteínas y/o complejos de proteína); una secuencia de control de estabilidad; una secuencia que forma un dúplex de ARNcd (es decir, una horquilla); una modificación o secuencia que dirige el ARN a una ubicación subcelular (por ejemplo, núcleo, mitocondrias, cloroplastos y similares); una modificación o secuencia que proporciona seguimiento (por ejemplo, conjugación directa con una molécula fluorescente, conjugación a una fracción que facilita la detección fluorescente, una secuencia que permite la detección fluorescente, etc.); una modificación o secuencia que proporciona un sitio de unión para proteínas (por ejemplo, proteínas que actúan sobre el ADN, que incluyen activadores transcripcionales, represores transcripcionales, ADN metiltransferasas, ADN desmetilasas, histonas acetiltransferasas, histonas desacetilasas y similares); y combinaciones de los mismos.

Los ARN guía se pueden proporcionar en cualquier forma. Por ejemplo, el ARNg se puede proporcionar en forma de ARN, ya sea como dos moléculas (ARNcr y ARNtracr separados) o como una molécula (ARNgs), y opcionalmente en forma de un complejo con una proteína Cas. Por ejemplo, los ARNg se pueden preparar mediante transcripciónin vitroutilizando, por ejemplo, ARN polimerasa T7 (véase, por ejemplo, los documentos WO 2014/089290 y WO 2014/065596). Los<a>R<n>guía también se pueden preparar mediante síntesis química.

El ARNg también se puede proporcionar en forma de ADN que codifica el ARNg. El ADN que codifica el ARNg puede codificar una molécula de ARN única (ARNgs) o moléculas de ARN separadas (por ejemplo, ARNcr y ARNtracr separados). En el último caso, el ADN que codifica el ARNg se puede proporcionar como una molécula de ADN o como moléculas de ADN separadas que codifican el ARNcr y el ARNtracr, respectivamente.

Cuando un ARNg se proporciona en forma de ADN, el ARNg se puede expresar de forma transitoria, condicional o constitutiva en la célula. Los ADN que codifican los ARNg se pueden integrar de manera estable en el genoma de la célula y ligarse operativamente a un promotor activo en la célula. Alternativamente, los ADN que codifican los ARNg se pueden ligar operativamente a un promotor en una construcción de expresión. Por ejemplo, el ADN que codifica el ARNg puede estar en un vector que comprende una plantilla de reparación exógena y/o un vector que comprende un ácido nucleico que codifica una proteína Cas. Alternativamente, puede estar en un vector o un plásmido que esté separado del vector que comprende una plantilla de reparación exógena y/o del vector que comprende el ácido nucleico que codifica la proteína Cas. Los promotores que se pueden utilizar en dichas construcciones de expresión incluyen promotores activos, por ejemplo, en una o más de una célula eucariota, una célula humana, una célula no humana, una célula de mamífero, una célula de mamífero no humana, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster, una célula de conejo, una célula pluripotente, una célula madre embrionaria (ES) o un cigoto. Dichos promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos o promotores específicos de tejido. Dichos promotores pueden ser también, por ejemplo, promotores bidireccionales. Los ejemplos específicos de promotores adecuados incluyen un promotor de la ARN polimerasa III, tal como un promotor U6 humano, un promotor de la polimerasa III U6 de rata o un promotor de la polimerasa III U6 de ratón.

(3) Secuencias de reconocimiento de ARN guía

El término “secuencia de reconocimiento de ARN guía” incluye secuencias de ácido nucleico presentes en un ADN diana (por ejemplo, el gen Fbn1) al que se unirá un segmento de un ARNg dirigido al ADN, siempre que existan condiciones suficientes para la unión. Por ejemplo, las secuencias de reconocimiento de ARN guía incluyen secuencias con las que se diseña un ARN guía para que tenga complementariedad, donde la hibridación entre una secuencia de reconocimiento de ARN guía y una secuencia de direccionamiento de ADN promueve la formación de un complejo CRISPR. No se requiere necesariamente una complementariedad total, siempre que haya suficiente complementariedad para provocar la hibridación y promover la formación de un complejo CRISPR. Las secuencias de reconocimiento de ARN guía también incluyen sitios de escisión para proteínas Cas, que se describen con más detalle a continuación. Una secuencia de reconocimiento de ARN guía puede comprender cualquier polinucleótido, que se puede ubicar, por ejemplo, en el núcleo o citoplasma de una célula o dentro de un orgánulo de una célula, tal como una mitocondria o un cloroplasto.

La secuencia de reconocimiento de ARN guía dentro de un ADN diana puede estar dirigida por (es decir, estar unida a, o hibridarse con, o ser complementaria a) una proteína Cas o un ARNg. Las condiciones de unión de ADN/ARN adecuadas incluyen condiciones fisiológicas normalmente presentes en una célula. Otras condiciones de unión de ADN/ARN adecuadas (por ejemplo, condiciones en un sistema libre de células) se conocen en la técnica. (véase, por ejemplo, Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001). La cadena del ADN diana que es complementaria y se hibrida con la proteína Cas o ARNg se puede denominar “cadena complementaria”, y la cadena del ADN diana que es complementaria de la “cadena complementaria” (y por lo tanto no es complementaria de la proteína Cas o ARNg) se puede denominar “cadena no complementaria” o “cadena de plantilla”.

La proteína Cas puede escindir el ácido nucleico en un sitio dentro o fuera de la secuencia de ácidos nucleicos presente en el ADN diana al que se unirá el segmento de un ARNg dirigido al ADN. El “sitio de escisión” incluye la posición de un ácido nucleico en la que una proteína Cas produce una ruptura de cadena sencilla o una ruptura de cadena doble. Por ejemplo, la formación de un complejo CRISPR (que comprende un ARNg hibridado con una secuencia de reconocimiento de ARN guía y formando un complejo con una proteína Cas) puede dar como resultado la escisión de una o ambas cadenas en o cerca (por ejemplo, dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 o más pares de bases de) la secuencia de ácidos nucleicos presente en un ADN diana al que se unirá un segmento de un ARNg dirigido al ADN. Si el sitio de escisión está fuera de la secuencia de ácidos nucleicos a la que se unirá el segmento dirigido al ADN del ARNg, todavía se considera que el sitio de escisión está dentro de la “secuencia de reconocimiento del ARN guía”. El sitio de escisión puede estar en una sola cadena o en ambas cadenas de un ácido nucleico. Los sitios de escisión pueden estar en la misma posición en ambas cadenas del ácido nucleico (produciendo extremos romos) o pueden estar en diferentes sitios en cada cadena (produciendo extremos escalonados (es decir, salientes)). Se pueden producir extremos escalonados, por ejemplo, al utilizar dos proteínas Cas, cada una de las cuales produce una ruptura de cadena sencilla en un sitio de escisión diferente en una cadena diferente, produciendo de esta manera una ruptura de cadena doble. Por ejemplo, una primera nickasa puede crear una ruptura de cadena sencilla en la primera cadena de ADN de cadena doble (ADNds), y una segunda nickasa puede crear una ruptura de cadena sencilla en la segunda cadena de ADNds de tal manera que se crean secuencias sobresalientes. En algunos casos, la secuencia de reconocimiento de ARN guía de la nickasa en la primera cadena está separada de la secuencia de reconocimiento de ARN guía de la nickasa en la segunda cadena por al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 o 1,000 pares de bases.

La escisión específica del sitio del ADN diana por parte de las proteínas Cas puede ocurrir en ubicaciones determinadas tanto por (i) la complementariedad del emparejamiento de bases entre el ARNg y el ADN diana como (ii) un motivo corto, denominado motivo adyacente protoespaciador (PAM), en el ADN diana. El PAM puede flanquear la secuencia de reconocimiento del ARN guía. Opcionalmente, la secuencia de reconocimiento del ARN guía se puede flanquear en el extremo 3' por el PAM. Alternativamente, la secuencia de reconocimiento del ARN guía se puede flanquear en el extremo 5' por el PAM. Por ejemplo, el sitio de escisión de las proteínas Cas puede ser de aproximadamente 1 a aproximadamente 10 o de aproximadamente 2 a aproximadamente 5 pares de bases (por ejemplo, 3 pares de bases) en dirección ascendente o en dirección descendente de la secuencia de PAM. En algunos casos (por ejemplo, cuando se utiliza Cas9 de S.pyogeneso un Cas9 estrechamente relacionado), la secuencia de PAM de la cadena no complementaria puede ser 5'-NiGG-3', donde Ni es cualquier nucleótido de ADN y está inmediatamente en 3' de la secuencia de reconocimiento del ARN guía de la cadena no complementaria del ADN diana. Como tal, la secuencia de PAM de la cadena complementaria sería 5'-CCN2-3', donde N<2>es cualquier nucleótido de ADN y está inmediatamente en 5' de la secuencia de reconocimiento del ARN guía de la cadena complementaria del ADN diana. En algunos de estos casos, N<1>y N<2>puede ser complementario y el N<1>-N<2>El par de bases puede ser cualquier par de bases (por ejemplo, N<f>C y N<2>=G; N<f>G y N<2>=C; N<f>A y N<2>=T; o N<f>T y N<2>=A). En el caso de Cas9 de S.aureus,el PAM puede ser NNGRRT (SEQ ID NO: 146) o NNGRR (SEQ ID NO: 147), donde N puede ser A, G, C o T, y R puede ser G o A. En algunos casos (por ejemplo, para FnCpfl), la secuencia de PAM puede estar en dirección ascendente del extremo 5' y tener la secuencia 5'-TTN-3'.

Ejemplos de secuencias de reconocimiento de ARN guía incluyen una secuencia de ADN complementaria al segmento dirigido al ADN de un ARNg, o dicha secuencia de ADN además de una secuencia de PAM. Por ejemplo, el motivo diana puede ser una secuencia de ADN de 20 nucleótidos que precede inmediatamente a un motivo NGG reconocido por una proteína Cas9, tal como GN<19>NGG (SEQ ID NO: 39) o N<20>NGG (SEQ ID NO: 40) (véase, por ejemplo, el documento WO 2014/165825). La guanina en el extremo 5' puede facilitar la transcripción mediante la ARN polimerasa en las células. Otros ejemplos de secuencias de reconocimiento de ARN guía pueden incluir dos nucleótidos de guanina en el extremo 5' (por ejemplo, GGN).<20>NGG; SEQ ID NO: 41) para facilitar la transcripción eficiente por la polimerasa T7in vitro.Véase, por ejemplo, el documento WO 2014/065596. Otras secuencias guía de reconocimiento de ARN pueden tener entre 4-22 nucleótidos de longitud de las SEQ ID NOS: 39-41, que incluyen el 5' G o GG y el 3' GG o NGG. Todavía otras secuencias guía de reconocimiento de ARN pueden tener entre 14 y 20 nucleótidos de longitud de las SEQ ID NOS: 39-41.

La secuencia de reconocimiento de ARN guía puede ser cualquier secuencia de ácidos nucleicos endógena o exógena a una célula. La secuencia de reconocimiento de ARN guía puede ser una secuencia que codifica un producto génico (por ejemplo, una proteína) o una secuencia no codificante (por ejemplo, una secuencia reguladora) o puede incluir ambas.

D. Plantillas de reparación exógenas

Los métodos y composiciones divulgados en el presente documento pueden utilizar plantillas de reparación exógenas para modificar un gen Fbn1 después de la escisión del gen Fbn1 con un agente de nucleasa. Por ejemplo, la célula puede ser un embrión en estadio unicelular y la plantilla de reparación exógena puede tener menos de 5 kb de longitud. En tipos de células distintos de los embriones en estadio unicelular, la plantilla de reparación exógena (por ejemplo, vector de dirección) puede ser más larga. Por ejemplo, en tipos de células distintos de los embriones en estadio unicelular, la plantilla de reparación exógena puede ser un vector de direccionamiento grande (LTVEC) como se describe en otra parte del presente documento (por ejemplo, un vector de dirección que tiene una longitud de al menos 10 kb o que tiene 5' y brazos de homología 3' que tienen una suma total de al menos 10 kb). El uso de plantillas de reparación exógenas en combinación con agentes de nucleasas puede dar lugar a modificaciones más precisas dentro del gen Fbn1 al promover la reparación dirigida por homología.

En dichos métodos, el agente de nucleasa escinde el gen Fbn1 para crear una ruptura de cadena sencilla (mella) o una ruptura de cadena doble, y la plantilla de reparación exógena recombina la gen Fbn1 a través de ligadura mediada por unión de extremos no homólogos (NHEJ) o a través de un evento de reparación dirigido por homología. Opcionalmente, la reparación con la plantilla de reparación exógena elimina o interrumpe el sitio de escisión de la nucleasa de tal manera que el agente de nucleasa no pueda volver a dirigir los alelos que han sido dirigidos.

Las plantillas de reparación exógenas pueden comprender ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN), pueden ser de cadena sencilla o de cadena doble y pueden estar en forma lineal o circular. Por ejemplo, una plantilla de reparación exógena puede ser un oligodesoxinucleótido de cadena sencilla (ssODN). Véase, por ejemplo, Yoshimi et al. (2016) Nat. Commun. 7:10431. Una plantilla de reparación exógena de ejemplo tiene entre aproximadamente 50 nucleótidos a aproximadamente 5 kb de longitud, tiene entre aproximadamente 50 nucleótidos a aproximadamente 3 kb de longitud, o tiene entre aproximadamente 50 a aproximadamente 1,000 nucleótidos de longitud. Otras plantillas de reparación exógena de ejemplo tienen entre aproximadamente 40 a aproximadamente 200 nucleótidos de longitud. Por ejemplo, la plantilla de reparación exógena puede tener entre aproximadamente 50 a aproximadamente 60, aproximadamente 60 a aproximadamente 70, aproximadamente 70 a aproximadamente 80, aproximadamente 80 a aproximadamente 90, aproximadamente 90 a aproximadamente 100, aproximadamente 100 a aproximadamente 110, aproximadamente 110 a aproximadamente 120, aproximadamente 120 a aproximadamente 130, aproximadamente 130 a aproximadamente 140, aproximadamente 140 a aproximadamente 150, aproximadamente 150 a aproximadamente 160, aproximadamente 160 a aproximadamente 170, aproximadamente 170 a aproximadamente 180, aproximadamente 180 a aproximadamente 190, o aproximadamente 190 a aproximadamente 200 nucleótidos de longitud. Alternativamente, la plantilla de reparación exógena puede tener entre aproximadamente 50 a aproximadamente 100, aproximadamente 100 a aproximadamente 200, aproximadamente 200 a aproximadamente 300, aproximadamente 300 a aproximadamente 400, aproximadamente 400 a aproximadamente 500, aproximadamente 500 a aproximadamente 600, aproximadamente 600 a aproximadamente 700, aproximadamente 700 a aproximadamente 800, aproximadamente 800 a aproximadamente 900, o aproximadamente 900 a aproximadamente 1,000 nucleótidos de longitud. Alternativamente, la plantilla de reparación exógena puede tener entre aproximadamente 1 kb a aproximadamente 1.5 kb, aproximadamente 1.5 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 2.5 kb, aproximadamente 2.5 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 3.5 kb, aproximadamente 3.5 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 4.5 kb, o aproximadamente 4.5 kb a aproximadamente 5 kb de longitud. Alternativamente, la plantilla de reparación exógena puede tener, por ejemplo, no más de 5 kb, 4.5 kb, 4 kb, 3.5 kb, 3 kb, 2.5 kb, 2 kb, 1.5 kb, 1 kb, 900 nucleótidos, 800 nucleótidos, 700 nucleótidos, 600 nucleótidos, 500 nucleótidos, 400 nucleótidos, 300 nucleótidos, 200 nucleótidos, 100 nucleótidos, o 50 nucleótidos en longitud. En tipos de células distintos de los embriones en estadio unicelular, la plantilla de reparación exógena (por ejemplo, vector de dirección) puede ser más larga. Por ejemplo, en tipos de células distintos de los embriones en estadio unicelular, la plantilla de reparación exógena puede ser un vector de direccionamiento grande (LTVEC) como se describe en otra parte del presente documento.

En un ejemplo, una plantilla de reparación exógena es un ssODN que tiene entre aproximadamente 80 nucleótidos y aproximadamente 200 nucleótidos de longitud. En otro ejemplo, una plantilla de reparación exógena es un ssODN que tiene entre aproximadamente 80 nucleótidos y aproximadamente 3 kb de longitud. Dicho ssODN puede tener brazos de homología, por ejemplo, que tienen cada uno una longitud de entre aproximadamente 40 nucleótidos y aproximadamente 60 nucleótidos. Un ssODN de este tipo también puede tener brazos de homología, por ejemplo, que tienen cada uno entre aproximadamente 30 nucleótidos y 100 nucleótidos de longitud. Los brazos de homología pueden ser simétricos (por ejemplo, cada uno de 40 nucleótidos o cada 60 nucleótidos de longitud) o pueden ser asimétricos (por ejemplo, un brazo de homología de 36 nucleótidos de longitud y un brazo de homología de 91 nucleótidos de longitud).

Las plantillas de reparación exógenas pueden incluir modificaciones o secuencias que proporcionan características deseables adicionales (por ejemplo, estabilidad modificada o regulada; seguimiento o detección con una etiqueta fluorescente; un sitio de unión para una proteína o complejo de proteínas; y así sucesivamente). Las plantillas de reparación exógenas pueden comprender una o más etiquetas fluorescentes, indicadores de purificación, indicadores de epítopos o una combinación de los mismos. Por ejemplo, una plantilla de reparación exógena puede comprender una o más etiquetas fluorescentes (por ejemplo, proteínas fluorescentes u otros fluoróforos o tintes), tales como al menos 1, al menos 2, al menos 3, al menos 4 o al menos 5 etiquetas fluorescentes. Las etiquetas fluorescentes de ejemplo incluyen fluoróforos tales como fluoresceína (por ejemplo, 6-carboxifluoresceína (6-FA<m>)), Rojo Texas, HEX, Cy3, Cy5, Cy5.5, Azul Pacífico, 5-(y-6)-carboxitetrametilrodamina (TAMRA), y Cy7. Hay disponible comercialmente una amplia gama de tintes fluorescentes para etiquetar oligonucleótidos (por ejemplo, de Integrated DNA Technologies). Dichas etiquetas fluorescentes (por ejemplo, etiquetas fluorescentes internas) se pueden utilizar, por ejemplo, para detectar una plantilla de reparación exógena que se ha integrado directamente en un gen Fbn1 escindido que tiene extremos sobresalientes compatibles con los extremos de la plantilla de reparación exógena. La etiqueta o indicador puede estar en el extremo 5', en el extremo 3' o internamente dentro de la plantilla de reparación exógena. Por ejemplo, se puede conjugar una plantilla de reparación exógena en el extremo 5' con el fluoróforo IR700 de Integrated DNA Technologies (5'IRDYE®700).

Las plantillas de reparación exógenas también pueden comprender inserciones de ácido nucleico que incluyen segmentos de ADN para integrarse en el gen Fbn1. La integración de un inserto de ácido nucleico en el gen Fbn1 puede resultar además de una secuencia de ácidos nucleicos de interés en el gen Fbn1, supresión de una secuencia de ácidos nucleicos de interés en el gen Fbn1, o reemplazo de una secuencia de ácidos nucleicos de interés en el gen Fbn1 (es decir, supresión e inserción). Algunas plantillas de reparación exógenas se diseñan para la inserción de un inserto de ácido nucleico en el gen Fbn1 sin ninguna supresión correspondiente en el gen Fbn1. Otras plantillas de reparación exógenas se diseñan para eliminar una secuencia de ácidos nucleicos de interés en el gen Fbn1 sin ninguna inserción correspondiente de un inserto de ácido nucleico. Todavía se diseñan otras plantillas de reparación exógenas para eliminar una secuencia de ácidos nucleicos de interés en el gen Fbn1 y reemplazarlo con un inserto de ácido nucleico.

El inserto de ácido nucleico o el ácido nucleico correspondiente en el gen Fbn1 que se suprime y/o reemplaza puede tener varias longitudes. Un inserto de ácido nucleico de ejemplo o ácido nucleico correspondiente en el gen Fbn1 que se suprime y/o reemplaza tiene entre aproximadamente 1 nucleótido a aproximadamente 5 kb de longitud o tiene entre aproximadamente 1 nucleótido a aproximadamente 1,000 nucleótidos de longitud. Por ejemplo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el gen Fbn1 que se está suprimiendo y/o reemplazando puede tener entre aproximadamente 1 a aproximadamente 10, aproximadamente 10 a aproximadamente 20, aproximadamente 20 a aproximadamente 30, aproximadamente 30 a aproximadamente 40, aproximadamente 40 a aproximadamente 50, aproximadamente 50 a aproximadamente 60, aproximadamente 60 a aproximadamente 70, aproximadamente 70 a aproximadamente 80, aproximadamente 80 a aproximadamente 90, aproximadamente 90 a aproximadamente 100, aproximadamente 100 a aproximadamente 110, aproximadamente 110 a aproximadamente 120, aproximadamente 120 a aproximadamente 130, aproximadamente 130 a aproximadamente 140, aproximadamente 140 a aproximadamente 150, aproximadamente 150 a aproximadamente 160, aproximadamente 160 a aproximadamente 170, aproximadamente 170 a aproximadamente 180, aproximadamente 180 a aproximadamente 190, o aproximadamente 190 a aproximadamente 200 nucleótidos de longitud. Asimismo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el gen Fbn1 que se está suprimiendo y/o reemplazando puede tener entre aproximadamente a aproximadamente 100, aproximadamente 100 a aproximadamente 200, aproximadamente 200 a aproximadamente 300, aproximadamente 300 a aproximadamente 400, aproximadamente 400 a aproximadamente 500, aproximadamente 500 a aproximadamente 600, aproximadamente 600 a aproximadamente 700, aproximadamente 700 a aproximadamente 800, aproximadamente 800 a aproximadamente 900, o aproximadamente 900 a aproximadamente 1,000 nucleótidos de longitud. Asimismo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el gen Fbn1 que se está suprimiendo y/o reemplazando puede tener entre aproximadamente 1 kb a aproximadamente 1.5 kb, aproximadamente 1.5 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 2.5 kb, aproximadamente 2.5 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 3.5 kb, aproximadamente 3.5 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 4.5 kb, o aproximadamente 4.5 kb a aproximadamente 5 kb de longitud. Un ácido nucleico que se suprime del gen Fbn1 también puede tener entre aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 70 kb, aproximadamente 70 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 90 kb, aproximadamente 90 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 600 kb, aproximadamente 600 kb a aproximadamente 700 kb, aproximadamente 700 kb a aproximadamente 800 kb, aproximadamente 800 kb a aproximadamente 900 kb, aproximadamente 900 kb a aproximadamente 1 Mb o más. Alternativamente, un ácido nucleico que se suprime del gen Fbn1 puede tener entre aproximadamente 1 Mb a aproximadamente 1.5 Mb, aproximadamente 1.5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2.5 Mb, aproximadamente 2.5 Mb a aproximadamente 3 Mb, aproximadamente 3 Mb a aproximadamente 4 Mb, aproximadamente 4 Mb a aproximadamente 5 Mb, aproximadamente 5 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb.

El inserto de ácido nucleico puede comprender ADN genómico o cualquier otro tipo de ADN. Por ejemplo, el inserto de ácido nucleico puede ser de un procariota, un eucariota, una levadura, un ave (por ejemplo, pollo), un mamífero no humano, un roedor, un humano, una rata, un ratón, un hámster, un conejo, un cerdo, un bovino, un ciervo, una oveja, una cabra, un gato, un perro, un hurón, un primate (por ejemplo, tití, mono rhesus), un mamífero domesticado, un mamífero agrícola, una tortuga o cualquier otro organismo de interés.

El inserto de ácido nucleico puede comprender una secuencia que es homóloga u ortóloga a todo o parte del gen Fbn1 (por ejemplo, una porción del gen que codifica un motivo o región particular de la proteína fibrilina-1). La secuencia homóloga puede ser de una especie diferente o de la misma especie. Por ejemplo, el inserto de ácido nucleico puede comprender una secuencia que comprende una o más mutaciones puntuales (por ejemplo, 1, 2, 3, 4, 5 o más) en comparación con una secuencia diana para reemplazo en la gen Fbn1. En algunos casos, el inserto de ácido nucleico es una secuencia de Fbn1 humana. Esto puede resultar en la humanización de todo o parte del locus de Fbn1 en el animal no humano si la inserción del inserto de ácido nucleico da como resultado la sustitución total o parcial de la secuencia de ácidos nucleicos no humana de Fbn1 con la correspondiente secuencia de ácidos nucleicos humano ortóloga (es decir, el inserto de ácido nucleico se inserta en lugar de la correspondiente secuencia de ADN no humano en su locus genómico endógeno). La secuencia humana insertada puede comprender además una o más mutaciones en la secuencia humana gen Fbn1.

El inserto de ácido nucleico o el ácido nucleico correspondiente en el gen Fbn1 que se suprime y/o reemplaza puede ser una región codificante tal como un exón; una región no codificante tal como un intrón, una región no traducida o una región reguladora (por ejemplo, un promotor, un potenciador o un elemento de unión a represor transcripcional); o cualquier combinación de los mismos.

El inserto de ácido nucleico también puede comprender un alelo condicional. El alelo condicional puede ser un alelo multifuncional, como se describe en el documento US 2011/0104799. Por ejemplo, el alelo condicional puede comprender: (a) una secuencia de actuación en orientación sentido con respecto a la transcripción de un gen diana; (b) un casete de selección de fármacos (DSC) en orientación sentido o antisentido; (c) una secuencia de nucleótidos de interés (NSI) en orientación antisentido; y (d) un módulo condicional por inversión (COIN, que utiliza un intrón que divide el exón y un módulo invertible similar a una trampa genética) en orientación inversa. Véase, por ejemplo, el documento US 2011/0104799. El alelo condicional puede comprender además unidades recombinables que se recombinan tras la exposición a una primera recombinasa para formar un alelo condicional que (i) carece de la secuencia de activación y del DSC; y (ii) contiene la NSI en orientación sentido y el COIN en orientación antisentido. Véase, por ejemplo, el documento US 2011/0104799.

Los insertos de ácido nucleico también pueden comprender un polinucleótido que codifica un marcador de selección. Alternativamente, los insertos de ácido nucleico pueden carecer de un polinucleótido que codifique un marcador de selección. El marcador de selección puede estar contenido en un casete de selección. Opcionalmente, el casete de selección puede ser un casete de autosupresión. Véase, por ejemplo, los documentos US 8,697,851 y US 2013/0312129. Como ejemplo, el casete de autosupresión puede comprender un gen Crei (comprende dos exones que codifican una recombinasa Cre, que están separados por un intrón) ligado operativamente a un promotorprm lde ratón y un gen de resistencia a la neomicina ligado operativamente a un promotor de ubiquitina humana. Al emplear el promotorprm l,el casete de autosupresión se puede suprimir específicamente en células germinales macho de animales F0. Los marcadores de selección de ejemplo incluyen neomicina fosfotransferasa (neor), higromicina B fosfotransferasa (hygr), puromicina-N-acetiltransferasa (puror), blasticidina S deaminasa (bsrr), xantina/guanina fosforribosil transferasa (gpt), o timidina quinasa del virus del herpes simple (HSV-k), o una combinación de los mismos. El polinucleótido que codifica el marcador de selección se puede ligar operativamente a un promotor activo en una célula a la que se dirige. Ejemplos de promotores se describen en otra parte del presente documento.

El inserto de ácido nucleico también puede comprender un gen informador. Los genes indicadores de ejemplo incluyen aquellos que codifican luciferasa, p-galactosidasa, proteína fluorescente verde (GFP), proteína fluorescente verde potenciada (eGFP), proteína fluorescente cian (CFP), proteína fluorescente amarilla (YFP), proteína fluorescente amarilla potenciada (eYFP), proteína fluorescente azul (BFP), proteína fluorescente azul potenciada (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Red, mOrange, mKO, mCitrine, Venus, YPet, Emerald, CyPet, Cerulean, T- Zafiro y fosfatasa alcalina. Dichos genes indicadores se pueden ligar operativamente a un promotor activo en una célula a la que se dirige. Ejemplos de promotores se describen en otra parte del presente documento.

El inserto de ácido nucleico también puede comprender uno o más casetes de expresión o casetes de supresión. Un casete determinado puede comprender una o más secuencias de nucleótidos de interés, un polinucleótido que codifica un marcador de selección y un gen indicador, junto con diversos componentes reguladores que influyen en la expresión. Ejemplos de marcadores seleccionables y genes indicadores que pueden incluirse se discuten en detalle en otra parte del presente documento.

El inserto de ácido nucleico puede comprender un ácido nucleico flanqueado con secuencias diana de recombinación específicas de sitio. Alternativamente, el inserto de ácido nucleico puede comprender una o más secuencias diana de recombinación específicas de sitio. Aunque todo el inserto de ácido nucleico puede estar flanqueado por dichas secuencias diana de recombinación específicas de sitio, cualquier región o polinucleótido individual de interés dentro del inserto de ácido nucleico también puede estar flanqueado por dichos sitios. Las secuencias diana de recombinación específicas de sitio, que pueden flanquear el inserto de ácido nucleico o cualquier polinucleótido de interés en el inserto de ácido nucleico pueden incluir, por ejemplo, loxP, lox511, lox2272, lox66, lox71, loxM2, lox5171, FRT, FRT11, FRT71, attp, att, FRT, rox o una combinación de los mismos. En un ejemplo, los sitios de recombinación específicos de sitio flanquean un polinucleótido que codifica un marcador de selección y/o un gen indicador contenido dentro del inserto de ácido nucleico. Tras la integración del inserto de ácido nucleico en el gen Fbn1, se pueden eliminar las secuencias entre los sitios de recombinación específicos del sitio. Opcionalmente, se pueden utilizar dos plantillas de reparación exógenas, cada una con un inserto de ácido nucleico que comprende un sitio de recombinación específico del sitio. Las plantillas de reparación exógenas pueden dirigirse a las regiones 5' y 3' que flanquean un ácido nucleico de interés. Tras la integración de los dos insertos de ácido nucleico en el locus genómico diana, se puede eliminar el ácido nucleico de interés entre los dos sitios de recombinación específicos del sitio insertados.

Los insertos de ácido nucleico también pueden comprender uno o más sitios de restricción para endonucleasas de restricción (es decir, enzimas de restricción), que incluyen endonucleasas de tipo I, tipo ll, tipo III y tipo IV. Las endonucleasas de restricción de tipo I y tipo III reconocen secuencias de reconocimiento específicas, pero normalmente se escinden en una posición variable del sitio de unión de la nucleasa, que puede estar a cientos de pares de bases del sitio de escisión (secuencia de reconocimiento). En los sistemas de Tipo II, la actividad de restricción es independiente de cualquier actividad metilasa y la escisión ocurre normalmente en sitios específicos dentro o cerca del sitio de unión. La mayoría de las enzimas de tipo II cortan secuencias palindrómicas, sin embargo, las enzimas de tipo IIa reconocen secuencias de reconocimiento no palindrómicas y las escinden fuera de la secuencia de reconocimiento, las enzimas de tipo IIb cortan secuencias dos veces con ambos sitios fuera de la secuencia de reconocimiento y las enzimas de tipo II reconocen una secuencia de reconocimiento asimétrica y se escinden en un lado y a una distancia definida de aproximadamente 1-20 nucleótidos de la secuencia de reconocimiento. Las enzimas de restricción de tipo IV se dirigen al ADN metilado. Las enzimas de restricción se describen y clasifican con más detalle, por ejemplo, en la base de datos REBASE (página web en rebase.neb.com; Roberts et al., (2003) Nucleic Acids Res. 31:418-420; Roberts et al., (2003) Nucleic Acids Res. 31:1805-1812; y Belfort et al. (2002) in Mobile DNA II, pp. 761-783, Eds. Craigie et al., (A<s>M Press, Washington, DC)).

(1) Plantillas de reparación para inserción mediada por unión de extremos no homólogos

Algunas plantillas de reparación exógenas tienen regiones de cadena sencilla cortas en el extremo 5' y/o en el extremo 3' que son complementarias a uno o más salientes creados por escisión mediada por la proteína Cas en el locus genómico diana (por ejemplo, en el gen Fbn1). Estos salientes también se pueden denominar brazos de homología 5' y 3'. Por ejemplo, algunas plantillas de reparación exógenas tienen regiones de cadena sencilla cortas en el extremo 5' y/o el extremo 3' que son complementarias a uno o más salientes creados por escisión mediada por la proteína Cas en secuencias diana 5' y/o 3' en el locus genómico diana. Algunas de dichas plantillas de reparación exógenas tienen una región complementaria sólo en el extremo 5' o sólo en el extremo 3'. Por ejemplo, algunas de tales plantillas de reparación exógenas tienen una región complementaria sólo en el extremo 5' complementario a un saliente creado en una secuencia diana 5' en el locus genómico diana o sólo en el extremo 3' complementario a un saliente creado en una secuencia diana 3' en el locus genómico diana. Otras plantillas de reparación exógenas de este tipo tienen regiones complementarias en los extremos 5' y 3'. Por ejemplo, otras plantillas de reparación exógenas tienen regiones complementarias en ambos extremos 5' y 3', por ejemplo, complementarias al primer y segundo saliente, respectivamente, generados por escisión mediada por Cas en el locus genómico diana. Por ejemplo, si la plantilla de reparación exógena es de cadena doble, las regiones complementarias de cadena sencilla pueden extenderse desde el extremo 5' de la cadena superior de la plantilla de reparación y el extremo 5' de la cadena inferior de la plantilla de reparación, creando salientes 5' en cada extremo. Alternativamente, la región complementaria de cadena sencilla puede extenderse desde el extremo 3' de la cadena superior de la plantilla de reparación y desde el extremo 3' de la cadena inferior de la plantilla, creando salientes 3'.

Las regiones complementarias pueden tener cualquier longitud suficiente para promover la ligación entre la plantilla de reparación exógena y el gen Fbn1. Las regiones complementarias de ejemplo tienen entre aproximadamente 1 a aproximadamente 5 nucleótidos de longitud, entre aproximadamente 1 a aproximadamente 25 nucleótidos de longitud, o entre aproximadamente 5 a aproximadamente 150 nucleótidos de longitud. Por ejemplo, una región complementaria puede tener al menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 nucleótidos de longitud. Alternativamente, la región complementaria puede tener aproximadamente 5 a aproximadamente 10, aproximadamente 10 a aproximadamente 20, aproximadamente 20 a aproximadamente 30, aproximadamente 30 a aproximadamente 40, aproximadamente 40 a aproximadamente 50, aproximadamente 50 a aproximadamente 60, aproximadamente 60 a aproximadamente 70, aproximadamente 70 a aproximadamente 80, aproximadamente 80 a aproximadamente 90, aproximadamente 90 a aproximadamente 100, aproximadamente 100 a aproximadamente 110, aproximadamente 110 a aproximadamente 120, aproximadamente 120 a aproximadamente 130, aproximadamente 130 a aproximadamente 140, aproximadamente 140 a aproximadamente 150 nucleótidos de longitud, o más largas.

Dichas regiones complementarias pueden ser complementarias de los salientes creados por dos pares de nickasas. Se pueden crear dos rupturas de cadena doble con extremos escalonados al utilizar primera y segunda nickasas que escinden cadenas opuestas de ADN para crear una primera ruptura de cadena doble, y tercera y cuarta nickasas que escinden cadenas opuestas de ADN para crear una segunda ruptura de cadena doble. Por ejemplo, se puede utilizar una proteína Cas para mellar las primera, segunda, tercera y cuarta secuencias de reconocimiento de ARN guía correspondientes con el primero, segundo, tercero y cuarto ARN guía. La primera y segunda secuencias de reconocimiento de ARN guía se pueden posicionar para crear un primer sitio de escisión de tal manera que las mellas creadas por la primera y segunda nickasas en la primera y segunda cadenas de ADN creen una ruptura de cadena doble (es decir, el primer sitio de escisión comprende las mellas dentro de la primera y segunda secuencias de reconocimiento de ARN guía). Asimismo, las secuencias de reconocimiento de a Rn guía tercera y cuarta se pueden posicionar para crear un segundo sitio de escisión de tal manera que las mellas creadas por las nickasas tercera y cuarta en la primera y segunda cadenas de ADN creen una ruptura de cadena doble (es decir, el segundo sitio de escisión comprende las mellas dentro de la tercera y cuarta secuencias de reconocimiento de ARN guía). Preferiblemente, las mellas dentro de la primera y segunda secuencias de reconocimiento de ARN guía y/o la tercera y cuarta secuencias de reconocimiento de ARN guía pueden ser mellas desplazadas que crean salientes. La ventana de compensación puede ser, por ejemplo, al menos aproximadamente 5 pb, 10 pb, 20 pb, 30 pb, 40 pb, 50 pb, 60 pb, 70 pb, 80 pb, 90 pb, 100 pb o más. Véase Ran et al. (2013) Cell 154: 1380-1389; Mali et al. (2013) Nat. Biotech.31:833-838; y Shen et al. (2014) Nat. Methods 11 :399-404. En dichos casos, se puede diseñar una plantilla de reparación exógena de cadena doble con regiones complementarias de cadena sencilla que son complementarias a los salientes creados por las mellas dentro de las secuencias de reconocimiento de ARN guía primera y segunda y por las mellas dentro de la tercera y cuarta secuencias de reconocimiento de ARN guía. Dicha plantilla de reparación exógena se puede insertar luego mediante ligadura mediada por unión de extremos no homólogos.

(2) Plantillas de reparación para inserción mediante reparación dirigida por homología

Algunas plantillas de reparación exógenas comprenden brazos de homología. Si la plantilla de reparación exógena también comprende un inserto de ácido nucleico, los brazos de homología pueden flanquear el inserto de ácido nucleico. Para facilitar la referencia, los brazos de homología se denominan en el presente documento brazos de homología 5' y 3' (es decir, en dirección ascendente y en dirección descendente). Esta terminología se refiere a la posición relativa de los brazos de homología con respecto al inserto de ácido nucleico dentro de la plantilla de reparación exógena. Los brazos de homología 5' y 3' corresponden a regiones dentro del gen Fbn1, que se denominan en el presente documento “secuencia diana 5'” y “secuencia diana 3'”, respectivamente.

Un brazo de homología y una secuencia diana “corresponden” o “que corresponden” entre sí cuando las dos regiones comparten un nivel suficiente de identidad de secuencia entre sí para actuar como sustratos para una reacción de recombinación homóloga. El término “homología” incluye secuencias de ADN que son idénticas o comparten identidad de secuencia con una secuencia correspondiente. La identidad de secuencia entre una secuencia diana determinada y el brazo de homología correspondiente encontrado en la plantilla de reparación exógena puede ser cualquier grado de identidad de secuencia que permita que se produzca la recombinación homóloga. Por ejemplo, la cantidad de identidad de secuencia compartida por el brazo de homología de la plantilla de reparación exógena (o un fragmento de la misma) y la secuencia diana (o un fragmento de la misma) puede ser al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia, de tal manera que las secuencias experimenten recombinación homóloga. Más aún, una región correspondiente de homología entre el brazo de homología y la secuencia diana correspondiente puede tener cualquier longitud que sea suficiente para promover la recombinación homóloga. Los brazos de homología de ejemplo tienen entre aproximadamente 25 nucleótidos a aproximadamente 2.5 kb de longitud, are entre aproximadamente 25 nucleótidos a aproximadamente 1.5 kb de longitud, o tienen entre aproximadamente 25 a aproximadamente 500 nucleótidos de longitud. Por ejemplo, un brazo de homología determinado (o cada uno de los brazos de homología) y/o la secuencia diana correspondiente pueden comprender regiones de homología correspondientes que tienen entre aproximadamente 25 a aproximadamente 30, aproximadamente 30 a aproximadamente 40, aproximadamente 40 a aproximadamente 50, aproximadamente 50 a aproximadamente 60, aproximadamente 60 a aproximadamente 70, aproximadamente 70 a aproximadamente 80, aproximadamente 80 a aproximadamente 90, aproximadamente 90 a aproximadamente 100, aproximadamente 100 a aproximadamente 150, aproximadamente 150 a aproximadamente 200, aproximadamente 200 a aproximadamente 250, aproximadamente 250 a aproximadamente 300, aproximadamente 300 a aproximadamente 350, aproximadamente 350 a aproximadamente 400, aproximadamente 400 a aproximadamente 450, o aproximadamente 450 a aproximadamente 500 nucleótidos de longitud, de tal manera que los brazos de homología tengan homología suficiente para experimentar recombinación homóloga con las secuencias diana correspondientes dentro del gen Fbn1. Alternativamente, un brazo de homología determinado (o cada brazo de homología) y/o la secuencia diana correspondiente pueden comprender regiones de homología correspondientes que tienen entre aproximadamente 0.5 kb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 1.5 kb, aproximadamente 1.5 kb a aproximadamente 2 kb, o aproximadamente 2 kb a aproximadamente 2.5 kb de longitud. Por ejemplo, los brazos de homología pueden tener cada uno de ellos aproximadamente 750 nucleótidos de longitud. Los brazos de homología pueden ser simétricos (cada uno aproximadamente del mismo tamaño en longitud) o pueden ser asimétricos (uno más largo que el otro).

Los brazos de homología pueden corresponder a un locus que es nativo de una célula (por ejemplo, el locus dirigido). Alternativamente, por ejemplo, pueden corresponder a una región de un segmento de ADN heterólogo o exógeno que se integró en el genoma de la célula, que incluye, por ejemplo, transgenes, casetes de expresión o regiones de a Dn heterólogas o exógenas. Alternativamente, los brazos de homología del vector de direccionamiento pueden corresponder a una región de un cromosoma artificial de levadura (YAC), un cromosoma artificial bacteriano (BAC), un cromosoma artificial humano o cualquier otra región modificada genéticamente contenida en una célula huésped apropiada. Aún más, los brazos de homología del vector de direccionamiento pueden corresponder o derivarse de una región de una biblioteca BAC, una biblioteca de cósmidos o una biblioteca de fagos P1, o se pueden derivar de ADN sintético.

Cuando se utiliza un agente de nucleasa en combinación con una plantilla de reparación exógena, las secuencias diana 5' y 3' se ubican preferiblemente en suficiente proximidad al sitio de escisión de la nucleasa para promover la aparición de un evento de recombinación homóloga entre las secuencias diana y los brazos de homología sobre una ruptura de cadena sencilla (mella) o una ruptura de cadena doble en el sitio de escisión de la nucleasa. El término “sitio de escisión de nucleasa” incluye una secuencia de ADN en la que un agente de nucleasa (por ejemplo, una proteína Cas9 forma un complejo con un ARN guía) crea una mella o ruptura de cadena doble. Las secuencias diana dentro del gen Fbn1 que corresponden a los brazos de homología 5' y 3' de la plantilla de reparación exógena están “ubicados lo suficientemente cerca” de un sitio de escisión de nucleasa si la distancia es tal que promueve la aparición de un evento de recombinación homóloga entre las secuencias diana 5' y 3' y los brazos de homología tras una ruptura de cadena sencilla o una ruptura de cadena doble en el sitio de escisión de la nucleasa. Por lo tanto, las secuencias diana correspondientes a los brazos de homología 5' y/o 3' de la plantilla de reparación exógena pueden estar, por ejemplo, dentro de al menos 1 nucleótido de un sitio de escisión de nucleasa determinado o dentro de al menos 10 nucleótidos a aproximadamente 1,000 nucleótidos de un sitio de escisión de nucleasa determinado. Como ejemplo, el sitio de escisión de la nucleasa puede estar inmediatamente adyacente a al menos una o ambas secuencias diana.

La relación espacial de las secuencias diana que corresponden a los brazos de homología de la plantilla de reparación exógena y el sitio de escisión de la nucleasa puede variar. Por ejemplo, las secuencias diana se pueden ubicar en 5' con respecto al sitio de escisión de la nucleasa, las secuencias diana se pueden ubicar en 3' con respecto al sitio de escisión de la nucleasa, o las secuencias diana pueden flanquear el sitio de escisión de la nucleasa.

En células distintas de los embriones en estadio unicelular, la plantilla de reparación exógena puede ser un “vector de direccionamiento grande” o “LTVEC”, que incluye vectores de direccionamiento que comprenden brazos de homología que corresponden y se derivan de secuencias de ácido nucleico más grandes que las utilizadas normalmente. por otros enfoques destinados a realizar recombinación homóloga en células. Los LTVEC también incluyen vectores de direccionamiento que comprenden inserciones de ácido nucleico que tienen secuencias de ácido nucleico más grandes que las utilizadas normalmente por otros enfoques destinados a realizar recombinación homóloga en células. Por ejemplo, los LTVEC hacen posible la modificación de loci grandes que no pueden adaptarse a los vectores de direccionamiento tradicionales basados en plásmidos debido a sus limitaciones de tamaño. Por ejemplo, el locus dirigido puede ser (es decir, los brazos de homología 5' y 3' pueden corresponder a) un locus de la célula que no puede ser dirigible utilizando un método convencional o que se puede dirigir sólo incorrectamente o sólo con una eficiencia significativamente baja en la ausencia de una mella o ruptura de cadena doble inducida por un agente de nucleasa (por ejemplo, una proteína Cas).

Los ejemplos de LTVEC incluyen vectores derivados de un cromosoma artificial bacteriano (BAC), un cromosoma artificial humano o un cromosoma artificial de levadura (YAC). Se describen ejemplos no limitantes de LTVEC y métodos para prepararlos, por ejemplo, en las Patentes de EE. UU. Nos. 6,586,251; 6,596,541; y 7,105,348; y en el documento WO 2002/036789. Los LTVEC pueden tener forma lineal o circular.

Los LTVEC pueden tener cualquier longitud y normalmente tienen al menos 10 kb de longitud. Por ejemplo, un LTVEC puede ser desde aproximadamente 50 kb hasta aproximadamente 300 kb, desde aproximadamente 50 kb hasta aproximadamente 75 kb, desde aproximadamente 75 kb hasta aproximadamente 100 kb, desde aproximadamente 100 kb hasta 125 kb, desde aproximadamente 125 kb hasta aproximadamente 150 kb, desde aproximadamente 150 kb hasta aproximadamente 175 kb, aproximadamente 175 kb a aproximadamente 200 kb, desde aproximadamente 200 kb hasta aproximadamente 225 kb, desde aproximadamente 225 kb hasta aproximadamente 250 kb, desde aproximadamente 250 kb hasta aproximadamente 275 kb o desde aproximadamente 275 kb hasta aproximadamente 300 kb. Alternativamente, un LTVEC puede tener al menos 10 kb, al menos 15 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb o más. El tamaño de un LTVEC puede ser demasiado grande para permitir el cribado de eventos dirigidos mediante ensayos convencionales, por ejemplo, transferencia Southern y PCR de largo alcance (por ejemplo, de 1 kb a 5 kb).

La suma total del brazo de homología 5' y el brazo de homología 3' en un LTVEC normalmente es de al menos 10 kb. Como un ejemplo, el brazo de homología 5' puede variar de aproximadamente 5 kb a aproximadamente 100 kb y/o el brazo de homología 3' puede variar desde aproximadamente 5 kb hasta aproximadamente 100 kb. Cada brazo de homología puede tener, por ejemplo, desde aproximadamente 5 kb hasta aproximadamente 10 kb, desde aproximadamente 10 kb hasta aproximadamente 20 kb, desde aproximadamente 20 kb hasta aproximadamente 30 kb, desde aproximadamente 30 kb hasta aproximadamente 40 kb, desde aproximadamente 40 kb hasta aproximadamente 50 kb, desde aproximadamente 50 kb hasta aproximadamente 60 kb, desde aproximadamente 60 kb hasta aproximadamente 70 kb, desde aproximadamente 70 kb hasta aproximadamente 80 kb, desde aproximadamente 80 kb hasta aproximadamente 90 kb, desde aproximadamente 90 kb hasta aproximadamente 100 kb, desde aproximadamente 100 kb hasta aproximadamente 110 kb, desde aproximadamente 110 kb hasta aproximadamente 120 kb, desde aproximadamente 120 kb hasta aproximadamente 130 kb, desde aproximadamente 130 kb hasta aproximadamente 140 kb, desde aproximadamente 140 kb hasta aproximadamente 150 kb, desde aproximadamente 150 kb hasta aproximadamente 160 kb, desde aproximadamente 160 kb hasta aproximadamente 170 kb, desde aproximadamente 170 kb hasta aproximadamente 180 kb, desde aproximadamente 180 kb hasta aproximadamente 190 kb, o desde aproximadamente 190 kb hasta aproximadamente 200 kb. La suma total de los brazos de homología 5' y 3' pueden tener, por ejemplo, desde aproximadamente 10 kb hasta aproximadamente 20 kb, desde aproximadamente 20 kb hasta aproximadamente 30 kb, desde aproximadamente 30 kb hasta aproximadamente 40 kb, desde aproximadamente 40 kb hasta aproximadamente 50 kb, desde aproximadamente 50 kb hasta aproximadamente 60 kb, desde aproximadamente 60 kb hasta aproximadamente 70 kb, desde aproximadamente 70 kb hasta aproximadamente 80 kb, desde aproximadamente 80 kb hasta aproximadamente 90 kb, desde aproximadamente 90 kb hasta aproximadamente 100 kb, desde aproximadamente 100 kb hasta aproximadamente 110 kb, desde aproximadamente 110 kb hasta aproximadamente 120 kb, desde aproximadamente 120 kb hasta aproximadamente 130 kb, desde aproximadamente 130 kb hasta aproximadamente 140 kb, desde aproximadamente 140 kb hasta aproximadamente 150 kb, desde aproximadamente 150 kb hasta aproximadamente 160 kb, desde aproximadamente 160 kb hasta aproximadamente 170 kb, desde aproximadamente 170 kb hasta aproximadamente 180 kb, desde aproximadamente 180 kb hasta aproximadamente 190 kb, o desde aproximadamente 190 kb hasta aproximadamente 200 kb. Alternativamente, cada brazo de homología puede tener al menos 5 kb, al menos 10 kb, al menos 15 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, o al menos 200 kb. Asimismo, la suma total de los brazos de homología 5' y 3' puede tener al menos 10 kb, al menos 15 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, o al menos 200 kb.

Los LTVEC pueden comprender inserciones de ácido nucleico que tienen secuencias de ácido nucleico más grandes que las utilizadas normalmente por otros enfoques destinados a realizar recombinación homóloga en células. Por ejemplo, un LTVEC puede comprender un inserto de ácido nucleico que varía desde aproximadamente 5 kb hasta aproximadamente 10 kb, desde aproximadamente 10 kb hasta aproximadamente 20 kb, desde aproximadamente 20 kb hasta aproximadamente 40 kb, desde aproximadamente 40 kb hasta aproximadamente 60 kb, desde aproximadamente 60 kb hasta aproximadamente 80 kb, desde aproximadamente 80 kb hasta aproximadamente 100 kb, desde aproximadamente 100 kb hasta aproximadamente 150 kb, desde aproximadamente 150 kb hasta aproximadamente 200 kb, desde aproximadamente 200 kb hasta aproximadamente 250 kb, desde aproximadamente 250 kb hasta aproximadamente 300 kb, desde aproximadamente 300 kb hasta aproximadamente 350 kb, desde aproximadamente 350 kb hasta aproximadamente 400 kb, o más.

E. Poner en contacto el genoma de una célula e introducir ácidos nucleicos en las células

Poner en contacto el genoma de una célula puede comprender introducir uno o más agentes de nucleasa o ácidos nucleicos que codifican agentes de nucleasa (por ejemplo, una o más proteínas Cas o ácidos nucleicos que codifican una o más proteínas Cas, y uno o más ARN guía o ácidos nucleicos que codifican una o más más ARN guía (es decir, uno o más ARN CRISPR y uno o más ARNtracr)) y/o una o más plantillas de reparación exógenas en la célula, siempre que si la célula es un embrión en estadio unicelular, por ejemplo, la plantilla de reparación exógena tener menos de 5 kb de longitud. Poner en contacto el genoma de una célula (es decir, poner en contacto una célula) puede comprender introducir sólo uno de los componentes anteriores, uno o más de los componentes, o todos los componentes en la célula. “ Introducir” incluye presentar a la célula el ácido nucleico o la proteína de tal manera que la secuencia obtenga acceso al interior de la célula. La introducción se puede lograr por cualquier medio, y uno o más de los componentes (por ejemplo, dos de los componentes, o todos los componentes) se pueden introducir en la célula de manera simultánea o secuencial en cualquier combinación. Por ejemplo, se puede introducir una plantilla de reparación exógena antes de la introducción de un agente de nucleasa, o se puede introducir después de la introducción del agente de nucleasa (por ejemplo, la plantilla de reparación exógena se puede administrar aproximadamente 1, 2, 3, 4, 8, 12, 24, 36, 48 o 72 horas antes o después de la introducción del agente de nucleasa). Véase, por ejemplo, los documento US 2015/0240263 y US 2015/0110762.

Un agente de nucleasa se puede introducir en la célula en forma de una proteína o en forma de un ácido nucleico que codifica el agente de nucleasa, tal como un ARN (por ejemplo, ARN mensajero (ARNm)) o ADN. Cuando se introduce en forma de ADN, el ADN se puede ligar operativamente a un promotor activo en la célula. Dichos ADN pueden estar en una o más construcciones de expresión.

Por ejemplo, se puede introducir una proteína Cas en la célula en forma de una proteína, tal como una proteína Cas complejada con un ARNg, o en forma de un ácido nucleico que codifica la proteína Cas, tal como un ARN (por ejemplo, ARN mensajero (ARNm)) o ADN. Un ARN guía se puede introducir en la célula en forma de ARN o en forma de ADN que codifique el ARN guía. Cuando se introduce en forma de ADN, el ADN que codifica la proteína Cas y/o el ARN guía se puede ligar operativamente a un promotor activo en la célula. Dichos ADN pueden estar en una o más construcciones de expresión. Por ejemplo, dichas construcciones de expresión pueden ser componentes de una única molécula de ácido nucleico. Alternativamente, se pueden separar en cualquier combinación entre dos o más moléculas de ácido nucleico (es decir, los ADN que codifican uno o más ARN CRISPR, los ADN que codifican uno o más ARNtracr y el ADN que codifica una proteína Cas pueden ser componentes de moléculas de ácido nucleico separadas).

En algunos métodos, el ADN que codifica un agente de nucleasa (por ejemplo, una proteína Cas y un ARN guía) y/o el ADN que codifica una plantilla de reparación exógena se puede introducir en una célula a través de minicírculos de ADN. Véase, por ejemplo, el documento WO 2014/182700. Los minicírculos de ADN son moléculas de ADN superenrolladas que se pueden utilizar para la transferencia de genes no virales y que no tienen un origen de replicación ni un marcador de selección de antibióticos. Por tanto, los minicírculos de ADN normalmente son de menor tamaño que el vector plasmídico. Estos ADN carecen de ADN bacteriano y, por tanto, carecen de los motivos CpG no metilados que se encuentran en el ADN bacteriano.

Los métodos proporcionados en el presente documento no dependen de un método particular para introducir un ácido nucleico o proteína en la célula, solo que el ácido nucleico o proteína obtenga acceso al interior de al menos una célula. Se conocen en la técnica métodos para introducir ácidos nucleicos y proteínas en diversos tipos de células e incluyen, por ejemplo, métodos de transfección estable, métodos de transfección transitoria y métodos mediados por virus.

Los protocolos de transfección así como los protocolos para introducir ácidos nucleicos o proteínas en las células pueden variar. Los métodos de transfección no limitantes incluyen métodos de transfección basados en productos químicos que utilizan liposomas; nanopartículas; Fosfato de calcio (Graham et al. (1973) Virology 52 (2): 456-67, Bacchetti et al. (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590-4, y Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W. H. Freeman and Company. pp. 96-97); dendrímeros; o polímeros catiónicos tales como DEAE-dextrano o polietilenimina. Los métodos no químicos incluyen electroporación, sonoporación y transfección óptica. La transfección basada en partículas incluye el uso de una pistola genética o transfección asistida por imán ((Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). También se pueden utilizar métodos virales para la transfección.

La introducción de ácidos nucleicos o proteínas en una célula también puede estar mediada por electroporación, por inyección intracitoplasmática, por infección viral, por adenovirus, por virus adenoasociados, por lentivirus, por retrovirus, por transfección, por transfección mediada por lípidos o por nucleofección. La nucleofección es una tecnología de electroporación mejorada que permite que los sustratos de ácidos nucleicos se suministren no solo al citoplasma sino también a través de la membrana nuclear y al núcleo. Además, el uso de nucleofección en los métodos divulgados en el presente documento normalmente requiere muchas menos células que la electroporación regular (por ejemplo, sólo aproximadamente 2 millones en comparación con 7 millones mediante electroporación regular). En un ejemplo, la nucleofección se realiza utilizando el sistema LONZA.® NUCLEOFECTOR™.

La introducción de ácidos nucleicos o proteínas en una célula (por ejemplo, un embrión en estadio unicelular) también se puede lograr mediante microinyección. En embriones en estadio unicelular, la microinyección puede realizarse en el pronúcleo materno y/o paterno o en el citoplasma. Si la microinyección es en un solo pronúcleo, es preferible el pronúcleo paterno debido a su mayor tamaño. Microinyección de un ARNm preferiblemente en el citoplasma (por ejemplo, para suministrar ARNm directamente a la maquinaria de traducción), mientras que la microinyección de una proteína o un ADN que codifica un ADN que codifica una proteína Cas se realiza preferiblemente en el núcleo/pronúcleo. Alternativamente, la microinyección se puede llevar a cabo mediante inyección tanto en el núcleo/pronúcleo como en el citoplasma: primero se puede introducir una aguja en el núcleo/pronúcleo y se puede inyectar una primera cantidad, y mientras se retira la aguja del embrión en estadio unicelular se puede inyectar una segunda cantidad en el citoplasma. Si se inyecta una proteína de agente de nucleasa en el citoplasma, la proteína comprende preferiblemente una señal de localización nuclear para asegurar el suministro al núcleo/pronúcleo. Los métodos para llevar a cabo la microinyección son bien conocidos. Véase, por ejemplo Nagy et al. (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Meyer et al. (2010) Proc. Natl. Acad. Sci. USA 107: 15022-15026 y Meyer et al. (2012) Proc. Natl. Acad. Sci. USA 109:9354-9359.

Otros métodos para introducir ácido nucleico o proteínas en una célula pueden incluir, por ejemplo, suministro mediante vectores, suministro mediado por partículas, suministro mediado por exosomas, suministro mediado por nanopartículas lipídicas, suministro mediado por péptidos que penetran células o suministro mediado por dispositivos implantables.

La introducción de ácidos nucleicos o proteínas en la célula se puede realizar una o varias veces durante un período de tiempo. Por ejemplo, la introducción se puede realizar al menos dos veces durante un período de tiempo, al menos tres veces durante un período de tiempo, al menos cuatro veces durante un período de tiempo, al menos cinco veces durante un período de tiempo, al menos seis veces durante un período de tiempo, al menos siete veces durante un período de tiempo, al menos ocho veces durante un período de tiempo, al menos nueve veces durante un período de tiempo, al menos diez veces durante un período de tiempo, al menos once veces, al menos doce veces durante un período de tiempo, al menos trece veces durante un período de tiempo, al menos catorce veces durante un período de tiempo, al menos quince veces durante un período de tiempo, al menos dieciséis veces durante un período de tiempo, al menos diecisiete veces durante un período de tiempo, al menos dieciocho veces durante un período de tiempo, al menos diecinueve veces durante un período de tiempo, o al menos veinte veces durante un período de tiempo.

En algunos casos, las células empleadas en los métodos y composiciones tienen una construcción de ADN incorporada de manera estable en su genoma. En dichos casos, el contacto puede comprender proporcionar a una célula la construcción ya incorporada de manera estable en su genoma. Por ejemplo, una célula empleada en los métodos divulgados en el presente documento puede tener un gen que codifica Cas preexistente incorporado de manera estable en su genoma (es decir, una célula lista para Cas). “ Incorporado de manera estable” o “ introducido de manera estable” o “ integrado de manera estable” incluye la introducción de un polinucleótido en la célula de tal manera que la secuencia de nucleótidos se integre en el genoma de la célula y sea capaz de ser heredada por la descendencia del mismo. Se puede utilizar cualquier protocolo para la incorporación estable de las construcciones de ADN o los diversos componentes del sistema de integración genómica dirigida.

F. Tipos de modificaciones genéticas dirigidas

Se pueden introducir varios tipos de modificaciones genéticas dirigidas utilizando los métodos descritos en el presente documento. Dichas modificaciones dirigidas pueden incluir, por ejemplo, adiciones de uno o más nucleótidos, supresiones de uno o más nucleótidos, sustituciones de uno o más nucleótidos, una mutación puntual, una inactivación de un polinucleótido de interés o una porción del mismo, una activación de un polinucleótido de interés o una porción del mismo, un reemplazo de una secuencia de ácidos nucleicos endógena por una secuencia de ácidos nucleicos heteróloga, exógena, homóloga u ortóloga, un intercambio de dominio, un intercambio de exón, un intercambio de intrón, un intercambio de secuencia reguladora, un intercambio de genes, o una combinación de los mismos. Por ejemplo, se pueden cambiar (por ejemplo, eliminar, insertar o sustituir) al menos 1, 2, 3, 4, 5, 7, 8, 9, 10 o más nucleótidos para formar la modificación genómica dirigida. Las supresiones, inserciones o reemplazos pueden ser de cualquier tamaño, como se divulga en otra parte del presente documento. Véase, por ejemplo, Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) PLOS ONE 7:e45768: 1-9; y Wang et al. (2013) Nat Biotechnol. 31:530-532.

Dichas modificaciones genéticas dirigidas pueden dar como resultado la interrupción de un locus genómico diana, pueden introducir mutaciones que provocan enfermedades o alelos que provocan enfermedades, pueden dar como resultado la humanización de un locus genómico diana (es decir, el reemplazo de una secuencia de ácidos nucleicos no humana con secuencia de ácidos nucleicos humana homóloga u ortóloga), puede crear alelos condicionales, etc. La interrupción puede incluir la alteración de un elemento regulador (por ejemplo, promotor o potenciador), una mutación con cambio de sentido, una mutación sin sentido, una mutación por desplazamiento del marco de lectura, una mutación de truncamiento, una mutación nula o una inserción o supresión de un pequeño número de nucleótidos (por ejemplo, que provoca una mutación por desplazamiento del marco de lectura), y puede resultar en inactivación (es decir, pérdida de función) o pérdida de un alelo.

La modificación genética dirigida puede ser, por ejemplo, una modificación bialélica o una modificación monoalélica. Preferiblemente, la modificación genética dirigida es una modificación monoalélica. Las modificaciones bialélicas incluyen eventos en los que se realiza la misma modificación en el mismo locus en los cromosomas homólogos correspondientes (por ejemplo, en una célula diploide), o en los que se realizan diferentes modificaciones en el mismo locus en los cromosomas homólogos correspondientes. En algunos métodos, la modificación genética dirigida es una modificación monoalélica. Una modificación monoalélica incluye eventos en los que se realiza una modificación en un solo alelo (es decir, una modificación del gen Fbn1 en sólo uno de los dos cromosomas homólogos). Los cromosomas homólogos incluyen cromosomas que tienen los mismos genes en los mismos loci pero posiblemente alelos diferentes (por ejemplo, cromosomas que se emparejan durante la meiosis). El término alelo incluye cualquiera de una o más formas alternativas de una secuencia genética. En una célula u organismo diploide, los dos alelos de una secuencia determinada normalmente ocupan loci correspondientes en un par de cromosomas homólogos.

Una mutación monoalélica puede dar como resultado una célula que es heterocigota para la modificación de Fbn1 dirigida. La heterocigosidad incluye situaciones en las que solo un alelo del gen Fbn1 (es decir, los alelos correspondientes en ambos cromosomas homólogos) tienen la modificación dirigida.

Una modificación bialélica puede dar como resultado homocigosidad para una modificación dirigida. La homocigosidad incluye situaciones en las que ambos alelos del gen Fbn1 (es decir, los alelos correspondientes en ambos cromosomas homólogos) tienen la modificación dirigida. Por ejemplo, la modificación bialélica se puede generar cuando una proteína Cas escinde un par de primer y segundo cromosomas homólogos dentro de una primera secuencia de reconocimiento de ARN guía (es decir, en un primer sitio de escisión dentro de la primera secuencia de reconocimiento de ARN guía), generando de este modo secuencias de extremo en el primer y segundo cromosomas homólogos. Las secuencias finales en cada uno de los cromosomas homólogos primero y segundo pueden experimentar entonces un proceso de reparación mediado por una plantilla de reparación exógena para formar un genoma con una modificación bialélica que comprende la modificación genética dirigida. Por ejemplo, si la plantilla de reparación exógena comprende un inserto de ácido nucleico, el inserto de ácido nucleico se puede insertar en el gen Fbn1 en el par de primero y segundo cromosomas homólogos, dando como resultado un genoma modificado homocigótico.

Alternativamente, una modificación bialélica puede dar como resultado una heterocigosidad del compuesto (por ejemplo, hemicigosidad) para la modificación dirigida. La heterocigosidad compuesta incluye situaciones en las que ambos alelos del locus diana (es decir, los alelos de ambos cromosomas homólogos) se han modificado, pero se han modificado de diferentes maneras (por ejemplo, una modificación dirigida en un alelo y la inactivación o interrupción del otro alelo). Por ejemplo, en el alelo sin la modificación dirigida, una ruptura de cadena doble creada por la proteína Cas puede haber sido reparada mediante reparación del ADN mediada por unión de extremos no homólogos (NHEJ), que genera un alelo mutante que comprende una inserción o una supresión de una secuencia de ácidos nucleicos y por lo tanto provoca la interrupción de ese locus genómico. Por ejemplo, una modificación bialélica puede resultar en la heterocigosidad compuesta si la célula tiene un alelo con la modificación dirigida y otro alelo que no es capaz de expresarse. La heterocigosidad compuesta incluye la hemicigosidad. La hemicigosidad incluye situaciones en las que sólo está presente un alelo (es decir, un alelo en uno de dos cromosomas homólogos) del locus diana. Por ejemplo, una modificación bialélica puede dar como resultado hemicigosidad para una modificación dirigida si la modificación dirigida ocurre en un alelo con la correspondiente pérdida o supresión del otro alelo.

G. Identificación de células con modificaciones genéticas dirigidas

Los métodos divulgados en el presente documento pueden comprender además identificar una célula que tiene un gen Fbn1 modificado. Se pueden utilizar varios métodos para identificar células que tienen una modificación genética dirigida, tal como una supresión o una inserción. Dichos métodos pueden comprender identificar una célula que tiene la modificación genética dirigida en el gen Fbn1. Se puede realizar un cribado para identificar dichas células con loci genómicos modificados.

La etapa de cribado puede comprender un ensayo cuantitativo para evaluar la modificación del alelo (MOA) (por ejemplo, ensayos de pérdida de alelo (LOA) y/o ganancia de alelo (GOA)) de un cromosoma parental. Por ejemplo, el ensayo cuantitativo se puede llevar a cabo a través de una PCR cuantitativa, tal como una PCR en tiempo real (qPCR). La PCR en tiempo real puede utilizar un primer conjunto de cebadores que reconoce el locus genómico diana y un segundo conjunto de cebadores que reconoce un locus de referencia no dirigido. El conjunto de cebadores puede comprender una sonda fluorescente que reconoce la secuencia amplificada.

La etapa de cribado también puede comprender un ensayo de retención, que es un ensayo utilizado para distinguir entre inserciones dirigidas correctas de un inserto de ácido nucleico en un locus genómico diana de inserciones transgénicas aleatorias del inserto de ácido nucleico en ubicaciones genómicas fuera del locus genómico diana. Los ensayos convencionales para cribar modificaciones específicas, como la PCR de largo alcance o la transferencia Southern, vinculan el vector de direccionamiento insertado al locus dirigido. Sin embargo, debido a los grandes tamaños de sus brazos de homología, los LTVEC no permiten el cribado mediante dichos ensayos convencionales. Para cribar el direccionamiento de LTVEC, se pueden utilizar ensayos de modificación de alelos (MOA), que incluyen ensayos de pérdida de alelos (LOA) y ganancia de alelos (GOA). (véase, por ejemplo, el documento US 2014/0178879 y Frendewey et al. (2010) Methods Enzymol. 476:295-307). El ensayo de pérdida de alelo (LOA) invierte la lógica de cribado convencional y cuantifica el número de copias del locus nativo al que se dirigió la mutación. En un clon celular dirigido correctamente, el ensayo LOA detecta uno de los dos alelos nativos (para genes que no están en el cromosoma X o Y), siendo el otro alelo se interrumpe por la modificación dirigida. El mismo principio se puede aplicar a la inversa como un ensayo de ganancia de alelo (GOA) para cuantificar el número de copias del vector de direccionamiento insertado. Por ejemplo, el uso combinado de ensayos GOA y LOA revelará que un clon heterocigoto dirigido correctamente ha perdido una copia del gen diana nativo y ha ganado una copia del gen de resistencia a fármacos u otro marcador insertado.

Como ejemplo, se puede utilizar la reacción en cadena de la polimerasa cuantitativa (qPCR) como método de cuantificación de alelos, pero se puede utilizar cualquier método que pueda distinguir de manera confiable la diferencia entre cero, una y dos copias del gen diana o entre cero, una y dos copias del inserto de ácido nucleico para desarrollar un ensayo MOA. Por ejemplo TAQMAN® se puede utilizar para cuantificar el número de copias de una plantilla de ADN en una muestra de ADN genómico, especialmente en comparación con un gen de referencia (véase, por ejemplo, el documento US 6,596,541). El gen de referencia se cuantifica en el mismo ADN genómico que el(los) gen(es) o locus (loci) diana. Por lo tanto, se realizan dos amplificaciones TAQMAN® (cada una con su respectiva sonda). Una sonda TAQMAN® determina el “Ct” (ciclo de umbral) del gen de referencia, mientras que la otra sonda determina el Ct de la región del(los) gen(es) o locus (loci) dirigido(s) que se reemplaza(n) por un direccionamiento exitoso (es decir, un ensayo LOA). El Ct es una cantidad que refleja la cantidad de ADN inicial para cada una de las sondas TAQMAN®, es decir, una secuencia menos abundante requiere más ciclos de PCR para alcanzar el ciclo umbral. Disminuir a la mitad el número de copias de la secuencia plantilla para una reacción TAQMAN® dará como resultado un aumento de aproximadamente una unidad Ct. Las reacciones TAQMAN® en células donde un alelo del(los) gen(es) o locus (loci) diana se ha reemplazado por recombinación homóloga darán como resultado un aumento de un Ct para la reacción TAQMAN® diana sin un aumento en el Ct para el gen de referencia cuando se compara con el ADN de células no dirigidas. Para un ensayo GOA, otra sonda TAQMAN® se puede utilizar para determinar el Ct del inserto de ácido nucleico que está reemplazando del(los) gen(es) o locus (loci) dirigido(s) mediante un direccionamiento exitoso.

Debido a que los ARNg emparejados pueden crear grandes supresiones mediadas por Cas en un locus genómico diana, puede ser útil aumentar los ensayos LOA y GOA estándar para verificar el direccionamiento correcto por parte de los LTVEC (es decir, en células distintas de los embriones en estadio unicelular). Por ejemplo, los ensayos LOA y GOA por sí solos pueden no distinguir clones celulares correctamente dirigidos de clones en los que una gran supresión inducida por Cas del locus genómico diana coincide con la integración aleatoria de un LTVEC en otra parte del genoma, particularmente si el ensayo GOA emplea una sonda contra un casete de selección dentro del inserto LTVEC. Debido a que la presión de selección en la célula dirigida se basa en el casete de selección, la integración transgénica aleatoria de los LTVEC en otras partes del genoma generalmente incluirá el casete de selección y las regiones adyacentes de los LTVEC, pero excluirá regiones más distales de los LTVEC. Por ejemplo, si una porción de un LTVEC se integra aleatoriamente en el genoma, y el LTVEC comprende un inserto de ácido nucleico de alrededor de 5 kb o más de longitud con un casete de selección adyacente al brazo de homología 3', generalmente el brazo de homología 3' pero no el brazo de homología 5' se integrará transgénicamente con el casete de selección. Alternativamente, si el casete de selección es adyacente al brazo de homología 5', generalmente el brazo de homología 5' pero no el brazo de homología 3' se integrará transgénicamente con el casete de selección. Como un ejemplo, si se utilizan ensayos LOA y GOA para evaluar la integración dirigida de LTVEC, y el ensayo GOA utiliza sondas contra el casete de selección, una supresión heterocigota en el locus genómico diana combinada con una integración transgénica aleatoria de LTVEC dará la misma lectura que una integración dirigida heterocigota de LTVEC en el locus genómico diana. Para verificar el direccionamiento correcto por parte del LTVEC, se pueden utilizar ensayos de retención, solos o junto con ensayos LOA y/o GOA.

Los ensayos de retención determinan los números de copias de una plantilla de ADN en la secuencia diana 5' (correspondiente al brazo de homología 5' de LTVEC) y/o la secuencia diana 3' (correspondiente al brazo de homología 3' de LTVEC). En particular, es útil determinar el número de copias de una plantilla de ADN en la secuencia diana correspondiente al brazo de homología que está adyacente al casete de selección. En las células diploides, números de copias superiores a dos generalmente indican una integración transgénica de LTVEC aleatoriamente fuera del locus genómico diana en lugar de en el locus genómico diana, lo cual no es deseable. Los clones correctamente seleccionados retendrán un número de copias de dos. Además, números de copias de menos de dos en dichos ensayos de retención generalmente indican grandes supresiones mediadas por Cas que se extienden más allá de la región dirigida para supresión, que tampoco son deseables. Véase, por ejemplo, los documentos US 2016/0145646 y WO 2016/081923.

Otros ejemplos de ensayos cuantitativos adecuados incluyen hibridación in situ mediada por fluorescencia (FISH), hibridación genómica comparativa, amplificación isotérmica de ADN, hibridación cuantitativa con sonda(s) inmovilizada(s), Sondas INVADER®, Sondas TAQMAN® de Molecular Beacon tecnología de sonda o ECLIPSE™ (véase, por ejemplo, el documento US 2005/0144655). También se pueden utilizar ensayos convencionales para cribar modificaciones específicas, tales como la PCR de largo alcance, la transferencia Southern o la secuenciación de Sanger. Dichos ensayos normalmente se utilizan para obtener evidencia de un ligamiento entre el vector de direccionamiento insertado y el locus genómico dirigido . Por ejemplo, para un ensayo de PCR de largo alcance, un cebador puede reconocer una secuencia dentro del ADN insertado mientras que el otro reconoce una secuencia del locus genómico diana más allá de los extremos de los brazos de homología del vector de direccionamiento.

La secuenciación de próxima generación (NGS) también se puede utilizar para el cribado, particularmente en embriones en estadio unicelular que han sido modificados. La secuenciación de próxima generación también se puede denominar como “NGS” o “secuenciación masiva en paralelo” o “secuenciación de alto rendimiento”. Dicha NGS se puede utilizar como herramienta de cribado además de los ensayos de MOA y los ensayos de retención para definir la naturaleza exacta de la modificación genética dirigida y detectar el mosaicismo. El mosaicismo se refiere a la presencia de dos o más poblaciones de células con diferentes genotipos en un individuo que se desarrolló a partir de un solo óvulo fertilizado (es decir, cigoto). En los métodos divulgados en el presente documento, no es necesario cribar los clones dirigidos utilizando marcadores de selección. Por ejemplo, se puede confiar en los ensayos MOA y NGS descritos en el presente documento sin utilizar casetes de selección.

H. Métodos para elaborar ratones genéticamente modificados

Se pueden generar ratones genéticamente modificados empleando los diversos métodos divulgados en el presente documento. Cualquier método o protocolo conveniente para producir un organismo genéticamente modificado, que incluyen los métodos descritos en el presente documento, es adecuado para producir dicho ratón genéticamente modificado. Dichos métodos que comienzan con la modificación genética de una célula pluripotente tal como una célula madre embrionaria (ES) generalmente comprenden: (1) modificar el genoma de una célula pluripotente que no es un embrión en estadio unicelular utilizando los métodos descritos en el presente documento; (2) identificar o seleccionar la célula pluripotente modificada genéticamente; (3) introducir la célula pluripotente modificada genéticamente en un embrión huésped; y (4) implantar y gestar el embrión huésped que comprende la célula pluripotente modificada genéticamente en una madre sustituta. La madre sustituta puede entonces producir ratones de generación F0 que comprendan la modificación genética dirigida y sean capaces de transmitir la modificación genética dirigida a través de la línea germinal. Los animales que portan el locus genómico modificado genéticamente se pueden identificar mediante un ensayo de modificación del alelo (MOA) como se describe en el presente documento. La célula donante se puede introducir en un embrión huésped en cualquier estadio, tal como el estadio de blastocisto o el estadio de premórula (es decir, el estadio de 4 células o el estadio de 8 células). Se generan descendencia que son capaces de transmitir la modificación genética a través de la línea germinal. La célula pluripotente puede ser, por ejemplo, una célula ES (por ejemplo, una célula ES de roedor, una célula ES de ratón o una célula ES de rata) como se discute en otra parte del presente documento. Véase, por ejemplo, Patente de EE.UU. No. 7,294,754.

Alternativamente, dichos métodos que comienzan con la modificación genética de un embrión en estadio unicelular generalmente comprenden: (1) modificar el genoma de un embrión en estadio unicelular utilizando los métodos descritos en el presente documento; (2) identificar o seleccionar el embrión genéticamente modificado; y (3) implantar y gestar el embrión genéticamente modificado en una madre sustituta. La madre sustituta puede entonces producir ratones de generación F0 que comprenden la modificación genética dirigida y sean capaces de transmitir la modificación genética dirigida a través de la línea germinal. Los animales que portan el locus genómico modificado genéticamente se pueden identificar mediante un ensayo de modificación del alelo (MOA) como se describe en el presente documento.

También se pueden utilizar técnicas de transferencia nuclear para generar los ratones. Brevemente, los métodos para la transferencia nuclear pueden incluir las etapas de: (1) enuclear un ovocito o proporcionar un ovocito enucleado; (2) aislar o proporcionar una célula o núcleo donante para combinarlo con el ovocito enucleado; (3) insertar la célula o el núcleo en el ovocito enucleado para formar una célula reconstituida; (4) implantar la célula reconstituida en el útero de un ratón para formar un embrión; y (5) permitir que el embrión se desarrolle. En dichos métodos, los ovocitos generalmente se recuperan de animales fallecidos, aunque también se pueden aislar de oviductos y/o ovarios de animales vivos. Los ovocitos pueden madurarse en una variedad de medios conocidos por aquellos expertos con conocimientos básicos en la técnica antes de la enucleación. La enucleación del ovocito se puede realizar de varias maneras bien conocidas por aquellos expertos con conocimientos básicos en la técnica. La inserción de la célula o núcleo del donante en el ovocito enucleado para formar una célula reconstituida puede ser mediante microinyección de una célula del donante debajo de la zona pelúcida antes de la fusión. La fusión se puede inducir mediante la aplicación de un pulso eléctrico de CC a través del plano de contacto/fusión (electrofusión), mediante la exposición de las células a sustancias químicas que promueven la fusión, tales como el polietilenglicol, o mediante un virus inactivado, como el virus Sendai. Una célula reconstituida se puede activar por medios eléctricos y/o no eléctricos antes, durante y/o después de la fusión del ovocito nuclear donante y receptor. Los métodos de activación incluyen pulsos eléctricos, choques inducidos químicamente, penetración de espermatozoides, niveles crecientes de cationes divalentes en el ovocito y reducción de la fosforilación de proteínas celulares (por ejemplo, mediante inhibidores de quinasas) en el ovocito. Las células reconstituidas activadas, o embriones, pueden cultivarse en un medio bien conocido por aquellos expertos con conocimientos básicos en la técnica y después transferirse al útero de un animal. Véase, por ejemplo, los documentos US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234, y la Patente de EE.UU. No. 7,612,250.

Los diversos métodos proporcionados en el presente documento permiten la generación de un ratón F0 genéticamente modificado en el que las células del animal F0 genéticamente modificado comprenden la modificación genética dirigida. Se reconoce que dependiendo del método utilizado para generar el animal f 0, variará el número de células dentro del animal F0 que tienen la modificación genética dirigida. La introducción de las células ES del donante en un embrión en estadio premórula de un organismo correspondiente (por ejemplo, un embrión de ratón en estadio de 8 células) a través de, por ejemplo, el método VELOCIMOUSE® método permite que un mayor porcentaje de la población celular del animal F0 comprenda células que tengan la modificación genética dirigida. Por ejemplo, al menos el 50 %, 60 %, 65 %, 70 %, 75 %, 85 %, 86 %, 87 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, El 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la contribución celular del animal F0 no humano puede comprender una población celular que tiene la modificación genética dirigida. Además, al menos una o más de las células germinales del animal F0 pueden tener la modificación genética dirigida.

I. Tipos de ratones y células

Los métodos proporcionados en el presente documento emplean ratones y células y embriones de ratones.

Una célula de ratón empleada en los métodos proporcionados en el presente documento puede ser, por ejemplo, una célula totipotente o una célula pluripotente (por ejemplo, una célula madre embrionaria (ES) tal como una célula ES de ratón). Las células totipotentes incluyen células indiferenciadas que pueden dar lugar a cualquier tipo de célula, y las células pluripotentes incluyen células indiferenciadas que poseen la capacidad de desarrollarse en más de un tipo de célula diferenciada. Dichas células pluripotentes y/o totipotentes pueden ser, por ejemplo, células ES o células similares a ES, tales como células madre pluripotentes inducidas (iPS). Las células ES incluyen células totipotentes o pluripotentes derivadas de embriones que son capaces de contribuir a cualquier tejido del embrión en desarrollo tras su introducción en un embrión. Las células ES pueden derivar de la masa celular interna de un blastocisto y son capaces de diferenciarse en células de cualquiera de las tres capas germinales de los vertebrados (endodermo, ectodermo y mesodermo).

Las células de ratón empleadas en los métodos proporcionados en el presente documento también pueden incluir embriones en estadio unicelular (es decir, ovocitos o cigotos fertilizados). Dichos embriones en estadio unicelular pueden ser de cualquier origen genético (por ejemplo, BALB/c, C57BL/6, 129 o una combinación de los mismos), pueden ser frescos o congelados y se pueden derivar de reproducción natural o fertilizaciónin vitro.

Los ratones y las células de ratón empleadas en los métodos proporcionados en el presente documento pueden ser de cualquier cepa, que incluye, por ejemplo, una cepa 129, una cepa C57BL/6, una cepa BALB/c, una cepa Swiss Webster, una mezcla de cepas 129 y C57BL/6, , una mezcla de cepas BALB/c y C57BL/6, una mezcla de cepas 129 y BALB/c, y una mezcla de cepas BALB/c, C57BL/6 y 129. Por ejemplo, un ratón o una célula de ratón empleada en los métodos proporcionados en el presente documento puede ser al menos parcialmente de una cepa BALB/c (por ejemplo, al menos aproximadamente un 25 %, al menos aproximadamente un 50 %, al menos aproximadamente un 75 % deriva de una cepa BALB/c o aproximadamente el 25 %, aproximadamente el 50 %, aproximadamente el 75 %, o aproximadamente el 100 % derivado de una cepa BALB/c). En un ejemplo, los ratones o las células de ratón pueden tener una cepa que comprende 50 % de BALB/c, 25 % de C57BL/6 y 25 % de 129. Alternativamente, los ratones o las células de ratón pueden comprender una cepa o combinación de cepas que excluye BALB/c.

En otra parte del presente documento se divulgan ejemplos de cepas 129 y cepas C57BL. Los ratones y las células de ratón empleados en los métodos proporcionados en el presente documento también pueden ser de una mezcla de una cepa 129 anteriormente mencionada y una cepa C57BL/6 anteriormente mencionada (por ejemplo, 50 % de 129 y 50%de C57BL/6). Asimismo, los ratones y las células de ratón empleadas en los métodos proporcionados en el presente documento pueden ser de una mezcla de las cepas 129 anteriormente mencionadas o una mezcla de las cepas BL/6 anteriormente mencionadas (por ejemplo, la cepa 129S6 (129/SvEvTac)). Un ejemplo específico de una célula ES de ratón es una célula ES de ratón VGF1. Las células ES de ratón VGF1 (también conocidas como F1H4) se derivaron de embriones híbridos producidos cruzando un ratón hembra C57BL/6NTac con un ratón macho 129S6/SvEvTac. Véase, por ejemplo, Auerbach et al. (2000) Biotechniques 29, 1024-1028.

Las células que se han implantado en un embrión huésped se pueden denominar “células de donante”. La célula donante puede ser de la misma cepa que el embrión huésped o de una cepa diferente. Asimismo, la madre sustituta puede ser de la misma cepa que la célula donante y/o el embrión huésped, o la madre sustituta puede ser de una cepa diferente que la célula donante y/o el embrión huésped.

Se puede emplear una variedad de embriones huéspedes en los métodos y composiciones divulgados en el presente documento. Por ejemplo, se puede introducir una célula donante (por ejemplo, una célula ES donante) en un embrión en estadio premórula (por ejemplo, un embrión en estadio de 8 células) de un organismo correspondiente. Véase, por ejemplo, los documentos US 7,576,259; US 7,659,442; US 7,294,754; y US 2008/0078000. En otros métodos, las células del donante SE pueden implantar en un embrión huésped en el estadio de 2 células, el estadio de 4 células, el estadio de 8 células, el estadio de 16 células, el estadio de 32 células o el estadio de 64 células. El embrión huésped también puede ser un blastocisto o puede ser un embrión de preblastocisto, un embrión en estadio de mórula previa, un embrión en estadio de mórula (por ejemplo, un embrión en estadio de mórula agregado), un embrión en estadio de mórula no compactado o un embrión en estadio de mórula compactada. Cuando se emplea un embrión de ratón, el estadio de embrión huésped puede ser un Estadio de Theiler 1 (TS1), un TS2, un TS3, un TS4, un TS5 y un TS6, con referencia a los Estadios de Theiler descritos en Theiler (1989) “The House Mouse: Atlas of Mouse Development,” Springer-Verlag, New York. Por ejemplo, el Estadio de Theiler se puede seleccionar entre TS1, TS2, TS3 y TS4. En algunos métodos, el embrión huésped comprende una zona pelúcida y la célula donante es una célula E<s>que se introduce en el embrión huésped a través de un orificio en la zona pelúcida. En otros métodos, el embrión huésped es un embrión sin zona.

III. Métodos de cribado de compuestos

Los ratones que tienen las mutaciones Fbn1 descritas en el presente documento se pueden utilizar para cribar compuestos en busca de actividad potencialmente útil para inhibir o reducir el síndrome progeroide neonatal con lipodistrofia congénita (NPSCL) o mejorar síntomas similares a NPSCL (por ejemplo, síntomas similares a lipodistrofia congénita) o cribar compuestos para actividad potencialmente dañina para promover o exacerbar NPSCL. Los compuestos que tienen actividad inhibidora o reductora de NPSCL o que mejoran síntomas similares a NPSCL son potencialmente útiles como terapéuticos o profilácticos contra NPSCL. Los compuestos que tienen actividad que promueve o exacerba el NPSCL se identifican como tóxicos y se deben evitar como productos terapéuticos o en otras circunstancias en las que puedan entrar en contacto con los humanos (por ejemplo, en alimentos, agricultura, construcción o suministro de agua).

Los ejemplos de compuestos que se pueden cribar incluyen anticuerpos, proteínas de unión a antígenos, proteínas de unión a ADN específicas de sitio (por ejemplo, complejos CRISPR-Cas), polipéptidos, miméticos de betaturno, polisacáridos, fosfolípidos, hormonas, prostaglandinas, esteroides, compuestos aromáticos, compuestos heterocíclicos, benzodiazepinas, glicinas oligoméricas N-sustituidas y oligocarbamatos. Se pueden construir grandes bibliotecas combinatorias de los compuestos mediante el método de bibliotecas sintéticas codificadas (ESL) descrito en los documentos WO 1995/012608, WO 1993/006121, WO 1994/008051, WO 1995/035503, y WO 1995/030642. También se pueden generar bibliotecas de péptidos mediante métodos de presentación en fagos. Véase, por ejemplo, el documento US 5,432,018. El uso de bibliotecas de ARN guía para dirigir sistemas CRISPR-Cas a diferentes genes se divulga, por ejemplo, en los documentos WO 2014/204727, WO 2014/093701, WO 2015/065964, y WO 2016/011080

Los ensayos basados en animales generalmente implican la administración de un compuesto al ratón mutante de Fbn1 y evaluar síntomas muy parecidos a los de NPSCL en humanos para detectar cambios en la respuesta. El cambio se puede evaluar a partir de los niveles del síntoma antes y después de poner en contacto el ratón con el compuesto o al realizar un experimento de control realizado con un animal de control que tenga la misma mutación Fbn1 (por ejemplo, hermano de cohorte de tipo silvestre) sin el compuesto.

Los signos o síntomas similares a NPSCL que se pueden monitorizar incluyen peso corporal, masa magra, masa grasa, masa adiposa blanca (por ejemplo, normalizada por el peso corporal), porcentaje de grasa corporal, ingesta de alimentos normalizada por el peso corporal y cifosis, como se divulga en otra parte en el presente documento. Por ejemplo, se puede monitorizar la masa de tejido adiposo blanco (por ejemplo, normalizada por el peso corporal). Estos síntomas se pueden monitorizar en combinación con uno o más de los siguientes: tolerancia a la glucosa, niveles de colesterol en suero, niveles de triglicéridos en suero y niveles de ácidos grasos no esterificados en suero. Asimismo, estos síntomas se pueden monitorizar en combinación con uno o más de los siguientes: tolerancia a la glucosa, niveles de colesterol en suero, niveles de triglicéridos en suero, niveles de ácidos grasos no esterificados en suero, peso del hígado, peso del tejido adiposo marrón (BAT), tejido adiposo blanco visceral. peso del tejido (WAT), peso WAT normalizado al peso corporal, tasa metabólica normalizada al peso corporal, gasto de energía y sensibilidad a la insulina con una dieta rica en grasas. Por ejemplo, la exacerbación de dichos síntomas similares a NPSCL puede resultar en uno o más de disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del tejido adiposo blanco (por ejemplo, normalizado por el peso corporal), disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal, y aumento de cifosis en comparación con los niveles de los síntomas antes del contacto con el compuesto o en comparación con los niveles de síntomas en el animal no humano de control. Dichas disminuciones o aumentos pueden ocurrir con uno o más de: disminución del peso del hígado, peso del tejido adiposo marrón (BAT) preservado (por ejemplo, normalizado por el peso corporal), disminución del peso del tejido adiposo blanco visceral (WAT), disminución del peso del WAT normalizado al peso corporal, tasa metabólica elevada normalizada con el peso corporal, aumento del gasto de energía, tolerancia a la glucosa mejorada y sensibilidad a la insulina mejorada con una dieta alta en grasas. Dichas disminuciones o aumentos pueden ocurrir si uno o más de los siguientes factores permanecen normales: tolerancia a la glucosa, niveles de colesterol en suero, niveles de triglicéridos en suero y niveles de ácidos grasos no esterificados en suero. Alternativamente, la mejora de dichos síntomas similares a NPSCL puede resultar en uno o más de aumento de peso corporal, aumento de masa magra, aumento de masa grasa, aumento del porcentaje de grasa corporal, disminución de la ingesta de alimentos normalizada por el peso corporal y disminución de la cifosis en comparación con los niveles de los síntomas antes del contacto con el compuesto o en comparación con los niveles de síntomas en el animal no humano de control. Dichas disminuciones o aumentos pueden ocurrir con uno o más de aumento del peso del hígado, peso del tejido adiposo marrón (BAT) conservado o alterado (por ejemplo, normalizado por el peso corporal), aumento del peso del tejido adiposo blanco visceral (WAT), aumento del peso del WAT normalizado al peso corporal, disminución de la tasa metabólica normalizada al peso corporal, disminución del gasto energético, disminución de la tolerancia a la glucosa y disminución de la sensibilidad a la insulina con una dieta alta en grasas. Dichos síntomas se pueden ensayar como se describe en los ejemplos proporcionados en el presente documento. La disminución o el aumento pueden ser estadísticamente significativos. Por ejemplo, la disminución o aumento puede estar en al menos aproximadamente 1 %, al menos aproximadamente 2 %, al menos aproximadamente 3 %, al menos aproximadamente 4 %, al menos aproximadamente 5 %, al menos aproximadamente 10 %, al menos aproximadamente 15 %, al menos aproximadamente 20 %, al menos aproximadamente 30 %, al menos aproximadamente 40 %, al menos aproximadamente 50 %, al menos aproximadamente 60 %, al menos aproximadamente 70 %, al menos aproximadamente 80 %, al menos aproximadamente 90 %, o 100 %.

Breve descripción de las secuencias

Las secuencias de nucleótidos y aminoácidos enumeradas en el listado de secuencias acompañante se muestran utilizando abreviaturas de letras estándar para bases de nucleótidos y códigos de tres letras para aminoácidos. Las secuencias de nucleótidos siguen la convención estándar de comenzar en el extremo 5' de la secuencia y avanzar (es decir, de izquierda a derecha en cada línea) hasta el extremo 3'. Sólo se muestra una cadena de cada secuencia de nucleótidos, pero se entiende que la cadena complementaria está incluida por cualquier referencia a la cadena mostrada. Las secuencias de aminoácidos siguen la convención estándar de comenzar en el extremo amino de la secuencia y avanzar (es decir, de izquierda a derecha en cada línea) hasta el terminal carboxi.

Tabla 1. Descripción de Secuencias

Ejemplos

Ejemplo 1. Generación de ratones mutantes de Fbn1 con MAID 8501 con terminal C truncado.

Se generó un alelo de ratón de Fbn1 mutante para recrear un alelo de FBN1 mutante humano. Utilizando NM_007993.2 como secuencia de referencia, la mutación es c.8213_8214delinsACT. Esta mutación, que se creó al insertar una A entre c.8212 y 8213 y realizando una sustitución G>T en c.8214, da como resultado un codón de terminación prematura en el penúltimo exón de Fbn1. El alelo mutante se indica como MAID 8501. Véase Figura 1. La mutación está dentro de los últimos 50 nucleótidos del penúltimo exón y se predice que escapará de la desintegración mediada por ARNm sin sentido (NMD), lo que lleva a la expresión de una proteína profibrilina truncada mutante.

Para generar el alelo mutante, se introdujeron componentes CRISPR/Cas9 en un embrión en estadio unicelular C57BL/6 a través de inyección pronuclear o inyecciones piezoeléctricas de ARNm citoplasmático junto con una plantilla de donante. La secuencia de la secuencia dirigida al ADN del ARN guía se establece en la SEQ ID NO: 37, y la secuencia del donante se establece en la SEQ ID NO: 38. Se utilizó NGS para cribar los clones correctamente dirigidos. Los resultados del direccionamiento se establecen en la Tabla 2.

Tabla 2. Resultados del direcionamiento para MAID 8501

Se generaron ratones fundadores F0 tras la microinyección de embriones en ratones hembra pseudopreñadas. Como se muestra en la Figura 2, ninguno de los ratones machos ni hembras homocigotos para la mutación de Fbn1 de MAID 8501 sobrevivieron después de 40 días, mientras que los ratones heterocigotos machos y hembras sobrevivieron mucho más tiempo.

Ejemplo 2. Generación de ratones mutantes de Fbn1 con MAID 8520 con terminal C truncado.

En otro experimento, se diseñaron una secuencia de ARN guía y una secuencia donante para generar un alelo de Fbn1 mutante correspondiente al alelo de Fbn1c.8155_8156del humano, que tiene una supresión de dos pares de bases en el exón codificante 64 (el penúltimo exón) provocando un desplazamiento del marco de lectura con un codón de terminación prematura posterior de 17 codones en dirección descendente de p.Lys2719. El alelo mutante previsto se indica como MAID 8502. Véase Figura 3.

Para generar el alelo mutante, se introdujeron componentes CRISPR/Cas9 en un embrión en estadio unicelular C57BL/6 a través de inyección pronuclear o inyecciones piezoeléctricas de ARNm citoplasmático junto con una plantilla de donante. Un clon que se generó tenía el alelo mutante MAID 8520 que se muestra en la Figura 3 en lugar del alelo MAID 8502 esperado. El alelo mutante MAID 8520 también da como resultado una terminación prematura de la proteína Fbn1 codificada como se muestra en la Figura 3.

Se generaron ratones fundadores F0 después de la microinyección de embriones en ratones hembra pseudopreñadas, y posteriormente se produjeron ratones de la generación F1. En comparación con los ratones de tipo silvestre, los ratones heterocigotos para la mutación Fbn1 comieron mucho más cuando se normalizaron por peso corporal. Véase, por ejemplo, Figura 4, que muestra la ingesta semanal de alimentos normalizada por el peso corporal (gramo por gramo), donde los machos heterocigotos comieron aproximadamente 1.7 veces más alimentos que sus homólogos de tipo silvestre cuando se normalizó por el peso corporal. A pesar del aumento de la ingesta de alimentos, los pesos corporales de los ratones machos y hembras heterocigotos para la mutación Fbn1 fue consistentemente más baja que la de los ratones de tipo silvestre correspondientes a lo largo del tiempo. Véase, por ejemplo, Figura 5, que muestra dos ratones heterocigotos F1 macho de 3 meses de edad en el lado izquierdo y dos ratones F1 macho de tipo silvestre de 3 meses de edad en el lado derecho. VéasetambiénFigura 6, que muestra los pesos corporales de las crías F1 desde las 5 semanas hasta las 13 semanas. Por ejemplo, mientras que los pesos corporales de los machos mutantes heterocigotos eran aproximadamente 7 gramos a las 5 semanas y 12 gramos a las 13 semanas, los pesos corporales de los machos de tipo silvestre correspondientes eran aproximadamente 18 gramos a las 5 semanas y 25 gramos a las 13 semanas. Estas tendencias también se observaron en los ratones hembra.

Un análisis más detallado de las hembras heterocigotas en comparación con las hembras de tipo silvestre mostró cifosis (es decir, redondeo hacia adelante exagerado de la espalda) en las hembras mutantes heterocigotas cuando se compara con las hembras de tipo silvestre. Véase Figuras 7A-7E. Asimismo, las hembras heterocigotas tenían muy poca grasa en comparación con sus homólogas de tipo silvestre. Como se muestra en las Figuras 8A-8C, los ratones hembra mutantes heterocigotos tenían niveles más bajos estadísticamente significativos de peso corporal, masa magra y masa grasa según se mide por ECHOMRI™, que se utiliza para medir la masa grasa y magra en roedores. Estas diferencias se mantuvieron incluso si los ratones fueron alimentados con una dieta alta en grasas al 60 % durante 21 semanas. A pesar de la ausencia de grasa corporal, las hembras mutantes heterocigotas y las correspondientes hembras de tipo silvestre mostraron una tolerancia a la glucosa similar (tolerancia a la glucosa oral, se administran 2 mg/kg después de un ayuno nocturno) con una dieta de alimento estándar y no hubo elevaciones en los niveles de colesterol, triglicéridos y ácidos grasos esterificados en suero (medidos por ADVIA). Véase, por ejemplo, Figuras 9A-9F y 10A-10F, respectivamente.

Un análisis más detallado de las hembras mutantes heterocigotas mostró la conservación del depósito de tejido adiposo marrón (BAT) a pesar de la pérdida casi completa del tejido adiposo blanco visceral. Véase Figuras 11A-11H. La preservación de BAT nos llevó a examinar el gasto energético de las hembras mutantes heterocigotas después de 12 semanas de alimentación con una dieta alta en grasas al 60 %. Véase Figuras 12A-12H. El análisis de la jaula metabólica utilizando un sistema Oxymax CLAMS de Columbia Instruments mostró que los ratones tenían una tasa metabólica elevada normalizada al peso corporal como lo indica su VO<2>, VCO<2>y gasto energético (Energía). Después de 20 semanas con una dieta alta en grasas, estos ratones también exhibieron una mejor tolerancia a la glucosa. Véase Figuras 13A-13D.

Los ratones heterocigotos para la supresión de terminal C en Fibrilina-1 son delgados con una gran reducción de los depósitos de grasa blanca, pero han conservado el adiposo marrón, aumento del gasto de energía, una tolerancia similar a la glucosa, sensibilidad a la insulina mejorada con una dieta alta en grasas y sin elevación en lípidos en suero en comparación con ratones de tipo silvestre. Esto recapitula el fenotipo FBN1 observado en pacientes humanos con NPSCL en el sentido de que, a diferencia de muchos síndromes lipodistróficos, estos ratones en particular tienen un perfil metabólico normal en términos de homeostasis de la glucosa y lípidos circulantes a pesar de no tener tejido adiposo visceral. Muchos otros modelos de ratones mutantes FBN1 tienen heterocigotos extremadamente normales, mientras que los homocigotos tienen muerte embrionaria o posnatal temprana. Véase, por ejemplo, Pereira et al. (1999) Proc. Natl. Acad. Sci. U.S.A. 96(7):3819-3823. Nuestro modelo muestra un fenotipo heterocigoto dominante, que recapitula muchas de las características de los pacientes humanos, lo que nos permite estudiar opciones terapéuticas. En particular, nuestro modelo muestra una pérdida de tejido adiposo blanco mientras que el tejido adiposo marrón se conserva en combinación con una mejora en la sensibilidad a la insulina a pesar de la pérdida de tejido adiposo blanco. Los pacientes con NPSCL humanos tienen una homeostasis normal de la glucosa a pesar de la pérdida de tejido adiposo blanco, lo que refleja nuestro modelo. La conservación del tejido adiposo marrón es probablemente el mecanismo subyacente al mantenimiento/sensibilidad a la insulina mejorada, ya que esto puede permitir a los ratones quemar el exceso de grasa que no pueden almacenar.

Claims

REIVINDICACIONES

1. Un ratón cuyo genoma comprende un gen de fibrilina-1 endógena (Fbn1) que comprende una mutación en el penúltimo exón del gen Fbn1 endógeno,

en el que el ratón es heterocigoto para la mutación,

en el que la mutación da como resultado la interrupción o ablación del producto de escisión del terminal C de asprosina de la profibrilina-1,

en el que la expresión del gen Fbn1 endógeno da como resultado una proteína Fbn1 truncada en el extremo de terminal C,

en el que el ratón exhibe uno o más síntomas similares a lipodistrofia congénita del síndrome progeroide neonatal, en el que los síntomas comprenden uno o más de los siguientes: disminución del peso corporal, disminución de la masa magra, disminución de la masa grasa, disminución del tejido adiposo blanco normalizado por el peso corporal, disminución del tejido adiposo blanco en combinación con preservación del tejido adiposo marrón normalizado por el peso corporal, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis, y

en el que la disminución o aumento se compara con un ratón de tipo silvestre de control.

2. El ratón de la reivindicación 1, en el que el gen Fbn1 endógeno incluye un promotor de Fbn1 endógeno del ratón.

3. El ratón de cualquier reivindicación anterior, en el que la mutación es una mutación por desplazamiento del marco o una mutación en el sitio de corte que da como resultado que se omita el penúltimo exón.

4. El ratón de cualquier reivindicación anterior, en el que la mutación da como resultado un codón de terminación prematura,

en el que el codón de terminación prematura está en el penúltimo o último exón del gen Fbn1 endógeno, opcionalmente en el que el codón de terminación prematura está en el exón final o está a menos de 55 pares de bases en dirección ascendente de la última unión exón-exón en el gen Fbn1 endógeno.

5. El ratón de cualquier reivindicación anterior, en el que la mutación interrumpe una secuencia de reconocimiento de aminoácidos básicos para las proproteínas convertasas de la familia de las furinas.

6. El ratón de cualquier reivindicación anterior, en el que la mutación está dentro de los 50 pares de bases de la secuencia de reconocimiento de aminoácidos básicos para las proproteínas convertasas de la familia de las furinas.

7. El ratón de cualquier reivindicación anterior, en el que la proteína Fbn1 truncada en el extremo de terminal C tiene un terminal C cargado positivamente.

8. El ratón de cualquier reivindicación anterior, en el que la proteína Fbn1 truncada en el extremo de terminal C se trunca en una posición correspondiente a una posición entre los aminoácidos 2700 y 2790, entre los aminoácidos 2710 y 2780, entre los aminoácidos 2720 y 2770, entre los aminoácidos 2730 y 2760, o entre los aminoácidos 2737 y 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína Fbn1 truncada en el extremo de terminal C está alineada de manera óptima con la SEQ ID NO: 30,

opcionalmente en el que la proteína Fbn1 truncada en el extremo de terminal C se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737, al aminoácido 2738 o al aminoácido 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína Fbn1 truncada en el extremo de terminal C está alineada de manera óptima con la SEQ ID NO: 30.

9. El ratón de cualquier reivindicación anterior, en el que la proteína Fbn1 truncada en el extremo de terminal C tiene un terminal C que consiste en la secuencia establecida en la SEQ ID NO: 8, 42, 43, 45, 46, o 47,

o en el que la proteína Fbn1 truncada en el extremo de terminal C consiste en la secuencia establecida en la SEQ ID NO: 31, 32, o 33.

10. El ratón de la reivindicación 8 o 9, en el que:

(i) la proteína Fbn1 truncada en el extremo de terminal C se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2737 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína Fbn1 truncada en el extremo de terminal C está alineada de manera óptima con la SEQ ID NO: 30, y en el que el terminal C de la proteína Fbn1 truncada en el extremo de terminal C consiste en la secuencia establecida en la SEQ ID NO: 43 o 46;

(ii) la proteína Fbn1 truncada en el extremo de terminal C se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2738 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína Fbn1 truncada en el extremo de terminal C está alineada de manera óptima con la SEQ ID NO: 30, y en el que el terminal C de la proteína Fbn1 truncada en el extremo de terminal C consiste en la secuencia establecida en la SEQ ID NO: 8 o 45; o

(iii) la proteína Fbn1 truncada en el extremo de terminal C se trunca de tal manera que el último aminoácido esté en una posición correspondiente al aminoácido 2755 en la proteína Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 30 cuando la proteína Fbn1 truncada en el extremo de terminal C está alineada de manera óptima con la SEQ ID NO: 30, y en el que el terminal C de la proteína Fbn1 truncada en el extremo de terminal C consiste en la secuencia establecida en la SEQ ID NO: 42 o 47.

11. El ratón de cualquier reivindicación anterior, en el que el penúltimo exón mutado del gen Fbn1 endógeno comprende mutaciones correspondientes a las mutaciones en la SEQ ID NO: 26, 27, o 28 en relación con la secuencia de penúltimos exones del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 25 cuando el penúltimo exón mutado está alineado óptimamente con la SEQ ID NO: 26, 27, o 28.

12. El ratón de cualquier reivindicación anterior, en el que la mutación comprende una inserción o supresión en el exón 64 del gen Fbn1 endógeno que provoca una mutación por desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 3' del exón 64 o en el extremo 5' del exón 65,

opcionalmente en el que la mutación comprende una inserción en el exón 64 que provoca una mutación por desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 5' del exón 65, y

opcionalmente en el que la inserción está entre las posiciones correspondientes a las posiciones 8179 y 8180 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 endógeno que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8241 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 endógeno que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20.

13. El ratón de la reivindicación 12, en el que la mutación comprende una inserción o supresión en el exón 64 que provoca un desplazamiento del marco de lectura-1 y da como resultado un codón de terminación prematura en el extremo 3' del exón 64, opcionalmente en el que:

(i) la mutación comprende una inserción entre las posiciones correspondientes a las posiciones 8209 y 8210 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 endógeno que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8214 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 endógeno que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20; o

(ii) la mutación comprende una supresión que comienza en una posición correspondiente a la posición 8161 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 endógeno que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20, y/o el codón de terminación prematura está en una posición correspondiente a la posición 8214 en la secuencia codificante del Fbn1 de ratón de tipo silvestre establecida en la SEQ ID NO: 20 cuando el gen Fbn1 endógeno que comprende la mutación está alineado de manera óptima con la SEQ ID NO: 20.

14. El ratón de cualquier reivindicación anterior, en el que el ratón exhibe uno o más de los siguientes: disminución del tejido adiposo blanco normalizado por el peso corporal, disminución del tejido adiposo blanco en combinación con tejido adiposo marrón conservado normalizado por el peso corporal, disminución del porcentaje de grasa corporal, aumento de la ingesta de alimentos normalizada por el peso corporal y aumento de la cifosis, opcionalmente en la que:

(i) el ratón exhibe uno o más de los siguientes: aumento de la tasa metabólica, sensibilidad a la insulina mejorada, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y nivel normal de ácidos grasos no esterificados en suero; o

(ii) el ratón exhibe una disminución del tejido adiposo blanco normalizado por el peso corporal y al menos uno de sensibilidad mejorada a la insulina, tolerancia normal a la glucosa, niveles normales de colesterol en suero, niveles normales de triglicéridos en suero y niveles normales de ácidos grasos no esterificados en suero, opcionalmente en el que el ratón exhibe una disminución del tejido adiposo blanco normalizado por el peso corporal y una mejor sensibilidad a la insulina.