ES2731437T3 - Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías - Google Patents

Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías Download PDF

Info

Publication number
ES2731437T3
ES2731437T3 ES15804289T ES15804289T ES2731437T3 ES 2731437 T3 ES2731437 T3 ES 2731437T3 ES 15804289 T ES15804289 T ES 15804289T ES 15804289 T ES15804289 T ES 15804289T ES 2731437 T3 ES2731437 T3 ES 2731437T3
Authority
ES
Spain
Prior art keywords
approximately
cell
target
sequence
crispr rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15804289T
Other languages
English (en)
Inventor
Andrew J Murphy
David Frendewey
Ka-Man Venus Lai
Wojtek Auerbach
Gustavo Droguett
Anthony Gagliardi
David M Valenzuela
Vera Voronina
Lynn Macdonald
George D Yancopoulos
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Application granted granted Critical
Publication of ES2731437T3 publication Critical patent/ES2731437T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Environmental Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicinal Preparation (AREA)

Abstract

Un método para hacer una modificación bialélica a un locus genómico diana en un genoma dentro de una célula, que comprende: (I) introducir en una población de células: (a) una proteína Cas; (b) un primer ARN guía que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro del locus genómico diana; (c) un segundo ARN guía que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del locus genómico diana; y (d) un vector de transformación que comprende un inserto de ácido nucleico flanqueado por un brazo de homología 5' que se hibrida con una secuencia diana 5' dentro del locus genómico diana y un brazo de homología 3' que se hibrida con una secuencia diana 3' dentro del locus genómico diana, en donde si la célula es un embrión en etapa de una célula el vector de transformación tiene una longitud de no más de 5 kb; en donde el genoma comprende un par de primer y segundo cromosomas homólogos que comprenden el locus genómico diana, opcionalmente en donde la primera y segunda secuencias de reconocimiento de ARN de CRISPR flanquean la totalidad o parte de una secuencia codificante de un gen; y en donde la proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria en cada uno del primer y segundo cromosomas homólogos, opcionalmente en donde la introducción del primer y segundo ARN guías da como resultado el aumento de la eficiencia de modificación bialélica en comparación con la introducción del primer ARN guía o el segundo ARN guía solos; y (II) identificar una célula que comprende un locus genómico diana modificado que comprende una deleción y/o una inserción, en donde la identificación comprende realizar un ensayo cuantitativo de modificación de alelo y un ensayo de retención, en donde el ensayo de modificación de alelo comprende: (a) un ensayo de ganancia de alelo para determinar el número de copias de una plantilla de ADN de inserto de ácido nucleico en una muestra de ADN genómico de la célula; y/o (b) un ensayo de pérdida de alelo para determinar el número de copias en la muestra de ADN genómico de una plantilla de ADN dentro de una región del locus genómico diana reconocida para la deleción, y en donde el ensayo de retención determina el número de copias en la muestra de ADN genómico de una plantilla de ADN de la secuencia diana 5' que se pretende retener en el locus genómico diana modificado y/o una plantilla de ADN de la secuencia diana 3' que se pretende retener en el locus genómico diana modificado, en donde la célula no se produce mediante el uso de un proceso que involucra la modificación de la identidad genética de la línea germinal de seres humanos o que involucra el uso de un embrión humano para fines industriales o comerciales, y en donde el método no es un método para el tratamiento del cuerpo humano o animal mediante terapia o cirugía.

Description

d e s c r ip c ió n
Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías
Referencia cruzada a las solicitudes relacionadas
Esta solicitud reivindica el beneficio de la solicitud de patente de Estados Unidos núm. 62/083,005, presentada el 21 de noviembre de 2014, la solicitud de patente de Estados Unidos núm. 62/182,314, presentada el 19 de Junio de 2015, y la solicitud de patente de Estados Unidos núm. 62/211,421, presentada el 28 de agosto de 2015.
Referencia a una lista de secuencias presentada
Como un archivo de texto por medio del sistema electrónico efs web
La Lista de Secuencias escrita en el archivo 472225SEQLIST.txt es de 32,7 kb, y se creó el 20 de noviembre de 2015.
Antecedentes de la invención
Aunque se han hecho progresos en la transformación de varios loci genómicos, aún quedan muchos tipos de loci genómicos que no pueden transformarse de manera eficiente o modificaciones genómicas que no pueden lograrse adecuadamente o de manera eficiente con estrategias de transformación convencionales. Por ejemplo, surgen dificultades cuando se intenta crear deleciones genómicas dirigidas grandes u otras modificaciones genéticas dirigidas grandes, particularmente en células y organismos eucariotas.
En particular, es difícil producir de manera eficiente células o animales que son homocigóticos o heterocigóticos combinados (por ejemplo, hemicigóticos) para una deleción genómica dirigida grande u otra modificación genómica cuando se usan estrategias de transformación convencionales. Por ejemplo, aunque pueden obtenerse ratones de generación FO heterocigóticos para una deleción genómica dirigida grande por medio de estrategias de transformación convencionales, se requiere el cruzamiento posterior de estos ratones heterocigóticos para producir ratones de generación F2 que son homocigóticos para la deleción. Estas etapas de cruzamiento adicionales son costosas y consumen tiempo. Yoshimi y otros 2014, Nature Comunications, VoI.5, páginas 1-17; Fujii Wataru y otros 2014, Biochemical and Biophysical Research Communication, voI. 445, núm. 4 páginas 791-794 e información complementaria páginas 1-6 y S.J.Gratz y otros 2014, Genetics, voI.196, núm.4 páginas 961-971 describen métodos de modificación bialélica de un genoma dentro de una célula. La patente US 2OO5/144655 describe un método para identificar una inserción dirigida de un inserto de ácido nucleico en una célula diploide. El documento WO2014/ i 04878 describe un método para modificar un genoma dentro de una célula que es heterocigótica para un primer alelo en donde la célula se modifica para convertirla en homocigótica para el primer alelo y en donde la secuencia de reconocimiento de ARN de CRISPR es centromérica al Iocus correspondiente al primer alelo. S.M.Byrne y otros 2014, Nucleic Acids Research, voI.43, núm. 3, páginas e21-e21, describe que el uso de dos ARN guías simples conduce al reemplazo homocigótico del gen de THY1 humano con su homólogo de ratón. Yang y otros 2OO3, Nature Biotechnology, voI.21, páginas 447-451 y Susan M. Byrne y otros 2014, Methods in Enzymology, VoI 546, páginas 119-138, describen la determinación de la variación del número de copias por f is h .
Resumen
La invención es como se define en las reivindicaciones.
En un primer aspecto, la invención proporciona un método para hacer una modificación bialélica a un Iocus genómico diana en un genoma dentro de una célula, que comprende:
(I) introducir en una población de células:
(a) una proteína Cas;
(b) un primer ARN guía que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana;
(c) un segundo ARN guía que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana; y
(d) un vector de transformación que comprende un inserto de ácido nucleico flanqueado por un brazo de homología 5' que se hibrida con una secuencia diana 5' dentro del Iocus genómico diana y un brazo de homología 3' que se hibrida con una secuencia diana 3' dentro del Iocus genómico diana, en donde si la célula es un embrión en etapa de una célula el vector de transformación tiene una longitud de no más de 5 kb;
en donde el genoma comprende un par de primer y segundo cromosomas homólogos que comprenden el Iocus genómico diana, opcionalmente en donde la primera y segunda secuencias de reconocimiento de ARN de CRISPR flanquean la totalidad o parte de una secuencia codificante de un gen; y
en donde la proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria en cada uno del primer y segundo cromosomas homólogos, opcionalmente en donde la introducción del primer y segundo ARN guías da como resultado el aumento de la eficiencia de modificación bialélica en comparación con la introducción del primer ARN guía o el segundo ARN guía soIos; y (II) identificar una célula que comprende un Iocus genómico diana modificado que comprende una deleción y/o una inserción, en donde la identificación comprende realizar un ensayo cuantitativo de modificación de alelo y un ensayo de retención,
en donde el ensayo de modificación de alelo comprende:
(a) un ensayo de ganancia de alelo para determinar el número de copias de una plantilla de ADN de inserto de ácido nucleico en una muestra de ADN genómico de la célula; y/o
(b) un ensayo de pérdida de alelo para determinar el número de copias en la muestra de ADN genómico de una plantilla de ADN dentro de una región del Iocus genómico diana reconocida para la deleción, y en donde el ensayo de retención determina el número de copias en la muestra de ADN genómico de una plantilla de a D n de la secuencia diana 5' que se pretende retener en el Iocus genómico diana modificado y/o una plantilla de ADN de la secuencia diana 3' que se pretende retener en el Iocus genómico diana modificado,
en donde la célula no se produce mediante el uso de un proceso que involucra la modificación de la identidad genética de la línea germinal de seres humanos o que involucra el uso de un embrión humano para fines industriales o comerciales, y
en donde el método no es un método para el tratamiento del cuerpo humano o animal mediante terapia.
Se proporcionan métodos y composiciones para modificar un genoma dentro de una célula. En un aspecto, la descripción proporciona métodos para hacer una modificación a un genoma dentro de una célula, que comprenden poner en contacto el genoma con: (a) una primera proteína Cas; (b) un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de ARN de C r ISPR dentro de un Iocus genómico diana; (c) un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana; (d) un ARNtracr; y (e) un vector de transformación que comprende un inserto de ácido nucleico flanqueado por un brazo de homología 5' que se hibrida con una secuencia diana 5' y un brazo de homología 3' que se hibrida con una secuencia diana 3', siempre que si la célula es un embrión en etapa de una célula el vector de transformación tiene una longitud de no más de 5 kb; en donde el genoma comprende un par de primer y segundo cromosomas homólogos que comprenden el Iocus genómico diana; y en donde la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria en al menos uno del primer y segundo cromosomas homólogos. En un aspecto, la descripción proporciona métodos para hacer una modificación bialélica a un genoma dentro de una célula, que comprenden poner en contacto el genoma con: (a) una primera proteína Cas; (b) un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de A r N de C r ISPR dentro de un Iocus genómico diana; (c) un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana; (d) un ARNtracr; y (e) un vector de transformación que comprende un inserto de ácido nucleico flanqueado por un brazo de homología 5' que se hibrida con una secuencia diana 5' y un brazo de homología 3' que se hibrida con una secuencia diana 3', siempre que si la célula es un embrión en etapa de una célula el vector de transformación tiene una longitud de no más de 5 kb; en donde el genoma comprende un par de primer y segundo cromosomas homólogos que comprenden el Iocus genómico diana; y en donde la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de A r N de CRISPR para generar al menos una ruptura bicatenaria en al menos uno del primer y segundo cromosomas homólogos.
Los métodos pueden comprender además identificar una célula que comprende el genoma modificado. En algunos métodos, el inserto de ácido nucleico comprende un casete de selección adyacente a un primer brazo de homología que se hibrida con una primera secuencia diana, en donde el primer brazo de homología es el brazo de homología 5' y la primera secuencia diana es la secuencia diana 5', o en donde el primer brazo de homología es el brazo de homología 3' y la primera secuencia diana es la secuencia diana 3', en donde la identificación comprende: (a) obtener ADN de la célula; (b) exponer el ADN de la célula a una sonda que se une dentro de la primera secuencia diana, una sonda que se une dentro del inserto de ácido nucleico, y una sonda que se une dentro de un gen de referencia que tiene un número de copias conocido, en donde cada sonda genera una señal detectable tras la unión; (c) detectar las señales de la unión de cada una de las sondas; y (d) comparar la señal de la sonda del gen de referencia con la señal de la sonda de la primera secuencia diana para determinar un número de copias de la primera secuencia diana, y comparar la señal de la sonda del gen de referencia con la señal de la sonda del inserto de ácido nucleico para determinar un número de copias del inserto de ácido nucleico, en donde un número de copias del inserto de ácido nucleico de uno o dos y un número de copias de la primera secuencia diana de dos indica la inserción dirigida del inserto de ácido nucleico en el Iocus genómico diana, y en donde un número de copias del inserto de ácido nucleico de uno o más y un número de copias de la primera secuencia diana de tres o más indica una inserción aleatoria del inserto de ácido nucleico en un Iocus genómico distinto al Iocus genómico diana.
En algunos métodos, la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR en cada uno del primer y segundo cromosomas homólogos para generar al menos una ruptura bicatenaria en cada uno del primer y segundo cromosomas homólogos. En algunos métodos, la primera proteína Cas escinde la primera y segunda secuencias de reconocimiento de ARN de CRISPR en al menos uno del primer y segundo cromosomas homólogos para generar al menos dos rupturas bicatenarias en al menos uno del primer y segundo cromosomas homólogos.
Algunos métodos comprenden además poner en contacto el genoma con: un tercer ARN de CRISPR que se hibrida con una tercera secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana; y un cuarto ARN de CRISPR que se hibrida con una cuarta secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana. Opcionalmente, la primera secuencia de reconocimiento de ARN de CRISPR y la tercera secuencia de reconocimiento de ARN de CRISPR se encuentran separadas por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 250 pb, aproximadamente 250 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 350 pb, aproximadamente 350 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 450 pb, aproximadamente 450 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 6 kb, aproximadamente 6 kb a aproximadamente 7 kb, aproximadamente 7 kb a aproximadamente 8 kb, aproximadamente 8 kb a aproximadamente 9 kb, aproximadamente 9 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 70 kb, aproximadamente 70 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 90 kb, o aproximadamente 90 kb a aproximadamente 100 kb. Opcionalmente, la segunda secuencia de reconocimiento de ARN de CRISPR y la cuarta secuencia de reconocimiento de ARN de CRISPR se encuentran separadas por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 250 pb, aproximadamente 250 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 350 pb, aproximadamente 350 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 450 pb, aproximadamente 450 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 6 kb, aproximadamente 6 kb a aproximadamente 7 kb, aproximadamente 7 kb a aproximadamente 8 kb, aproximadamente 8 kb a aproximadamente 9 kb, aproximadamente 9 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 70 kb, aproximadamente 70 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 90 kb, o aproximadamente 90 kb a aproximadamente 100 kb. Opcionalmente, la primera y tercera secuencias de reconocimiento de ARN de CRISPR son un primer par de secuencias de reconocimiento de ARN de CRISPR, y la segunda y cuarta secuencias de reconocimiento de ARN de CRISPR son un segundo par de secuencias de reconocimiento de ARN de CRISPR, en donde el primer par y el segundo par se encuentran separados por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 250 pb, aproximadamente 250 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 350 pb, aproximadamente 350 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 450 pb, aproximadamente 450 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, aproximadamente 2,5 Mb a aproximadamente 3 Mb, aproximadamente 3 Mb a aproximadamente 4 Mb, aproximadamente 4 Mb a aproximadamente 5 Mb, aproximadamente 5 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb.
En algunos métodos, la primera proteína Cas escinde al menos dos de la primera, segunda, tercera y cuarta secuencias de reconocimiento de ARN de CRISPR para generar al menos dos rupturas bicatenarias en al menos uno del primer y segundo cromosomas homólogos. En algunos métodos, la primera proteína Cas escinde al menos dos de la primera, segunda, tercera y cuarta secuencias de reconocimiento de ARN de CRISPR para generar al menos dos rupturas bicatenarias en el primer y segundo cromosomas homólogos.
En algunos métodos, el Inserto de ácido nucleico se Inserta entre las secuencias diana 5' y 3'. Opclonalmente, las secuencias diana 5' y 3' están dentro del Iocus genómico diana. Opcionalmente, la célula no es un embrión en etapa de una célula, y el vector de transformación es un vector de transformación grande (LTVEC) que es de al menos 10 kb.
En algunos métodos, poner en contacto el genoma con el primer y segundo ARN de CRISPR da como resultado el aumento de la eficiencia de modificación bialélica en comparación con poner en contacto el genoma con el primer ARN de CRISPR o el segundo ARN de CRISPR soIos. En algunos métodos, la célula es diploide, y la modificación bialélica da como resultado homocigosidad o heterocigosidad combinada en el Iocus genómico diana. Opcionalmente, la heterocigosidad combinada es hemicigosidad. En algunos métodos, la modificación bialélica comprende una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo. En algunos métodos, la modificación bialélica comprende la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer y segundo cromosomas homólogos. En algunos métodos, la modificación bialélica comprende además la inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer y segundo cromosomas homólogos. En algunos métodos, la modificación bialélica comprende: (1) la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer y segundo cromosomas homólogos; y (2) la inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer cromosoma homólogo pero no en el segundo cromosoma homólogo. En algunos métodos, la modificación bialélica comprende: (1) la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo; y (2) la interrupción de un Iocus entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el segundo cromosoma homólogo. En algunos de Ios métodos, la modificación bialélica comprende: (1) la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo; (2) una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer cromosoma homólogo; y (3) la interrupción de un Iocus entre las secuencias diana 5' y 3' en el segundo cromosoma homólogo. En algunos métodos, la modificación bialélica comprende: (1) la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo; y (2) una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer cromosoma homólogo, en donde la secuencia del inserto de ácido nucleico es homóloga u ortóloga a la secuencia eliminada.
En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, o aproximadamente 2,5 Mb a aproximadamente 3 Mb. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 Pb a aproximadamente 250 Pb, aproximadamente 250 Pb a aproximadamente 300 pb, aproximadamente 300 Pb a aproximadamente 350 Pb, aproximadamente 350 Pb a aproximadamente 400 pb, aproximadamente 400 Pb a aproximadamente 450 Pb, aproximadamente 450 Pb a aproximadamente 500 pb, aproximadamente 500 Pb a aproximadamente 600 Pb, aproximadamente 600 Pb a aproximadamente 700 pb, aproximadamente 700 Pb a aproximadamente 800 Pb, aproximadamente 800 Pb a aproximadamente 900 pb, o aproximadamente 900 pb a aproximadamente 1 kb. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de c R iSPR se encuentran separadas por menos de 25 pb, menos de 50 pb, menos de 100 pb, menos de 150 pb, menos de 200 pb, menos de 250 pb, menos de 300 pb, menos de 350 pb, menos de 400 pb, menos de 450 pb, menos de 500 pb, menos de 600 pb, menos de 700 pb, menos de 800 pb, menos de 900 pb, menos de 1 kb, menos de 2 kb, menos de 3 kb, menos de 4 kb, menos de 5 kb, o menos de 10 kb.
En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se ubican cada una al menos 50 pb, al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 900 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, o al menos 100 kb de las secuencias diana 5' y 3'. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se ubican cada una entre aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 200 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente
4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente
40 kb, aproximadamente 40 kb a aproximadamente 50 kb, o aproximadamente 50 kb a aproximadamente 100 kb de las secuencias diana 5' y 3'. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se ubican cada una más de 50 pb, más de 100 pb, más de 200 pb, más de 300 pb, más de 400 pb, más de 500 pb, más de 600 pb, más de 700 pb, más de 800 pb, más de 900 pb, más de 1 kb, más de 2 kb, más de 3 kb, más de 4 kb, más de
5 kb, más de 6 kb, más de 7 kb, más de 8 kb, más de 9 kb, más de 10 kb, más de 20 kb, más de 30 kb, más de 40 kb, más de 50 kb, más de 60 kb, más de 70 kb, más de 80 kb, más de 90 kb, o más de 100 kb de las secuencias diana 5' y
3'.
En algunos métodos, el ácido nucleico eliminado es de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 400 kb, de aproximadamente 400 kb a aproximadamente 500 kb, de aproximadamente 500 kb a aproximadamente 1 Mb, de aproximadamente 1 Mb a aproximadamente 1,5 Mb, de aproximadamente 1,5 Mb a aproximadamente 2 Mb, de aproximadamente 2 Mb a aproximadamente 2,5 Mb, o de aproximadamente 2,5 Mb a aproximadamente 3 Mb. En algunos métodos, el ácido nucleico eliminado es de al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb. Opcionalmente, el ácido nucleico eliminado es de al menos
550 kb, al menos 600 kb, al menos 650 kb, al menos 700 kb, al menos 750 kb, al menos 800 kb, al menos 850 kb, al menos 900 kb, al menos 950 kb, al menos 1 Mb, al menos 1,5 Mb, o al menos 2 Mb.
En algunos métodos, el vector de transformación está en forma lineal. Opcionalmente, el vector de transformación es monocatenario o bicatenario. En algunos métodos, la célula no es un embrión en etapa de una célula, y el vector de transformación es un vector de transformación grande (LTVEC) que es de al menos 10 kb. En algunos métodos, la célula no es un embrión en etapa de una célula, y el vector de transformación es un vector de transformación grande (LTVEC), en donde la suma total de los brazos de homología 5' y 3' del LTVEC es al menos 10 kb. Opcionalmente, el LTVEC es de aproximadamente 50 kb a aproximadamente 300 kb, de aproximadamente 50 kb a aproximadamente 75 kb, de aproximadamente 75 kb a aproximadamente 100 kb, de aproximadamente 100 kb a 125 kb, de aproximadamente 125 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 175 kb, aproximadamente 175 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 225 kb, de aproximadamente 225 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 275 kb o de aproximadamente 275 kb a aproximadamente 300 kb. Opcionalmente, la suma total de los brazos de homología 5' y 3' del LTVEC es de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 30 kb, de aproximadamente 30 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 50 kb, de aproximadamente 50 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 70 kb, de aproximadamente 70 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 90 kb, de aproximadamente 90 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 110 kb, de aproximadamente 110 kb a aproximadamente 120 kb, de aproximadamente 120 kb a aproximadamente 130 kb, de aproximadamente 130 kb a aproximadamente 140 kb, de aproximadamente 140 kb a
Figure imgf000006_0001
aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 160 kb, de aproximadamente 160 kb a aproximadamente 170 kb, de aproximadamente 170 kb a aproximadamente 180 kb, de aproximadamente 180 kb a aproximadamente 190 kb, o de aproximadamente 190 kb a aproximadamente 200 kb.
En algunos métodos, la célula huésped es una célula eucariota. Opcionalmente, la célula eucariota es una célula de mamífero, una célula humana, una célula no humana, una célula de roedor, una célula de ratón, y una célula de rata.
Opcionalmente, la célula eucariota es una célula pluripotente, una célula no pluripotente, una célula pluripotente no humana, una célula pluripotente humana, una célula pluripotente de roedor, una célula pluripotente de ratón, una célula pluripotente de rata, una célula madre embrionaria (ES) de ratón, una célula ES de rata, una célula ES humana, una célula madre adulta humana, una célula progenitora humana restringida por el desarrollo, o una célula madre pluripotente inducida (iPS) humana. Opcionalmente, la célula eucariota es un embrión en etapa de una célula. Opcionalmente, la célula eucariota es un embrión en etapa de una célula, y el vector de transformación es de entre aproximadamente 50 nucleótidos a aproximadamente 5 kb de longitud. Opcionalmente, la célula eucariota es un embrión en etapa de una célula, y el vector de transformación es ADN monocatenario y es de entre aproximadamente 60 a aproximadamente 200 nucleótidos de longitud.
En algunos métodos, la primera proteína Cas es Cas9. En algunos métodos, la primera proteína Cas tiene actividad nucleasa en ambas cadenas de ADN bicatenario.
En algunos métodos, la primera proteína Cas es una nlckasa. Algunos métodos comprenden además poner en contacto el genoma con: (f) una segunda proteína Cas que es una nlckasa; (g) un tercer ARN de CRISPR que se híbrida con una tercera secuencia de reconocimiento de ARN de CRISPR; y (h) un cuarto ARN de CRISPR que se híbrida con una cuarta secuencia de reconocimiento de ARN de CRISPR; en donde la primera proteína Cas escinde una primera cadena de ADN genómico dentro de la primera secuencia de reconocimiento de ARN de CRISPR y dentro de la segunda secuencia de reconocimiento de ARN de CRISPR, y la segunda proteína Cas escinde una segunda cadena de ADN genómico dentro de la tercera secuencia de reconocimiento de ARN de CRISPR y dentro de la cuarta secuencia de reconocimiento de ARN de CRISPR.
En algunos métodos, el primer ARN de CRISPR y el ARNtracr se fusionan entre como un primer ARN guía (ARNg), y/o el segundo ARN de CRISPR y el ARNtracr se fusionan entre como un segundo ARNg. En algunos métodos, el primer ARN de CRISPR y el ARNtracr son moléculas de ARN separadas, y/o el segundo ARN de CRISPR y el ARNtracr son moléculas de ARN separadas.
En algunos métodos, el contacto comprende introducir la primera proteína Cas, el primer y segundo ARN de CRISPR, y el ARNtracr en la célula. En algunos métodos, (a) la primera proteína Cas se introduce en la célula en forma de una proteína, un ARN mensajero (ARNm) que codifica la primera proteína Cas, o un ADN que codifica la primera proteína Cas; (b) el primer ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el primer ARN de CRISPR; (c) el segundo ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el segundo ARN de CRISPR; y/o (d) el ARNtracr se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el ARNtracr. En algunos métodos, la primera proteína Cas, el primer ARN de CRISPR, y el ARNtracr se introducen en la célula como un primer complejo de ARN y proteína, y/o la primera proteína Cas, el segundo ARN de CRISPR, y el ARNtracr se introducen en la célula como un segundo complejo de ARN y proteína. En algunos métodos, (a) el a D n que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; (b) el ADN que codifica el primer ARN de CRISPR se une operativamente a un segundo promotor en un segundo constructo de expresión; (c) el ADN que codifica el segundo ARN de CRISPR se une operativamente a un tercer promotor en un tercer constructo de expresión; y/o (d) el ADN que codifica el ARNtracr se une operativamente a un cuarto promotor en un cuarto constructo de expresión; en donde el primer, segundo, tercer, y cuarto promotores son activos en la célula. Opcionalmente, el primer, segundo, tercer, y/o cuarto constructos de expresión son componentes de una sola molécula de ácido nucleico. En algunos métodos, (a) el ADN que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; (b) los ADN que codifican el primer ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un primer ARN guía (ARNg) y se unen operativamente a un segundo promotor en un segundo constructo de expresión; y/o (c) Ios ADN que codifican el segundo ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un segundo ARNg y se unen operativamente a un tercer promotor en un tercer constructo de expresión; en donde el primer, segundo, y tercer promotores son activos en la célula. Opcionalmente, el primer, segundo, y/o tercer constructos de expresión son componentes de una sola molécula de ácido nucleico.
En algunos métodos, la célula se ha modificado para disminuir la unión de extremos no homólogos (NHEJ) y/o para aumentar la conversión génica o la reparación dirigida por homología (HDR). Opcionalmente, la célula se ha modificado para disminuir la expresión o la actividad de A D N -P k y/o para disminuir la expresión o la actividad de PARP1. Opcionalmente, la célula se ha modificado para disminuir la expresión o la actividad de la ligasa IV. Opcionalmente, la disminución de la expresión o la actividad es inducible, reversible, temporalmente específica, y/o espacialmente específica.
En algunos métodos, (1) la célula no es un embrión en etapa de una célula, y el vector de transformación es un vector de transformación grande, en donde Ios brazos de homología 5' y 3' tienen una suma total de al menos 10 kb; (2) la primera y segunda secuencias de reconocimiento de ARN de CRISPR se ubican cada una más de 200 pb, más de 300 pb, más de 400 pb, más de 500 pb, más de 600 pb, más de 700 pb, más de 800 pb, más de 900 pb, más de 1 kb, más de 2 kb, más de 3 kb, más de 4 kb, más de 5 kb, más de 6 kb, más de 7 kb, más de 8 kb, más de 9 kb, más de 10 kb, más de 20 kb, más de 30 kb, más de 40 kb, más de 50 kb, más de 60 kb, más de 70 kb, más de 80 kb, más de 90 kb, o más de 100 kb de las secuencias diana 5' y 3'; (3) la primera proteína Cas escinde la primera y segunda secuencias de reconocimiento de ARN de CRISPR en al menos uno del primer y segundo cromosomas homólogos para generar al menos dos rupturas bicatenarias en al menos uno del primer y segundo cromosomas homólogos; y (4) la modificación bialélica comprende la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo y una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer cromosoma homólogo, en donde la secuencia del inserto de ácido nucleico es homóloga u ortóloga a la secuencia eliminada.
La descripción proporciona además métodos para producir un animal no humano de generación FO, que comprenden: (a) introducir una célula ES no humana en un embrión huésped no humano, en donde la célula ES no humana se produjo por cualquiera de Ios métodos anteriores; y (b) gestar el embrión huésped no humano en una madre sustituta; en donde la madre sustituta produce el animal no humano de generación FO que comprende la modificación bialélica. Algunos métodos comprenden: (a) poner en contacto el genoma en una célula ES no humana con: (i) una primera proteína Cas; (ii) un primer ARN de C R IS p R que se hibrida con una primera secuencia de reconocimiento de a R n de c R iSPR dentro de un Iocus genómico diana; (iii) un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana; (Iv ) un ARNtracr; y (v ) un vector de transformación que comprende un inserto de ácido nucleico flanqueado por un brazo de homología 5' y un brazo de homología 3', en donde el genoma comprende un par de primer y segundo cromosomas homólogos que comprenden el Iocus genómico diana; y en donde la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria en al menos uno del primer y segundo cromosomas homólogos; (b) identificar una célula ES no humana que comprende la modificación bialélica; (c) introducir la célula ES no humana que comprende la modificación bialélica en un embrión huésped no humano; y (d) gestar el embrión huésped no humano en una madre sustituta; en donde la madre sustituta produce el animal no humano de generación FO que comprende la modificación bialélica.
En algunos métodos, la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR en cada uno del primer y segundo cromosomas homólogos para generar al menos una ruptura bicatenaria en cada uno del primer y segundo cromosomas homólogos. En algunos métodos, la primera proteína Cas escinde la primera y segunda secuencias de reconocimiento de ARN de CRISPR en al menos uno del primer y segundo cromosomas homólogos para generar al menos dos rupturas bicatenarias en al menos uno del primer y segundo cromosomas homólogos.
En algunos métodos, el animal no humano es un ratón, la célula ES no humana es una célula ES de ratón, y el embrión huésped no humano es un embrión huésped de ratón. En algunos métodos, el animal no humano es una rata, la célula ES no humana es una célula ES de rata, y el embrión huésped no humano es un embrión huésped de rata.
En algunos métodos, la modificación bialélica da como resultado homocigosidad o heterocigosidad combinada en el Iocus genómico diana. Opcionalmente, la heterocigosidad combinada es hemicigosidad.
En algunos métodos, el primer ARN de CRISPR y el ARNtracr se fusionan entre como un primer ARN guía (ARNg), y/o el segundo ARN de CRISPR y el ARNtracr se fusionan entre como un segundo ARNg. En algunos métodos, el primer ARN de CRISPR y el ARNtracr son moléculas de ARN separadas, y/o el segundo ARN de CRISPR y el ARNtracr son moléculas de ARN separadas.
En algunos métodos, el contacto comprende introducir la primera proteína Cas, el primer y segundo ARN de CRISPR, y el ARNtracr en la célula. En algunos métodos, (a) la primera proteína Cas se introduce en la célula en forma de una proteína, un ARN mensajero (ARNm) que codifica la primera proteína Cas, o un ADN que codifica la primera proteína Cas; (b) el primer ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el primer ARN de CRISPR; (c) el segundo ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el segundo ARN de CRISPR; y/o (d) el ARNtracr se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el ARNtracr. En algunos métodos, la primera proteína Cas, el primer ARN de CRISPR, y el ARNtracr se introducen en la célula como un primer complejo de ARN y proteína, y/o la primera proteína Cas, el segundo ARN de CRISPR, y el ARNtracr se introducen en la célula como un segundo complejo de ARN y proteína. En algunos métodos, (a) el a D n que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; (b) el ADN que codifica el primer ARN de CRISPR se une operativamente a un segundo promotor en un segundo constructo de expresión; (c) el ADN que codifica el segundo ARN de CRISPR se une operativamente a un tercer promotor en un tercer constructo de expresión; y/o (d) el ADN que codifica el ARNtracr se une operativamente a un cuarto promotor en un cuarto constructo de expresión; en donde el primer, segundo, tercer, y cuarto promotores son activos en la célula. Opcionalmente, el primer, segundo, tercer, y/o cuarto constructos de expresión son componentes de una sola molécula de ácido nucleico. En algunos métodos, (a) el ADN que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; (b) Ios ADN que codifican el primer ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un primer ARN guía (ARNg) y se unen operativamente a un segundo promotor en un segundo constructo de expresión; y/o (c) Ios ADN que codifican el segundo ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un segundo ARNg y se unen operativamente a un tercer promotor en un tercer constructo de expresión; en donde el primer, segundo, y tercer promotores son activos en la célula. Opcionalmente, el primer, segundo, y/o tercer constructos de expresión son componentes de una sola molécula de ácido nucleico.
En algunos métodos, la primera proteína Cas es Cas9. En algunos métodos, la primera proteína Cas tiene actividad nucleasa en ambas cadenas de ADN bicatenario.
En algunos métodos, la primera proteína Cas es una nickasa. Algunos métodos comprenden además poner en contacto el genoma con: (f) una segunda proteína Cas que es una nickasa; (g) un tercer ARN de CRISPR que se hibrida con una tercera secuencia de reconocimiento de ARN de CRISPR; y (h) un cuarto ARN de CRISPR que se hibrida con una cuarta secuencia de reconocimiento de ARN de CRISPR; en donde la primera proteína Cas escinde una primera cadena de ADN genómico dentro de la primera secuencia de reconocimiento de ARN de CRISPR y dentro de la segunda secuencia de reconocimiento de ARN de CRISPR, y la segunda proteína Cas escinde una segunda cadena de ADN genómico dentro de la tercera secuencia de reconocimiento de ARN de CRISPR y dentro de la cuarta secuencia de reconocimiento de ARN de CRISPR.
En algunos métodos, la célula se ha modificado para disminuir la unión de extremos no homólogos (NHEJ) y/o para aumentar la conversión génica o la reparación dirigida por homología (HDR). Opcionalmente, la célula se ha modificado para disminuir la expresión o la actividad de ADN-PK y/o para disminuir la expresión o la actividad de PARP1. Opcionalmente, la célula se ha modificado para disminuir la expresión o la actividad de la ligasa IV. Opcionalmente, la disminución de la expresión o la actividad es inducible, reversible, temporalmente específica, y/o espacialmente específica.
La descripción proporciona además métodos para producir un animal no humano de generación FO, que comprenden implantar en una madre sustituta un embrión genéticamente modificado en etapa de una célula que se produjo por cualquiera de los métodos anteriores; en donde la madre sustituta produce el animal no humano de generación FO que comprende la modificación bialélica.
La descripción proporciona además métodos para modificar un genoma dentro de una célula que es heterocigótica para un primer alelo, que comprenden poner en contacto el genoma con: (a) una primera proteína Cas; (b) un ARNtracr; (c) un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro de un segundo alelo, en donde el primer alelo está en un primer cromosoma homólogo y el segundo alelo está en un Iocus correspondiente en un segundo cromosoma homólogo; y (d) un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del segundo alelo; en donde la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria y secuencias de extremos que experimentan recombinación, en donde la recombinación es entre el primer y segundo alelos para formar un genoma modificado que es homocigótico para el primer alelo. Algunos métodos comprenden además identificar una célula que es homocigótica para el primer alelo.
En algunos métodos, la primera proteína Cas escinde la primera secuencia de reconocimiento de ARN de CRISPR y la segunda secuencia de reconocimiento de ARN de CRISPR. En algunos métodos, la primera proteína Cas escinde la primera secuencia de reconocimiento de ARN de CRISPR y la segunda secuencia de reconocimiento de ARN de CRISPR para generar al menos dos rupturas bicatenarias y secuencias de extremos que experimentan recombinación. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se ubican dentro del segundo alelo pero no en el primer alelo. En algunos métodos, la proteína Cas y el primer ARN de CRISPR no aparecen juntos en la naturaleza.
En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 1OO kb, aproximadamente 1OO kb a aproximadamente 15O kb, aproximadamente 15O kb a aproximadamente 2OO kb, aproximadamente 2OO kb a aproximadamente 3OO kb, aproximadamente 3OO kb a aproximadamente 4OO kb, aproximadamente 4OO kb a aproximadamente 5OO kb, aproximadamente 5OO kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, o aproximadamente 2,5 Mb a aproximadamente 3 Mb. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 1OO kb, al menos 110 kb, al menos 12O kb, al menos 13O kb, al menos 14O kb, al menos 15O kb, al menos 16O kb, al menos 17O kb, al menos 18O kb, al menos 19O kb, al menos 2OO kb, al menos 25O kb, al menos 3OO kb, al menos 35O kb, al menos 4OO kb, al menos 45O kb, o al menos 5OO kb. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 1OO pb, aproximadamente 1OO pb a aproximadamente 15O pb, aproximadamente 15O pb aproximadamente 2OO pb, aproximadamente 2OO Pb a aproximadamente 25O pb, aproximadamente 25O pb aproximadamente 3OO pb, aproximadamente 3OO Pb a aproximadamente 35O pb, aproximadamente 35O pb aproximadamente 4OO pb, aproximadamente 4OO Pb a aproximadamente 45O pb, aproximadamente 45O pb aproximadamente 5OO pb, aproximadamente 5OO Pb a aproximadamente 6OO pb, aproximadamente 6OO pb aproximadamente 7OO pb, aproximadamente 7OO Pb a aproximadamente 8OO pb, aproximadamente 8OO pb aproximadamente 9OO pb, o aproximadamente 9OO Pb a aproximadamente 1 kb. En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se encuentran separadas por menos de 25 pb, menos de 50 pb, menos de 1OO pb, menos de 15O pb, menos de 2OO pb, menos de 25O pb, menos de 3OO pb, menos de 35O pb, menos de 4OO pb, menos de 45O pb, menos de 5OO pb, menos de 6OO pb, menos de 7OO pb, menos de 8OO pb, menos de 9OO pb, menos de 1 kb, menos de 2 kb, menos de 3 kb, menos de 4 kb, menos de 5 kb, o menos de 10 kb.
En algunos métodos, las diferencias de secuencias entre el primer alelo y el segundo alelo abarcan aproximadamente 1OO pb a aproximadamente 2OO pb, aproximadamente 2OO pb a aproximadamente 4OO pb, aproximadamente 4OO pb a aproximadamente 6OO pb, aproximadamente 6OO pb a aproximadamente 8OO pb, aproximadamente 8OO pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 1OO kb, aproximadamente 1OO kb a aproximadamente 15O kb, aproximadamente 15O kb a aproximadamente 2OO kb, aproximadamente 2OO kb a aproximadamente 3OO kb, aproximadamente 3OO kb a aproximadamente 4OO kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, o aproximadamente 2,5 Mb a aproximadamente 3 Mb. En algunos métodos, las diferencias de secuencias entre el primer alelo y el segundo alelo abarcan al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 800 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb.
En algunos métodos, el primer alelo comprende una modificación dirigida y el segundo alelo es un alelo de tipo silvestre. En algunos métodos, el primer alelo es un alelo de tipo silvestre, y el segundo alelo comprende una mutación que causa enfermedad.
En algunos métodos, la recombinación comprende la conversión génica. En algunos métodos, la recombinación comprende la pérdida de heterocigosidad (LOH).
En algunos métodos, la célula huésped es una célula eucariota. Opcionalmente, la célula eucariota es una célula de mamífero, una célula humana, una célula no humana, una célula de roedor, una célula de ratón, o una célula de rata. Opcionalmente, la célula eucariota es una célula pluripotente, una célula no pluripotente, una célula pluripotente no humana, una célula pluripotente humana, una célula pluripotente de roedor, una célula pluripotente de ratón, una célula pluripotente de rata, una célula madre embrionaria (ES) de ratón, una célula ES de rata, una célula ES humana, una célula madre adulta humana, una célula progenitora humana restringida por el desarrollo, o una célula madre pluripotente inducida (iPS) humana.
En algunos métodos, la primera proteína Cas es Cas9. En algunos métodos, la primera proteína Cas tiene actividad nucleasa en ambas cadenas de ADN bicatenario.
En algunos métodos, la primera proteína Cas es una nickasa. Algunos métodos comprenden además poner en contacto el genoma con: (f) una segunda proteína Cas que es una nickasa; (g) un tercer ARN de CRISPR que se hibrida con una tercera secuencia de reconocimiento de ARN de CRISPR; y (h) un cuarto ARN de CRISPR que se hibrida con una cuarta secuencia de reconocimiento de ARN de CRISPR; en donde la primera proteína Cas escinde una primera cadena de ADN genómico dentro de la primera secuencia de reconocimiento de ARN de CRISPR y dentro de la segunda secuencia de reconocimiento de ARN de CRISPR, y la segunda proteína Cas escinde una segunda cadena de ADN genómico dentro de la tercera secuencia de reconocimiento de ARN de CRISPR y dentro de la cuarta secuencia de reconocimiento de ARN de CRISPR.
En algunos métodos, el primer ARN de CRISPR y el ARNtracr se fusionan entre como un primer ARN guía (ARNg), y/o el segundo ARN de CRISPR y el ARNtracr se fusionan entre como un segundo ARNg. En algunos métodos, el primer ARN de CRISPR y el ARNtracr son moléculas de ARN separadas, y/o el segundo ARN de CRISPR y el ARNtracr son moléculas de ARN separadas.
En algunos métodos, el contacto comprende introducir la primera proteína Cas, el primer y segundo ARN de CRISPR, y el ARNtracr en la célula. En algunos métodos, (a) la primera proteína Cas se introduce en la célula en forma de una proteína, un ARN mensajero (ARNm) que codifica la primera proteína Cas, o un ADN que codifica la primera proteína Cas; (b) el primer ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el primer ARN de CRISPR; (c) el segundo ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el segundo ARN de CRISPR; y/o (d) el ARNtracr se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el ARNtracr. En algunos métodos, la primera proteína Cas, el primer ARN de CRISPR, y el ARNtracr se introducen en la célula como un primer complejo de ARN y proteína, y/o la primera proteína Cas, el segundo ARN de CRISPR, y el ARNtracr se introducen en la célula como un segundo complejo de ARN y proteína. En algunos métodos, (a) el a D n que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; (b) el ADN que codifica el primer ARN de CRISPR se une operativamente a un segundo promotor en un segundo constructo de expresión; (c) el ADN que codifica el segundo ARN de CRISPR se une operativamente a un tercer promotor en un tercer constructo de expresión; y/o (d) el ADN que codifica el ARNtracr se une operativamente a un cuarto promotor en un cuarto constructo de expresión; en donde el primer, segundo, tercer, y cuarto promotores son activos en la célula. Opcionalmente, el primer, segundo, tercer, y/o cuarto constructos de expresión son componentes de una sola molécula de ácido nucleico. En algunos métodos, (a) el ADN que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; (b) los ADN que codifican el primer ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un primer ARN guía (ARNg) y se unen operativamente a un segundo promotor en un segundo constructo de expresión; y/o (c) Ios ADN que codifican el segundo ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un segundo ARNg y se unen operativamente a un tercer promotor en un tercer constructo de expresión; en donde el primer, segundo, y tercer promotores son activos en la célula. Opcionalmente, el primer, segundo, y/o tercer constructos de expresión son componentes de una sola molécula de ácido nucleico.
En algunos métodos, la célula se ha modificado para disminuir la unión de extremos no homólogos (NHEJ) y/o para aumentar la conversión génica o la reparación dirigida por homología (HDR). Opcionalmente, la célula se ha modificado para disminuir la expresión o la actividad de A D N -P k y/o para disminuir la expresión o la actividad de PARP1. Opcionalmente, la célula se ha modificado para disminuir la expresión o la actividad de la ligasa IV. Opcionalmente, la disminución de la expresión o la actividad es inducible, reversible, temporalmente específica, y/o espacialmente específica.
La descripción proporciona además métodos para modificar un genoma dentro de una célula que es heterocigótica para un primer alelo, que comprenden poner en contacto el genoma con: (a) una primera proteína Cas; (b) un ARNtracr; y (c) un primer ARN de CRiSPR que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR sin especificidad por alelo, en donde el primer alelo está en un primer cromosoma homólogo y la secuencia de reconocimiento de ARN de c R iSPR es centromérica al Iocus correspondiente al primer alelo en un segundo cromosoma homólogo; y en donde la primera proteína Cas escinde la primera secuencia de reconocimiento de ARN de CRISPR para generar una ruptura bicatenaria y la célula se modifica para convertirla en homocigótica para el primer alelo. Algunos métodos comprenden además identificar una célula que es homocigótica para el primer alelo. En algunos métodos, la proteína Cas y el primer ARN de CRISPR no aparecen Juntos en la naturaleza.
Tales métodos pueden comprender además poner en contacto el genoma con un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR sin especificidad por alelo centromérica al Iocus correspondiente al primer alelo en un segundo cromosoma homólogo, en donde la primera proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria. En algunos métodos, la primera proteína Cas escinde la primera secuencia de reconocimiento de ARN de CRISPR y la segunda secuencia de reconocimiento de ARN de CRISPR.
En algunos métodos, la pérdida de heterocigosidad ocurre en la orientación telomérica de la ruptura bicatenaria.
En algunos métodos, la primera y segunda secuencias de reconocimiento de ARN de CRISPR se ubican en el segundo cromosoma homólogo pero no en el primer cromosoma homólogo. En algunos métodos, el primer sitio de reconocimiento de ARN de CRISPR está de aproximadamente 100 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb del centrómero. En algunos métodos, el primer alelo está de aproximadamente 100 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb del primer sitio de reconocimiento de ARN de CRISPR. En algunos métodos, la región del segundo cromosoma homólogo que se reemplaza por pérdida de heterocigosidad es de aproximadamente 100 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb.
En algunos métodos, la célula huésped es una célula eucariota. Opcionalmente, la célula eucariota es una célula de mamífero, una célula humana, una célula no humana, una célula de roedor, una célula de ratón, una célula de rata, una célula pluripotente, una célula no pluripotente, una célula pluripotente no humana, una célula pluripotente humana, una célula pluripotente de roedor, una célula pluripotente de ratón, una célula pluripotente de rata, una célula madre embrionaria (ES) de ratón, una célula ES de rata, una célula ES humana, una célula madre adulta humana, una célula progenitora humana restringida por el desarrollo, una célula madre pluripotente inducida (iPS) humana, o un embrión en etapa de una célula.
En algunos métodos, la primera proteína Cas es Cas9. En algunos métodos, la primera proteína Cas tiene actividad nucleasa en ambas cadenas de ADN bicatenario. En algunos métodos, la primera proteína Cas es una nickasa. Opcionalmente, la primera proteína Cas es una nickasa, y en donde el método comprende además poner en contacto el genoma con una segunda proteína Cas que es una nickasa, un tercer ARN de CRISPR que se hibrida con una tercera secuencia de reconocimiento de ARN de C r ISPR, y un cuarto ARN de CRISPR que se hibrida con una cuarta secuencia de reconocimiento de ARN de CRISPR, en donde la primera proteína Cas escinde una primera cadena de ADN genómico dentro de la primera secuencia de reconocimiento de A r N de CRISPR y dentro de la segunda secuencia de reconocimiento de ARN de CRISPR, y la segunda proteína Cas escinde una segunda cadena de ADN genómico dentro de la tercera secuencia de reconocimiento de A r N de CRISPR y dentro de la cuarta secuencia de reconocimiento de ARN de CRISPR.
En algunos métodos, el primer ARN de CRISPR y el ARNtracr se fusionan entre como un primer ARN guía (ARNg), y/o el segundo ARN de CRISPR y el ARNtracr se fusionan entre como un segundo ARNg. En algunos métodos, el primer ARN de CRISPR y el ARNtracr son moléculas de ARN separadas, y/o el segundo ARN de CRISPR y el ARNtracr son moléculas de ARN separadas.
En algunos métodos, el contacto comprende introducir la primera proteína Cas, el primer y segundo ARN de CRISPR, y el ARNtracr en la célula. En algunos métodos, la primera proteína Cas se introduce en la célula en forma de una proteína, un ARN mensajero (ARNm) que codifica la primera proteína Cas, o un ADN que codifica la primera proteína Cas. Opcionalmente, el ADN que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión, en donde el primer promotor es activo en la célula. En algunos métodos, el primer ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el primer a R n de CRISPR. Opcionalmente, el ADN que codifica el primer ARN de CRISPR se une operativamente a un segundo promotor en un segundo constructo de expresión, en donde el segundo promotor es activo en la célula. En algunos métodos, el segundo ARN de CRISPR se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el segundo ARN de CRISPR. Opcionalmente, el ADN que codifica el segundo ARN de CRISPR se une operativamente a un tercer promotor en un tercer constructo de expresión, en donde el tercer promotor es activo en la célula. En algunos métodos, el ARNtracr se introduce en la célula en forma de un ARN o en forma de un ADN que codifica el ARNtracr. Opcionalmente, el ADN que codifica el ARNtracr se une operativamente a un cuarto promotor en un cuarto constructo de expresión, en donde el cuarto promotor es activo en la célula. Opcionalmente, el primer, segundo, tercer, y/o cuarto constructos de expresión son componentes de una sola molécula de ácido nucleico.
Opcionalmente, el ADN que codifica la primera proteína Cas se une operativamente a un primer promotor en un primer constructo de expresión; los ADN que codifican el primer ARN de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un primer ARN guía (ARNg) y se unen operativamente a un segundo promotor en un segundo constructo de expresión; y/o los ADN que codifican el segundo a R n de CRISPR y el ARNtracr se fusionan entre en un ADN que codifica un segundo ARNg y se unen operativamente a un tercer promotor en un tercer constructo de expresión; en donde el primer, segundo, y tercer promotores son activos en la célula. Opcionalmente, el primer, segundo, y/o tercer constructos de expresión son componentes de una sola molécula de ácido nucleico.
Opcionalmente, la primera proteína Cas, el primer ARN de CRISPR, y el ARNtracr se introducen en la célula como un primer complejo de ARN y proteína, y/o la primera proteína Cas, el segundo ARN de CRISPR, y el ARNtracr se introducen en la célula como un segundo complejo de ARN y proteína.
En algunos métodos, la célula se ha modificado para disminuir la unión de extremos no homólogos (NHEJ) y/o para aumentar la conversión génica o la reparación dirigida por homología (HDR). Opcionalmente, la célula se ha modificado para disminuir la expresión y/o la actividad de uno o más de los siguientes: ADN-PK, PARP1, y ligasa IV. Opcionalmente, la disminución de la expresión o la actividad es inducible, reversible, temporalmente específica, y/o espacialmente específica.
En algunos métodos, el primer alelo comprende una mutación. Opcionalmente, la mutación es una modificación dirigida. En algunos métodos, el primer alelo es un alelo de tipo silvestre, y el Iocus correspondiente en el segundo cromosoma homólogo comprende una mutación.
La descripción proporciona además métodos que identifican la inserción dirigida de un inserto de ácido nucleico en un Iocus genómico diana en una célula diploide que no es un embrión en etapa de una célula, que comprenden: (a) obtener ADN de la célula, en donde la célula se ha puesto en contacto con un vector de transformación grande (LTVEC) que comprende el inserto de ácido nucleico flanqueado por un primer brazo de homología que se hibrida con una primera secuencia diana y un segundo brazo de homología que se hibrida con una segunda secuencia diana, en donde el inserto de ácido nucleico comprende un casete de selección adyacente al primer brazo de homología; (b) exponer el ADN de la célula a una sonda que se une dentro de la primera secuencia diana, una sonda que se une dentro del inserto de ácido nucleico, y una sonda que se une dentro de un gen de referencia que tiene un número de copias conocido, en donde cada sonda genera una señal detectable tras la unión; (c) detectar las señales de la unión de cada una de las sondas; y (d) comparar la señal de la sonda del gen de referencia con la señal de la sonda de la primera secuencia diana para determinar un número de copias de la primera secuencia diana, y comparar la señal de la sonda del gen de referencia con la señal de la sonda del inserto de ácido nucleico para determinar un número de copias del inserto de ácido nucleico, en donde un número de copias del inserto de ácido nucleico de uno o dos y un número de copias de la primera secuencia diana de dos indica la inserción dirigida del inserto de ácido nucleico en el Iocus genómico diana, y en donde un número de copias del inserto de ácido nucleico de uno o más y un número de copias de la primera secuencia diana de tres o más indica una inserción aleatoria del inserto de ácido nucleico en un Iocus genómico distinto al Iocus genómico diana.
En algunos métodos, la señal de la unión de la sonda de la primera secuencia diana se usa para determinar un valor de ciclo umbral (Ct) de la primera secuencia diana, la señal de la unión de la sonda del gen de referencia se usa para determinar un valor de ciclo umbral (Ct) del gen de referencia, y el número de copias de la primera secuencia diana se determina mediante la comparación del valor de Ct de la primera secuencia diana y el valor de Ct del gen de referencia. En algunos métodos, la señal de la unión de la sonda del inserto de ácido nucleico se usa para determinar un valor de ciclo umbral (Ct) del inserto de ácido nucleico, y el número de copias del inserto de ácido nucleico se determina mediante la comparación del valor de Ct de la primera secuencia diana y el valor de Ct del gen de referencia.
En algunos métodos, el casete de selección comprende un gen de resistencia a fármaco.
En algunos métodos, el inserto de ácido nucleico es de al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb. En algunos métodos, la distancia entre las secuencias a las que se unen las sondas en la primera secuencia diana y el casete de selección es de no más de 100 nucleótidos, 20 o nucleótidos, 300 nucleótidos, 400 nucleótidos, 500 nucleótidos, 600 nucleótidos, 700 nucleótidos, 800 nucleótidos, 900 nucleótidos, 1 kb, 1,5 kb, 2 kb, 2,5 kb, 3 kb, 3,5 kb, 4 kb, 4,5 kb, o 5 kb.
Algunos métodos comprenden además determinar el número de copias de la segunda secuencia diana. Opcionalmente, la etapa (b) comprende además exponer el ADN de la célula a una sonda que se une a la segunda secuencia diana, la etapa (c) comprende además detectar la señal de la unión de la sonda de la segunda secuencia diana, y la etapa (d) comprende además comparar la señal de la sonda del gen de referencia con la señal de la sonda de la segunda secuencia diana para determinar un número de copias de la segunda secuencia diana.
Algunos métodos comprenden además determinar el número de copias de una o más secuencias adicionales dentro del inserto de ácido nucleico. Opcionalmente, la etapa (b) comprende además exponer el ADN de la célula a una o más sondas adicionales que se unen al inserto de ácido nucleico, la etapa (c) comprende además detectar la señal de la unión de la una o más sondas adicionales, y la etapa (d) comprende además comparar la señal de la sonda del gen de referencia con la señal de la una o más sondas del inserto de ácido nucleico adicionales para determinar los números de copias de la una o más secuencias adicionales dentro del inserto de ácido nucleico. Opcionalmente, la una o más secuencias adicionales dentro del inserto de ácido nucleico comprenden una secuencia adyacente a la segunda secuencia diana.
En algunos métodos, el LTVEC se diseña para eliminar una secuencia endógena del Iocus genómico diana, o la célula se ha puesto en contacto además con una proteína Cas, un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro de un Iocus genómico diana, un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana, y un ARNtracr. Opcionalmente, tales métodos comprenden además determinar el número de copias de las secuencias endógenas en el Iocus genómico diana. Opcionalmente, la etapa (b) comprende además exponer el ADN de la célula a una sonda que se une a la secuencia endógena en el Iocus genómico diana, la etapa (c) comprende además detectar la señal de la unión de la sonda de la secuencia endógena, y la etapa (d) comprende además comparar la señal de la sonda del gen de referencia con la señal de la sonda de la secuencia endógena para determinar un número de copias de la secuencia endógena.
Breve descripción de las figuras
La Figura 1 muestra una representación esquemática de la deleción simultánea del ectodominio Lrp5 de ratón y su reemplazo con una versión humana correspondiente LRP5 mediante el uso de un LTVEC y uno o dos ARNg para la región 5' (A, B, B2), la región media (C, D), y la región 3' (E2, E, F). El LTVEC se muestra en la porción superior de la figura, y el Iocus del gen Lrp5 de ratón se muestra en la porción inferior de la figura. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios ocho ARN guías se indican con las flechas verticales debajo de la secuencia del gen de ratón. Las flechas horizontales representan cebadores de PCR para las secuencias de ratón y humano.
La Figura 2A muestra una representación esquemática general de la deleción simultánea de un gen de ratón y su reemplazo con una versión humana correspondiente mediante el uso de un LTVEC y dos ARN guías (ARN guías A y B). El LTVEC se muestra en la porción superior de la Figura 2A, y el Iocus del gen de ratón se muestra en la porción inferior de la Figura 2A. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios dos ARN guías se indican con las flechas debajo de la secuencia del gen de ratón.
Las Figuras 2B-E muestran las modificaciones bialélicas únicas (tipos de alelos) que ocurren a una frecuencia mayor cuando se usan dos ARN guías. Las líneas gruesas con rayas diagonales indican el gen de ratón, las líneas de puntos indican deleciones en el gen de ratón, y las líneas negras gruesas indican la inserción del gen humano. La Figura 2B muestra alelos homocigóticos colapsados (deleción grande inducida por CRISPR). La Figura 2C muestra alelos con transformación homocigótica. La Figura 2D muestra alelos con transformación hemicigótica. La Figura 2E muestra alelos heterocigóticos combinados.
La Figura 3A y 3B muestran ensayos de PCR que confirman Ios genotipos de clones seleccionados. La Figura 3A muestra Ios resultados de ensayos de PCR de largo alcance de clones de células ES seleccionados mediante el uso de Ios cebadores m-lr-f y m-5'-r, que establecen la unión entre el inserto humano y las secuencias fuera de las homólogas al brazo de homología 5', para demostrar de este modo la transformación correcta. La Figura 3B muestra Ios resultados de Ios ensayos de PCR 5' Del J, 5' Ins J, Del A F, y Del A E2. 5' Del J representa Ios productos de PCR mediante el uso de Ios cebadores m-5'-f y m-5-r, que amplifican la secuencia de tipo silvestre que rodea el sitio de escisión del ARNg A para establecer la retención o la pérdida de esta secuencia. 5' Ins J representa Ios productos de PCR mediante el uso de Ios cebadores m-5'-f y h-5'-r, que establecen una unión entre el inserto humano y el genoma de ratón. Este ensayo proporcionará un resultado positivo en clones con integración tanto dirigida como aleatoria. Del A F representa el tamaño de amplicón esperado (359 pb) y las bandas reales para la deleción grande mediada por la escisión por el par de ARNg A y F en Ios clones BO-FIO y a W -A8. Del A E2 representa la misma idea para el clon BA-A7. NT indica sin plantilla, /+ indica control de tipo silvestre de células ES híbridas VGF1 progenitoras, h /+ indica genotipo humanizado heterocigótico, H/A indica genotipo humanizado hemicigótico, H/H indica genotipo humanizado homocigótico, y A/A indica genotipo con deleción homocigótica.
La Figura 4A-C muestra el análisis de hibridación fluorescente in situ (FISH) de Ios clones de células ES de ratón AW-D9 (Figura 4A) y BA-D5 (Figura 4C), que se transformaron con el LTVEC de humanización de Lrp5 combinado con Cas9 y dos ARNg, y el clon BS-C4 (Figura 4B), que se transformó con el LTVEC soIo. Las flechas indican las posiciones de las señales de hibridación en la banda B del cromosoma 19. Una señal roja indica la hibridación solamente con la sonda de ratón (flecha discontinua, Figura 4B). Una señal de color amarillo mixto indica la hibridación tanto con la sonda de ratón roja como con la sonda humana verde. Una banda B de cromosoma 19 que tiene una señal roja (flecha discontinua) y la otra banda B de cromosoma 19 que tiene una señal amarilla (flecha sólida) confirmaron la transformación del Iocus correcto y el genotipo heterocigótico para el clon BS-C4 (Figura 4B). Las bandas B de ambos cromosomas 19 que tienen una señal amarilla (flechas sólidas, Figuras 4A y 4C) confirmaron la transformación del Iocus correcto y Ios genotipos homocigóticos para Ios clones AW-D9 y BS-C4.
La Figura 5 muestra una representación esquemática del cromosoma 19 con ensayos diseñados para examinar Ios eventos de conversión génica o recombinación mitótica mediados por dos ARN guías mediante el análisis de la pérdida de heterocigosidad (LOH) en células ES híbridas VGF1. Las posiciones aproximadas de Ios ensayos de número de copias cromosómicas (CCN) por qPCR TaqMan® se muestran con flechas. Las posiciones aproximadas de Ios ensayos de Pc R de polimorfismo de variantes estructurales (SV) se muestran con cheurones con sus distancias (en Mb) del Iocus Lrp5 proporcionadas anteriormente. Las posiciones aproximadas de Ios ensayos de discriminación alélica TaqMan® de variantes de nucleótido simple (SNV) se muestran con puntas de flecha con sus distancias (en Mb) del Iocus de Lrp5 proporcionadas debajo. Las posiciones de Ios sitios de reconocimiento de ARNg para F, E2, D, B2, y A se muestran con flechas diagonales encima de la representación del gen Lrp5.
La Figura 6 muestra una representación esquemática de la deleción simultánea de la región desde el exón 2 hasta el codón de terminación del gen C5 (H c) de ratón y su reemplazo con una versión humana correspondiente C5 mediante el uso de un LTVEC y uno o dos ARNg para la región 5' (A, B), la región media (C, D), y la región 3' (E, E2). El LTVEC se muestra en la porción superior de la figura, y el Iocus del gen C5 (H c) de ratón se muestra en la porción inferior de la figura. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios seis ARN guías se indican con las flechas debajo de la secuencia del gen de ratón.
Las Figuras 7A y 7B muestran el análisis de hibridación fluorescente in situ (FISH) de Ios clones de células ES de ratón Q-E9 (Figura 7A) y 0-E3 (Figura 7B), que se transformaron con el LTVEC de humanización de Hc combinado con Cas9 y dos ARNg. Las flechas indican las posiciones de las señales de hibridación en la banda B de cromosoma 2. Una señal roja indica la hibridación solamente con la sonda de ratón (flecha discontinua, Figura 7A). Una señal de color amarillo mixto indica la hibridación tanto con la sonda de ratón roja como con la sonda humana verde (flecha sólida). Una banda B de cromosoma 2 que tiene una señal roja (flecha discontinua) y la otra banda B de cromosoma 2 que tiene una señal amarilla (flecha sólida) confirmaron la transformación del Iocus correcto y el genotipo heterocigótico para el clon Q-E9 (Figura 7A). Las bandas B de ambos cromosomas 2 que tienen una señal amarilla (flecha sólidas, Figura 7B) confirmaron la transformación del Iocus correcto y el genotipo homocigótico para el clon 0-E3.
La Figura 8 muestra una representación esquemática de la deleción simultánea del gen Rorl de ratón y su reemplazo con una versión humana correspondiente ROR1 mediante el uso de un LTVEC y uno o dos ARNg para la región 5' (A, B), la región media (D, C), y la región 3' (E, F). El LTVEC se muestra en la porción superior de la figura, y el Iocus del gen Rorl de ratón se muestra en la porción inferior de la figura. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios seis ARN guías se indican con las flechas debajo de la secuencia del gen de ratón.
La Figura 9 muestra una representación esquemática de la deleción simultánea del gen Trpal de ratón y su reemplazo con una versión humana correspondiente t R p A I mediante el uso de un LTVEC y uno o dos ARNg para la región 5' (A, A2, B), la región media (C, D), y la región 3' (E2, E, F). El LTVEC se muestra en la porción superior de la figura, y el Iocus del gen Trpal de ratón se muestra en la porción inferior de la figura. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios ocho ARN guías se indican con las flechas debajo de la secuencia del gen de ratón.
La Figura 1OA-E muestra Ios resultados de Ios ensayos de variación estructural (SV) de Ios clones BR-B4, BP-G7, BO-G11, BO-FIO, BO-A8, y BC-H9, mediante el uso de ADN de VGF1 (F1H4), 129, y B6 como controles. Los ensayos se realizaron a las siguientes distancias teloméricas al Iocus de Lrp5: 13,7 Mb (Figura 10A), 20,0 Mb (Figura 10B), 36,9 Mb (Figura 10C), 48,3 Mb (Figura 10D), y 56,7 Mb (Figura 10E). Las posiciones de Ios productos de PCR para Ios alelos B6 y 129 se muestran con las flechas.
La Figura 11A-C muestra gráficos de discriminación alélica para las 0,32 Mb centroméricas de Lrp5 (Figura 11A), 1,2 Mb teloméricas de Lrp5(Figura 11B), y 57,2 Mb teloméricas de Lrp5 (Figura 11C). Los valores en cada eje representan la intensidad de fluorescencia relativa. Los gráficos representan cuatro réplicas para cada muestra, que se muestran como puntos sólidos (alelo B6), puntos abiertos (alelo 129), y puntos con líneas diagonales (ambos alelos B6/129).
La Figura 12A-C es una representación esquemática que muestra un posible mecanismo de recombinación mitótica durante la fase G2 del ciclo celular que puede producir eventos homocigóticos y conversión génica de amplio alcance detectados por la pérdida de heterocigosidad. La Figura 12A muestra cromosomas homólogos replicados que muestran las dos cromátidas en una célula ES 129/B6 híbrida heterocigótica para una humanización dirigida en el homólogo 129. Las flechas de dos puntas indican las rupturas bicatenarias potenciales generadas por la escisión por Cas9 dirigida por dos ARNg que promueven el intercambio recíproco por recombinación homóloga entre las cromátidas en cromosomas homólogos, mostrado como un entrecruzamiento en el lado centromérico del alelo diana, lo que da como resultado las cromátidas híbridas que se muestran en la Figura 12B. La Figura 12C muestra que después de la mitosis y la división celular, son posibles cuatro tipos de segregación de Ios cromosomas a las células hijas. Dos con retención de la heterocigosidad, un heterocigótico del tipo progenitor (Hum/+, porción superior izquierda) y un heterocigótico por intercambio equivalente (Hum/+, porción superior derecha), no pueden distinguirse por Ios ensayos LOH. Otros dos muestran pérdida de heterocigosidad, un homocigótico humanizado (Hum/Hum, por ejemplo el clon BO-A8, porción inferior izquierda) con pérdida de alelos B6 teloméricos y un homocigótico de tipo silvestre (+/+, porción inferior derecha) con pérdida de alelos 129 teloméricos. Este último tipo se perderá debido a que no retiene el casete de resistencia a fármaco del alelo humanizado.
La Figura 13 muestra una representación esquemática de la deleción simultánea de la región desde el exón 2 hasta el codón de terminación del gen C5 (H c) de ratón y su reemplazo con una versión humana correspondiente C5 mediante el uso de un vector de transformación con tamaños de Ios brazos de homología de 35 kb y 31 kb (LTVEC) o un vector de transformación con tamaños de Ios brazos de homología de 5 kb cada uno (sTVEC) y uno o dos ARNg para la región 5' (A, B), la región media (C, D), y la región 3' (E, E2). Los dos vectores de transformación se muestran en la porción superior de la figura, y el Iocus del gen C5 (H c) de ratón se muestra en la porción inferior de la figura. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios seis ARN guías se indican con las flechas verticales debajo de la secuencia del gen de ratón, y Ios cebadores usados para el tamizaje se indican con flechas horizontales. Las posiciones de Ios ensayos de ganancia de alelos (GOA) que cuantifican el número de copias del inserto y Ios ensayos de pérdida de alelos (LOA) que cuantifican la secuencia de ratón reconocida para la deleción se indican con Ios triángulos.
La Figura 14 muestra una representación esquemática de la deleción simultánea de Ios primeros cinco exones del gen Cmah de ratón y su reemplazo con un reportero lacZ y un casete de selección de resistencia a higromicina mediante el uso de un LTVEC y dos ARNg de la región 5' (A, B). El LTVEC se muestra en la porción superior de la figura, y el Iocus del gen Cmah de ratón se muestra en la porción inferior de la figura. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios dos ARN guías se indican con las flechas verticales debajo de la secuencia del gen de ratón, y las posiciones de Ios ensayos GOA que cuantifican el número de copias del inserto y Ios ensayos LOA que cuantifican la secuencia de ratón reconocida para la deleción se indican con Ios triángulos.
La Figura 15 muestra una representación esquemática de Ios eventos de escisión y el producto de supresión producido (SEQ ID NO: 112) cuando el Iocus del gen Cmah de ratón (SEQ ID NO: 109) se reconoce con dos ARNg para la región 5' (A y B; SEQ ID NOS: 107 y 108, respectivamente). Las secuencias de ARNg hibridadas al Iocus del gen Cmah están en negritas, las proteínas Cas9 se representan mediante Ios óvalos punteados, Ios sitios de escisión de Cas9 se indican con las flechas verticales, y Ios motivos adyacentes al protoespaciador (PAM) están en recuadros. Las posiciones aproximadas del cebador directo, la sonda, y el cebador inverso del ensayo LOA TaqMan® se indican con las barras horizontales y las flechas en la parte superior de la figura. Los fragmentos 5' y 3' producidos después de la escisión y supresión son las SEQ ID NOS: 110 y 111, respectivamente.
Las Figuras 16A-E muestran posibles mecanismos que explican Ios resultados observados, que incluyen la pérdida de heterocigosidad (LOH), en experimentos de humanización asistida por CRISPR/Cas9 en células ES de ratón híbridas F1 que tienen un complemento cromosómico haploide derivado de la cepa de ratón 129S6/Sv EvT ac y un complemento cromosómico haploide derivado de la cepa de ratón C57BL/6NTac (B6). La Figura 16A muestra el intercambio recíproco de cromátidas por entrecruzamiento mitótico donde ocurre una modificación heterocigótica en el cromosoma 129 antes de la replicación del genoma o después de la replicación del genoma seguido de la conversión génica entre cromátidas hermanas. La Figura 16B muestra el intercambio recíproco de cromátidas por entrecruzamiento mitótico donde una sola cromátida del 129 se modifica después de la replicación del genoma. La Figura 16C muestra el intercambio recíproco de cromátidas por entrecruzamiento mitótico donde no ha ocurrido transformación por LTVEC, pero ha ocurrido escisión por Cas9 en el cromosoma 129 o el B6 (se muestra la escisión de B6). La Figura 16D muestra la copia de cromátidas mediante la replicación inducida por ruptura donde ocurre una modificación heterocigótica en el cromosoma 129 antes de la replicación del genoma o después de la replicación del genoma seguido de la conversión génica entre cromátidas hermanas. La Figura 16E muestra la copia de cromátidas mediante la replicación inducida por ruptura donde una sola cromátida 129 se modifica después de la replicación del genoma. La Figura 16F muestra la copia de cromátidas mediante la replicación inducida por ruptura donde no ha ocurrido transformación por LTVEC, pero ha ocurrido escisión por Cas9 en el cromosoma 129 o el B6 (se muestra la escisión de B6).
La Figura 17A-C muestra estrategias de tamizaje de las modificaciones dirigidas. La Figura 17A muestra una estrategia de tamizaje de modificación de alelo (MOA) estándar para detectar la transformación heterocigótica por un vector de transformación grande (LTVEC) en la que una secuencia endógena en un cromosoma de ratón se elimina y se reemplaza con un inserto Neo-SDC. La estrategia usa las sondas TaqMan® mTU y mTD contra regiones corriente arriba y corriente abajo de la secuencia endógena reconocida para la deleción. La Figura 17B muestra el uso de ensayos de retención TaqMan® (sondas retU y retD) en combinación con ensayos de modificación de alelo (MOA) (sondas mTGU, mTM, y mTGD para el ensayo de pérdida de alelo (LOA), y sondas hTU y hTD para el ensayo de ganancia de alelo (GOA)) para tamizar la humanización asistida por CRISPR/Cas9. La Figura 17C muestra el uso de ensayos de retención TaqMan® (sondas retU y retD) en combinación con ensayos de pérdida de alelo (LOA) (sondas mTGU, mTM, y mTGD)) para tamizar las deleciones asistidas por CRISPR/Cas9 mediante el uso de pares de ARN guías (gU y gD).
La Figura 18 muestra representaciones esquemáticas (no están a escala) de una región de aproximadamente 900 kb de un Iocus de cadena pesada de inmunoglobulina de ratón con segmentos génicos de región variable reemplazados con sus equivalentes humanos (triángulos) y un vector de transformación con un inserto Pgk-Neo (promotor de la fosfoglicerato quinasa I unido operativamente al gen de neomicina fosfotransferasa) flanqueado por sitios IoxP. Se usan dos ARNg para escindir el Iocus de cadena pesada de inmunoglobulina de ratón en el extremo 5' y se usan dos ARNg para escindir el Iocus en el extremo 3', y el vector de transformación elimina y reemplaza el Iocus de cadena pesada de inmunoglobulina de ratón con el inserto Pgk-Neo. Las posiciones de Ios sitios de escisión de Cas9 guiados por Ios cuatro ARN guías se indican con las flechas verticales debajo del Iocus diana. Las líneas horizontales circuladas representan las sondas TaqMan® para Ios ensayos de modificación de alelo (MOA) (hlgH31, hlgH1, mlgHA1, mlgHA7, y hlgH9) y Ios ensayos de retención (5' IgH Brazo 1, 5' IgH Brazo 2, mlgM-398, y mlgM-1045).
Definiciones
Los términos "proteína," "polipéptido," y "péptido," usados indistintamente en la presente descripción, incluyen formas poliméricas de aminoácidos de cualquier longitud, que incluyen aminoácidos codificados y no codificados y aminoácidos químicamente o bioquímicamente modificados o derivatizados. Los términos incluyen además polímeros que se han modificado, tales como polipéptidos que tienen cadenas principales peptídicas modificadas.
Los términos "ácido nucleico" y "polinucleótido," usados indistintamente en la presente descripción, incluyen formas poliméricas de nucleótidos de cualquier longitud, que incluyen ribonucleótidos, desoxirribonucleótidos, o análogos o versiones modificadas de estos. Estos incluyen ADN o ARN monocatenario, bicatenario, y de múltiples cadenas, ADN genómico, A D N c, híbridos ADN-ARN, y polímeros que comprenden bases purínicas, bases pirimidínicas, u otras bases nucleotídicas naturales, químicamente modificadas, bioquímicamente modificadas, no naturales, o derivatizadas.
"Optimización de codones" generalmente incluye un proceso para modificar una secuencia de ácido nucleico para la expresión mejorada en células huésped particulares mediante el reemplazo de al menos un codón de la secuencia nativa con un codón que se usa con mayor frecuencia o con la máxima frecuencia en Ios genes de la célula huésped mientras se mantiene la secuencia de aminoácidos nativa. Por ejemplo, un ácido nucleico que codifica una proteína Cas puede modificarse para sustituir Ios codones que tienen una mayor frecuencia de uso en una célula procariota o eucariota dada, que incluye una célula bacteriana, una célula de levadura, una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster, o cualquier otra célula huésped, en comparación con la secuencia de ácido nucleico de origen natural. Las tablas de uso de codones están fácilmente disponibles, por ejemplo, en la "Base de datos de uso de codones." Estas tablas pueden adaptarse en una serie de maneras. Ver Nakamura y otros (2000) Nucleic Acids Research 28:292. Se dispone además de algoritmos informáticos para la optimización de codones de una secuencia particular para la expresión en un huésped particular (ver, por ejemplo, Gene Forge).
"Unión operativa" o estar "unido operativamente" incluye la yuxtaposición de dos o más componentes (por ejemplo, un promotor y otro elemento de secuencia) de manera que ambos componentes funcionen normalmente y permitan la posibilidad de que al menos uno de Ios componentes pueda mediar una función que se ejerce sobre al menos uno de Ios otros componentes. Por ejemplo, un promotor puede unirse operativamente a una secuencia codificante si el promotor controla el nivel de transcripción de la secuencia codificante en respuesta a la presencia o ausencia de uno o más factores reguladores de la transcripción.
"Complementariedad" de ácidos nucleicos significa que una secuencia de nucleótidos en una cadena de ácido nucleico, debido a la orientación de sus grupos de nucleobases, forma enlaces de hidrógeno con otra secuencia en una cadena de ácido nucleico opuesta. Las bases complementarias en el ADN son típicamente A con T y C con G. En el ARN, son típicamente C con G y U con A. La complementariedad puede ser perfecta o sustancial/suficiente. La complementariedad perfecta entre dos ácidos nucleicos significa que Ios dos ácidos nucleicos pueden formar un dúplex en el que cada base en el dúplex se enlaza a una base complementaria mediante apareamiento de Watson-Crick. Complementariedad "sustancial" o "suficiente" significa que una secuencia en una cadena no es completamente y/o perfectamente complementaria a una secuencia en una cadena opuesta, sino que ocurre el enlace entre bases en las dos cadenas suficiente para formar un complejo híbrido estable en un conjunto de condiciones de hibridación (por ejemplo, concentración de sales y temperatura). Tales condiciones pueden predecirse mediante el uso de las secuencias y cálculos matemáticos estándar para predecir la Tm (temperatura de fusión) de las cadenas hibridadas, o por determinación empírica de la Tm mediante el uso de métodos de rutina. La Tm incluye la temperatura a la cual se desnaturaliza el 50 % de una población de complejos de hibridación formados entre dos cadenas de ácidos nucleicos. A una temperatura por debajo de la Tm, se favorece la formación de un complejo de hibridación, mientras que a una temperatura por encima de la Tm, se favorece la fusión o separación de las cadenas en el complejo de hibridación. La Tm puede calcularse para un ácido nucleico que tiene un contenido de G+C conocido en una solución acuosa de NaCI 1 M mediante el uso de, por ejemplo, T iti=81,5+0,41(% G+C), aunque otros cálculos de Tm conocidos tienen en cuenta las características estructurales del ácido nucleico.
"Condición de hibridación" incluye el entorno acumulado en el que una cadena de ácido nucleico se enlaza a una segunda cadena de ácido nucleico mediante interacciones entre cadenas complementarias y enlaces de hidrógeno para producir un complejo de hibridación. Tales condiciones incluyen los componentes químicos y sus concentraciones (por ejemplo, sales, agentes quelantes, formamida) de una solución acuosa u orgánica que contiene los ácidos nucleicos, y la temperatura de la mezcla. Otros factores, tales como la duración del tiempo de incubación o las dimensiones de la cámara de reacción pueden contribuir al entorno. Ver, por ejemplo, Sarnbrook y otros, Molecular Cloning, A Laboratory Manual, 2.sup.nd ed., pp. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.
La hibridación requiere que los dos ácidos nucleicos contengan secuencias complementarias, aunque son posibles los errores de apareamiento entre bases. Las condiciones adecuadas para la hibridación entre dos ácidos nucleicos dependen de la longitud de los ácidos nucleicos y el grado de complementación, variables bien conocidas en la técnica. Mientras mayor sea el grado de complementación entre dos secuencias de nucleótidos, mayor será el valor de la temperatura de fusión (Tm) de los híbridos de los ácidos nucleicos que tienen esas secuencias. Para las hibridaciones entre ácidos nucleicos con tramos cortos de complementariedad (por ejemplo complementariedad de 35 o menos, 30 o menos, 25 o menos, 22 o menos, 20 o menos, o 18 o menos nucleótidos) la posición de los errores de apareamiento cobra importancia (ver Sambrook y otros, más arriba, 11.7-11.8). Típicamente, la longitud de un ácido nucleico hibridable es de al menos aproximadamente 10 nucleótidos. Las longitudes mínimas ilustrativas de un ácido nucleico hibridable incluyen al menos aproximadamente 15 nucleótidos, al menos aproximadamente 20 nucleótidos, al menos aproximadamente 22 nucleótidos, al menos aproximadamente 25 nucleótidos, y al menos aproximadamente 30 nucleótidos. Además, la temperatura y la concentración de sales de la solución de lavado pueden ajustarse según sea necesario de acuerdo con factores tales como la longitud de la región de complementación y el grado de complementación.
No es necesario que la secuencia del polinucleótido sea 100 % complementaria a la de su ácido nucleico diana para que sea específicamente hibridable. Por otra parte, un polinucleótido puede hibridarse con uno o más segmentos de manera que los segmentos intermedios o adyacentes no estén involucrados en el evento de hibridación (por ejemplo, una estructura de lazo o una estructura en horquilla). Un polinucleótido (por ejemplo, ARNg) puede comprender al menos 70 %, al menos 80 %, al menos 90 %, al menos 95 %, al menos 99 %, o 100 % de complementariedad de secuencia con una región diana dentro de la secuencia de ácido nucleico diana a la que se encuentra orientado. Por ejemplo, un ARNg en el que 18 de 20 nucleótidos son complementarios a una región diana, y por lo tanto se hibridaría específicamente, representaría un 90 % complementariedad. En este ejemplo, los nucleótidos no complementarios restantes pueden agruparse o intercalarse con nucleótidos complementarios y no es necesario que sean contiguos entre sí o a nucleótidos complementarios.
El porcentaje de complementariedad entre tramos particulares de secuencias de ácidos nucleicos dentro de los ácidos nucleicos puede determinarse de manera rutinaria mediante el uso de programas BLAST (herramientas de búsqueda de alineamiento local básico) y programas PowerBLAST conocidos en la técnica (Altschul y otros (1990) J. Mol. Biol. 215:403-410; Zhang y Madden (1997) Genome Res. 7:649-656) o mediante el uso del programa Gap (Paquete de análisis de secuencias Wisconsin, Versión 8 para Unix, Genetics Computer Group, University Research Park, Madison W ís.), mediante el uso de ajustes predeterminados, que usa el algoritmo de Smith y Waterman (Adv. Appl. Math., 1981, 2, 482­ 489).
Los métodos y composiciones proporcionados en la presente descripción emplean una variedad de componentes diferentes. Se reconoce a lo largo de la descripción que algunos componentes pueden tener variantes y fragmentos activos. Tales componentes incluyen, por ejemplo, proteínas Cas, ARN de CRISPR, ARNtracr, y ARN guías. La actividad biológica de cada uno de estos componentes se describe en otra parte en la presente descripción.
"Identidad de secuencia" o "identidad" en el contexto de dos secuencias de polinucleótidos o polipéptidos hace referencia a los residuos en las dos secuencias que son iguales cuando se alinean para su correspondencia máxima en una ventana de comparación especificada. Cuando el porcentaje de identidad de secuencia se usa en referencia a proteínas se reconoce que las posiciones de los residuos que no son idénticas difieren frecuentemente por sustituciones de aminoácidos conservativas, donde los residuos de aminoácidos se sustituyen por otros residuos de aminoácidos con propiedades químicas similares (por ejemplo, carga o hidrofobicidad) y por lo tanto no cambian las propiedades funcionales de la molécula. Cuando las secuencias difieren en sustituciones conservativas, el porcentaje de identidad de secuencia puede ajustarse hacia arriba para corregir la naturaleza conservativa de la sustitución. Se dice que las secuencias que difieren portales sustituciones conservativas tienen "similitud de secuencia" o "similitud". Los medios para hacer este ajuste son bien conocidos para los expertos en la técnica. Típicamente, esto involucra la calificación de una sustitución conservativa como un error de apareamiento parcial en lugar de total, lo que aumenta de este modo el porcentaje de identidad de secuencia. Por lo tanto, por ejemplo, cuando a un aminoácido idéntico se le da una puntuación de 1 y a una sustitución no conservativa se le da una puntuación de cero, a una sustitución conservativa se le da una puntuación entre cero y 1. La puntuación de las substituciones conservativas se calcula, por ejemplo, como se implementa en el programa PC/GENE (Intelligenetics, Mountain View, California).
El "porcentaje de identidad de secuencia" incluye el valor determinado mediante la comparación de dos secuencias óptimamente alineadas en una ventana de comparación, en donde la porción de la secuencia de polinucleótido en la ventana de comparación puede comprender adiciones o deleciones (es decir, interrupciones) en comparación con la secuencia de referencia (que no comprende adiciones o deleciones) para el alineamiento óptimo de las dos secuencias. El porcentaje se calcula mediante la determinación del número de posiciones en las que la base de ácido nucleico o el residuo de aminoácido idéntico aparece en ambas secuencias para producir el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes por el número total de posiciones en la ventana de comparación, y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia.
A menos que se indique de otra manera, los valores de identidad/similitud de secuencia incluyen el valor obtenido mediante el uso del programa GAP Versión 10 que usa los siguientes parámetros: % identidad y % similitud de una secuencia de nucleótidos mediante el uso de Peso de GAP de 50 y Peso de Longitud de 3, y la matriz de puntuación nwsgapdna.cmp; % identidad y % similitud de una secuencia de aminoácidos mediante el uso de Peso de Ga p de 8 y Peso de Longitud de 2, y la matriz de puntuación BLOSUM62; o cualquier programa equivalente de este. "Programa equivalente" incluye cualquier programa de comparación de secuencias que, para dos secuencias cualesquiera en cuestión, genera un alineamiento que tiene coincidencias de nucleótidos o residuos de aminoácidos idénticos y un porcentaje de identidad de secuencia idéntico en comparación con el alineamiento correspondiente generado por el programa GAP Versión 10.
El término "in vitro" incluye entornos artificiales y procesos o reacciones que ocurren dentro de un entorno artificial (por ejemplo, un tubo de ensayo). El término "in vivo" incluye entornos naturales (por ejemplo, una célula u organismo o cuerpo) y procesos o reacciones que ocurren dentro de un entorno natural. El término "ex vivo" incluye células que se han extraído del cuerpo de un individuo y procesos o reacciones que ocurren dentro de tales células.
Composiciones o métodos "que comprenden" o "que incluyen" uno o más elementos mencionados pueden incluir otros elementos no mencionados específicamente. Por ejemplo, una composición que "comprende" o "incluye" una proteína puede contener la proteína sola o en combinación con otros ingredientes.
La designación de un intervalo de valores incluye todos los números enteros dentro de o que definen el intervalo, y todos los subintervalos definidos por los números enteros dentro del intervalo.
A menos que sea evidente de otra manera a partir del contexto, el término "aproximadamente" abarca los valores dentro de un margen estándar de error de medición (por ejemplo, SEM) de un valor indicado.
Las formas singulares de los artículos "un", "una" y "el/la" incluyen las referencias en plural a menos que el contexto lo indique claramente de otra manera. Por ejemplo, el término "una proteína Cas" o "al menos una proteína Cas" puede incluir una pluralidad de proteínas Cas, que incluyen mezclas de estas.
Descripción detallada
I. Ejemplo general
Se proporcionan métodos y composiciones para modificar un genoma dentro de una célula. Los métodos y composiciones emplean sistemas CRISPR/Cas que usan dos ARN guías (ARNg) que reconocen sitios diferentes dentro de un solo Iocus genómico diana. Por ejemplo, Ios métodos y composiciones pueden emplear sistemas CRISPR/Cas que usan Ios dos ARN guías (ARNg) para crear pares de rupturas bicatenarias en sitios diferentes dentro de un solo Iocus genómico diana. Alternativamente, Ios métodos y composiciones pueden emplear sistemas CRISPR/Cas que usan Ios dos ARN guías (ARNg) para crear pares de rupturas monocatenarias en sitios diferentes dentro de un solo Iocus genómico diana. En algunos métodos, dos o más ARN guías (por ejemplo, tres o cuatro) pueden usarse, por ejemplo, para crear dos o más rupturas monocatenarias o rupturas bicatenarias en sitios diferentes dentro de un solo Iocus genómico diana.
Algunos métodos promueven modificaciones genéticas bialélicas y comprenden el colapso del genoma, de manera que una secuencia de ácido nucleico grande se elimina de un cromosoma entre dos sitios de escisión. Otros métodos promueven modificaciones genéticas bialélicas y comprenden la deleción simultánea de una secuencia de ácido nucleico dentro de la célula y su reemplazo con una secuencia de ácido nucleico exógena. Como se describe en más detalle a continuación, estos métodos que usan dos ARNg aumentan la eficiencia de generación de células o animales con modificaciones genéticas dirigidas bialélicas al promover la generación de tales células y animales en una sola etapa de transformación. Por consiguiente, el número de animales y crías necesarios para generar un animal con una modificación genética dirigida bialélica se reduce.
Otros métodos comprenden la conversión génica o la pérdida de heterocigosidad, de manera que un genoma que es heterocigótico para un alelo se modifica para convertirlo en homocigótico para el alelo por medio de la escisión en sitios determinados por dos ARNg en el alelo correspondiente en un cromosoma homólogo correspondiente. Como se describe en más detalle a continuación, el uso de dos ARNg en estos métodos aumenta la frecuencia de conversión génica y hace posible la conversión génica en tramos grandes de ADN cromosómico.
II. Sistemas CRISPR/Cas
Los métodos y composiciones descritos en la presente descripción pueden utilizar sistemas de repeticiones palindrómicas cortas agrupadas y regularmente intercaladas (CRISPR)/proteína asociada a CRISPR (Cas) o componentes de tales sistemas para modificar un genoma dentro de una célula. Los sistemas CRISPR/Cas incluyen transcritos y otros elementos involucrados en la expresión de, o el control de la actividad de, los genes Cas. Un sistema CRISPR/Cas puede ser un sistema tipo I, tipo II, o tipo III. Los métodos y composiciones descritos en la presente descripción emplean sistemas CRISPR/Cas mediante la utilización de complejos CRISPR (que comprenden un A r N guía (ARNg) en complejo con una proteína Cas) para la escisión dirigida al sitio de ácidos nucleicos.
Algunos sistemas CRISPR/Cas usados en los métodos descritos en la presente descripción son de origen no natural. Un sistema "de origen no natural" incluye algo que indique la intervención de la mano del hombre, tal como la alteración o mutación de uno o más componentes del sistema respecto a su estado de origen natural, que esté al menos sustancialmente libre de al menos uno de otro componente con el que se asocia de manera natural en la naturaleza, o que se asocie con al menos uno de otro componente con el que no se asocia de manera natural. Por ejemplo, algunos sistemas CRISPR/Cas emplean complejos c R iSPR de origen no natural que comprenden un ARNg y una proteína Cas que no aparecen juntos en la naturaleza.
A. Endonucleasas Cas guiadas por ARN
Las proteínas Cas generalmente comprenden al menos un dominio de reconocimiento o unión al ARN. Tales dominios pueden interactuar con los ARN guías (ARNg, descritos en más detalle a continuación). Las proteínas Cas pueden comprender además dominios nucleasa (por ejemplo, dominios DNasa o RNasa), dominios de unión al ADN, dominios helicasa, dominios de interacción proteína-proTeína, dominios de dimerización, y otros dominios. Un dominio nucleasa posee actividad catalítica para la escisión de ácidos nucleicos. La escisión incluye la ruptura de los enlaces covalentes de una molécula de ácido nucleico. La escisión puede producir extremos romos o extremos escalonados, y puede ser monocatenaria o bicatenaria.
Los ejemplos de proteínas Cas incluyen Casi, CaslB, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csnl o C sx12), Casio, CaslOd, CasF, CasG, CasH, Csyl, Csy2, Csy3, Csel (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), C sc1, C sc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, C sx17, C sx14, C sx10, C sx16, CsaX, C sx3, C sx1, C sx15, Csfl, Csf2, Csf3, Csf4, y C u1966, y homólogos o versiones modificadas de estas.
En algunos casos, una proteína Cas es de un sistema CRISPR/Cas tipo II. Por ejemplo, la proteína Cas puede ser una proteína Cas9 o derivarse de una proteína Cas9. Las proteínas Cas9 Típicamente comparten cuatro motivos principales con una arquitectura conservada. Los motivos i, 2, y 4 son motivos similares a R uvC, y el motivo 3 es un motivo HNH. La proteína Cas9 puede ser de, por ejemplo, Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, AlicyclobacHIus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, o Acaryochioris marina. Ejemplos adicionales de los miembros de la familia de Cas9 incluyen los descritos en el documento WO 2014/131833. En un ejemplo específico, la proteína Cas9 es una proteína Cas9 de S. pyogenes o se deriva de esta. La secuencia de aminoácidos de una proteína Cas9 de S. pyogenes puede encontrarse, por ejemplo, en la base de datos SwissProt con el número de acceso Q99ZW2.
Las proteínas Cas pueden ser proteínas de tipo silvestre (es decir, las que aparecen en la naturaleza), proteínas Cas modificadas (es decir, variantes de proteínas Cas), o fragmentos de proteínas Cas de tipo silvestre o modificadas. Las proteínas Cas también pueden ser variantes o fragmentos activos de proteínas Cas de tipo silvestre o modificadas. Las variantes o fragmentos activos pueden comprender al menos 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más identidad de secuencia con la proteína Cas de tipo silvestre o modificada o una porción de esta, en donde las variantes activas retienen la capacidad de cortar en un sitio de escisión deseado y por tanto retienen la actividad de inducción de mellas o de inducción de rupturas bicatenarias. Los ensayos de actividad de inducción de mellas o de inducción de rupturas bicatenarias se conocen y generalmente miden la actividad total y la especificidad de la proteína Cas sobre ADN sustratos que contienen el sitio de escisión.
Las proteínas Cas pueden modificarse para aumentar o disminuir su afinidad de unión al ácido nucleico, su especificidad de unión al ácido nucleico, y/o su actividad enzimática. Las proteínas Cas pueden modificarse además para cambiar cualquier otra actividad o propiedad de la proteína, tal como la estabilidad. Por ejemplo, uno o más dominios nucleasa de la proteína Cas pueden modificarse, eliminarse, o inactivarse, o una proteína Cas puede truncarse para eliminar dominios que no son esenciales para la función de la proteína o para optimizar (por ejemplo, mejorar o reducir) la actividad de la proteína Cas.
Algunas proteínas Cas comprenden al menos dos dominios nucleasa, tales como dominios DNasa. Por ejemplo, una proteína Cas9 puede comprender un dominio nucleasa similar a R uvC y un dominio nucleasa similar a HNH. Cada uno de los dominios R uvC y HNH puede cortar una cadena diferente de ADN bicatenario para hacer una ruptura bicatenaria en el ADN. Ver, por ejemplo, Jineky otros (2012) Science 337:816-821.
Uno o ambos dominios nucleasa pueden eliminarse o mutarse de modo que ya no sean funcionales o que tengan actividad nucleasa reducida. Si uno de los dominios nucleasa se elimina o se muta, la proteína Cas resultante (por ejemplo, Cas9) puede referirse como una nickasa y puede generar una ruptura monocatenaria en una secuencia de reconocimiento de ARN de CRISPR dentro de un a D n bicatenario pero no una ruptura bicatenaria (es decir, puede escindir la cadena complementaria o la cadena no complementaria, pero no ambas). Si ambos dominios nucleasa se eliminan o se mutan, la proteína Cas resultante (por ejemplo, Cas9) tendrá una capacidad reducida de escindir ambas cadenas de un ADN bicatenario. Un ejemplo de una mutación que convierte Cas9 en una nickasa es una mutación D10A (aspartato a alanina en la posición 10 de Cas9) en el dominio R uvC de Cas9 de S. pyogenes. Del mismo modo, H939A (histidina a alanina en la posición de aminoácido 839) o H840A (histidina a alanina en la posición de aminoácido 840) en el dominio HNH de Cas9 de S. pyogenes pueden convertir la Cas9 en una nickasa. Otros ejemplos de mutaciones que convierten Cas9 en una nickasa incluyen las mutaciones correspondientes a Cas9 de S. thermophilus. Ver, por ejemplo, Sapranauskas y otros (2011) Nucleic Acids Research 39:9275-9282 y el documento WO 2013/141680. Tales mutaciones pueden generarse mediante el uso de métodos bien conocidos tales como mutagénesis dirigida al sitio, mutagénesis mediada por PCR, o síntesis génica total. Los ejemplos de otras mutaciones que crean nickasas pueden encontrarse, por ejemplo, en los documentos WO/2013/176772A1 y WO/2013/142578A1.
Las proteínas Cas también pueden ser proteínas de fusión. Por ejemplo, una proteína Cas puede fusionarse a un dominio de escisión, un dominio de modificación epigenética, un dominio de activación de la transcripción, o un dominio represor de la transcripción. Ver el documento WO 2014/089290. Las proteínas Cas pueden fusionarse además a un polipéptido heterólogo que proporciona mayor o menor estabilidad. El dominio o polipéptido heterólogo fusionado puede ubicarse en el extremo N-terminal, el extremo C-terminal, o internamente dentro de la proteína Cas.
Un ejemplo de una proteína de fusión Cas es una proteína Cas fusionada a un polipéptido heterólogo que proporciona localización subcelular. Tales secuencias pueden incluir, por ejemplo, una señal de localización nuclear (NLS) tal como la NLS de SV40 para la orientación al núcleo, una señal de localización mitocondrial para la orientación a la mitocondria, una señal de retención en ER, y similares. Ver, por ejemplo, Lange y otros (2007) J. Biol. Chem. 282:5101-5105. Por ejemplo, las proteínas Cas pueden fusionarse a una o más señales de localización nuclear (por ejemplo, dos o tres señales de localización nuclear). Tales señales de localización subcelular pueden ubicarse en el extremo N-terminal, el extremo C-terminal, o en cualquier parte dentro de la proteína Cas. Una NLS puede comprender un tramo de aminoácidos básicos, y puede ser una secuencia monopartita o una secuencia bipartita.
Las proteínas Cas pueden comprender además un dominio de penetración celular. Por ejemplo, el dominio de penetración celular puede derivarse de la proteína TAT de HIV-1, el motivo de penetración celular TLM del virus de la hepatitis B humana, MPG, Pep-1, VP22, un péptido de penetración celular del virus Herpes simplex, o una secuencia peptídica de poliarginina. Ver, por ejemplo, el documento WO 2014/089290. El dominio de penetración celular puede ubicarse en el extremo N-terminal, el extremo C-terminal, o en cualquier parte dentro de la proteína Cas.
Las proteínas Cas pueden comprender además un polipéptido heterólogo para facilitar la detección o la purificación, tal como una proteína fluorescente, una etiqueta de purificación, o una etiqueta tipo epítopo. Los ejemplos de proteínas fluorescentes incluyen proteínas fluorescentes verdes (por ejemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Azami Green monomérica, CopGFP, AceGFP, ZsGreenl), proteínas fluorescentes amarillas (por ejemplo, YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), proteínas fluorescentes azules (por ejemplo eBFP, eBFP2, Azurite, mKalamal, G FP uv, Sapphire, T-sapphire), proteínas fluorescentes cian (por ejemplo eCFp, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes rojas (mKate, mKate2, mPlum, monómero DsRed, mCherry, mRFPI, DsRed-Express, DsRed2, DsRed-Monómero, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), proteínas fluorescentes naranjas (mOrange, mKO, Kusabira-Orange, Kusabira-Orange monomérica, mTangerine, tdTomato), y cualquier otra proteína fluorescente adecuada. Los ejemplos de etiquetas incluyen glutatión-S-transferasa (GST), proteína de unión a quitina (CBP), proteína de unión a maltosa, tiorredoxina (TRX), poli(NANP), etiqueta para la purificación por afinidad en tándem (TAP), myc, A cV5, AU1, AU5, E, ECS, E2, FLAG, hemaglutinina (HA), ñus, Softag 1, Softag 3, Strep, SBP, G Iu-G Iu , HSV, KT3, S, SI, T7, V5, VSV-G, histidina (H ís), proteína portadora de biotina y carboxilo (BCCP), y calmodulina.
Las proteínas Cas pueden proporcionarse en cualquier forma. Por ejemplo, una proteína Cas puede proporcionarse en forma de una proteína, tal como una proteína Cas en complejo con un ARNg. Alternativamente, una proteína Cas puede proporcionarse en forma de un ácido nucleico que codifica la proteína Cas, tal como un ARN (por ejemplo, ARN mensajero (ARNm)) o ADN. Opcionalmente, el ácido nucleico que codifica la proteína Cas puede tener Ios codones optimizados para la traducción eficiente a proteína en una célula u organismo particular. Por ejemplo, el ácido nucleico que codifica la proteína Cas puede modificarse para sustituir Ios codones que tienen una mayor frecuencia de uso en una célula bacteriana, una célula de levadura, una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata, o cualquier otra célula huésped de interés, en comparación con la secuencia de polinucleótido de origen natural. Cuando un ácido nucleico que codifica la proteína Cas se introduce en la célula, la proteína Cas puede expresarse de manera transitoria, de manera condicional, o de manera constitutiva en la célula.
Los ácidos nucleicos que codifican las proteínas Cas pueden integrarse de manera estable en el genoma de la célula y unirse operativamente a un promotor activo en la célula. Alternativamente, Ios ácidos nucleicos que codifican las proteínas Cas pueden unirse operativamente a un promotor en un constructo de expresión. Los constructos de expresión incluyen cualquiera de Ios constructos de ácido nucleico capaces de dirigir la expresión de un gen u otra secuencia de ácido nucleico de interés (por ejemplo, un gen Cas) y que pueden transferir una secuencia de ácido nucleico de interés de este tipo a una célula diana. Por ejemplo, el ácido nucleico que codifica la proteína Cas puede estar en un vector de transformación que comprende un inserto de ácido nucleico y/o un vector que comprende un ADN que codifica un ARNg. Alternativamente, puede estar en un vector o plásmido que se encuentra separado del vector de transformación que comprende el inserto de ácido nucleico y/o separado del vector que comprende el ADN que codifica el ARNg. Los promotores que pueden usarse en un constructo de expresión incluyen, por ejemplo, promotores activos en una célula pluripotente de rata, eucariota, de mamífero, de mamífero no humano, humana, de roedor, de ratón, o de hámster. Pueden usarse además promotores activos en un embrión en etapa de una célula. Tales promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos, o promotores específicos de tejido. Ejemplos de otros promotores se describen en otra parte en la presente descripción.
B. ARN guías (ARNg)
Un "ARN guía" o "ARNg" incluye una molécula de ARN que se une a una proteína Cas y dirige a la proteína Cas hacia un ubicación específica dentro de un ADN diana. Los ARN guías pueden comprender dos segmentos: un "segmento de orientación al ADN" y un "segmento de unión a proteína." "Segmento" incluye un segmento, sección, o región de una molécula, tal como un tramo contiguo de nucleóTidos en un ARN. Algunos ARNg comprenden dos moléculas de ARN separadas: un "ARN activador" y un "ARN orientador." Otros ARNg son una sola molécula de ARN (un solo polinucleótido de ARN), que también puede llamarse una "ARNg de molécula simple," un "ARN guía simple," o un "ARNgs." Ver, por ejemplo, Ios documentos WO/2013/176772A1, WO/2014/065596A1, WO/2014/089290A1, WO/2014/093622A2, WO/2014/099750A2, WO/2013142578A1, y WO 2014/131833A1. Los términos "ARN guía" y "ARNg" son incluyentes, e incluyen tanto Ios ARNg de dos moléculas como Ios ARNg de molécula simple.
Un ARNg de dos moléculas ilustrativo comprende una molécula tipo ARNcr ("ARN de CRISPR" o "ARN orientador" o "ARNcr" o "repetición de ARNcr") y una molécula tipo ARNtracr correspondiente ("ARN de CRISPR transactivador" o "ARN activador" o "ARNtracr" o "andamio"). Un ARNcr comprende tanto el segmento de orientación al ADN (monocatenario) del ARNg como un tramo de nucleótidos que forma una mitad del dúplex de ARNbc del segmento de unión a proteína del ARNg.
Un ARNtracr correspondiente (ARN activador) comprende un tramo de nucleótidos que forma la otra mitad del dúplex de ARNbc del segmento de unión a proteína del ARNg. Un tramo de nucleótidos de un ARNcr es complementario a y se hibrida con un tramo de nucleótidos de un ARNtracr para formar el dúplex de ARNbc del dominio de unión a proteína del ARNg. Como tal, puede decirse que cada ARNcr tiene un ARNtracr correspondiente. Los ARNtracr pueden estar en cualquier forma (por ejemplo, ARNtracr de longitud completa o ARNtracr parciales activos) y ser de longitudes variables. Las formas de ARNtracr pueden incluir transcritos primarios o formas procesadas. Por ejemplo, en S. pyogenes, las diferentes formas de Ios ARNtracr incluyen versiones de 171 nucleótidos, 89 nucleótidos, 75 nucleótidos, y 65 nucleótidos. Ver, por ejemplo, Deltcheva y otros (2011) Nature 471:602-607 y el documento WO 2014/093661.
El ARNcr y el ARNtracr correspondiente se hibridan para formar un ARNg. El ARNcr proporciona además el segmento monocatenario de orientación al ADN que se hibrida con una secuencia de reconocimiento de ARN de CRISPR. Si se usa para la modificación dentro de una célula, la secuencia exacta de una molécula de ARNcr o ARNtracr dada puede diseñarse de modo que sea específica para la especie en la que se usarán las moléculas de ARN. Ver, por ejemplo, Mali y otros (2013) Science 339:823-826; Jinek y otros (2012) Science 337:816-821; Hwang y otros (2013) Nat. Biotechnol.
31:227-229; Jiang y otros (2013) Nat. Biotechnol. 31:233-239; y Cong y otros (2013) Science 339:819-823.
El segmento de orientación al ADN (ARNcr) de un ARNg dado comprende una secuencia de nucleótidos que es complementaria a una secuencia en un ADN diana. El segmento de orientación al ADN de un ARNg interactúa con un ADN diana de una manera específica de la secuencia por medio de hibridación (es decir, apareamiento de bases). Como tal, la secuencia de nucleótidos del segmento de orientación al ADN puede variar y determina la ubicación dentro del ADN diana con la que van a interactuar el ARNg y el ADN diana. El segmento de orientación al ADN de un ARNg en cuestión puede modificarse de modo que se hibride con cualquier secuencia deseada dentro de un ADN diana. Los ARNcr de origen natural difieren en dependencia del sistema de Cas9 y el organismo pero frecuentemente contienen un segmento de orientación de entre 21 a 72 nucleótidos de longitud, flanqueado por dos repeticiones directas (DR) de una longitud de entre 21 a 46 nucleótidos (ver, por ejemplo, el documento WO2014/131833). En el caso de S. pyogenes, las DR son de 36 nucleótidos de longitud y el segmento de orientación es de 30 nucleótidos de longitud. La DR ubicada en 3' es complementaria a y se hibrida con el ARNtracr correspondiente, el que a su vez se une a la proteína Cas9.
El segmento de orientación al ADN puede tener una longitud de aproximadamente 12 nucleótidos a aproximadamente 100 nucleótidos. Por ejemplo, el segmento de orientación al ADN puede tener una longitud de aproximadamente 12 nucleótidos (nt) a aproximadamente 80 nt, de aproximadamente 12 nt a aproximadamente 50 nt, de aproximadamente 12 nt a aproximadamente 40 nt, de aproximadamente 12 nt a aproximadamente 30 nt, de aproximadamente 12 nt a aproximadamente 25 nt, de aproximadamente 12 nt a aproximadamente 20 nt, o de aproximadamente 12 nt a aproximadamente 19 nt. Alternativamente, el segmento de orientación al ADN puede tener una longitud de aproximadamente 19 nt a aproximadamente 20 nt, de aproximadamente 19 nt a aproximadamente 25 nt, de aproximadamente 19 nt a aproximadamente 30 nt, de aproximadamente 19 nt a aproximadamente 35 nt, de aproximadamente 19 nt a aproximadamente 40 nt, de aproximadamente 19 nt a aproximadamente 45 nt, de aproximadamente 19 nt a aproximadamente 50 nt, de aproximadamente 19 nt a aproximadamente 60 nt, de aproximadamente 19 nt a aproximadamente 70 nt, de aproximadamente 19 nt a aproximadamente 80 nt, de aproximadamente 19 nt a aproximadamente 90 nt, de aproximadamente 19 nt a aproximadamente 100 nt, de aproximadamente 20 nt a aproximadamente 25 nt, de aproximadamente 20 nt a aproximadamente 30 nt, de aproximadamente 20 nt a aproximadamente 35 nt, de aproximadamente 20 nt a aproximadamente 40 nt, de aproximadamente 20 nt a aproximadamente 45 nt, de aproximadamente 20 nt a aproximadamente 50 nt, de aproximadamente 20 nt a aproximadamente 60 nt, de aproximadamente 20 nt a aproximadamente 70 nt, de aproximadamente 20 nt a aproximadamente 80 nt, de aproximadamente 20 nt a aproximadamente 90 nt, o de aproximadamente 20 nt a aproximadamente 100 nt.
La secuencia de nucleótidos del segmento de orientación al ADN que es complementaria a una secuencia de nucleótidos (secuencia de reconocimiento de ARN de CRISPR) del ADN diana puede tener una longitud de al menos aproximadamente 12 nt. Por ejemplo, la secuencia de orientación al ADN (es decir, la secuencia dentro del segmento de orientación al ADN que es complementaria a una secuencia de reconocimiento de ARN de CRISPR dentro del ADN diana) puede tener una longitud de al menos aproximadamente 12 nt, al menos aproximadamente 15 nt, al menos aproximadamente 18 nt, al menos aproximadamente 19 nt, al menos aproximadamente 20 nt, al menos aproximadamente 25 nt, al menos aproximadamente 30 nt, al menos aproximadamente 35 nt, o al menos aproximadamente 40 nt. Alternativamente, la secuencia de orientación al ADN puede tener una longitud de aproximadamente 12 nucleótidos (nt) a aproximadamente 80 nt, de aproximadamente l2 nt a aproximadamente 50 nt, de aproximadamente 12 nt a aproximadamente 45 nt, de aproximadamente 12 nt a aproximadamente 40 nt, de aproximadamente 12 nt a aproximadamente 35 nt, de aproximadamente 12 nt a aproximadamente 30 nt, de aproximadamente 12 nt a aproximadamente 25 nt, de aproximadamente 12 nt a aproximadamente 20 nt, de aproximadamente 12 nt a aproximadamente 19 nt, de aproximadamente 19 nt a aproximadamente 20 nt, de aproximadamente 19 nt a aproximadamente 25 nt, de aproximadamente 19 nt a aproximadamente 30 nt, de aproximadamente 19 nt a aproximadamente 35 nt, de aproximadamente 19 nt a aproximadamente 40 nt, de aproximadamente 19 nt a aproximadamente 45 nt, de aproximadamente 19 nt a aproximadamente 50 nt, de aproximadamente 19 nt a aproximadamente 60 nt, de aproximadamente 20 nt a aproximadamente 25 nt, de aproximadamente 20 nt a aproximadamente 30 nt, de aproximadamente 20 nt a aproximadamente 35 nt, de aproximadamente 20 nt a aproximadamente 40 nt, de aproximadamente 20 nt a aproximadamente 45 nt, de aproximadamente 20 nt a aproximadamente 50 nt, o de aproximadamente 20 nt a aproximadamente 60 nt. En algunos casos, la secuencia de orientación al ADN puede tener una longitud de aproximadamente 20 nt.
Los ARNtracr pueden estar en cualquier forma (por ejemplo, ARNtracr de longitud completa o ARNtracr parciales activos) y ser de longitudes variables. Pueden incluir transcritos primarios o formas procesadas. Por ejemplo, los ARNtracr (como parte de un ARN guía simple o como una molécula separada como parte de un ARNg de dos moléculas) puede comprender o consistir en la totalidad o una porción de una secuencia de ARNtracr de tipo silvestre (por ejemplo, aproximadamente o más de aproximadamente 2o , 26, 32, 45, 48, 54, 63, 67, 85, o más nucleótidos de una secuencia de ARNtracr de tipo silvestre). Los ejemplos de secuencias de ARNtracr de tipo silvestre de S. pyogenes incluyen versiones de 171 nucleótidos, 89 nucleótidos, 75 nucleótidos, y 65 nucleótidos. Ver, por ejemplo, Deltcheva y otros (2011) Nature 471:602-607; documento WO2014/093661. Los ejemplos de ARNtracr dentro de los ARN guías simples (ARNgs) incluyen los segmentos de ARNtracr encontrados dentro de las versiones 48, 54, 67, y 85 de los ARNgs, donde "+n" indica que hasta el nucleótido n del ARNtracr de tipo silvestre se incluye en el ARNgs. Ver el documento US 8,697,359.
El porcentaje de complementariedad entre la secuencia de orientación al ADN y la secuencia de reconocimiento de ARN de CRISPR dentro del ADN diana puede ser al menos 60 % (por ejemplo, al menos 65 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 97 %, al menos 98 %, al menos 99 %, o 100 %). En algunos casos, el porcentaje de complementarledad entre la secuencia de orientación al ADN y la secuencia de reconocimiento de ARN de CRISPR dentro del ADN diana es al menos 60 % en aproximadamente 20 nucleótidos contiguos. En un ejemplo, el porcentaje de complementariedad entre la secuencia de orientación al ADN y la secuencia de reconocimiento de Ar N de CRISPR dentro del ADN diana es 100 % en los 14 nucleótidos contiguos en el extremo 5' de la secuencia de reconocimiento de ARN de CRISPR dentro de la cadena complementaria del ADN diana y tan bajo como 0 % en el resto. En un caso de este tipo, puede considerarse que la secuencia de orientación al ADN es de 14 nucleótidos de longitud. En otro ejemplo, el porcentaje de complementariedad entre la secuencia de orientación al ADN y la secuencia de reconocimiento de ARN de CRISPR dentro del ADN diana es 100 % en los siete nucleótidos contiguos en el extremo 5' de la secuencia de reconocimiento de ARN de CRISPR dentro de la cadena complementaria del ADN diana y tan bajo como 0 % en el resto. En un caso de este tipo, puede considerarse que la secuencia de orientación al ADN es de 7 nucleótidos de longitud.
El segmento de unión a proteína de un ARNg puede comprender dos tramos de nucleótidos que son complementarios entre sí. Los nucleótidos complementarios del segmento de unión a proteína se hibridan para formar un dúplex de ARN bicatenario (ARNbc). El segmento de unión a proteína de un ARNg en cuestión interactúa con una proteína Cas, y el ARNg dirige la proteína Cas unida a una secuencia de nucleótidos específica dentro del ADN diana por medio del segmento de orientación al ADN.
Los ARN guías pueden incluir modificaciones o secuencias que proporcionan características convenientes adicionales (por ejemplo, estabilidad modificada o regulada; orientación subcelular; detección con una etiqueta fluorescente; un sitio de unión de una proteína o un complejo de proteínas; y similares). Los ejemplos de tales modificaciones incluyen, por ejemplo, una caperuza 5' (por ejemplo, una caperuza de 7-metilguanilato (m7G)); una cola de poliadenina 3' (es decir, una cola poli(A) 3'); una secuencia riboswitch (por ejemplo, para permitir la estabilidad regulada y/o la accesibilidad regulada por proteínas y/o complejos de proteínas); una secuencia de control de la estabilidad; una secuencia que forma un dúplex de ARNbc (es decir, una horquilla); una modificación o secuencia que dirige el ARN a una ubicación subcelular (por ejemplo, núcleo, mitocondria, cloroplastos, y similares); una modificación o secuencia que proporciona la detección (por ejemplo, conjugación directa a una molécula fluorescente, conjugación a una porción que facilita la detección fluorescente, una secuencia que permite la detección fluorescente, etc.); una modificación o secuencia que proporciona un sitio de unión de proteínas (por ejemplo, proteínas que actúan sobre el ADN, que incluyen activadores de la transcripción, represores de la transcripción, Ad N metiltransferasas, ADN desmetilasas, histona acetiltransferasas, histona desacetilasas, y similares); y combinaciones de estas.
Un ARNg puede comprender una secuencia de ácido nucleico que codifica un ARNcr y un ARNtracr. Por ejemplo, un ARNg puede comprender: (a) un ARN quimérico que tiene la secuencia de ácido nucleico 5'-g u u u u a g a g c u a g a a a u a g c a a g u u a a a a u a a g g c u a g u c c g u u a u c a a c u u GAAAAAGUGGCACCGAGUCGGUGCUUUU-3' (SEQ ID NO: 1); o (b) un ARN quimérico que tiene la secuencia de ácido nucleico 5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG-3' (SEQ ID NO: 2).
En algunos casos, el ARNcr comprende 5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAU-3' (SEQ ID NO: 3); 5'-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAG (SEQ ID NO: 4); o 5'-GAGUCCGAGCAGAAGAAGAAGUUUUA-3' (SEQ ID NO: 5).
En algunos casos, el ARNtracr comprende, 5'-AAGGCUAGUCCG-3' (SEQ ID NO: 6) o 5'-a a g g c u a g u c c g u u a u c a a c u u g a a a a a g u g g c a c c g a g u c g g u g c u u u u -3' (s e q id NO: 7).
Los ARN guías pueden proporcionarse en cualquier forma. Por ejemplo, el ARNg puede proporcionarse en forma de ARN, ya sea como dos moléculas (ARNcr y ARNtracr separados) o como una molécula (ARNgs), y opcionalmente en forma de un complejo con una proteína Cas. El ARNg puede proporcionarse además en forma de ADN que codifica el ARN. El ADN que codifica el ARNg puede codificar una sola molécula de ARN (ARNgs) o moléculas de ARN separadas (por ejemplo, ARNcr y ARNtracr separados). En el último caso, el ADN que codifica el ARNg puede proporcionarse como moléculas de ADN separadas que codifican el ARNcr y el ARNtracr, respectivamente.
Cuando un ADN que codifica un ARNg se introduce en la célula, el ARNg puede expresarse de manera transitoria, de manera condicional, o de manera constitutiva en la célula. Los ADN que codifican los ARNg pueden integrarse de manera estable en el genoma de la célula y unirse operativamente a un promotor activo en la célula. Alternativamente, los ADN que codifican los ARNg pueden unirse operativamente a un promotor en un constructo de expresión. Por ejemplo, el ADN que codifica el ARNg puede estar en un vector de transformación que comprende un inserto de ácido nucleico y/o un vector que comprende un ácido nucleico que codifica una proteína Cas. Alternativamente, puede estar en un vector o un plásmido que se encuentra separado del vector de transformación que comprende el inserto de ácido nucleico y/o separado del vector que comprende el ácido nucleico que codifica la proteína Cas. Los promotores que pueden usarse en tales constructos de expresión incluyen promotores activos, por ejemplo, en una célula pluripotente de rata, eucariota, de mamífero, de mamífero no humano, humana, de roedor, de ratón, o de hámster. Pueden usarse además promotores activos en un embrión en etapa de una célula. Tales promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos, o promotores específicos de tejido. En algunos casos, el promotor es un promotor de ARN polimerasa III, tal como un promotor U6 humano, un promotor de polimerasa III U6 de rata, o un promotor de polimerasa III U6 de ratón. Ejemplos de otros promotores se describen en otra parte en la presente descripción.
Alternativamente, los ARNg pueden prepararse mediante varios otros métodos. Por ejemplo, los ARNg pueden prepararse por transcripción in vitro mediante el uso, por ejemplo, de la ARN polimerasa T7 (ver, por ejemplo, los documentos WO 2014/089290 y WO 2014/065596). Los a Rn guías pueden ser además una molécula producida por síntesis preparada por síntesis química.
C. Secuencias de reconocimiento de ARN de CRISPR
El término "secuencia de reconocimiento de ARN de CRISPR" incluye las secuencias de ácidos nucleicos presentes en un ADN diana a las que se unirá un segmento de orientación al ADN de un ARNg, siempre que existan condiciones suficientes para la unión. Por ejemplo, las secuencias de reconocimiento de ARN de CRISp R incluyen las secuencias para las que se diseña un ARN guía de modo que tengan complementariedad, donde la hibridación entre una secuencia de reconocimiento de ARN de CRISPR y una secuencia de orientación al ADN promueve la formación de un complejo CRISp R. No se requiere necesariamente de complementariedad completa, siempre que exista complementariedad suficiente para causar la hibridación y promover la formación de un complejo CRISp R. Las secuencias de reconocimiento de ARN de CRISPR incluyen además sitios de escisión de proteínas Cas, descritos en más detalle a continuación. Una secuencia de reconocimiento de ARN de CRISPR puede comprender cualquier polinucleótido, que puede ubicarse, por ejemplo, en el núcleo o el citoplasma de una célula o dentro de un organelo de una célula, tal como una mitocondria o un cloroplasto.
La secuencia de reconocimiento de ARN de CRISPR dentro de un ADN diana puede reconocerse por (es decir, unirse a, o hibridarse con, o ser complementaria a) una proteína Cas o un ARNg. Las condiciones de unión de ADN/ARN adecuadas incluyen las condiciones fisiológicas presentes normalmente en una célula. Otras condiciones de unión de ADN/ARN adecuadas (por ejemplo, condiciones en un sistema libre de células) se conocen la técnica (ver, por ejemplo, Molecular Cloning: A Laboratory Manual, 3ra Ed. (Sambrook y otros, Harbor Laboratory Press 2001)). La cadena del ADN diana que es complementaria a y se hibrida con la proteína Cas o ARNg puede llamarse la "cadena complementaria," y la cadena del ADN diana que es complementaria a la "cadena complementaria" (y que por lo tanto no es complementaria a la proteína Cas o ARNg) puede llamarse "cadena no complementaria" o "cadena plantilla."
La proteína Cas puede escindir el ácido nucleico en un sitio dentro de o fuera de la secuencia de ácido nucleico presente en el ADN diana a la que se unirá el segmento de orientación al ADN de un ARNg. El "sitio de escisión" incluye la posición de un ácido nucleico en la que una proteína Cas produce una ruptura monocatenaria o una ruptura bicatenaria. Por ejemplo, la formación de un complejo CRISPR (que comprende un ARNg hibridado a una secuencia de reconocimiento de a Rn de CRISPR y en complejo con una proteína Cas) puede dar como resultado la escisión de una o ambas cadenas en o cerca de (por ejemplo, dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, o más pares de bases de) la secuencia de ácido nucleico presente en un ADN diana a la que se unirá un segmento de orientación al ADN de un ARNg. Si el sitio de escisión está fuera de la secuencia de ácido nucleico a la que se unirá el segmento de orientación al ADN del ARNg, el sitio de escisión aún se considera dentro de la "secuencia de reconocimiento de ARN de CRISp R." El sitio de escisión puede estar solamente en una cadena o en ambas cadenas de un ácido nucleico. Los sitios de escisión pueden estar en la misma posición en ambas cadenas del ácido nucleico (lo que produce extremos romos) o pueden estar en sitios diferentes en cada cadena (lo que produce extremos escalonados). Los extremos escalonados pueden producirse, por ejemplo, mediante el uso de dos proteínas Cas, cada una de las cuales produce una ruptura monocatenaria en un sitio de escisión diferente en cada cadena, lo que produce de este modo una ruptura bicatenaria. Por ejemplo, una primera nickasa puede crear una ruptura monocatenaria en la primera cadena de ADN bicatenario (ADNbc), y una segunda nickasa puede crear una ruptura monocatenaria en la segunda cadena de ADNbc de manera que se crean secuencias salientes. En algunos casos, la secuencia de reconocimiento de ARN de CRISPR de la nickasa en la primera cadena se encuentra separada de la secuencia de reconocimiento de ARN de CRISPR de la nickasa en la segunda cadena por al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, o 1000 pares de bases.
La escisión sitio específica del ADN diana por Cas9 puede ocurrir en ubicaciones determinadas por (i) la complementariedad de apareamiento de bases entre el ARNg y el ADN diana y (ii) un motivo corto, llamado el motivo adyacente al protoespaciador (PAM), en el ADN diana. El PAM puede flanquear la secuencia de reconocimiento de ARN de CRISp R. Opcionalmente, la secuencia de reconocimiento de ARN de CRISPR puede estar flanqueada en el extremo 3' por el PAM. Por ejemplo, el sitio de escisión de Cas9 puede estar aproximadamente 1 a aproximadamente 10 o aproximadamente 2 a aproximadamente 5 pares de bases (por ejemplo, 3 pares de bases) corriente arriba o corriente abajo de la secuencia PAM. En algunos casos (por ejemplo, cuando se usa la Cas9 de S. pyogenes o una Cas9 estrechamente relacionada), la secuencia PAM de la cadena no complementaria puede ser 5'-Ni GG-3', donde Ni es cualquier nucleótido de ADN y está inmediatamente 3' de la secuencia de reconocimiento de ARN de CRISPR de la cadena no complementaria del ADN diana. Como tal, la secuencia PAM de la cadena complementaria sería 5'-CCN2-3', donde N2 es cualquier nucleótido de ADN y está inmediatamente 5' de la secuencia de reconocimiento de ARN de CRISPR de la cadena complementaria del ADN diana. En algunos de tales casos, Ni y N2 pueden ser complementarios y el par de bases N1-N2 puede ser cualquier par de bases (por ejemplo, N-f C y N2=G; N-f G y N2=C; N-f A y N2=T; o N-f T, y N2=A).
Los ejemplos de secuencias de reconocimiento de ARN de CRISPR incluyen una secuencia de ADN complementaria al segmento de orientación al ADN de un ARNg, o una secuencia de ADN de este tipo además de una secuencia PAM. Por ejemplo, el motivo diana puede ser una secuencia de ADN de 20 nucleótidos que precede inmediatamente a un motivo NGG reconocido por una proteína Cas, tal como GNigNGG (SEQ ID NO: 8) o N2oNGg (SEQ ID NO: 9) (ver, por ejemplo, el documento w O 2014/165825). La guanina en el extremo 5' puede facilitar la transcripción por la ARN polimerasa en las células. Otros ejemplos de secuencias de reconocimiento de ARN de CRISPR pueden incluir dos nucleótidos de guanina en el extremo 5' (por ejemplo, GGN20NGG; SEQ ID NO: 10) para facilitar la transcripción eficiente por la polimerasa T7 in vitro. Ver, por ejemplo, el documento WO 2014/065596. Otras secuencias de reconocimiento de ARN de CRISPR pueden tener entre 4-22 nucleótidos de longitud de las SEQ ID NOS: 8-10, que incluyen el 5' G o GG y el 3' GG o NGG. Aún otras secuencias de reconocimiento de ARN de CRISPR pueden tener entre 14 y 20 nucleótidos de longitud de las SEQ ID NOS: 8-10. Ejemplos específicos de secuencias de reconocimiento de ARN de CRISPR incluyen secuencias de ADN complementarias a ácidos nucleicos que comprenden cualquiera de las SEQ ID NOS: 11-38.
La secuencia de reconocimiento de ARN de CRISPR puede ser cualquier secuencia de ácido nucleico endógena o exógena a una célula. La secuencia de reconocimiento de ARN de CRISPR puede ser una secuencia que codifica un producto génico (por ejemplo, una proteína) o una secuencia no codificante (por ejemplo, una secuencia reguladora) o puede incluir ambas. En algunos casos, la secuencia de reconocimiento de ARN de CRISPR puede estar dentro de un gen o ácido nucleico asociado a enfermedad y/o dentro de un gen o ácido nucleico asociado a ruta de señalización. Un gen o ácido nucleico asociado a enfermedad incluye cualquier gen o ácido nucleico que produce productos de transcripción o traducción a un nivel anormal o en una forma anormal en células derivadas de tejidos afectados por enfermedad en comparación con tejidos o células de un control sin enfermedad. Por ejemplo, un gen asociado a enfermedad puede poseer una o mutaciones o variaciones genéticas que son directamente responsables de la etiología de una enfermedad o están en desequilibrio de ligamiento con uno o más genes que son responsables de la etiología de una enfermedad. Los productos transcritos o traducidos pueden ser conocidos o desconocidos, y pueden estar a un nivel normal o anormal. Los ejemplos de genes y ácidos nucleicos asociados a enfermedad están disponibles del Instituto de Medicina Genética McKusick-Nathans, Universidad Johns Hopkins (Baltimore, MD) y del Centro Nacional para la Información Biotecnológica, Biblioteca Nacional de Medicina (Bethesda, MD), disponible en la red mundial. Para ejemplos adicionales de genes y ácidos nucleicos asociados a enfermedad, ver la patente de Estados Unidos núm. 8,697,359.
Las mutaciones en los genes que causan enfermedad pueden ser mutaciones recesivas o mutaciones dominantes. Los organismos diploides (es decir, organismos que tienen dos copias de cada cromosoma) típicamente portan dos copias de cada gen. Si las dos copias en un individuo son idénticas, el individuo es homocigótico para el gen. Si las copias están en alelos diferentes, el individuo es heterocigótico para el gen. El término genotipo incluye si un individuo porta mutaciones en un solo gen (o genes), y el término fenotipo incluye las consecuencias físicas y funcionales de ese genotipo. Las mutaciones recesivas incluyen mutaciones en las que ambos alelos deben ser mutantes para que se observe un fenotipo mutante (es decir, el organismo debe ser homocigótico para el alelo mutante para mostrar el fenotipo mutante). Las mutaciones recesivas pueden, por ejemplo, inactivar un gen afectado y conducir a una pérdida de función. Por ejemplo, una mutación recesiva puede eliminar la totalidad o parte de un gen de un cromosoma, interrumpir la expresión de un gen, o alterar la estructura de la proteína codificada, lo que altera de este modo su función. Por el contrario, las mutaciones dominantes incluyen mutaciones en las que el fenotipo mutante se observa en un organismo que es heterocigótico para la mutación (es decir, el organismo porta un alelo mutante y un alelo de tipo silvestre). Una mutación dominante puede, por ejemplo, conducir a una ganancia de función. Por ejemplo, una mutación dominante puede aumentar la actividad de un producto génico dado, confiere una nueva actividad al producto génico, o conduce a su expresión espacial y temporal inadecuada. Una mutación dominante puede asociarse además con una pérdida de función. En algunos casos, si dos copias de un gen se requieren para la función normal, eliminar una sola copia puede causar un fenotipo mutante. Tales genes son haploinsuficientes. En otros casos, las mutaciones en un alelo pueden conducir a un cambio estructural en la proteína que interfiere con la función de la proteína de tipo silvestre codificada por el otro alelo. Tales mutaciones son mutaciones negativas dominantes. Algunos alelos pueden asociarse tanto con un fenotipo recesivo como con uno dominante.
Algunas secuencias de reconocimiento de ARN de CRISPR están dentro de un gen o ácido nucleico que comprende una mutación. La mutación puede ser, por ejemplo, una mutación dominante o una mutación recesiva. En algunos casos, la mutación dominante está dentro de una célula que es heterocigótica para la mutación dominante (es decir, la célula comprende un alelo de tipo silvestre y un alelo mutante que comprende la mutación dominante). En algunos de tales casos, la secuencia de reconocimiento de ARN de CRISPR puede estar dentro del alelo mutante pero no en el alelo de tipo silvestre. Alternativamente, la secuencia de reconocimiento de ARN de CRISPR puede estar dentro del alelo de tipo silvestre pero no en el alelo mutante.
III. Vectores de transformación e insertos de ácido nucleico
Los métodos y composiciones descritos en la presente descripción pueden utilizar además vectores de transformación que comprenden insertos de ácido nucleico y brazos de homología para modificar un genoma dentro de una célula. En tales métodos, el inserto de ácido nucleico se integra en un Iocus genómico diana determinado por los brazos de homología a través de un evento de recombinación homóloga. Los métodos proporcionados en la presente descripción pueden beneficiarse de Ios agentes tipo nucleasa (por ejemplo, proteínas Cas) en combinación con el evento de recombinación homóloga. Tales métodos emplean la mella o ruptura bicatenaria creada por el agente tipo nucleasa en un sitio de escisión de nucleasa en combinación con recombinación homóloga para facilitar la integración dirigida del inserto de ácido nucleico en el Iocus genómico diana.
A. Vectores de transformación e insertos de ácido nucleico para células distintas a Ios embriones en etapa de una célula
(1) Inserto de ácido nucleico
Uno o más insertos de ácido nucleico separados pueden emplearse en Ios métodos descritos en la presente descripción, y pueden introducirse en una célula por medio de vectores de transformación separados o en el mismo vector de transformación. Los insertos de ácido nucleico incluyen segmentos de ADN a integrar en loci genómicos diana. La integración de un inserto de ácido nucleico en un Iocus diana puede dar como resultado la adición de una secuencia de ácido nucleico de interés al Iocus diana, la deleción de una secuencia de ácido nucleico de interés en el Iocus diana, y/o el reemplazo de una secuencia de ácido nucleico de interés en el Iocus diana (es decir, deleción e inserción).
El inserto de ácido nucleico o el ácido nucleico correspondiente en el Iocus diana que se reemplaza puede ser una región codificante, un intrón, un exón, una región no traducida, una región reguladora, un promotor, un potenciador, o cualquier combinación de estos. Por otra parte, el inserto de ácido nucleico o el ácido nucleico correspondiente en el Iocus diana que se reemplaza puede ser de cualquier longitud deseada, que incluye, por ejemplo, entre 10-100 nucleótidos de longitud,
100-500 nucleótidos de longitud, 500 nucleótidos-1 kb de longitud, 1 kb a 1,5 kb de nucleótidos de longitud, 1,5 kb a 2 kb de nucleótidos de longitud, 2 kb a 2,5 kb de nucleótidos de longitud, 2,5 kb a 3 kb de nucleótidos de longitud, 3 kb a 5 kb de nucleótidos de longitud, 5 kb a 8 kb de nucleótidos de longitud, 8 kb a 10 kb de nucleótidos de longitud o más. En otros casos, la longitud puede ser de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 2 o kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 350 kb, de aproximadamente 350 kb a aproximadamente 400 kb, de aproximadamente 400 kb a aproximadamente 800 kb, de aproximadamente 800 kb a 1 Mb, de aproximadamente 1 Mb a aproximadamente 1,5 Mb, de aproximadamente 1,5 Mb a aproximadamente 2 Mb, de aproximadamente 2 Mb, a aproximadamente 2,5 Mb, de aproximadamente 2,5 Mb a aproximadamente 2,8 Mb, de aproximadamente 2,8 Mb a aproximadamente 3 Mb. Aún en otros casos, la longitud puede ser de al menos 100, 200, 300,
400, 500, 600, 700, 800, o 900 nucleótidos o al menos 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 12 kb, 13 kb, 14 kb, 15 kb, 16 kb, o más. Algunos insertos de ácido nucleico pueden ser incluso menores. A modo de ejemplo, un inserto de aproximadamente 4 nucleótidos a aproximadamente 12 nucleótidos de longitud puede insertarse para crear un sitio de enzima de restricción.
En algunos vectores de transformación, el inserto de ácido nucleico puede ser de aproximadamente 5 kb a aproximadamente 200 kb, de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 30 kb, de aproximadamente 30 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 50 kb, de aproximadamente 60 kb a aproximadamente 70 kb, de aproximadamente 80 kb a aproximadamente 90 kb, de aproximadamente 90 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 110 kb, de aproximadamente 120 kb a aproximadamente 130 kb, de aproximadamente 130 kb a aproximadamente 140 kb, de aproximadamente 140 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 160 kb, de aproximadamente 160 kb a aproximadamente 170 kb, de aproximadamente 170 kb a aproximadamente 180 kb, de aproximadamente 180 kb a aproximadamente 190 kb, de aproximadamente 190 kb a aproximadamente 200 kb. Alternativamente, el inserto de ácido nucleico puede ser de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente
20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 350 kb, o de aproximadamente 350 kb a aproximadamente 400 kb.
En algunos casos, el reemplazo del ácido nucleico en el Iocus diana da como resultado la deleción de una secuencia de ácido nucleico en el intervalo de aproximadamente 1 kb a aproximadamente 200 kb, de aproximadamente 2 kb a aproximadamente 20 kb, o de aproximadamente 0,5 kb a aproximadamente 3 Mb. En algunos casos, la extensión de la deleción es mayor que una longitud total del brazo de homología 5' y el brazo de homología 3'.
En algunos casos, la extensión de la deleción de la secuencia de ácido nucleico está en el intervalo de aproximadamente
5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 20 kb aproximadamente 30 kb, de aproximadamente 30 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 50 kb, de aproximadamente 50 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 70 kb, de aproximadamente 70 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 90 kb, de aproximadamente 90 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 110 kb, de aproximadamente 110 kb a aproximadamente 120 kb, de aproximadamente 120 kb a aproximadamente 130 kb, de aproximadamente 130 kb a aproximadamente 140 kb, de aproximadamente 140 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 160 kb, de aproximadamente 160 kb a aproximadamente 170 kb, de aproximadamente 170 kb a aproximadamente 180 kb, de aproximadamente 180 kb a aproximadamente 190 kb, de aproximadamente 190 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 350 kb, de aproximadamente 350 kb a aproximadamente 400 kb, de aproximadamente 400 kb a aproximadamente 800 kb, de aproximadamente 800 kb a 1 Mb, de aproximadamente 1 Mb a aproximadamente 1,5 Mb, de aproximadamente 1,5 Mb a aproximadamente 2 Mb, de aproximadamente 2 Mb, a aproximadamente 2,5 Mb, de aproximadamente 2,5 Mb a aproximadamente 2,8 Mb, de aproximadamente 2,8 Mb a aproximadamente 3 Mb, de aproximadamente 200 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 400 kb, de aproximadamente 400 kb a aproximadamente 500 kb, de aproximadamente 500 kb a aproximadamente 1 Mb, de aproximadamente 1 Mb a aproximadamente 1,5 Mb, de aproximadamente 1,5 Mb a aproximadamente 2 Mb, de aproximadamente 2 Mb a aproximadamente 2,5 Mb, o de aproximadamente 2,5 Mb a aproximadamente 3 Mb.
En otros casos, el inserto de ácido nucleico o el ácido nucleico correspondiente en el Iocus diana que se reemplaza puede ser de al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb o más.
El inserto de ácido nucleico puede comprender ADN genómico o cualquier otro tipo de ADN. Por ejemplo, el inserto de ácido nucleico puede ser de un procariota, un eucariota, una levadura, un ave (por ejemplo, pollo), un mamífero no humano, un roedor, un ser humano, una rata, un ratón, un hámster un conejo, un cerdo, un bovino, un ciervo, una oveja, una cabra, un gato, un perro, un hurón, un primate (por ejemplo, tití, mono rhesus), un mamífero doméstico, un mamífero de uso agrícola, o cualquier otro organismo de interés.
El inserto de ácido nucleico y/o el ácido nucleico en el Iocus diana pueden comprender una secuencia codificante o una secuencia no codificante, tal como un elemento regulador (por ejemplo, un promotor, un potenciador, o un elemento de unión a represor de la transcripción). Por ejemplo, el inserto de ácido nucleico puede comprender un alelo sustituido de al menos un exón de un gen endógeno, o un alelo sustituido del gen endógeno completo (es decir, "sustitución por intercambio de genes").
Por ejemplo, el inserto de ácido nucleico puede ser homólogo u ortólogo a una secuencia que se reconoce para la deleción en el Iocus genómico diana. El inserto de ácido nucleico homólogo u ortólogo puede reemplazar la secuencia que se reconoce para la deleción en el Iocus genómico de interés. Una secuencia homóloga incluye una secuencia de ácido nucleico que es idéntica o sustancialmente similar a una secuencia de referencia conocida, de manera que es al menos
70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99 %, o 100 % idéntica a la secuencia de referencia conocida. Una secuencia ortóloga incluye una secuencia de ácido nucleico de una especie que es funcionalmente equivalente a una secuencia de referencia conocida en otra especie. Esto puede dar como resultado la humanización de un Iocus si la inserción del inserto de ácido nucleico da como resultado el reemplazo de una secuencia de ácido nucleico no humana con una secuencia de ácido nucleico humana homóloga u ortóloga (es decir, el inserto de ácido nucleico se inserta en el lugar de la secuencia de ADN no humana correspondiente en su Iocus genómico endógeno).
El inserto de ácido nucleico puede comprender además un alelo condicional. El alelo condicional puede ser un alelo multifuncional, como se describe en el documento US 2011/0104799. Por ejemplo, el alelo condicional puede comprender:
(a) una secuencia accionadora en orientación con sentido con respecto a la transcripción de un gen diana; (b) un casete de selección de fármaco (DSC) en orientación con sentido o antisentido; (c) una secuencia de nucleótidos de interés (NSI) en orientación antisentido; y (d) un módulo condicional por inversión (COIN, que utiliza un intrón separador de exones y un módulo tipo trampa de genes invertible) en orientación inversa. Ver, por ejemplo, el documento US 2011/0104799. El alelo condicional puede comprender además unidades recombinables que se recombinan tras la exposición a una primera recombinasa para formar un alelo condicional que (i) carece de la secuencia accionadora y el DSC; y (ii) contiene la NSI en orientación con sentido y el COIN en orientación antisentido. Ver el documento US 2011/0104799.
Algunos insertos de ácido nucleico comprenden un polinucleótido que codifica un marcador de selección. El marcador de selección puede estar contenido en un casete de selección. Tales marcadores de selección incluyen, pero no se limitan, a neomicina fosfotransferasa (neoR), higromicina B fosfotransferasa (hygR), puromicina-N-acetiltransferasa (puroR), blasticidina S desaminasa (bsrR), xantina/guanina fosforribosil transferasa (gpt), o timidina quinasa del virus herpes simplex
(HSV-k), o una combinación de estos. El polinucleótido que codifica el marcador de selección puede unirse operativamente a un promotor activo en una célula a transformar. Los ejemplos de promotores se describen en otra parte en la presente descripción.
En algunos vectores de transformación, el inserto de ácido nucleico comprende un gen reportero. Los ejemplos de genes reporteros son Ios genes que codifican luciferasa, p-galactosidasa, proteína fluorescente verde (GFP), proteína fluorescente verde mejorada (eGFP), proteína fluorescente cian (CFP), proteína fluorescente amarilla (YFP), proteína fluorescente amarilla mejorada (eYFP), proteína fluorescente azul (BFP), proteína fluorescente azul mejorada (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Red, mOrange, mKO, mCitrine, Venus, YPet, Emerald, CyPet, Cerulean, T-Sapphire, fosfatasa alcalina, y una combinación de estas. Tales genes reporteros pueden unirse operativamente a un promotor activo en una célula a transformar. Los ejemplos de promotores se describen en otra parte en la presente descripción.
En algunos vectores de transformación, el inserto de ácido nucleico comprende uno o más casetes de expresión o casetes de deleción. Un casete dado puede comprender una secuencia de nucleótidos de interés, un ácido nucleico que codifica un marcador de selección, y/o un gen reportero, junto con varios componentes reguladores que influyen en la expresión. Los ejemplos de marcadores de selección y genes reporteros que pueden incluirse se analizan en detalle en otra parte en la presente descripción.
En algunos vectores de transformación, el inserto de ácido nucleico comprende un ácido nucleico flanqueado con secuencias diana de recombinación sitio específica. Aunque el inserto de ácido nucleico completo puede estar flanqueado portales secuencias diana de recombinación sitio específica, cualquier región o polinucleótido de interés individual dentro del inserto de ácido nucleico también puede estar flanqueado por tales sitios. Las secuencias diana de recombinación sitio específica, que pueden flanquear el inserto de ácido nucleico o cualquier polinucleótido de interés en el inserto de ácido nucleico pueden incluir, por ejemplo, IoxP, Iox511, Iox2272, Iox66, Iox71, IoxM2, Iox5171, FRT, FRT11, FRT71, attp, att, FRT, rox, y una combinación de estas. En un ejemplo, Ios sitios de recombinación sitio específica flanquean un polinucleótido que codifica un marcador de selección y/o un gen reportero contenido dentro del inserto de ácido nucleico. Después de la integración del inserto de ácido nucleico en un Iocus diana, las secuencias entre Ios sitios de recombinación sitio específica pueden eliminarse.
(2) Vectores de transformación
Los vectores de transformación pueden emplearse para introducir el inserto de ácido nucleico en un Iocus genómico diana y comprenden el inserto de ácido nucleico y brazos de homología que flanquean el inserto de ácido nucleico. Los vectores de transformación pueden estar en forma lineal o en forma circular, y pueden ser monocatenarios o bicatenarios. Los vectores de transformación pueden ser de ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN). Para facilitar la referencia, Ios brazos de homología se refieren en la presente descripción como brazos de homología 5' y 3' (es decir, corriente arriba y corriente abajo). Esta terminología se refiere a la posición relativa de Ios brazos de homología respecto al inserto de ácido nucleico dentro del vector de transformación. Los brazos de homología 5' y 3' corresponden a regiones dentro del Iocus diana, que se refieren en la presente descripción como "secuencia diana 5'" y "secuencia diana 3'," respectivamente. Algunos vectores de transformación comprenden brazos de homología 5' y 3' sin inserto de ácido nucleico. Tales vectores de transformación pueden funcionar para eliminar la secuencia entre las secuencias diana 5' y 3' sin insertar un inserto de ácido nucleico.
Un brazo de homología y una secuencia diana "corresponden" o son "correspondientes" entre cuando las dos regiones comparten entre un nivel de identidad de secuencia suficiente para actuar como sustratos de una reacción de recombinación homóloga. El término "homología" incluye secuencias de ADN que son idénticas o comparten identidad de secuencia con una secuencia correspondiente. La identidad de secuencia entre una secuencia diana dada y el brazo de homología correspondiente que se encuentra en el vector de transformación puede ser cualquier grado de identidad de secuencia que permita que ocurra la recombinación homóloga. Por ejemplo, la cantidad de identidad de secuencia compartida por el brazo de homología del vector de transformación (o un fragmento de este) y la secuencia diana (o un fragmento de esta) puede ser al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia, de manera que las secuencias experimenten recombinación homóloga. Por otra parte, una región correspondiente de homología entre el brazo de homología y la secuencia diana correspondiente puede ser de cualquier longitud que sea suficiente para promover la recombinación homóloga en el sitio de reconocimiento escindido. Por ejemplo, un brazo de homología dado y/o la secuencia diana correspondiente pueden comprender regiones correspondientes de homología que son de al menos aproximadamente 5-10 kb, 5-15 kb, 5-20 kb, 5-25 kb, 5-30 kb, 5-35 kb, 5-4o kb, 5-45 kb, 5-50 kb, 5­ 55 kb, 5-60 kb, 5-65 kb, 5-70 kb, 5-75 kb, 5-80 kb, 5-85 kb, 5-90 kb, 5-95 kb, 5-100 kb, 100-200 kb, o 200-300 kb de longitud o más (tal como se describe en Ios vectores LTVEC descritos en otra parte en la presente descripción) de manera que el brazo de homología tenga homología suficiente para experimentar recombinación homóloga con las secuencias diana correspondientes dentro del genoma de la célula.
Los brazos de homología pueden corresponder a un Iocus que es nativo para una célula (por ejemplo, el Iocus diana), o alternativamente pueden corresponder a una región de un segmento de A d N heterólogo o exógeno que se integró en el genoma de la célula, que incluye, por ejemplo, transgenes, casetes de expresión, o regiones de ADN heterólogas o exógenas. Alternativamente, Ios brazos de homología del vector de transformación pueden corresponder a una región de un cromosoma artificial de levadura (YAC), un cromosoma artificial bacteriano (BAC), un cromosoma artificial humano, o cualquier otra región modificada genéticamente contenida en una célula huésped adecuada. Más aún, Ios brazos de homología del vector de transformación pueden corresponder a o derivarse de una región de una biblioteca de BAC, una biblioteca de cósmidos, o una biblioteca de fagos P1. En ciertos casos, Ios brazos de homología del vector de transformación corresponden a un Iocus que es nativo, heterólogo, o exógeno para un procariota, una levadura, un ave (por ejemplo, pollo), un mamífero no humano, un roedor, un ser humano, una rata, un ratón, un hámster un conejo, un cerdo, un bovino, un ciervo, una oveja, una cabra, un gato, un perro, un hurón, un primate (por ejemplo, tití, mono rhesus), un mamífero doméstico, un mamífero de uso agrícola, o cualquier otro organismo de interés. En algunos casos, los brazos de homología corresponden a un Iocus de la célula que no puede transformarse mediante el uso de un método convencional o que puede transformarse solamente de manera incorrecta o solamente con una eficiencia significativamente baja en ausencia de una mella o ruptura bicatenaria inducida por un agente tipo nucleasa (por ejemplo, una proteína Cas). En algunos casos, Ios brazos de homología se derivan de a D n sintético.
En algunos vectores de transformación, Ios brazos de homología 5' y 3' corresponden a un genoma diana. Alternativamente, Ios brazos de homología pueden ser de un genoma relacionado. Por ejemplo, el genoma diana es un genoma de ratón de una primera cepa, y Ios brazos de transformación son de un genoma de ratón de una segunda cepa, en donde la primera cepa y la segunda cepa son diferentes. En ciertos casos, Ios brazos de homología son del genoma del mismo animal o son del genoma de la misma cepa, por ejemplo, el genoma diana es un genoma de ratón de una primera cepa, y Ios brazos de transformación son de un genoma de ratón del mismo ratón o de la misma cepa.
Un brazo de homología de un vector de transformación puede ser de cualquier longitud que sea suficiente para promover un evento de recombinación homóloga con una secuencia diana correspondiente, que incluye, por ejemplo, al menos 5­ 10 kb, 5-15 kb, 5-20 kb, 5-25 kb, 5-30 kb, 5-35 kb, 5-40 kb, 5-45 kb, 5-50 kb, 5-55 kb, 5-60 kb, 5-65 kb, 5-70 kb, 5-75 kb, 5-80 kb, 5-85 kb, 5-90 kb, 5-95 kb, 5-100 kb, 100-200 kb, o 200-300 kb de longitud o más. Como se describe en más detalle a continuación, Ios vectores de transformación grandes pueden emplear brazos de transformación de mayor longitud.
Los agentes tipo nucleasa (por ejemplo, sistemas CRISPR/Cas) pueden emplearse en combinación con vectores de transformación para ayudar a la modificación de un Iocus diana. Tales agentes tipo nucleasa pueden promover la recombinación homóloga entre el vector de transformación y el Iocus diana. Cuando se emplean agentes tipo nucleasa en combinación con un vector de transformación, el vector de transformación puede comprender brazos de homología 5' y 3' correspondientes a secuencias diana 5' y 3' ubicadas en proximidad suficiente a un sitio de escisión de nucleasa a fin de promover la ocurrencia de un evento de recombinación homóloga entre las secuencias diana y Ios brazos de homología tras una mella o ruptura bicatenaria en el sitio de escisión de nucleasa. El término "sitio de escisión de nucleasa" incluye una secuencia de ADN en la que se crea una mella o ruptura bicatenaria por un agente tipo nucleasa (por ejemplo, un sitio de escisión de Cas9). Las secuencias diana dentro del Iocus diana que corresponden a Ios brazos de homología 5' y 3' del vector de transformación se "ubican en proximidad suficiente" a un sitio de escisión de nucleasa si la distancia es tal que promueve la ocurrencia de un evento de recombinación homóloga entre las secuencias diana 5' y 3' y Ios brazos de homología tras una mella o ruptura bicatenaria en el sitio de reconocimiento. Por lo tanto, en casos específicos, las secuencias diana correspondientes a Ios brazos de homología 5' y/o 3' del vector de transformación están dentro de al menos 1 nucleótido de un sitio de reconocimiento dado o están dentro de al menos 10 nucleótidos a aproximadamente 14 kb de un sitio de reconocimiento dado. En algunos casos, el sitio de escisión de nucleasa está inmediatamente adyacente a al menos una o ambas de las secuencias diana.
La relación espacial de las secuencias diana que corresponden a Ios brazos de homología del vector de transformación y el sitio de escisión de nucleasa puede variar. Por ejemplo, las secuencias diana pueden ubicarse 5' al sitio de escisión de nucleasa, las secuencias diana pueden ubicarse 3' al sitio de escisión de nucleasa, o las secuencias diana pueden flanquear el sitio de escisión de nucleasa.
El uso combinado del vector de transformación (que incluye, por ejemplo, un vector de transformación grande) con un agente tipo nucleasa puede dar como resultado un aumento de la eficiencia de transformación en comparación con el uso del vector de transformación soIo . Por ejemplo, cuando un vector de transformación se usa junto con un agente tipo nucleasa, la eficiencia de transformación del vector de transformación puede aumentarse en al menos dos veces, al menos tres veces, al menos 4 veces, o al menos 10 veces en comparación con el uso del vector de transformación soIo .
(3) Vectores de transformación grandes
Algunos vectores de transformación son "vectores de transformación grandes" o "LTVEC," que incluyen vectores de transformación que comprenden brazos de homología que corresponden a y se derivan de secuencias de ácidos nucleicos mayores que las usadas típicamente por otros enfoques destinados a realizar la recombinación homóloga en células. Los LTV e C incluyen además vectores de transformación que comprenden insertos de ácido nucleico que tienen secuencias de ácidos nucleicos mayores que las usadas típicamente por otros enfoques destinados a realizar la recombinación homóloga en células. Por ejemplo, Ios LTVEC hacen posible la modificación de loci grandes que no pueden adaptarse a Ios vectores de transformación basados en plásmidos tradicionales debido a sus limitaciones de tamaño. Por ejemplo, el Iocus diana puede ser (es decir, Ios brazos de homología 5' y 3' pueden corresponder a) un Iocus de la célula que no puede transformarse mediante el uso de un método convencional o que puede transformarse solamente de manera incorrecta o solamente con una eficiencia significativamente baja en ausencia de una mella o ruptura bicatenaria inducida por un agente tipo nucleasa (por ejemplo, una proteína Cas).
Los ejemplos de LTVEC incluyen vectores derivados de un cromosoma artificial bacteriano (BAC), un cromosoma artificial humano, o un cromosoma artificial de levadura (YAC). Los ejemplos no limitantes de LTVEC y métodos para producirlos se describen, por ejemplo, en la patente de Estados Unidos núm. 6,586,251; la patente de Estados Unidos núm.
6,596,541; la patente de Estados Unidos núm. 7,105,348; y el documento WO 2002/036789(PCT/US01/45375). Los LTVEC pueden estar en forma lineal o en forma circular.
Los LTVEC pueden ser de cualquier longitud, que incluye, por ejemplo, de aproximadamente 50 kb a aproximadamente 300 kb, de aproximadamente 50 kb a aproximadamente 75 kb, de aproximadamente 75 kb a aproximadamente 100 kb, de aproximadamente 100 kb a 125 kb, de aproximadamente 125 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 175 kb, aproximadamente 175 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 225 kb, de aproximadamente 225 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 275 kb o de aproximadamente 275 kb a aproximadamente 300 kb. Alternativamente, un LTVEC puede ser de al menos 10 kb, al menos 15 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb o más. El tamaño de un LTVEC puede ser demasiado grande para hacer posible el tamizaje de eventos de transformación por ensayos convencionales, por ejemplo, transferencia Southern y PCR de largo alcance (por ejemplo, 1 kb a 5 kb).
En algunos casos, un LTVEC comprende un inserto de ácido nucleico en el intervalo de aproximadamente 5 kb a aproximadamente 200 kb, de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 30 kb, de aproximadamente 30 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 50 kb, de aproximadamente 60 kb a aproximadamente 70 kb, de aproximadamente 80 kb a aproximadamente 90 kb, de aproximadamente 90 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 110 kb, de aproximadamente 120 kb a aproximadamente 130 kb, de aproximadamente 130 kb a aproximadamente 140 kb, de aproximadamente 140 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 160 kb, de aproximadamente 160 kb a aproximadamente 170 kb, de aproximadamente 170 kb a aproximadamente 180 kb, de aproximadamente 180 kb a aproximadamente 190 kb, o de aproximadamente 190 kb a aproximadamente 200 kb. En otros casos, el inserto de ácido nucleico puede estar en el intervalo de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 350 kb, o de aproximadamente 350 kb a aproximadamente 400 kb.
En algunos LTVEC, la suma total del brazo de homología 5' y el brazo de homología 3' es al menos 10 kb. En otros LTVEC, el brazo de homología 5' está en el intervalo de aproximadamente 5 kb a aproximadamente 100 kb y/o el brazo de homología 3' está en el intervalo de aproximadamente 5 kb a aproximadamente 100 kb. Cada brazo de homología puede ser, por ejemplo, de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 30 kb, de aproximadamente 30 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 50 kb, de aproximadamente 50 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 70 kb, de aproximadamente 70 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 90 kb, de aproximadamente 90 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 110 kb, de aproximadamente 110 kb a aproximadamente 120 kb, de aproximadamente 120 kb a aproximadamente 130 kb, de aproximadamente 130 kb a aproximadamente 140 kb, de aproximadamente 140 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 160 kb, de aproximadamente 160 kb a aproximadamente 170 kb, de aproximadamente 170 kb a aproximadamente 180 kb, de aproximadamente 180 kb a aproximadamente 190 kb, o de aproximadamente 190 kb a aproximadamente 200 kb. La suma total de los brazos de homología 5' y 3' puede ser, por ejemplo, de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 30 kb, de aproximadamente 30 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 50 kb, de aproximadamente 50 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 70 kb, de aproximadamente 70 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 90 kb, de aproximadamente 90 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 110 kb, de aproximadamente 110 kb a aproximadamente 120 kb, de aproximadamente 120 kb a aproximadamente 130 kb, de aproximadamente 130 kb a aproximadamente 140 kb, de aproximadamente 140 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 160 kb, de aproximadamente 160 kb a aproximadamente 170 kb, de aproximadamente 170 kb a aproximadamente 180 kb, de aproximadamente 180 kb a aproximadamente 190 kb, o de aproximadamente 190 kb a aproximadamente 200 kb. Alternativamente, cada brazo de homología puede ser de al menos 5 kb, al menos 10 kb, al menos 15 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, o al menos 200 kb. Del mismo modo, la suma total de los brazos de homología 5' y 3' puede ser de al menos 5 kb, al menos 10 kb, al menos 15 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, o al menos 200 kb.
En algunos casos, el LTVEC y el Inserto de ácido nucleico se diseñan de modo que permitan una deleclón en el Iocus diana de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, o de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 400 kb, de aproximadamente 400 kb a aproximadamente 500 kb, de aproximadamente 500 kb a aproximadamente 1 Mb, de aproximadamente 1 Mb a aproximadamente 1,5 Mb, de aproximadamente 1,5 Mb a aproximadamente 2 Mb, de aproximadamente 2 Mb a aproximadamente 2,5 Mb, o de aproximadamente 2,5 Mb a aproximadamente 3 Mb.
Alternativamente, la deleción puede ser de al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb o más.
En otros casos, el LTVEC y el inserto de ácido nucleico se diseñan de modo que permitan una inserción en el Iocus diana de una secuencia de ácido nucleico exógena en el intervalo de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 250 kb, de aproximadamente 250 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 350 kb, o de aproximadamente 350 kb a aproximadamente 400 kb. Alternativamente, la inserción puede ser de al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb o más.
Aún en otros casos, el inserto de ácido nucleico y/o la región del Iocus endógeno que se elimina es de al menos 100, 200, 300, 400, 500, 600, 700, 800, o 900 nucleótidos o al menos 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 12 kb, 13 kb, 14 kb, 15 kb, 16 kb o más.
B. Vectores de transformación e insertos de ácido nucleico para embriones en etapa de una célula
Los vectores de transformación para el uso en embriones en etapa de una célula son de no más de 5 kb de longitud y pueden ser de ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN), pueden ser monocatenarios o bicatenarios, y pueden estar en forma circular o en forma lineal. Un vector de transformación ilustrativo para el uso en embriones en etapa de una célula es de entre aproximadamente 50 nucleótidos a aproximadamente 5 kb de longitud. Por ejemplo, un vector de transformación para el uso en embriones en etapa de una célula puede ser de entre aproximadamente 50 a aproximadamente 100, aproximadamente 100 a aproximadamente 200, aproximadamente 200 a aproximadamente 300, aproximadamente 300 a aproximadamente 400, aproximadamente 400 a aproximadamente 500, aproximadamente 500 a aproximadamente 600, aproximadamente 600 a aproximadamente 700, aproximadamente 700 a aproximadamente 800, aproximadamente 800 a aproximadamente 900, o aproximadamente 90o a aproximadamente 1000 nucleótidos de longitud. Alternativamente, un vector de transformación para el uso en embriones en etapa de una célula puede ser de entre aproximadamente 1 kb a aproximadamente 1,5 kb, aproximadamente 1,5 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 2,5 kb, aproximadamente 2,5 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 3,5 kb, aproximadamente 3,5 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 4,5 kb, o aproximadamente 4,5 kb a aproximadamente 5 kb de longitud. Alternativamente, un vector de transformación para el uso en embriones en etapa de una célula puede ser, por ejemplo, de no más de 5 kb, 4,5 kb, 4 kb, 3,5 kb, 3 kb, 2,5 kb, 2 kb, 1,5 kb, 1 kb, 900 nucleótidos, 800 nucleótidos, 700 nucleótidos, 600 nucleótidos, 500 nucleótidos, 400 nucleótidos, 300 nucleótidos, 200 nucleótidos, 100 nucleótidos, o 50 nucleótidos de longitud. En el caso de donantes de ADN monocatenario, Ios vectores de transformación ilustrativos pueden ser de entre aproximadamente 60 nucleótidos y aproximadamente 200 nucleótidos (por ejemplo, aproximadamente 60 nucleótidos a aproximadamente 80 nucleótidos, aproximadamente 80 nucleótidos a aproximadamente 100 nucleótidos, aproximadamente 100 nucleótidos a aproximadamente 120 nucleótidos, aproximadamente 120 nucleótidos a aproximadamente 140 nucleótidos, aproximadamente 140 nucleótidos a aproximadamente 160 nucleótidos, aproximadamente 160 nucleótidos a aproximadamente 180 nucleótidos, o aproximadamente 180 nucleótidos a aproximadamente 200 nucleótidos).
Tales vectores de transformación comprenden brazos de homología 5' y 3' correspondientes a regiones dentro del Iocus diana (secuencia diana 5' y secuencia diana 3', respectivamente). Opcionalmente, el vector de transformación comprende un inserto de ácido nucleico (por ejemplo, un segmento de ADN a integrar en un Iocus genómico diana) flanqueado por Ios brazos de homología 5' y 3'. La integración de un inserto de ácido nucleico en un Iocus diana puede dar como resultado la adición de una secuencia de ácido nucleico de interés al Iocus diana, la deleción de una secuencia de ácido nucleico de interés en el Iocus diana, o el reemplazo de una secuencia de ácido nucleico de interés en el Iocus diana (es decir, deleción e inserción).
Una región correspondiente de homología entre el brazo de homología y la secuencia diana correspondiente puede ser de cualquier longitud que sea suficiente para promover la recombinación homóloga. Los brazos de homología ilustrativos para el uso en embriones en etapa de una célula son de entre aproximadamente 20 nucleótidos a aproximadamente 2,5 kb de longitud (por ejemplo, aproximadamente 30 nucleótidos a aproximadamente 100 nucleótldos de longitud). Por ejemplo, un brazo de homología dado y/o la secuencia diana correspondiente pueden comprender regiones correspondientes de homología que son de entre aproximadamente 20 a aproximadamente 30, aproximadamente 30 a aproximadamente 40, aproximadamente 40 a aproximadamente 50, aproximadamente 50 a aproximadamente 60, aproximadamente 60 a aproximadamente 70, aproximadamente 70 a aproximadamente 80, aproximadamente 80 a aproximadamente 90, aproximadamente 90 a aproximadamente 100, aproximadamente 100 a aproximadamente 150, aproximadamente 150 a aproximadamente 200, aproximadamente 200 a aproximadamente 250, aproximadamente 250 a aproximadamente 300, aproximadamente 300 a aproximadamente 350, aproximadamente 350 a aproximadamente 400, aproximadamente 400 a aproximadamente 450, o aproximadamente 450 a aproximadamente 500 nucleótidos de longitud, de manera que los brazos de homología tengan homología suficiente para experimentar recombinación homóloga con las secuencias diana correspondientes dentro del genoma de la célula. Alternativamente, un brazo de homología dado y/o la secuencia diana correspondiente pueden comprender regiones correspondientes de homología que son de entre aproximadamente 0,5 kb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 1,5 kb, aproximadamente 1,5 kb a aproximadamente 2 kb, o aproximadamente 2 kb a aproximadamente 2,5 kb de longitud. En el caso de donantes de ADN monocatenario, los brazos de homología ilustrativos pueden ser de entre aproximadamente 30 nucleótidos y aproximadamente 60 nucleótidos (por ejemplo, aproximadamente 30 a aproximadamente 40 nucleótidos, aproximadamente 40 nucleótidos a aproximadamente 50 nucleótidos, o aproximadamente 50 nucleótidos a aproximadamente 60 nucleótidos).
Como se describió anteriormente, los brazos de homología pueden corresponder a un Iocus que es nativo para una célula (por ejemplo, el Iocus diana), o alternativamente pueden corresponder a una región de un segmento de A d N heterólogo o exógeno que se integró en el genoma de la célula. Como se describió anteriormente, las secuencias diana 5' y 3' se ubican preferentemente en proximidad suficiente al sitio de escisión de Cas a fin de promover la ocurrencia de un evento de recombinación homóloga entre las secuencias diana y Ios brazos de homología tras una ruptura monocatenaria (mella) o una ruptura bicatenaria en el sitio de escisión de Cas.
El inserto de ácido nucleico o el ácido nucleico correspondiente en el Iocus diana que se elimina y/o reemplaza puede ser de varias longitudes. Un inserto de ácido nucleico ilustrativo o ácido nucleico correspondiente en el Iocus diana que se elimina y/o reemplaza es de entre aproximadamente 10 nucleótidos a aproximadamente 5 kb de longitud. Por ejemplo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el Iocus diana que se elimina y/o reemplaza puede ser de entre aproximadamente 1 a aproximadamente 10, aproximadamente 10 a aproximadamente 2 o, aproximadamente 20 a aproximadamente 30, aproximadamente 30 a aproximadamente 40, aproximadamente 40 a aproximadamente 50, aproximadamente 50 a aproximadamente 60, aproximadamente 60 a aproximadamente 70, aproximadamente 70 a aproximadamente 80, aproximadamente 80 a aproximadamente 90, aproximadamente 90 a aproximadamente 100, aproximadamente 100 a aproximadamente 110, aproximadamente 110 a aproximadamente 120, aproximadamente 120 a aproximadamente 130, aproximadamente 130 a aproximadamente 140, aproximadamente 140 a aproximadamente 150, aproximadamente 150 a aproximadamente 160, aproximadamente 160 a aproximadamente 170, aproximadamente 170 a aproximadamente 180, aproximadamente 180 a aproximadamente 190, aproximadamente 190 a aproximadamente 200, aproximadamente 200 a aproximadamente 300, aproximadamente 300 a aproximadamente 400, aproximadamente 400 a aproximadamente 500, aproximadamente 500 a aproximadamente 600, aproximadamente 600 a aproximadamente 700, aproximadamente 700 a aproximadamente 800, aproximadamente 800 a aproximadamente 900, o aproximadamente 900 a aproximadamente 1000 nucleótidos de longitud. A modo de ejemplo, un inserto de aproximadamente 4 nucleótidos a aproximadamente 12 nucleótidos de longitud puede insertarse para crear un sitio de enzima de restricción. Del mismo modo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el Iocus diana que se elimina y/o reemplaza puede ser de entre aproximadamente 1 kb a aproximadamente 1,5 kb, aproximadamente 1,5 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 2,5 kb, aproximadamente 2,5 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 3,5 kb, aproximadamente 3,5 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 4,5 kb, o aproximadamente 4,5 kb a aproximadamente 5 kb de longitud. Un ácido nucleico que se elimina de un Iocus genómico diana puede ser además de entre aproximadamente 5 kb a aproximadamente 1o kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 3o kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 70 kb, aproximadamente 70 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 90 kb, aproximadamente 90 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 200 kb, aproximadamente kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 600 kb, aproximadamente 600 kb a aproximadamente 700 kb, aproximadamente 700 kb a aproximadamente 800 kb, aproximadamente 800 kb a aproximadamente 900 kb, aproximadamente 900 kb a aproximadamente 1 Mb o más. Alternativamente, un ácido nucleico que se elimina de un Iocus genómico diana puede ser de entre aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, aproximadamente 2,5 Mb a aproximadamente 3 Mb, aproximadamente 3 Mb a aproximadamente 4 Mb, aproximadamente 4 Mb a aproximadamente 5 Mb, aproximadamente 5 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb.
Como se describió anteriormente, el inserto de ácido nucleico puede comprender ADN genómico o cualquier otro tipo de ADN, el inserto de ácido nucleico o el ácido nucleico correspondiente en el Iocus diana que se elimina y/o reemplaza puede ser una región codificante o una región no codificante, y el inserto de ácido nucleico puede ser homólogo u ortólogo a una secuencia que se reconoce para la deleción en el Iocus genómico diana. El inserto de ácido nucleico puede comprender además un alelo condicional, un polinucleótido que codifica un marcador de selección, un gen reportero, uno o más casetes de expresión, uno o más casetes de deleción, o un inserto de ácido nucleico que comprende un ácido nucleico flanqueado con secuencias diana de recombinación sitio específica como se describió anteriormente.
C. Promotores
Varias secuencias de ácidos nucleicos descritas en la presente descripción pueden unirse operativamente a promotores. Tales promotores pueden ser activos, por ejemplo, en una célula pluripotente de rata, eucariota, de mamífero, de mamífero no humano, humana, de roedor, de ratón, o de hámster. También puede usarse un promotor activo en un embrión en etapa de una célula. Un promotor puede ser, por ejemplo, un promotor activo de manera constitutiva, un promotor condicional, un promotor inducible, un promotor restringido temporalmente (por ejemplo, un promotor regulado por el desarrollo), o un promotor restringido espacialmente (por ejemplo, un promotor específico de célula o específico de tejido). Los ejemplos de promotores pueden encontrarse, por ejemplo, en el documento WO 2013/176772.
Los ejemplos de promotores inducibles incluyen, por ejemplo, promotores regulados químicamente y promotores regulados físicamente. Los promotores regulados químicamente incluyen, por ejemplo, promotores regulados por alcohol (por ejemplo, un promotor del gen de la alcohol deshidrogenasa (alcA)), promotores regulados por tetraciclina (por ejemplo, un promotor sensible a la tetraciclina, una secuencia operadora de tetraciclina (tetO), un promotor tet-On, o un promotor tet-Off), promotores regulados por esteroides (por ejemplo, un receptor de glucocorticoides de rata, un promotor de un receptor de estrógeno, o un promotor de un receptor de ecdisona), o promotores regulados por metales (por ejemplo, un promotor de metaloproteína). Los promotores regulados físicamente incluyen, por ejemplo promotores regulados por temperatura (por ejemplo, un promotor de choque térmico) y promotores regulados por la luz (por ejemplo, un promotor inducible por la luz o un promotor reprimible por la Iu z).
Los promotores específicos de tejido pueden ser, por ejemplo, promotores específicos de neuronas, promotores específicos de células gliales, promotores específicos de células musculares, promotores específicos de células cardíacas, promotores específicos de células renales, promotores específicos de células óseas, promotores específicos de células endoteliales, o promotores específicos de células inmunitarias (por ejemplo, un promotor de células B o un promotor de células T).
Los promotores regulados por el desarrollo incluyen, por ejemplo, promotores activos solamente durante una etapa embrionaria del desarrollo, o solamente en una célula adulta.
Un promotor puede seleccionarse además en base al tipo celular. Por ejemplo, varios promotores conocidos son útiles en una célula eucariota, una célula de mamífero, una célula de mamífero no humano, una célula pluripotente, una célula pluripotente no humana, una célula pluripotente humana, una célula ES humana, una célula madre adulta humana, una célula progenitora humana restringida por el desarrollo, una célula iPS humana, una célula humana, una célula de roedor, una célula de rata, una célula de ratón, una célula de hámster, un fibroblasto, o una célula CHO.
IV. Métodos para modificar genomas y producir animales no humanos genéticamente modificados
A. Métodos para modificar un genoma
Se proporcionan varios métodos para modificar un genoma dentro de una célula a través del uso de dos ARN guías para reconocer regiones diferentes dentro de un solo Iocus genómico diana. Se proporcionan además métodos que usan dos o más ARN guías (por ejemplo, tres ARN guías o cuatro ARN guías) para reconocer regiones diferentes dentro de un solo Iocus genómico diana. Los métodos pueden ocurrir in v itro , e x v iv o , o in v iv o . Tales métodos promueven la creación de modificaciones genéticas bialélicas y pueden comprender el colapso del genoma u otras modificaciones dirigidas tales como la deleción simultánea de una secuencia de ácido nucleico dentro del genoma y su reemplazo con una secuencia de ácido nucleico exógena.
La modificación génica dirigida por recombinación homóloga entre un vector de transformación y un Iocus diana puede ser muy ineficiente, especialmente en tipos celulares distintos a las células madre embrionarias de roedor. El uso de un vector de transformación en combinación con una ruptura bicatenaria del ADN dirigida por nucleasa en el Iocus diana puede mejorar enormemente la eficiencia de transformación heterocigótica para modificaciones simples, tales como deleciones o inserciones pequeñas.
La combinación de un vector de transformación con un sistema CRISPR/nucleasa Cas9 guiado por un ARN guía (ARNg) también puede aumentar la eficiencia de transformación heterocigótica para modificaciones génicas muy grandes y de baja eficiencia, tales como la deleción de un gen de ratón y el reemplazo simultáneo con su equivalente humano (humanización). Tales modificaciones pueden involucrar deleciones e inserciones muy grandes (por ejemplo, >50 kb) (ver la transformación de Lrp5, C5(H c), Rorl, y Trpal en el Ejemplo 1).
Durante la reparación dirigida por homología de una o más rupturas bicatenarias generadas por una nucleasa tal como Cas9 en un Iocus genómico diana, la una o más rupturas se procesan primero para crear un saliente monocatenario en 3' por resección del extremo 5'. Después Rad51 se polimeriza en el A d N monocatenario en busca de una secuencia homóloga, ocurre la invasión de la cadena en el ADN dúplex plantilla homólogo no dañado (por ejemplo, el vector de transformación), y se forma una estructura de lazo D intermedia para facilitar la reparación de la una o más rupturas bicatenarias mediante el uso del ADN homólogo no dañado (por ejemplo, el vector de transformación) como plantilla. Después las secuencias cromosómicas se reemplazan con el inserto de ácido nucleico del vector de transformación mediante un evento de entrecruzamiento doble que involucra las regiones de homología flanqueantes. Varios factores afectan la ejecución adecuada de este proceso, tales como el tamaño del inserto de ácido nucleico, la longitud de las regiones homólogas a Ios brazos de homología del vector de transformación, y las posiciones de las regiones homólogas a Ios brazos de homología del vector de transformación (por ejemplo, en relación con la una o más rupturas bicatenarias).
A medida que el inserto de ácido nucleico o la secuencia eliminada en el Iocus genómico diana aumenta, el proceso de resección se vuelve más impredecible, la estabilidad de la estructura de lazo D intermedia disminuye y se vuelve más impredecible, y el éxito del proceso de recombinación en general disminuye y se vuelve más impredecible. Por ejemplo, a medida que el tamaño de la modificación dirigida aumenta, el riesgo de recombinación interna aumenta, particularmente cuando existe similitud entre la secuencia que se reemplaza y la secuencia que se inserta. Cuando ocurre dicha recombinación interna, el intercambio por recombinación homóloga tiene lugar internamente a la región diana prevista, y el inserto de ácido nucleico completo no se incorpora en el Iocus genómico diana. Además, el pensamiento convencional es que la eficiencia de las inserciones mediadas por HR disminuye a medida que la distancia entre la ruptura bicatenaria y el sitio de mutación o inserción aumenta (por ejemplo, más de 100 pb o 200 pb). Ver Beumer y otros (2013) Genes\Genomes\Genetics 3:657-664; Elliott y otros (1998) M o I. Cell. B íoI. 18:93-101; y Byrne y otros (2015) Nucleic Acids Research 43(3):e21.
El logro de una modificación génica dirigida que crea una deleción grande en un Iocus genómico diana e inserta simultáneamente un pedazo grande de ADN extraño requiere la formación de una estructura omega doble como un intermediario de recombinación. Mientras mayor sea la modificación, menor será la estabilidad de la estructura. En Ios tipos celulares distintos a Ios embriones en etapa de una célula, pueden usarse LTVEC que tienen una suma total de 10 kb o más de homología total. Los LTVEC con brazos de homología que tienen una suma total de 10 kb o más de homología total aumentan la estabilidad del intermediario de recombinación omega doble para facilitar una deleción grande simultánea mediada por nucleasa y su reemplazo con un inserto de ácido nucleico grande y hacen posible además no solo que las rupturas bicatenarias adyacentes a las regiones de homología mejoren la eficiencia de transformación sino que también hacen posible que aumente la eficiencia de transformación de aquellas alejadas de las regiones de homología.
Para las modificaciones génicas que involucran humanizaciones muy grandes, la combinación de un vector de transformación con un sistema CRISPR/nucleasa Cas9 guiado por dos ARNg puede mejorar además la eficiencia de transformación más allá de la lograda con un ARNg (ver las humanizaciones de Lrp5, C5 (H c), Rorl, y Trpal en el Ejemplo 1). El uso de dos ARNg produce resultados inesperados en este sentido. En comparación con la transformación con un ARNg, que produce modificaciones bialélicas a una frecuencia baja o no las produce en absoluto, la transformación con dos ARNg da como resultado la creación de células con transformación homocigótica, células con deleción homocigótica, y células con transformación heterocigótica combinada (que incluyen células con transformación hemicigótica) a una tasa significativamente aumentada.
El método para crear tres tipos de alelos, con transformación homocigótica, con deleción homocigótica, y con transformación heterocigótica combinada (particularmente con transformación hemicigótica), en un solo experimento de transformación proporciona nuevas posibilidades y eficiencias mejoradas para las modificaciones génicas dirigidas. Para una modificación génica simple, tal como la deleción dirigida de un gen en células ES de ratón y su reemplazo con una secuencia que codifica una proteína que reporta la expresión génica (por ejemplo, p-galactosidasa o una proteína fluorescente), la combinación de un vector de transformación con un sistema CRISPR/Cas9 guiado por dos ARNg mejora la producción de células ES con transformación heterocigótica, que pueden usarse después para producir ratones de generación FO completamente derivados de células ES mediante el método VelociMouse®. Ver Poueymirou y otros (2007) Nat. Biotech. 25:91-99. Estos ratones son útiles para estudiarla expresión génica específica de tejido con el alelo reportero sustituido. Los clones de células ES con transformación homocigótica producidos en el mismo experimento pueden convertirse a VelociMice con una deleción génica con transformación homocigótica, que puede estudiarse en cuanto a las consecuencias fenotípicas de la desactivación génica así como la expresión génica del reportero. La producción de VelociMice a partir de células ES que tienen una deleción homocigótica inducida por CRISPR del gen diana hace posible la comprobación del fenotipo de desactivación génica observado en Ios ratones con transformación homocigótica y puede revelar las diferencias fenotípicas entre una deleción génica limpia y una deleción acompañada por la inserción del reportero y un casete de selección por fármaco. Los clones de células ES heterocigóticas combinadas (y particularmente hemicigóticas) que portan el alelo transformado por deleción e inserción y la deleción inducida por CRISPR hacen posible la producción de VelociMice con las mismas oportunidades para el estudio que Ios derivados de Ios clones con transformación homocigótica y con deleción homocigótica. Además, estos ratones pueden cruzarse para establecer líneas de ratones mutantes de deleción tanto dirigida como simple a partir de un solo clon de células ES.
Estas ventajas tienen valor añadido cuando se extienden al caso de una humanización. Un uso importante de la humanización de un gen de ratón es crear un modelo animal en el cual probar un producto terapéutico específico para seres humanos. Para que una humanización sea un modelo eficaz, el gen de ratón debe eliminarse o inactivarse para evitar las interacciones entre los productos génicos de ratón y humano que pudieran afectar la función biológica o la interacción adecuada con el fármaco. Al mismo tiempo, el gen humano debe ser capaz de sustituir las funciones biológicas de su equivalente de ratón. Estos requisitos pueden probarse mediante la combinación de una nucleasa Cas9 guiada por dos ARNg con un vector de transformación diseñado para hacer una deleción simultánea de un gen de ratón y su reemplazo con el gen humano. Los VelociMice derivados de células ES que tienen una humanización dirigida homocigótica pueden compararse con los VelociMice derivados de células ES que tienen una deleción homocigótica inducida por CRISPR del gen de ratón. Si la deleción de desactivación causa un fenotipo mutante observable y los ratones humanizados no expresan este fenotipo sino que en lugar de esto son normales, entonces el gen humano es capaz de sustituir las funciones biológicas del gen de ratón. Los ratones humanizados homocigóticos o Ios portadores de una combinación heterocigótica combinada (por ejemplo, hemicigótica) de un alelo humanizado y un alelo con deleción inducida por CRISPR pueden usarse como modelos animales para estudiar el mecanismo de acción y la eficacia del producto terapéutico específico para seres humanos. Los VelociMice heterocigóticos combinados (por ejemplo, hemicigóticos) pueden usarse además para generar líneas de ratones tanto humanizados como con desactivación génica por deleción mediante cruzamiento convencional. Por lo tanto, a partir de un solo experimento de transformación génica que combina un sistema CRISPR de dos ARNg con un vector de transformación, se producen ratones genéticamente modificados que crean valiosos modelos de ratón para la prueba preclínica de un producto terapéutico y líneas con desactivación génica para estudiar la función biológica del homólogo de ratón de la diana farmacológica humana.
(1) Métodos para generar, promover, o aumentar la frecuencia de modificaciones genéticas bialélicas
En la presente descripción se proporcionan métodos para hacer modificaciones bialélicas a un genoma dentro de una célula o para promover o aumentar la frecuencia de modificaciones bialélicas de un genoma dentro de una célula. Tales métodos pueden dar como resultado, por ejemplo, el colapso de un genoma para eliminar una sección grande de ADN genómico entre dos secuencias de ADN genómico que posteriormente se recombinan. Tales métodos también pueden dar como resultado la inserción de un inserto de ácido nucleico o la deleción de una sección grande de ADN genómico y su reemplazo con un inserto de ácido nucleico.
Los métodos proporcionados en la presente descripción para modificar un genoma dentro de una célula comprenden poner en contacto el genoma con una primera proteína Cas, un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro de un Iocus genómico diana, un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana, y un ARNtracr. Opcionalmente, el genoma puede ponerse en contacto además con ARN de CRISPR adicionales que se hibridan con secuencias de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana, tales como un tercer ARN de CRISPR que se hibrida con una tercera secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana y/o un cuarto ARN de CRISPR que se hibrida con una cuarta secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana. Las modificaciones bialélicas pueden generarse al poner en contacto el genoma con una primera proteína Cas, un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro de un Iocus genómico diana, un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del Iocus genómico diana, y un ARNtracr. Como se describe en más detalle a continuación, la proteína Cas, Ios ARN de CRISPR, y el ARNtracr pueden introducirse en la célula en cualquier forma y por cualquier medio. Del mismo modo, la totalidad o parte de la proteína Cas, Ios ARN de CRISPR, y el ARNtracr puede introducirse simultáneamente o secuencialmente en cualquier combinación. El contacto del genoma puede ocurrir directamente (es decir, un componente se pone en contacto directamente con el propio genoma) o indirectamente (es decir, un componente interactúa con otro componente que se pone en contacto directamente con el genoma).
El genoma puede comprender un par de primer y segundo cromosomas homólogos que comprenden el Iocus genómico diana. La primera proteína Cas puede escindir uno o ambos de estos cromosomas dentro de una o ambas de la primera y segunda secuencias de reconocimiento de ARN de CRISPR (es decir, en un primer sitio de escisión dentro de la primera secuencia de reconocimiento de ARN de CRISPR y/o en un segundo sitio de escisión dentro de la segunda secuencia de reconocimiento de ARN de CRISPR). Si se usa además un tercer y/o cuarto ARN de CRISPR, la primera proteína Cas puede escindir uno o ambos de estos cromosomas dentro de una o ambas de la tercera y/o cuarta secuencias de reconocimiento de ARN de CRISPR (es decir, en un tercer sitio de escisión dentro de la tercera secuencia de reconocimiento de ARN de CRISPR y/o en un cuarto sitio de escisión dentro de la cuarta secuencia de reconocimiento de ARN de CRISPR). Después Ios eventos de escisión pueden generar al menos una ruptura bicatenaria en uno o ambos de Ios cromosomas. Los eventos de escisión pueden generar además al menos dos rupturas bicatenarias en uno o ambos de Ios cromosomas. Si se usan nickasas Cas, Ios eventos de escisión pueden generar al menos una ruptura monocatenaria en uno o ambos de Ios cromosomas, o al menos dos rupturas monocatenarias en uno o ambos de Ios cromosomas. Si se usa un tercer y/o cuarto ARN de CRISPR, Ios eventos de escisión pueden generar al menos tres de cuatro rupturas monocatenarias o bicatenarias en uno o ambos de Ios cromosomas. Después las secuencias de extremos generadas por las rupturas bicatenarias pueden experimentar recombinación, o después las secuencias de extremos generadas por las rupturas monocatenarias pueden experimentar recombinación. Después puede identificarse una célula que tiene el genoma modificado que comprende la modificación bialélica.
Por ejemplo, la primera proteína Cas puede escindir el genoma en un primer sitio de escisión dentro de la primera secuencia de reconocimiento de ARN de CRISPR en el primer y segundo cromosomas homólogos y en un segundo sitio de escisión dentro de la segunda secuencia de reconocimiento de ARN de CRISPR en al menos el primer cromosoma homólogo, lo que genera de este modo secuencias de extremos en el primer y segundo cromosomas homólogos. Después las secuencias de extremos pueden experimentar recombinación para formar un genoma con una modificación bialélica que comprende una modificación dirigida. La modificación dirigida puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en al menos el primer cromosoma.
La primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden estar en cualquier parte dentro de un Iocus genómico diana. La primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden flanquear cualquier región genómica de interés. Por ejemplo, la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden flanquear la totalidad o parte de una secuencia codificante de un gen, tal como el Iocus Lrp5, el Iocus C5 (H c), el Iocus Rorl, o el Iocus Trpal. La primera y segunda secuencias de reconocimiento de ARN de c R iSPR pueden flanquear además la totalidad o parte de una secuencia codificante del gen Cmah. Alternativamente, la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden flanquear una secuencia no codificante, tal como un elemento regulador (por ejemplo, un promotor), o tanto secuencias codificantes como no codificantes. La tercera y cuarta secuencias de reconocimiento de ARN de CRISPR pueden estar, por ejemplo, en cualquier parte dentro de la región genómica de interés que está flanqueada por la primera y segunda secuencias de reconocimiento de ARN de C R iSPR.
A modo de ejemplo, la tercera secuencia de reconocimiento de ARN de CRISPR puede estar adyacente a la primera secuencia de reconocimiento de ARN de C R iSPR, y la cuarta secuencia de reconocimiento de ARN de CRISPR puede estar adyacente a la segunda secuencia de reconocimiento de ARN de C R iSPR. Por lo tanto, la primera y tercera secuencias de reconocimiento de ARN de CRISPR pueden ser un primer par de secuencias de reconocimiento de ARN de C R iSPR, y la segunda y cuarta secuencias de reconocimiento de ARN de CRISPR pueden ser un segundo par de secuencias de reconocimiento de ARN de C R iSPR. Por ejemplo, la primera y tercera secuencias de reconocimiento de ARN de CRISPR (y/o la segunda y cuarta secuencias de reconocimiento de ARN de C R iSPR) pueden encontrarse separadas por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 Pb a aproximadamente 150 Pb, aproximadamente 150 Pb a aproximadamente 200 Pb; aproximadamente 200 Pb a aproximadamente 250 Pb, aproximadamente 250 Pb a aproximadamente 300 Pb; aproximadamente 300 Pb a aproximadamente 350 Pb, aproximadamente 350 Pb a aproximadamente 400 Pb; aproximadamente 400 Pb a aproximadamente 450 Pb, aproximadamente 450 Pb a aproximadamente 500 Pb; aproximadamente 500 Pb a aproximadamente 600 Pb, aproximadamente 600 Pb a aproximadamente 700 Pb; aproximadamente 700 Pb a aproximadamente 800 Pb, aproximadamente 800 Pb a aproximadamente 900 Pb; aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 1,5 kb, aproximadamente 1,5 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 2,5 kb, aproximadamente 2,5 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 3,5 kb, aproximadamente 3,5 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 4,5 kb, aproximadamente 4,5 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 6 kb, aproximadamente 6 kb a aproximadamente 7 kb, aproximadamente 7 kb a aproximadamente 8 kb, aproximadamente 8 kb a aproximadamente 9 kb, o aproximadamente 9 kb a aproximadamente 10 kb. A modo de ejemplo, la primera y tercera secuencias de reconocimiento de ARN de CRISPR (y/o la segunda y cuarta secuencias de reconocimiento de ARN de C R iSPR) pueden encontrarse separadas por aproximadamente 100 pb a aproximadamente 1 kb. Alternativamente, la primera y tercera secuencias de reconocimiento de ARN de CRISPR (y/o la segunda y cuarta secuencias de reconocimiento de ARN de C R iSPR) pueden solaparse.
El primer par de secuencias de reconocimiento de ARN de CRISPR puede ubicarse cerca del extremo 5' del Iocus genómico diana y el segundo par puede ubicarse cerca del extremo 3' del Iocus genómico diana. Alternativamente, el primer y segundo pares pueden ubicarse ambos cerca del extremo 5' del Iocus genómico diana o pueden ubicarse ambos cerca del extremo 3' del Iocus diana. Alternativamente, uno o ambos de Ios pares pueden ubicarse internamente dentro del Iocus genómico diana. Por ejemplo, la primera secuencia de reconocimiento de ARN de CRISPR o el primer par de secuencias de reconocimiento de ARN de CRISPR puede estar menos de 25 pb, menos de 50 pb, menos de 100 pb, menos de 150 pb, menos de 200 pb, menos de 250 pb, menos de 300 pb, menos de 350 pb, menos de 400 pb, menos de 450 pb, menos de 500 pb, menos de 600 pb, menos de 700 pb, menos de 800 pb, menos de 900 pb, menos de 1 kb, menos de 2 kb, menos de 3 kb, menos de 4 kb, menos de 5 kb, o menos de 10 kb del extremo 5' del Iocus genómico diana. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR o el primer par de secuencias de reconocimiento de ARN de CRISPR puede estar menos de 25 pb, menos de 50 pb, menos de 100 pb, menos de 150 pb, menos de 200 pb, menos de 250 pb, menos de 300 pb, menos de 350 pb, menos de 400 pb, menos de 450 pb, menos de 500 pb, menos de 600 pb, menos de 700 pb, menos de 800 pb, menos de 900 pb, menos de 1 kb, menos de 2 kb, menos de 3 kb, menos de 4 kb, menos de 5 kb, o menos de 10 kb del extremo 3' del Iocus genómico diana.
Alternativamente, la primera secuencia de reconocimiento de ARN de CRISPR o el primer par de secuencias de reconocimiento de ARN de CRISPR puede estar, por ejemplo, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb del extremo 5' del Iocus genómlco diana. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR o el primer par de secuencias de reconocimiento de ARN de CRISPR puede estar, por ejemplo, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb del extremo 3' del Iocus genómico diana.
Alternativamente, la primera secuencia de reconocimiento de ARN de CRISPR o el primer par de secuencias de reconocimiento de ARN de CRISPR puede estar, por ejemplo, aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 250 pb, aproximadamente 250 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 350 pb, aproximadamente 350 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 450 pb, aproximadamente 450 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 6 kb, aproximadamente 6 kb a aproximadamente 7 kb, aproximadamente 7 kb a aproximadamente 8 kb, aproximadamente 8 kb a aproximadamente 9 kb, aproximadamente 9 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 70 kb, aproximadamente 70 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 90 kb, o aproximadamente 90 kb a aproximadamente 100 kb del extremo 5' del Iocus genómico diana. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR o el primer par de secuencias de reconocimiento de ARN de CRISPR puede estar, por ejemplo, aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 250 pb, aproximadamente 250 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 350 pb, aproximadamente 350 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 450 pb, aproximadamente 450 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 6 kb, aproximadamente 6 kb a aproximadamente 7 kb, aproximadamente 7 kb a aproximadamente 8 kb, aproximadamente 8 kb a aproximadamente 9 kb, aproximadamente 9 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 70 kb, aproximadamente 70 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 90 kb, o aproximadamente 90 kb a aproximadamente 100 kb del extremo 3' del Iocus genómico diana.
El primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados, por ejemplo, por aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, o aproximadamente 2,5 Mb a aproximadamente 3 Mb. El primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados además, por ejemplo, por aproximadamente 3 Mb a aproximadamente 4 Mb, aproximadamente 4 Mb a aproximadamente 5 Mb, aproximadamente 5 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb. El primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados además, por ejemplo, por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 100 pb a aproximadamente 150 pb, aproximadamente 150 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 250 pb, aproximadamente 250 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 350 pb, aproximadamente 350 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 450 pb, aproximadamente 450 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, o aproximadamente 900 pb a aproximadamente 1 kb. Del mismo modo, el primer par de secuencias de reconocimiento de ARN de CRISPR puede encontrarse separado del segundo par secuencias de reconocimiento de ARN de CRISPR, por ejemplo, por aproximadamente 25 pb a aproximadamente 50 pb, aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 1OO Pb a aproximadamente 15O Pb, aproximadamente 15O Pb a aproximadamente 2OO Pb; aproximadamente 2OO Pb a aproximadamente 25O Pb, aproximadamente 25O Pb a aproximadamente 3OO Pb; aproximadamente 3OO Pb a aproximadamente 35O Pb, aproximadamente 35O Pb a aproximadamente 4OO Pb; aproximadamente 4OO Pb a aproximadamente 45O Pb, aproximadamente 45O Pb a aproximadamente 5OO Pb; aproximadamente 5OO Pb a aproximadamente 6OO Pb, aproximadamente 6OO Pb a aproximadamente 7OO Pb; aproximadamente 7OO Pb a aproximadamente 8OO Pb, aproximadamente 8OO Pb a aproximadamente 9OO Pb; aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente lO kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 1OO kb, aproximadamente 1OO kb a aproximadamente 15O kb, aproximadamente 15O kb a aproximadamente 2OO kb, aproximadamente 2OO kb a aproximadamente 3OO kb, aproximadamente 3OO kb a aproximadamente 4OO kb, aproximadamente 4OO kb a aproximadamente 5OO kb, aproximadamente 5OO kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, aproximadamente 2,5 Mb a aproximadamente 3 Mb, aproximadamente 3 Mb a aproximadamente 4 Mb, aproximadamente 4 Mb a aproximadamente 5 Mb, aproximadamente 5 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 1OO Mb.
Alternativamente, el primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados, por ejemplo, por al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 1OO kb, al menos 110 kb, al menos 12O kb, al menos 13O kb, al menos 14O kb, al menos 15O kb, al menos 16O kb, al menos 17O kb, al menos 18O kb, al menos 19O kb, al menos 2OO kb, al menos 25O kb, al menos 3OO kb, al menos 35O kb, al menos 4OO kb, al menos 45O kb, o al menos 5OO kb o más. Del mismo modo, el primer par de secuencias de reconocimiento de ARN de CRISPR puede encontrarse separado del segundo par secuencias de reconocimiento de ARN de CRISPR, por ejemplo, por al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 1OO kb, al menos 110 kb, al menos 12O kb, al menos 13O kb, al menos 14O kb, al menos 15O kb, al menos 16O kb, al menos 17O kb, al menos 18O kb, al menos 19O kb, al menos 2OO kb, al menos 25O kb, al menos 3OO kb, al menos 35O kb, al menos 4OO kb, al menos 45O kb, o al menos 5OO kb o más.
Alternativamente, el primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados por menos de 25 pb, menos de 50 pb, menos de 1OO pb, menos de 15O pb, menos de 20 o pb, menos de 25O pb, menos de 3OO pb, menos de 35O pb, menos de 4OO pb, menos de 45O pb, menos de 5OO pb, menos de 6OO pb, menos de 7OO pb, menos de 8OO pb, menos de 9OO pb, menos de 1 kb, menos de 2 kb, menos de 3 kb, menos de 4 kb, menos de 5 kb, o menos de 10 kb. Del mismo modo, el primer par de secuencias de reconocimiento de ARN de CRISPR puede encontrarse separado del segundo par secuencias de reconocimiento de ARN de CRISPR, por ejemplo, por menos de 25 pb, menos de 50 pb, menos de 1o0 pb, menos de 15O pb, menos de 2OO pb, menos de 25O pb, menos de 3OO pb, menos de 35O pb, menos de 4OO pb, menos de 45O pb, menos de 5OO pb, menos de 6OO pb, menos de 7OO pb, menos de 8OO pb, menos de 9OO pb, menos de 1 kb, menos de 2 kb, menos de 3 kb, menos de 4 kb, menos de 5 kb, o menos de 10 kb.
Las secuencias de extremos creadas por escisión del genoma en el primer y/o segundo sitios de escisión pueden ser extremos romos o extremos escalonados, y la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR puede incluir la totalidad o parte de la secuencia de ácido nucleico entre y que incluye la primera y segunda secuencias de reconocimiento de ARN de CRISPR. Del mismo modo, las secuencias de extremos creadas por escisión del genoma en el tercer y/o cuarto sitios de escisión pueden ser extremos romos o extremos escalonados. Por ejemplo, la deleción puede incluir solamente una porción de la secuencia de ácido nucleico entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR y/o solamente una porción de la primera secuencia de reconocimiento de ARN de CRISPR y/o la segunda secuencia de reconocimiento de ARN de CRISPR. Alternativamente, la deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR puede incluir la totalidad de la secuencia de ácido nucleico entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR. Del mismo modo, la deleción puede incluir la primera secuencia de reconocimiento de ARN de CRISPR y/o la segunda secuencia de reconocimiento de ARN de CRISPR, o porciones de estas. En algunos casos, la deleción comprende además secuencias ubicadas fuera de la primera y segunda secuencias de reconocimiento de ARN de CRISPR (es decir, secuencias que no incluyen y no están entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR).
La deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR puede ser de cualquier longitud. Por ejemplo, el ácido nucleico eliminado puede ser de aproximadamente 5 kb a aproximadamente 10 kb, de aproximadamente 10 kb a aproximadamente 20 kb, de aproximadamente 20 kb a aproximadamente 40 kb, de aproximadamente 40 kb a aproximadamente 60 kb, de aproximadamente 60 kb a aproximadamente 80 kb, de aproximadamente 80 kb a aproximadamente 100 kb, de aproximadamente 100 kb a aproximadamente 150 kb, o de aproximadamente 150 kb a aproximadamente 200 kb, de aproximadamente 200 kb a aproximadamente 300 kb, de aproximadamente 300 kb a aproximadamente 400 kb, de aproximadamente 400 kb a aproximadamente 500 kb, de aproximadamente 500 kb a aproximadamente 1 Mb, de aproximadamente 1 Mb a aproximadamente 1,5 Mb, de aproximadamente 1,5 Mb a aproximadamente 2 Mb, de aproximadamente 2 Mb a aproximadamente 2,5 Mb, o de aproximadamente 2,5 Mb a aproximadamente 3 Mb.
Alternativamente, el ácido nucleico eliminado puede ser, por ejemplo, de al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb o más. En algunos casos, el ácido nucleico eliminado puede ser de al menos 550 kb, al menos 600 kb, al menos 650 kb, al menos 700 kb, al menos 750 kb, al menos 800 kb, al menos 850 kb, al menos 900 kb, al menos 950 kb, al menos 1 Mb, al menos 1,5 Mb, al menos 2 Mb, al menos 2,5 Mb, al menos 3 Mb, al menos 4 Mb, al menos 5 Mb, al menos 10 Mb, al menos 20 Mb, al menos 30 Mb, al menos 40 Mb, al menos 50 Mb, al menos 60 Mb, al menos 70 Mb, al menos 80 Mb, al menos 90 Mb, o al menos 100 Mb (por ejemplo, la mayor parte de un cromosoma).
La deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR puede ser una deleción precisa en donde el ácido nucleico eliminado consiste solamente en la secuencia de ácido nucleico entre el primer y segundo sitios de escisión de proteína Cas de manera que no existan deleciones o inserciones adicionales en el Iocus genómico diana modificado. La deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR también puede ser una deleción imprecisa que se extiende más allá del primer y segundo sitios de escisión de proteína Cas, consistente con la reparación imprecisa por unión de extremos no homólogos (NHEJ), Io que da como resultado deleciones y/o inserciones adicionales en el Iocus genómico modificado. Por ejemplo, la deleción puede extenderse aproximadamente 1 pb, aproximadamente 2 pb, aproximadamente 3bp, aproximadamente 4 pb, aproximadamente 5 pb, aproximadamente 10 pb, aproximadamente 20 pb, aproximadamente 30 pb, aproximadamente 40 pb, aproximadamente 50 pb, aproximadamente 100 pb, aproximadamente 200 pb, aproximadamente 300 pb, aproximadamente 400 pb, aproximadamente 500 pb, o más allá del primer y segundo sitios de escisión de proteína Cas. Del mismo modo, el Iocus genómico modificado puede comprender inserciones adicionales consistentes con la reparación imprecisa por NHEJ, tales como inserciones de aproximadamente 1 pb, aproximadamente 2 pb, aproximadamente 3 pb, aproximadamente 4 pb, aproximadamente 5 pb, aproximadamente 10 pb, aproximadamente 20 pb, aproximadamente 30 pb, aproximadamente 40 pb, aproximadamente 50 pb, aproximadamente 100 pb, aproximadamente 200 pb, aproximadamente 300 pb, aproximadamente 400 pb, aproximadamente 500 pb, o más.
El contacto puede ocurrir en ausencia de una secuencia donante exógena o la presencia de una secuencia donante exógena, siempre que si la célula es un embrión en etapa de una célula, la secuencia donante exógena tiene una longitud de no más de 5 kb. Las moléculas o secuencias exógenas incluyen moléculas o secuencias que normalmente no están presentes en una célula. La presencia normal incluye la presencia con respecto a la etapa del desarrollo particular y las condiciones del entorno de la célula. Una molécula o secuencia exógena, por ejemplo, puede incluir una versión mutada de una secuencia endógena correspondiente dentro de la célula, tal como una versión humanizada de la secuencia endógena. Por el contrario, las moléculas o secuencias endógenas incluyen moléculas o secuencias que normalmente están presentes en una célula particular en una etapa del desarrollo particular en condiciones del entorno particulares.
La secuencia donante exógena puede estar dentro de un vector de transformación y puede comprender un inserto de ácido nucleico flanqueado por brazos de homología 5' y 3' que corresponden a secuencias diana 5' y 3' dentro del genoma, siempre que si la célula es un embrión en etapa de una célula, el vector de transformación tiene una longitud de no más de 5 kb. En tipos celulares distintos a Ios embriones en etapa de una célula, el vector de transformación puede ser más largo. En tipos celulares distintos a Ios embriones en etapa de una célula, el vector de transformación puede ser, por ejemplo, un vector de transformación grande (LTVEC) como se describe en la presente descripción, y puede ser de al menos 10 kb. Por lo tanto, en algunos métodos, el genoma se pone en contacto además con un vector de transformación, y el inserto de ácido nucleico se inserta entre las secuencias diana 5' y 3'.
Alternativamente, la secuencia donante exógena puede comprender brazos de homología 5' y 3' sin inserto de ácido nucleico. Tales vectores de transformación sin inserto de ácido nucleico pueden facilitar deleciones precisas entre las secuencias diana 5' y 3' dentro del genoma. Tales deleciones precisas pueden ser, por ejemplo, de al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, al menos 500 kb, al menos 550 kb, al menos 600 kb, al menos 650 kb, al menos 700 kb, al menos 750 kb, al menos 800 kb, al menos 850 kb, al menos 900 kb, al menos 950 kb, al menos 1 Mb, al menos 1,5 Mb, o al menos 2 Mb o más.
En algunos de tales métodos, Ios brazos de homología 5' y 3' corresponden a secuencias diana 5' y 3' en el Iocus genómlco diana que comprende la primera secuencia de reconocimiento de ARN de CRISPR del primer ARN de CRISPR y/o la segunda secuencia de reconocimiento de ARN de CRISPR del segundo ARN de c R iSPR. La primera y segunda secuencias de reconocimiento de ARN de CRISPR o el primer y segundo sitios de escisión pueden estar adyacentes a la secuencia diana 5', adyacentes a la secuencia diana 3', o no adyacentes ni a la secuencia diana 5' ni la secuencia diana 3'. Alternativamente, la primera secuencia de reconocimiento de ARN de CRISPR o el primer sitio de escisión puede estar adyacente a la secuencia diana 5', y la segunda secuencia de reconocimiento de ARN de CRISPR o el segundo sitio de escisión puede estar adyacente a la secuencia diana 3'. Alternativamente, la primera secuencia de reconocimiento de ARN de CRISPR o el primer sitio de escisión puede estar adyacente a la secuencia diana 5' o la secuencia diana 3', y la segunda secuencia de reconocimiento de ARN de CRISPR o el segundo sitio de escisión puede no estar adyacente ni a la secuencia diana 5' ni la secuencia diana 3'.
Por ejemplo, la primera y/o segunda secuencias de reconocimiento de ARN de CRISPR pueden ubicarse entre las secuencias diana 5' y 3' o pueden estar adyacentes a o en proximidad con la secuencia diana 5' y/o la secuencia diana 3', tal como dentro de 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, 150 kb, 160 kb, 170 kb, 180 kb, 190 kb, 200 kb, 250 kb, 300 kb, 350 kb, 400 kb, 450 kb, o 500 kb de las secuencias diana 5' y/o 3'. Del mismo modo, el primer y/o segundo sitios de escisión pueden ubicarse entre las secuencias diana 5' y 3' o pueden estar adyacentes a o en proximidad con la secuencia diana 5' y/o la secuencia diana 3', tal como dentro de 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, 150 kb, 160 kb, 170 kb, 180 kb, 190 kb, 200 kb, 250 kb, 300 kb, 350 kb, 400 kb, 450 kb, o 500 kb de las secuencias diana 5' y/o 3'. Por ejemplo, la primera secuencia de reconocimiento de ARN de CRISPR o el primer sitio de escisión puede estar dentro de 50 pb, 100 pb, 200 pb, 300 pb, 400 pb, 500 pb, 600 pb, 700 pb, 800 pb, 900 pb, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, 150 kb, 160 kb, 170 kb, 180 kb, 190 kb, 200 kb, 250 kb, 300 kb, 350 kb, 400 kb, 450 kb, o 500 kb de la secuencia diana 5' o ambas secuencias diana 5' y 3'. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR o el segundo sitio de escisión puede estar dentro de 50 pb, 100 pb, 200 pb, 300 pb, 400 pb, 500 pb, 600 pb, 700 pb, 800 pb, 900 pb, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, 150 kb, 160 kb, 170 kb, 180 kb, 190 kb, 200 kb, 250 kb, 300 kb, 350 kb, 400 kb, 450 kb, o 500 kb de la secuencia diana 3' o ambas secuencias diana 5' y 3'.
Alternativamente, la primera y/o segunda secuencias de reconocimiento de ARN de CRISPR pueden ubicarse al menos 50 pb, al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 900 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb de las secuencias diana 5' y/o 3'. Del mismo modo, el primer y/o segundo sitios de escisión pueden ubicarse al menos 50 pb, al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 900 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb de las secuencias diana 5' y/o 3'. Por ejemplo, la primera secuencia de reconocimiento de ARN de CRISPR o el primer sitio de escisión puede ubicarse al menos 50 pb, al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 900 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb de la secuencia diana 5' o de ambas secuencias diana 5' y 3'. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR del segundo sitio de escisión puede ubicarse al menos 50 pb, al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 900 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb de la secuencia diana 3' o de ambas secuencias diana 5' y 3'.
Por ejemplo, la primera y/o segunda secuencias de reconocimiento de ARN de CRISPR pueden ubicarse entre aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 200 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, o aproximadamente 400 kb a aproximadamente 500 kb de las secuencias diana 5' y/o 3'. Del mismo modo, el primer y/o segundo sitios de escisión pueden ubicarse entre aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 200 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, o aproximadamente 400 kb a aproximadamente 500 kb de las secuencias diana 5' y/o 3'. Por ejemplo, la primera secuencia de reconocimiento de ARN de CRISPR o el primer sitio de escisión pueden ubicarse entre aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 200 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, o aproximadamente 400 kb a aproximadamente 500 kb de la secuencia diana 5' o de ambas secuencias diana 5' y 3'. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR o el segundo sitio de escisión pueden ubicarse entre aproximadamente 50 pb a aproximadamente 100 pb, aproximadamente 200 pb a aproximadamente 300 pb, aproximadamente 300 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 500 pb, aproximadamente 500 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 700 pb, aproximadamente 700 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 900 pb, aproximadamente 900 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 3 kb a aproximadamente 4 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 30 kb, aproximadamente 30 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 50 kb, aproximadamente 50 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, o aproximadamente 400 kb a aproximadamente 500 kb de la secuencia diana 3' o de ambas secuencias diana 5' y 3'.
Alternativamente, la primera y/o segunda secuencias de reconocimiento de ARN de CRISPR o el primer y/o segundo sitios de escisión pueden ubicarse más de 50 pb, más de 100 pb, más de 200 pb, más de 300 pb, más de 400 pb, más de 500 pb, más de 600 pb, más de 700 pb, más de 800 pb, más de 900 pb, más de 1 kb, más de 2 kb, más de 3 kb, más de 4 kb, más de 5 kb, más de 6 kb, más de 7 kb, más de 8 kb, más de 9 kb, más de 10 kb, más de 20 kb, más de 30 kb, más de 40 kb, más de 50 kb, más de 60 kb, más de 70 kb, más de 80 kb, más de 90 kb, o más de 100 kb de las secuencias diana 5' y/o 3'. Por ejemplo, la primera secuencia de reconocimiento de ARN de CRISPR o el primer sitio de escisión pueden ubicarse más de 50 pb, más de 100 pb, más de 200 pb, más de 300 pb, más de 400 pb, más de 500 pb, más de 600 pb, más de 700 pb, más de 800 pb, más de 900 pb, más de 1 kb, más de 2 kb, más de 3 kb, más de 4 kb, más de 5 kb, más de 6 kb, más de 7 kb, más de 8 kb, más de 9 kb, más de 10 kb, más de 20 kb, más de 30 kb, más de 40 kb, más de 50 kb, más de 60 kb, más de 70 kb, más de 80 kb, más de 90 kb, o más de 100 kb de la secuencia diana 5' o de ambas secuencias diana 5' y 3'. Del mismo modo, la segunda secuencia de reconocimiento de ARN de CRISPR o el segundo sitio de escisión pueden ubicarse más de 50 pb, más de 100 pb, más de 200 pb, más de 300 pb, más de 400 pb, más de 500 pb, más de 600 pb, más de 700 pb, más de 800 pb, más de 900 pb, más de 1 kb, más de 2 kb, más de 3 kb, más de 4 kb, más de 5 kb, más de 6 kb, más de 7 kb, más de 8 kb, más de 9 kb, más de 10 kb, más de 20 kb, más de 30 kb, más de 40 kb, más de 50 kb, más de 60 kb, más de 70 kb, más de 80 kb, más de 90 kb, o más de 100 kb de la secuencia diana 3' o de ambas secuencias diana 5' y 3'.
Los métodos descritos en la presente descripción promueven y aumentan la frecuencia de modificaciones bialélicas. En particular, al poner en contacto el genoma con el primer y segundo ARN de CRISPR, la eficiencia de producción de modificaciones bialélicas puede aumentarse en comparación con poner en contacto el genoma con el primer ARN de CRISPR o el segundo ARN de CRISPR soIos. La eficiencia de producción de modificaciones bialélicas puede aumentarse además al poner en contacto el genoma con el primer, segundo, y tercer ARN de CRISPR, o el primer, segundo, tercer, y cuarto a R n de CRISPR. Las modificaciones bialélicas incluyen eventos en Ios que se hace la misma modificación al mismo Iocus en cromosomas homólogos correspondientes (por ejemplo, en una célula diploide), o en Ios que se hacen modificaciones diferentes al mismo Iocus en cromosomas homólogos correspondientes. Los cromosomas homólogos incluyen cromosomas que tienen Ios mismos genes en Ios mismos loci pero posiblemente en alelos diferentes (por ejemplo, cromosomas que se aparean durante la meiosis). El término alelo incluye cualquiera de una o más formas alternativas de una secuencia genética. En una célula u organismo diploide, Ios dos alelos de una secuencia dada típicamente ocupan loci correspondientes en un par de cromosomas homólogos.
Una modificación bialélica puede dar como resultado homocigosidad para una modificación dirigida o heterocigosidad combinada (por ejemplo, hemicigosidad) para la modificación dirigida. Un solo experimento de transformación con una población de células puede producir células que son homocigóticas para una modificación dirigida (por ejemplo, la humanización de un Iocus), células que son heterocigóticas combinadas para esa modificación dirigida (que incluyen células que son hemicigóticas para la modificación dirigida), y células con colapso homocigótico entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR (es decir, una secuencia de ácido nucleico grande se elimina entre dos secuencias de reconocimiento de ARN de CRISPR). La homocigosidad incluye situaciones en las que ambos alelos de un Iocus diana (es decir, Ios alelos correspondientes en ambos cromosomas homólogos) tienen la modificación dirigida. La heterocigosidad combinada incluye situaciones en las que ambos alelos del Iocus diana (es decir, Ios alelos en ambos cromosomas homólogos) se han modificado, pero se han modificado de maneras diferentes (por ejemplo, una modificación dirigida en un alelo e inactivación o interrupción del otro alelo). La interrupción de la secuencia de ácido nucleico endógena puede ser el resultado, por ejemplo, cuando una ruptura bicatenaria creada por la proteína Cas se repara por reparación del ADN mediada por unión de extremos no homólogos (NHEJ), que genera un alelo mutante que comprende una inserción o una deleción de una secuencia de ácido nucleico y de este modo causa la interrupción de ese Iocus genómico. Los ejemplos de interrupción incluyen la alteración de un elemento regulador (por ejemplo, un promotor o potenciador), una mutación con cambio de sentido, una mutación sin sentido, una mutación de desplazamiento del marco de lectura, una mutación de truncamiento, una mutación nula, o una inserción o deleción de un pequeño número de nucleótidos (por ejemplo, que causa una mutación de desplazamiento del marco de lectura). La interrupción puede dar como resultado la inactivación (es decir, la pérdida de función) o pérdida del alelo.
Por ejemplo, una modificación bialélica puede dar como resultado la heterocigosidad combinada si la célula tiene un alelo con la modificación dirigida y otro alelo que no es capaz de expresarse o de otra manera no es funcional. La heterocigosidad combinada incluye la hemicigosidad. La hemicigosidad incluye situaciones en las que solo un alelo (es decir, un alelo en uno de Ios dos cromosomas homólogos) del Iocus diana está presente. Por ejemplo, una modificación bialélica puede dar como resultado la hemicigosidad para una modificación dirigida si la modificación dirigida ocurre en un alelo con una pérdida o deleción correspondiente del otro alelo.
En un ejemplo específico, la modificación bialélica puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el par de primer y segundo cromosomas homólogos. Las deleciones pueden ocurrir simultáneamente, o la deleción puede ocurrir inicialmente en el primer cromosoma homólogo, después la célula logra la homocigosidad mediante el uso del primer cromosoma homólogo como secuencia donante para reparar una o más rupturas bicatenarias en el segundo cromosoma homólogo por medio de recombinación homóloga, tal como por conversión génica. La secuencia de ácido nucleico eliminada en el primer y segundo cromosomas homólogos puede ser igual, parcialmente solapada, o diferente. Alternativamente, la modificación bialélica puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo y pérdida del alelo o Iocus correspondiente en el segundo cromosoma homólogo. Alternativamente, la modificación bialélica puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer cromosoma homólogo e inactivación o interrupción del alelo o Iocus correspondiente entre la primera y segunda secuencias de reconocimiento de ARN de C R IS P r en el segundo cromosoma homólogo.
Si se usa una secuencia donante, la modificación bialélica puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de C R IS P r así como una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el par de primer y segundo cromosomas homólogos, lo que da como resultado de este modo un genoma modificado homocigótico. La deleción y la inserción pueden ocurrir simultáneamente en ambos cromosomas, o la deleción y la inserción pueden ocurrir inicialmente en el primer cromosoma homólogo, después la célula logra la homocigosidad mediante el uso del primer cromosoma homólogo como secuencia donante para reparar la(s) ruptura(s) bicatenaria(s) en el segundo cromosoma homólogo por medio de recombinación homóloga, tal como por conversión génica. Por ejemplo, sin desear limitarse por ninguna teoría particular, la inserción del inserto de ácido nucleico podría ocurrir en el primer cromosoma homólogo (con o sin escisión por la proteína Cas), y el segundo cromosoma homólogo puede modificarse después mediante un evento de conversión génica estimulado por la escisión por la proteína Cas en el segundo cromosoma homólogo.
Alternativamente, la modificación bialélica puede dar como resultado un genoma modificado heteroclgótlco combinado. Por ejemplo, la modificación dirigida puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR en el primer y segundo cromosomas homólogos y una inserción del inserto de ácido nucleico en el primer cromosoma homólogo pero no en el segundo cromosoma homólogo. Alternativamente, la modificación dirigida puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR así como la inserción del inserto de ácido nucleico en el primer cromosoma homólogo y la inactivación o interrupción del alelo o Iocus correspondiente en el segundo cromosoma homólogo. Alternativamente, la modificación bialélica puede dar como resultado un genoma modificado hemicigótico en el que la modificación dirigida puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR así como la inserción del inserto de ácido nucleico en el primer cromosoma homólogo y la pérdida o deleción del alelo o Iocus correspondiente en el segundo cromosoma homólogo.
Las modificaciones genéticas dirigidas homocigóticas y heterocigóticas combinadas (particularmente hemicigóticas) son ventajosas porque el proceso para producir animales genéticamente modificados con estas modificaciones (descritos en más detalle a continuación) puede ser más eficiente y consumir menos tiempo. En muchas situaciones, tales como la eliminación de un gen para estudiar el efecto de su ausencia, la simple heterocigosidad de una modificación genética dirigida (es decir, modificación en un alelo y sin cambio en el otro alelo) no es suficiente. Con las estrategias de transformación convencionales, podrían obtenerse animales de generación FO que son heterocigóticos para una deleción genómica dirigida grande, pero se requiere el entrecruzamiento posterior de estos animales heterocigóticos para producir animales de generación F l que son homocigóticos para la deleción. Estas etapas de cruzamiento adicionales son costosas y consumen tiempo. La capacidad de crear animales genéticamente modificados de generación FO que son homocigóticos o heterocigóticos combinados (particularmente hemicigóticos) para una modificación genética dirigida da como resultado ganancias de eficiencia significativas y ahorro de tiempo debido a que se requieren menos etapas de cruzamiento.
(2) Conversión génica o pérdida de heterocigosidad
En algunos métodos, el genoma a modificar está dentro de una célula que es heterocigótica para un primer alelo, y el gen se modifica para convertirlo en homocigótico para el primer alelo. El término heterocigótico incluye situaciones en las que un genoma comprende alelos diferentes en uno o más loci cromosómicos correspondientes (por ejemplo, alelos diferentes en loci correspondientes en cromosomas homólogos). El término homocigótico incluye situaciones en las que un genoma comprende el mismo alelo en loci cromosómicos correspondientes (por ejemplo, en cromosomas homólogos correspondientes). En algunos de tales métodos, la célula puede lograr la homocigosidad mediante el uso del primer alelo como secuencia donante para reparar una ruptura bicatenaria en un segundo alelo correspondiente por medio de recombinación homóloga, tal como conversión génica. Típicamente, la extensión de la conversión génica se limita a algunos cientos de pares de bases. Ver, por ejemplo, Kasparek & Humphrey (2011) Seminars in Cell & Dev. BIo I. 22:886-897. Sin embargo, el uso de pares de ARN guías que dirigen la escisión en sitios de escisión diferentes dentro de un solo Iocus puede promover y mejorar las capacidades de conversión génica en tramos más largos.
Tales métodos pueden ser útiles en varios contextos. El primer alelo puede comprender una mutación. En algunos métodos, por ejemplo, el primer alelo contiene una modificación genética dirigida deseada. El logro de la homocigosidad para esa modificación genética dirigida puede dar como resultado ahorros de tiempo y costos significativos si, por ejemplo, el objetivo es crear un animal no humano que sea homocigótico para esa modificación. En otros métodos, el primer alelo es un alelo de tipo silvestre de un gen que corresponde a un segundo alelo del gen que causa enfermedad. Alternativamente, el segundo alelo puede comprender cualquier mutación. Los métodos pueden usarse entonces para lograr el objetivo final de la terapia génica de reemplazar el alelo que causa enfermedad con el alelo de tipo silvestre en su Iocus cromosómico natural.
En algunos de tales métodos para modificar un genoma que es heteroclgótlco para un primer alelo para convertirlo en homocigótico para el primer alelo, el genoma se pone en contacto con una proteína Cas, un ARNtracr, y un primer ARN de CRISPR que se híbrida con una primera secuencia de reconocimiento de ARN de CRISPR dentro de un segundo alelo, y un segundo ARN de CRISPR que se híbrida con una segunda secuencia de reconocimiento de ARN de CRISPR dentro del segundo alelo, en donde el primer alelo está en un primer cromosoma homólogo y el segundo alelo está en un Iocus correspondiente en un segundo cromosoma homólogo (es decir, el primer alelo y el segundo alelo pueden ser alelos correspondientes en un par de primer y segundo cromosomas homólogos). Opcionalmente, el genoma puede ponerse en contacto con ARN de c R iSPR adicionales (por ejemplo, un tercer ARN de CRISPR, o un tercer y cuarto ARN de CRISPR) que se hibridan con secuencias de reconocimiento de ARN de CRISPR dentro del segundo alelo. La proteína Cas puede escindir una o ambas de la primera y segunda secuencias de reconocimiento de ARN de CRISPR (es decir, en un primer sitio de escisión dentro de la primera secuencia de reconocimiento de ARN de CRISPR y/o en un segundo sitio de escisión dentro de la segunda secuencia de reconocimiento de ARN de C R iSPR). La escisión del genoma en el primer y/o segundo sitios de escisión puede crear extremos romos en el ADN genómico o puede crear extremos escalonados. Los sitios de escisión pueden repararse después a través de la recombinación entre el primer y segundo alelos, lo que da como resultado un genoma modificado que es homocigótico para el primer alelo. Después puede identificarse una célula que tiene el genoma modificado.
En algunos métodos, la primera y/o segunda secuencias de reconocimiento de ARN de CRISPR se ubican dentro del segundo alelo pero no dentro del primer alelo. El primer y/o segundo alelos pueden ser alelos de tipo silvestre o pueden comprender modificaciones dirigidas u otras desviaciones de un alelo de tipo silvestre. Por ejemplo, el primer alelo puede comprender una modificación dirigida deseada y el segundo alelo puede ser un alelo de tipo silvestre. Alternativamente, el primer alelo puede ser un alelo de tipo silvestre, y el segundo alelo puede comprender una modificación no deseada, tal como una mutación que causa enfermedad. En algunos de tales métodos, ocurre la reparación génica dirigida o la corrección génica dirigida de manera que la mutación que causa enfermedad en el segundo alelo se corrige por medio de recombinación mediante el uso del primer alelo como secuencia donante.
El primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados, por ejemplo, por aproximadamente 1 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, o aproximadamente 2,5 Mb a aproximadamente 3 Mb.
Alternativamente, el primer y segundo sitios de escisión o la primera y segunda secuencias de reconocimiento de ARN de CRISPR pueden encontrarse separados, por ejemplo, por al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb.
En algunos métodos, las diferencias de secuencias entre el primer alelo y el segundo alelo abarcan aproximadamente 100 pb a aproximadamente 200 pb, aproximadamente 200 pb a aproximadamente 400 pb, aproximadamente 400 pb a aproximadamente 600 pb, aproximadamente 600 pb a aproximadamente 800 pb, aproximadamente 800 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 2 kb, aproximadamente 2 kb a aproximadamente 3 kb, aproximadamente 4 kb a aproximadamente 5 kb, aproximadamente 5 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 20 kb, aproximadamente 20 kb a aproximadamente 40 kb, aproximadamente 40 kb a aproximadamente 60 kb, aproximadamente 60 kb a aproximadamente 80 kb, aproximadamente 80 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 150 kb, aproximadamente 150 kb a aproximadamente 200 kb, aproximadamente 200 kb a aproximadamente 300 kb, aproximadamente 300 kb a aproximadamente 400 kb, aproximadamente 400 kb a aproximadamente 500 kb, aproximadamente 500 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 1,5 Mb, aproximadamente 1,5 Mb a aproximadamente 2 Mb, aproximadamente 2 Mb a aproximadamente 2,5 Mb, o aproximadamente 2,5 Mb a aproximadamente 3 Mb.
En otros métodos, las diferencias entre el primer alelo y el segundo alelo abarcan al menos 100 pb, al menos 200 pb, al menos 300 pb, al menos 400 pb, al menos 500 pb, al menos 600 pb, al menos 700 pb, al menos 800 pb, al menos 800 pb, al menos 1 kb, al menos 2 kb, al menos 3 kb, al menos 4 kb, al menos 5 kb, al menos 6 kb, al menos 7 kb, al menos 8 kb, al menos 9 kb, al menos 10 kb, 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 110 kb, al menos 120 kb, al menos 130 kb, al menos 140 kb, al menos 150 kb, al menos 160 kb, al menos 170 kb, al menos 180 kb, al menos 190 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb.
En otros de tales métodos para modificar un genoma en una célula que es heterocigótica para un primer alelo para convertirla en homocigótica para el primer alelo, el genoma se pone en contacto con una proteína Cas, un ARNtracr, y un primer ARN de CRISPR sin especificidad por alelo que se hibrida con una primera secuencia de reconocimiento de A r N de CRISPR. El primer alelo está en un primer cromosoma homólogo, y la secuencia de reconocimiento de ARN de CRISPR es centromérica (es decir, más cercana al centrómero) al Iocus correspondiente al primer alelo en un segundo cromosoma homólogo. La proteína Cas puede escindir la primera secuencia de reconocimiento de ARN de CRISPR para generar una ruptura bicatenaria. La recombinación puede ocurrir después para modificar la célula para convertirla en homocigótica para el primer alelo.
Opcionalmente, la célula es heterocigótica para uno o más alelos adicionales, la primera secuencia de reconocimiento de ARN de CRISPR es centromérica a Ios IocI correspondientes al uno o más alelos adicionales en el segundo cromosoma homólogo, y la recombinación modifica la célula para convertirla en homocigótica para el uno o más alelos adicionales.
Opcionalmente, el método puede comprender además poner en contacto el genoma con un segundo ARN de CRISPR sin especificidad por alelo que se híbrida con una segunda secuencia de reconocimiento de ARN de CRISPR centromérica al Iocus correspondiente al primer alelo en el segundo cromosoma homólogo, en donde la proteína Cas escinde al menos una de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar al menos una ruptura bicatenaria. Opcionalmente, el método puede comprender además poner en contacto el genoma con ARN de CRISPR sin especificidad por alelo adicionales (por ejemplo, un tercer ARN de CRISPR, o un tercer y un cuarto ARN de CRISPR) que se hibridan con secuencias de reconocimiento de ARN de CRISPR centroméricas al Iocus correspondiente al primer alelo en un segundo cromosoma homólogo. Después puede identificarse una célula que tiene el genoma modificado.
En algunos métodos, la primera (o segunda, tercera, o cuarta) secuencias de reconocimiento de ARN de CRISPR se ubican en el segundo cromosoma homólogo pero no en el primer cromosoma homólogo. El primer (o segundo, tercer, o cuarto) sitio de reconocimiento de ARN de CRISPR puede estar de aproximadamente 100 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb aproximadamente 20 Mb, aproximadamente 20 Mb aproximadamente 30 Mb, aproximadamente 30 Mb aproximadamente 40 Mb, aproximadamente 40 Mb aproximadamente 50 Mb, aproximadamente 50 Mb aproximadamente 60 Mb, aproximadamente 60 Mb aproximadamente 70 Mb, aproximadamente 70 Mb aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb aproximadamente 100 Mb del centrómero.
El primer alelo y/o el uno o más alelos adicionales pueden comprender una mutación tal como una modificación dirigida. Alternativamente, el primer alelo y/o el uno o más alelos adicionales pueden ser un alelo de tipo silvestre, y Ios Iocí correspondientes en el segundo cromosoma homólogo pueden comprender mutaciones tales como una mutación que causa enfermedad. El primer alelo puede estar de aproximadamente loo pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb del primer sitio de reconocimiento de ARN de CRISPR. Alternativamente, el primer alelo puede estar al menos 100 pb, al menos 1 kb, al menos 10 kb, al menos 100 kb, al menos 1 Mb, al menos 10 Mb, al menos 20 Mb, al menos 30 Mb, al menos 40 Mb, al menos 50 Mb, al menos 60 Mb, al menos 70 Mb, al menos 80 Mb, al menos 90 Mb, o al menos 100 Mb o más del primer sitio de reconocimiento de ARN de CRISPR.
La proteína Cas puede ser Cas9. Esta puede tener actividad nucleasa en ambas cadenas del ADN bicatenario, o puede ser una nickasa. En algunos métodos, la proteína Cas y el primer ARN de CRISPR no aparecen juntos en la naturaleza.
La recombinación puede comprender la pérdida de heterocigosidad telomérica (es decir, hacia el telómero) de la ruptura bicatenaria (por ejemplo, una conversión génica o pérdida de heterocigosidad polar o direccional). La región del segundo cromosoma homólogo que se reemplaza por pérdida de heterocigosidad puede ser de aproximadamente 100 pb a aproximadamente 1 kb, aproximadamente 1 kb a aproximadamente 10 kb, aproximadamente 10 kb a aproximadamente 100 kb, aproximadamente 100 kb a aproximadamente 1 Mb, aproximadamente 1 Mb a aproximadamente 10 Mb, aproximadamente 10 Mb a aproximadamente 20 Mb, aproximadamente 20 Mb a aproximadamente 30 Mb, aproximadamente 30 Mb a aproximadamente 40 Mb, aproximadamente 40 Mb a aproximadamente 50 Mb, aproximadamente 50 Mb a aproximadamente 60 Mb, aproximadamente 60 Mb a aproximadamente 70 Mb, aproximadamente 70 Mb a aproximadamente 80 Mb, aproximadamente 80 Mb a aproximadamente 90 Mb, o aproximadamente 90 Mb a aproximadamente 100 Mb. Alternativamente, la región del segundo cromosoma homólogo que se reemplaza puede ser de al menos 100 pb, al menos 1 kb, al menos 10 kb, al menos 100 kb, al menos 1 Mb, al menos 10 Mb, al menos 20 Mb, al menos 30 Mb, al menos 40 Mb, al menos 50 Mb, al menos 60 Mb, al menos 70 Mb, al menos 80 Mb, al menos 90 Mb, o al menos 100 Mb o más. Por ejemplo, puede reemplazarse la mayor parte del cromosoma.
B. Métodos para producir un animal no humano genéticamente modificado
Los animales no humanos genéticamente modificados pueden generarse con el empleo de Ios varios métodos descritos en la presente descripción. En algunos casos, el método para producir un animal no humano genéticamente modificado comprende: (1) modificar el genoma de una célula pluripotente mediante el uso de Ios métodos descritos anteriormente; (2) seleccionar la célula pluripotente genéticamente modificada; (3) introducir la célula pluripotente genéticamente modificada en un embrión huésped; y (4) implantar el embrión huésped que comprende la célula pluripotente genéticamente modificada en una madre sustituta. Se genera una progenie a partir de la célula pluripotente genéticamente modificada. La célula donante puede introducirse en un embrión huésped en cualquier etapa, tal como la etapa de blastocisto o la etapa de premórula (es decir, la etapa de 4 células o la etapa de 8 células). Se genera progenie que es capaz de transmitir la modificación genética a través de la línea germinal. La célula pluripotente puede ser una célula ES (por ejemplo, una célula ES de ratón o una célula ES de rata) como se analizó en otra parte en la presente descripción. Ver, por ejemplo, la patente de Estados Unidos núm. 7,294,754.
Alternativamente, el método para producir un animal no humano genéticamente modificado puede comprender: (1) modificar el genoma de un embrión en etapa de una célula mediante el uso de Ios métodos descritos anteriormente; (2) seleccionar el embrión genéticamente modificado; y (3) implantar el embrión genéticamente modificado en una madre sustituta. Se genera progenie que es capaz de transmitir la modificación genética a través de la línea germinal.
Pueden usarse además técnicas de transferencia nuclear para generar Ios animales mamíferos no humanos. En resumen, Ios métodos de transferencia nuclear pueden incluir las etapas de: (1) enuclear un oocito o proporcionar un oocito enucleado; (2) aislar o proporcionar una célula o núcleo donante a combinar con el oocito enucleado; (3) insertar la célula o núcleo en el oocito enucleado para formar una célula reconstituida; (4) implantar la célula reconstituida en el útero de un animal para formar un embrión; y (5) permitir que el embrión se desarrolle. En tales métodos, Ios oocitos generalmente se obtienen de animales fallecidos, aunque también pueden aislarse de oviductos y/u ovarios de animales vivos. Los oocitos pueden madurarse en una variedad de medios conocidos para Ios expertos en la técnica antes de la enucleación. La enucleación del oocito puede realizarse en un número de maneras bien conocidas para Ios expertos en la técnica. La inserción de la célula o núcleo donante en el oocito enucleado para formar una célula reconstituida puede ser por microinyección de una célula donante debajo de la zona pelúcida antes de la fusión. La fusión puede inducirse mediante la aplicación de un pulso eléctrico de DC a través del plano de contacto/fusión (electrofusión), por exposición de las células a sustancias químicas que promueven la fusión, tales como polietilenglicol, o por medio de un virus inactivado, tal como el virus Sendai. Una célula reconstituida puede activarse por medios eléctricos y/o no eléctricos antes, durante, y/o después de la fusión del donante nuclear y el oocito receptor. Los métodos de activación incluyen pulsos eléctricos, choque inducido químicamente, penetración por esperma, aumento de Ios niveles de cationes divalentes en el oocito, y reducción de la fosforilación de proteínas celulares (igual que por medio de inhibidores de quinasas) en el oocito. Las células reconstituidas activadas, o embriones, pueden cultivarse en medio bien conocido para Ios expertos en la técnica y después transferirse al útero de un animal. Ver, por ejemplo, Ios documentos US20080o92249, WO/1999/005266A2, US20040177390, WO/2008/017234A1, y la patente de Estados Unidos núm. 7,612,25o .
Algunos métodos para producir un animal no humano genéticamente modificado comprenden métodos para producir un animal no humano de generación FO. Tales métodos pueden comprender poner en contacto el genoma en una célula ES no humana con una proteína Cas, un primer ARN de CRISPR que se hibrida con una primera secuencia de reconocimiento de ARN de CRISPR, un segundo ARN de CRISPR que se hibrida con una segunda secuencia de reconocimiento de ARN de CRISPR, y un ARNtracr. La proteína Cas puede escindir el genoma dentro de la primera y segunda secuencias de reconocimiento de ARN de CRISPR para generar secuencias de extremos. Las secuencias de extremos pueden experimentar recombinación para formar un genoma con una modificación dirigida, y la modificación dirigida puede comprender una deleción entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR.
Los métodos pueden comprender además: (1) identificar una célula ES no humana que comprende la modificación dirigida; (2) introducir la célula ES no humana que comprende la modificación dirigida en un embrión huésped no humano; y (3) gestar el embrión huésped no humano en una madre sustituta. Después la madre sustituta puede producir el animal no humano de generación FO que comprende la modificación dirigida. El embrión huésped que comprende la célula pluripotente o totipotente genéticamente modificada (por ejemplo, una célula ES no humana) puede incubarse hasta la etapa de blastocisto y después implantarse en una madre sustituta para producir un animal FO. Los animales que portan el Iocus genómico genéticamente modificado pueden identificarse por medio de un ensayo de modificación de alelo (MOA) como se describe en la presente descripción.
Los varios métodos proporcionados en la presente descripción permiten la generación de un animal FO no humano genéticamente modificado en donde las células del animal FO genéticamente modificado comprenden la modificación dirigida. Se reconoce que en dependencia del método usado para generar el animal FO, el número de células dentro del animal FO que tienen la secuencia de nucleótidos de interés y carecen del casete de recombinasa y/o el casete de selección variará. La introducción de las células ES donantes en un embrión en etapa de premórula de un organismo correspondiente (por ejemplo, un embrión de ratón en etapa de 8 células) por medio de por ejemplo, el método VELOCIMOUSE® permite que un mayor porcentaje de la población de células del animal FO comprenda células que tienen la secuencia de nucleótidos de interés que comprende la modificación genética dirigida. En casos específicos, al menos 50 %, 60 %, 65 %, 70 %, 75 %, 85 %, 86 %, 87 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la contribución celular del animal FO no humano comprende una población de células que tiene la modificación dirigida. En otros casos, al menos una o más de las células germinales del animal FO tienen la modificación dirigida.
En algunos casos, las células del animal FO genéticamente modificado son heterocigóticas o heterocigóticas combinadas para la modificación dirigida. Por ejemplo, las células del animal FO genéticamente modificado pueden ser hemicigóticas para la modificación dirigida. En otros casos, las células del animal FO genéticamente modificado son homocigóticas para la modificación dirigida.
En algunos casos, el animal FO generado por Ios métodos y composiciones descritos en la presente descripción puede cruzarse con un animal de tipo silvestre para generar una generación F1 que es heterocigótica para la modificación dirigida. Después Ios animales de la generación F1 pueden cruzarse entre para generar un animal F2 homocigótico para la modificación dirigida. La progenie F1 puede genotipificarse mediante el uso de cebadores y/o sondas específicos para determinar si la modificación genética dirigida está presente.
C. Genomas y loci genómicos diana
Un genoma o Iocus genómico diana modificado mediante Ios métodos descritos en la presente descripción puede incluir cualquier segmento o región de ADN dentro de una célula. El genoma o Iocus genómico diana puede ser nativo para la célula, puede ser un segmento de ADN heterólogo o exógeno que se Integró en el genoma de la célula, o puede ser una combinación de estos. Tales segmentos de ADN heterólogos o exógenos pueden Incluir transgenes, casetes de expresión, polinucleótido que codifica marcadores de selección, o regiones heterólogas o exógenas de ADN genómico.
El genoma o Iocus genómico diana puede incluir además ADN extracromosómico dentro de la célula, tal como un cromosoma artificial de levadura (YAC), un cromosoma artificial bacteriano (BAC), un cromosoma artificial humano, o cualquier otra región genómica modificada genéticamente contenida en una célula huésped adecuada.
D. Formas de Cas9 y ARN guía
En algunos métodos, el contacto del genoma comprende introducir una o más proteínas Cas, uno o más ARN de CRISPR, y uno o más ARNtracr en la célula. La introducción puede llevarse a cabo por cualquier medio, y uno o más de Ios componentes (por ejemplo, dos de Ios componentes, o la totalidad de Ios componentes) pueden introducirse en la célula simultáneamente o secuencialmente en cualquier combinación.
Un ARN de CRISPR y un ARNtracr pueden fusionarse entre como un ARN guía (ARNg) a introducir en una célula. Alternativamente, un A r N de C R IS p R y el ARNtracr pueden ser moléculas de ARN distintas. Un ARN de CRISPR puede introducirse en la célula en forma de un ARN o en forma de un ADN que codifica el ARN de CRISPR. Del mismo modo, un ARNtracr puede introducirse en la célula en forma de un ARN o en forma de un ADN que codifica el ARNtracr, y un ARNg puede introducirse en la célula en forma de un ARN o en forma de un ADN que codifica el ARNg.
Una proteína Cas puede introducirse en la célula en forma de una proteína, un ARN mensajero (ARNm) que codifica la proteína Cas, o un ADN que codifica la proteína Cas. En algunos métodos, una proteína Cas, un ARN de C r ISPR, y un ARNtracr pueden introducirse en la célula como un complejo de ARN y proteína. Del mismo modo, una proteína Cas y un ARNg pueden introducirse en la célula como un complejo de ARN y proteína. La proteína Cas puede ser una proteína Cas permeable a la célula (por ejemplo, una proteína Cas con un dominio de penetración celular).
Un ADN que codifica una proteína Cas, un ARN de CRISPR, o un ARNtracr puede unirse operativamente a un promotor activo en la célula. Tales A d N pueden estar en uno o más constructos de expresión. En algunos métodos, uno o más de tales constructos de expresión pueden ser componentes de una sola molécula de ácido nucleico. Por ejemplo, Ios ADN que codifican una o más proteínas Cas, Ios A d N que codifican uno o más ARN de CRISPR, y Ios ADN que codifican uno o más ARNtracr pueden ser todos componentes de una sola molécula de ácido nucleico. Alternativamente, pueden encontrarse separados en cualquier combinación entre dos, tres, cuatro, o más moléculas de ácidos nucleicos.
De manera similar, un ADN que codifica una proteína Cas o un ADN que codifica un ARNg puede unirse operativamente a un promotor activo en la célula. Tales ADN también pueden estar en uno o más constructos de expresión. En algunos métodos, uno o más de tales constructos de expresión pueden ser componentes de una sola molécula de ácido nucleico. Por ejemplo, Ios ADN que codifican una o más proteínas Cas y Ios ADN que codifican uno o más ARNg pueden ser todos componentes de una sola molécula de ácido nucleico. Alternativamente, pueden encontrarse separados en cualquier combinación entre dos, tres, cuatro, o más moléculas de ácidos nucleicos.
En algunos métodos, la proteína Cas y el ARN de CRISPR y/o el ARNtracr no aparecen juntos en la naturaleza. En algunos métodos, por ejemplo, la proteína Cas y el primer ARN de CRISPR no aparecen juntos en la naturaleza, la proteína Cas y el segundo A r N de CRISPR no aparecen juntos en la naturaleza, y/o la proteína Cas y el ARNtracr no aparecen juntos en la naturaleza.
En algunos métodos, la proteína Cas es una proteína Cas9. La proteína Cas puede fusionarse a un polipéptido heterólogo, tal como una señal de localización nuclear (N l S). La proteína Cas puede tener actividad de escisión total y crear rupturas bicatenarias dentro del ADN genómico (por ejemplo, una ruptura bicatenaria con extremos romos), o puede ser una nickasa que puede escindir una sola cadena de ADN genómico.
En algunos métodos, se emplean pares de nickasas. Por ejemplo, el genoma puede ponerse en contacto con una primera y segunda nickasas que escinden cadenas de ADN opuestas, de manera que el genoma se modifica a través de la doble formación de mellas. La primera nickasa puede escindir una primera cadena de ADN genómico (es decir, la cadena complementaria), y la segunda nickasa puede escindir una segunda cadena de ADN genómico (es decir, la cadena no complementaria). Alternativamente, ambas nickasas pueden escindir la misma cadena. La primera y segunda nickasas pueden crearse, por ejemplo, mediante la mutación de un residuo catalítico en el dominio R uvC (por ejemplo, la mutación D10A descrita en otra parte en la presente descripción) de la primera nickasa y la mutación de un residuo catalítico en el dominio HNH (por ejemplo, la mutación H840A descrita en otra parte en la presente descripción) de la segunda nickasa. Alternativamente, la primera nickasa puede usarse para crear ambas mellas.
En algunos de tales métodos, la doble formación de mellas puede emplearse para crear una o más rupturas bicatenarias que tienen extremos escalonados. Por ejemplo, la doble formación de mellas se emplea para crear extremos escalonados en el primer y segundo sitios de escisión. La primera nickasa puede escindir la primera cadena de ADN dentro de la primera y segunda secuencias de reconocimiento de ARN de c R iSPR con las que se hibridan el primer y segundo ARN de CRISPR, y la segunda nickasa puede escindir la segunda cadena de ADN dentro de la tercera y cuarta secuencias diana de reconocimiento de ARN de CRISPR con las que se hibridan el tercer y cuarto ARN de CRISPR. Alternativamente, la primera nickasa puede usarse para formar mellas en la primera, segunda, tercera, y cuarta secuencias de reconocimiento de ARN de CRISPR. La primera y tercera secuencias diana de reconocimiento de ARN de CRISPR pueden posicionarse para crear un primer sitio de escisión de manera que las mellas creadas por la primera y segunda nickasas en la primera y segunda cadenas de ADN creen una ruptura bicatenaria (es decir, el primer sitio de escisión comprende las mellas dentro de la primera y tercera secuencias de reconocimiento de ARN de CRISPR). Del mismo modo, la segunda y cuarta secuencias de reconocimiento de ARN de CRISPR pueden posicionarse para crear un segundo sitio de escisión de manera que las mellas creadas por la primera y segunda nickasas en la primera y segunda cadenas de ADN creen una ruptura bicatenaria (es decir, el segundo sitio de escisión comprende las mellas dentro de la segunda y cuarta secuencias de reconocimiento de ARN de CRISPR). En algunos casos, las mellas dentro de la primera y tercera secuencias de reconocimiento de ARN de CRISPR y/o la segunda y cuarta secuencias de reconocimiento de ARN de CRISPR pueden ser mellas desplazadas. La ventana de desplazamiento puede ser, por ejemplo, de al menos aproximadamente 5 pb, 10 pb, 20 pb, 30 pb, 40 pb, 50 pb, 60 pb, 70 pb, 80 pb, 90 pb, 100 pb o más. Ver Ran y otros (2013) Cell 154:1380-1389; Mali y otros (2013) Nat. Biotech.31:833-838;y Shen y otros (2014) Nat. Methods 11:399-404.
E. Métodos para introducir ácidos nucleicos y proteínas en células
En la presente descripción se proporcionan varios métodos y composiciones para permitir la introducción de un ácido nucleico en una célula. En algunos casos, el sistema empleado para introducir el ácido nucleico permite la integración dirigida en un Iocus genómico específico. Tales sistemas emplean una variedad de componentes y para facilitar la referencia, el término "sistema de integración genómica dirigida" incluye genéricamente la totalidad de Ios componentes requeridos para un evento de integración (por ejemplo, uno o más de Ios agentes tipo nucleasa, sitios de escisión de nucleasa, polinucleótidos insertos de ADN, vectores de transformación, loci genómicos diana, y polinucleótidos de interés).
Los métodos proporcionados en la presente descripción pueden comprender introducir en una célula uno o más constructos de polinucleótidos o polipéptidos que comprenden uno o más componentes de un sistema de integración genómica dirigida. "Introducir" incluye presentar a la célula la secuencia (polipéptido o polinucleótido) de manera tal que la secuencia acceda al interior de la célula. Los métodos proporcionados en la presente descripción no dependen de un método particular para introducir un ácido nucleico o proteína en la célula, solo que el ácido nucleico o proteína acceda al interior de al menos una célula. Los métodos para introducir ácidos nucleicos y proteínas en varios tipos celulares se conocen en la técnica e incluyen, por ejemplo, métodos de transfección estable, métodos de transfección transitoria, y métodos mediados por virus.
En algunos casos, las células empleadas en Ios métodos y composiciones tienen un constructo de ADN incorporado de manera estable en su genoma. Por ejemplo, una célula empleada en Ios métodos descritos en la presente descripción puede tener un gen que codifica Cas preexistente incorporado de manera estable en su genoma (es decir, una célula con Cas lista). "Incorporado de manera estable" o "introducido de manera estable" incluye la introducción de un polinucleótido en la célula de manera que la secuencia de nucleótidos se integre en el genoma de la célula y sea capaz de heredarse por su progenie. Puede usarse cualquier protocolo para la incorporación estable de Ios constructos de a D n o de Ios varios componentes del sistema de integración genómica dirigida.
Los protocolos de transfección así como Ios protocolos para introducir polipéptidos o secuencias de polinucleótidos en células pueden variar. Los métodos de transfección no limitantes incluyen métodos de transfección químicos que usan liposomas; nanopartículas; fosfato de calcio (Graham y otros (1973) Virology 52 (2): 456-67, Bacchetti y otros (1977) Proc Nati Acad Sci u Sa 74 (4): 1590-4, y Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. Nueva York: W. H. Freeman and Company. pp. 96-97); dendrímeros; o polímeros catiónicos tales como DEAE-dextrana o polietilenimina. Los métodos no químicos incluyen electroporación; sonoporación, y transfección óptica. La transfección basada en partículas incluye el uso de una pistola de genes, o transfección asistida por imanes (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). Pueden usarse además métodos virales de transfección.
En algunos casos, la introducción de ácidos nucleicos o proteínas en una célula está mediada por electroporación, por inyección intracitoplasmática, por infección viral, por adenovirus, por lentivirus, por retrovirus, por transfección, por transfección mediada por lípidos, o por Nucleofection™.
La introducción de ácidos nucleicos o proteínas en una célula (por ejemplo, un embrión en etapa de una célula) también puede llevarse a cabo por microinyección. En embriones en etapa de una célula, la microinyección puede ser en el pronúcleo materno y/o paterno o en el citoplasma. Si la microinyección es solamente en un pronúcleo, se prefiere el pronúcleo paterno debido a su mayor tamaño. La microinyección de un ARNm es preferentemente en el citoplasma (por ejemplo, para suministrar el ARNm directamente a la maquinaria de traducción), mientras que la microinyección de una proteína Cas o una molécula de ácido nucleico que codifica una proteína Cas o que codifica un ARN se prefiere en el núcleo/pronúcleo. Alternativamente, la microinyección puede llevarse a cabo por inyección tanto en el núcleo/pronúcleo como en el citoplasma: una aguja puede introducirse primero en el núcleo/pronúcleo y puede inyectarse una primera cantidad, y mientras se retira la aguja del embrión en etapa de una célula puede inyectarse una segunda cantidad en el citoplasma. Si una proteína Cas se inyecta en el citoplasma, la proteína Cas comprende preferentemente una señal de localización nuclear para garantizar su suministro al núcleo/pronúcleo. Los métodos para llevar a cabo la microinyección se conocen bien. Ver, por ejemplo, Nagy y otros (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Coid Spring Harbor, Nueva York: Coid Sprlng Harbor Laboratory Press); Meyer y otros (2010) Pros Nati Acad Sel USA 107:15022-15026 y Meyer y otros (2012) Proc Nati Acad Sel USA 109:9354-9359.
La Introducción de ácidos nucleicos o proteínas en ia célula puede realizarse una vez o múltiples veces durante un período de tiempo. Por ejemplo, la Introducción puede realizarse al menos dos veces durante un período de tiempo, al menos tres veces durante un período de tiempo, al menos cuatro veces durante un período de tiempo, al menos cinco veces durante un período de tiempo, al menos seis veces durante un período de tiempo, al menos siete veces durante un período de tiempo, al menos ocho veces durante un período de tiempo, al menos nueve veces durante un período de tiempos, al menos diez veces durante un período de tiempo, al menos once veces, al menos doce veces durante un período de tiempo, al menos trece veces durante un período de tiempo, al menos catorce veces durante un período de tiempo, al menos quince veces durante un período de tiempo, al menos dieciséis veces durante un período de tiempo, al menos diecisiete veces durante un período de tiempo, al menos dieciocho veces durante un período de tiempo, al menos diecinueve veces durante un período de tiempo, o al menos veinte veces durante un período de tiempo.
Cuando se introducen en la célula agentes tipo nueleasa y vectores de transformación (por ejemplo, LTVEC para células distintas a los embriones en etapa de una célula), estos pueden introducirse simultáneamente. Alternativamente, el agente tipo nueleasa puede introducirse por separado del vector de transformación. Por ejemplo, el agente tipo nueleasa puede introducirse antes de la introducción del vector de transformación, o puede introducirse después de la introducción del vector de transformación.
F. Mecanismos de recombinación y métodos para alterar la prevalencia de unión de extremos no homólogos, conversión géniea, o recombinación homóloga
La recombinación incluye cualquier proceso de intercambio de información genética entre dos polinucleótidos y puede ocurrir por cualquier mecanismo. La recombinación en respuesta a rupturas bieatenarias (DSB) ocurre principalmente a través de dos rutas de reparación del ADN conservadas: la unión de extremos no homólogos (NHEJ) y la recombinación homóloga (HR). Ver Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897. La NHEJ incluye la reparación de rupturas bieatenarias en un ácido nucleico por ligación directa entre de los extremos de las rupturas sin la necesidad de una plantilla homóloga. La ligación de secuencias no contiguas por NHEJ frecuentemente puede dar como resultado deleeiones, inserciones, o translocaciones cerca del sitio de la ruptura bieatenaria. La recombinación puede ocurrir además por medio de reparación dirigida por homología (HDR) o recombinación homóloga (HR). La HDR o HR incluye una forma de reparación de ácidos nucleicos que puede requerir homología de secuencias de nucleótidos, usa una molécula "donante" para la reparación por plantilla de una molécula "diana" (es decir, la que experimentó la ruptura bieatenaria), y conduce a la transferencia de información genética del donante a la diana. Sin desear limitarse por ninguna teoría particular, tal transferencia puede involucrar la corrección de errores de apareamiento del heterodúplex de ADN que se forma entre la diana con ruptura y el donante, y/o la hibridación de cadenas dependiente de síntesis, en la que el donante se usa para resintetizar la información genética que se convertirá en parte de la diana, y/o procesos relacionados. En algunos casos, el polinucleótido donante, una porción del polinucleótido donante, una copia del polinucleótido donante, o una porción de una copia del polinucleótido donante se integra en el ADN diana.
En el contexto de la modificación del genoma de una célula que es heterocigótiea para un alelo para convertirla en homocigótiea para ese alelo, la recombinación puede incluir cualquier medio por el cual las células homocigótieas se derivan de células heterocigótieas. Tales medios pueden incluir, por ejemplo, pérdida de heteroeigosidad (LOH), conversión géniea, o eventos de entrecruzamiento que ocurren mediante cualquier mecanismo de recombinación conocido. Sin desear limitarse por la teoría, la LOH puede ocurrir, por ejemplo, por medio de recombinación mitótiea, con o sin conversión géniea, o por medio de pérdida y duplicación de cromosomas. Ver, por ejemplo, Lefebvre y otros (2001) Nat. Genet. 27:257-258. La conversión géniea en este contexto puede incluir la transferencia unidireccional de material genético de una secuencia donante a un aeeptor altamente homólogo (es decir, el intercambio no recíproco de información genética de una molécula a su homóloga). La conversión géniea incluye cualquier medio para copiar un alelo mediante cualquier mecanismo de recombinación conocido. Por ejemplo, la conversión géniea puede involucrar la transferencia no recíproca de información genética de una secuencia intacta a una región homóloga que contiene una ruptura bieatenaria, y puede ocurrir entre eromátidas hermanas, cromosomas homólogos, o secuencias homólogas en la misma eromátida o en cromosomas diferentes. Ver, por ejemplo, Chen y otros (2007) Nat. Rev. Genet. 8:762-775. En casos específicos, la conversión géniea es el resultado directo de la recombinación homóloga como resultado de la copia de información genética a partir de un cromosoma homólogo. Esto puede conducir a la pérdida de heteroeigosidad (LOH) localizada cuando las secuencias homólogas no son idénticas.
A modo de ejemplo, la LOH podría ocurrir a través de intercambio recíproco de eromátidas por entrecruzamiento mitótieo, o por copia de eromátidas mediante replicación inducida por ruptura. En cualquier caso, podría ocurrir una modificación heterocigótiea en la que un cromosoma se transforma antes de la replicación del genoma. Alternativamente, podría transformarse una sola eromátida después de la replicación del genoma, seguido de conversión géniea entre eromátidas.
En cualquiera de los métodos descritos en la presente descripción, la célula puede ser una célula que se ha modificado para aumentar o disminuir la actividad de NHEj . Del mismo modo, la célula puede ser una célula que se ha modificado para aumentar la conversión géniea o la actividad de HDR. Tales modificaciones pueden comprender modificaciones en la expresión o la actividad de genes involucrados en la regulación de NHEj , conversión géniea, y/o HDR. Por ejemplo, la dism inución de la actividad de NHEJ y/o el aum ento de la actividad de HDR pueden prom over el colapso bialélico de regiones genóm icas entre secuencias de reconocim iento de ARN de CRISPR correspondientes a dos ARNg. Sin desear lim itarse por ninguna teoría particular, un m ecanism o m ediante el cual puede ocurrir el colapso genóm ico bialélico es por reparación m ediada por NHEj o reparación m ediada por HDR dentro de un prim er alelo y la creación de un segundo alelo idéntico por medio de m ecanism os de HDR, tales com o la conversión génica (ver el Ejemplo 1). Por lo tanto, prom over las rutas m ediadas por HDR (por ejemplo, m ediante la dism inución de la actividad de NHEJ o m ediante el aum ento de la actividad de HDR tam bién puede prom over el colapso bialélico de regiones genóm icas. De m anera similar, sin desear lim itarse por ninguna teoría particular, la conversión de una célula heterocigótica a una célula hom ocigótica m ediante el uso de pares de ARN guías que reconocen un solo Iocus puede prom overse si la actividad de NHEJ dism inuye y la actividad de HDR (por ejemplo, la actividad de conversión génica) aum enta en proporción.
Pueden usarse inhibidores para aum entar o d ism inu ir la actividad de NHEJ o para aum entar o d ism inuir la actividad de HDR. Tales inhibidores pueden ser, por ejemplo, m oléculas pequeñas o ácidos nucleicos inhibidores tales com o ácidos nucle icos de in terferencia cortos (por ejemplo, ARN de interferencia corto (ARNÍc), ARN bicatenario (ARNbc), m icroARN (m iARN), y ARN en horquilla corto (ARNhc)) u o ligonucleótidos antisentido específicos para un transcrito génico. Los inhib idores pueden dirig irse a enzim as involucradas en NHEJ o HDR o a su regulación corriente arriba por m odificación postraduccional por medio de, por ejemplo, fosforilación, ubiquitinación, y sumoilación.
En células de mamífero, la NHEJ es el m ecanism o de reparación de DSB predom inante y está activo a lo largo del ciclo celular. En vertebrados, la ruta de NHEJ "canónica" o "clásica" (C -NHEJ) requiere varios factores centrales, que incluyen ADN-PK, K u70-80, Artem is, ligasa IV (Lig4), XRCC4, CLF, y PoI |j para reparar una DSB. Ver Kasparek & Hum phrey (2011) Sem inars in Cell & Dev. B íoI. 22:886-897. Durante la NHEj , Ios extrem os de ADN se unen a la proteína Ku protectora de extrem os m uy abundante, que funciona com o una estación de acoplam iento para la incorporación de Ios otros com ponentes de la n H e J.
Por lo tanto, en algunos de Ios m étodos descritos en la presente descripción, la célula se ha m odificado para reducir o e lim inar o para aum entar la expresión o la actividad de factores involucrados en la C-NHEJ. Por ejemplo, en algunos métodos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de ADN-PK, K u70-80, Artem is, ligasa IV (Lig4), XRCC4, CLF, y/o PoI j . En m étodos específicos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de A D N -P K o para aum entar la expresión o la actividad de A D N -P K (por ejemplo, la expresión o la actividad de las A D N -P K c; secuencia de UniProt ilustrativa designada P97313). Los ejem plos de inhibidores de ADN -PKc incluyen, por ejemplo, NU7026, y NU7441. Ver, por ejemplo, la patente de Estados Unidos núm. 6,974,867. En m étodos específicos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de ligasa IV o para aum entar la expresión o la actividad de ligasa IV. Un ejem plo de un inhib idor de ligasa IV es SCR7.
Pueden usarse adem ás inhib idores dirig idos a proteínas de puntos de regulación del ciclo celular com o ATM (por ejemplo, KU55933), CHK1/CHK2 (por ejemplo, KLD1162 o CHIR-124) y ATR (por ejemplo, VE 821) para m ejorar sinérgicam ente Ios efectos de inhib idores de la reparación del ADN específicos o para prevenir efectos secundarios no intencionales como la detención del ciclo celu lar y/o la apoptosis (ver C iccia y otros (2010) Mol Cell 40:179).
La interrupción de C-NHEJ puede aum entar Ios niveles de unión anormal m ediada por rutas de NHEJ "a lternativas" (A-NHEJ) y tam bién puede aum entar la reparación por HR. Las rutas A-NHEJ m uestran un sesgo hacia las uniones m ediadas por m ícrohom ología y siguen cinéticas más lentas que la C-NHEJ. Se ha propuesto la participación de varios factores, que incluyen el com plejo MRN (MRE11, RAD50, n Bs 1), CtlP, XRCC1, PARP, L ig l, y Lig3. Ver Kasparek & Hum phrey (2011) Sem inars in Cell & Dev. B íoI. 22:886-897 y C laybon y otros (2010) Nucleic Acids Res. 38(21):7538-7545.
Por lo tanto, en algunos de Ios m étodos descritos en la presente descripción, la célula se ha m odificado para reducir o e lim inar o para aum entar la expresión o la actividad de factores involucrados en la A-NHEJ. Por ejemplo, en algunos métodos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de MRE11, RAD5o , NBS1, CtlP, XRCC1, PARP (por ejemplo, PARP1), L ig l, y/o Lig3. En otros métodos, la célula se ha m odificado para aum entar la expresión o la actividad de MRE11, RAD50, n Bs 1, CtlP, XRCC1, PARP (por ejemplo, PARP1), L ig l, y/o Lig3. En m étodos específicos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de PARP1 o para aum entar la expresión o la actividad de PARP1 (secuencia de UniProt ilustrativa designada P11103). Los ejem plos de inhib idores de PARP (por ejemplo, NU1025, Iniparib, O laparib) incluyen nicotinam idas; isoquinolinonas y dihidroisoquinolinonas; bencim idazoles e índoles; fta lazin-1(2H)-onas y quinazolinonas; iso indolinonas y análogos y derivados de estas; fenantrid inas y fenantrid inonas; benzopironas y análogos y derivados de estas; derivados insaturados del ácido hidroxím ico y análogos y derivados de este; piridazinas, que incluyen piridazinas fusionadas y análogos y derivados de estas; y/u otros com puestos tales com o cafeína, teofilina, y tim id ina, y análogos y derivados de estas. Ver, por ejemplo, la patente de Estados Unidos núm. 8,071,579.
La C-NHEJ exhibe adem ás una relación com petitiva con HR de m anera que la interrupción de la C-NHEJ tam bién puede conducir al aum ento de la reparación por HR. Tal com petencia entre NHEj y HR puede explotarse ya que la interrupción de NHEJ puede conducir a la transform ación génica m ejorada a través de la reducción de la integración aleatoria y posib lem ente el aum ento de la integración dirigida por recom binación homóloga.
Existen varias form as de reparación por recom binación homóloga, que incluyen hibridación de cadenas simples, conversión génica, entrecruzam ientos, y replicación inducida por ruptura. La hibridación de cadenas sim ples es una form a m inoritaria de reparación por HR en la que secuencias m onocatenarias hom ólogas en cua lquier lado de una DSB resecada se hibridan, lo que da com o resultado la reconstitución del crom osom a. La hibridación de cadenas sim ples genera deleciones de tam año variable, en dependencia de la distancia que separa las dos regiones de hom ología de secuencia. La conversión génica incluye el in tercam bio no recíproco de inform ación genética de una m olécula a su homóloga, como resultado directo de la HR com o resultado de la copia de inform ación genética a partir de un crom osom a homólogo. Esto puede conducir a la LOH localizada cuando las secuencias hom ólogas no son idénticas. Normalmente, la extensión de la conversión génica se lim ita a algunos cientos de pares de bases. Sin embargo, se ha inform ado la conversión génica de tram os largos en algunos fondos genéticos, que incluyen la deficiencia de RAD51C. Ver Nagaraju y otros (2006) M o I. Cell. Biol. 26:8075-8086. Los entrecruzam ientos pueden ocurrir, por ejemplo, entre crom osom as homólogos, y tienen el potencial de conducir a translocaciones recíprocas si ocurren en G1 o a translocaciones no recíprocas y LOH que se extiende desde el sitio de ruptura hasta el te lóm ero distal si ocurren en G2. La replicación inducida por ruptura es una varian te de HR en la que después de la invasión de la cadena, la replicación del ADN continúa hasta el extrem o del crom osom a. Por lo tanto, existen m uchos m ecanism os m ediante Ios cuales la HR puede prom over la LOH.
Por lo tanto, en algunos de Ios m étodos descritos en la presente descripción, la célula se ha m odificado para reducir o e lim inar o para aum entar la expresión o la actividad de factores involucrados en la HR. Por ejemplo, en algunos métodos, la célula se ha m odificado para aum entar la expresión o la actividad de RAD51, RAD52, r A D 54, RAD55, RAD51C, BRCA1, y/o BRCA2. En otros métodos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de RAD51, RAD52, RAD54, RAD55, RAD51C, BRCA1, y/o BRCA2.
En algunos métodos, la expresión o la actividad de otras proteínas involucradas en la regulación de NHEJ y/o HR pueden alterarse. Por ejemplo, en algunos métodos, la célula se ha m odificado para reducir o e lim inar la expresión o la actividad de Chk2, para reducir o e lim inar la expresión o la actividad de Clspn, para reducir o e lim inar la expresión o la actividad de Setd2, para aum entar la expresión o la actividad de Kat2a, y/o para aum entar la expresión o la actividad de Rad51. En otros métodos, la célula se ha m odificado para aum entar la expresión o la actividad de Chk2, para aum entar la expresión o la actividad de Clspn, para aum entar la expresión o la actividad de Setd2, para reducir o e lim inar la expresión o la actividad de Kat2a, y/o para reducir o e lim inar la expresión o la actividad de Rad51.
Chk2 (tam bién conocida com o Chek2 y Rad53; el hom ólogo de S. p o m b e es Cds1) es una proteína quinasa serina/treonina requerida para la detención del ciclo celu lar m ediada por punto de regulación, activación de la reparación del ADN, y apoptosis en respuesta a la presencia de rupturas bicatenarias en el ADN. Ver Blaikley y otros (2014) Nucleic Acids Research 42:5644-5656. Clspn (tam bién conocida como Claspina; el hom ólogo de S. p o m b e es Mrc1) es una proteína requerida para la detención del ciclo celular m ediada por punto de regulación en respuesta al daño del ADN. Se ha inform ado que la deleción de hom ólogos de Chk2 o Clspn en S. p o m b e da com o resultado un fenotipo h iperrecom binante que exhibe niveles s ignificativam ente elevados de conversión génica inducida por ruptura en com paración con el tipo silvestre. Específicam ente, se inform ó que Ios niveles de conversión génica se encontraban significativam ente aum entados, m ientras que se inform ó que Ios niveles de unión de extrem os no hom ólogos (NHEJ), conversión de crom átidas herm anas (SCC), y pérdida de heterocigosidad (LO H) se encontraban dism inuidos. Ver B laikley y otros (2014) Nucleic Acids Research 42:5644-5656.
Kat2a (tam bién conocida com o Gcn5 y G cn512) es una histona acetiltransferasa ubicua que prom ueve la activación de la transcripción y se ha inform ado su asociación con la reparación de rupturas bicatenarias. La acetilación de la lisina 36 de la histona H3 (H3K36) dependiente de Kat2a aum enta la accesib ilidad a la crom atina, aum enta la resección, y promueve la recom binación hom óloga m ientras que suprim e la unión de extrem os no homólogos. Ver Pai y otros (2014) Nat. Com m un. 5:4091. Setd2 (tam bién conocida com o Kiaa1732, Kmt3a, y Set2) es una histona m etiltransferasa que trim e tila específicam ente la lisina 36 de la histona H3 (H3K36m e3) m ediante el uso de lisina 36 desm etilada (H3K36m e2) como sustrato. La m etilación H3K36 dependiente de Setd2 reduce la accesib ilidad a la crom atina, reduce la resección, y prom ueve la NHEJ. Ver Pai y otros (2014) Nat. Commun. 5:4091.
Rad 51 (tam bién conocida com o Reca, Rad51A, y hom ólogo 1 de la proteína Rad51 de reparación del ADN ) es una proteína que funciona con Rad52 y otras proteínas para efectuar el in tercam bio de cadenas durante la recom binación homóloga, lo que form a un heterodúplex de ADN que se resuelve por reparación de errores de apaream iento para producir un tram o de conversión génica. En células de mamífero, se ha inform ado que la sobreexpresión de Rad51 y Rad52 aum enta la frecuencia de recom binación hom óloga y conversión génica. Ver Yanez & Porter (1999) Gene Ther. 6:1282-1290 y Lam bert & López (2000) EMBO J. 19:3090-3099.
Las m odificaciones en la expresión o la actividad de Ios genes involucrados en la regulación de la NHEJ, la conversión génica, y/o la reparación dirigida por hom ología pueden ser espacialm ente o tem pora lm ente específicas y tam bién pueden ser inducibles o tem porales y reversibles. Por ejemplo, pueden constru irse varias form as de casetes para perm itir la deleción en tipos de células o te jidos específicos, en etapas del desarro llo específicas, o tras la inducción. Tales casetes pueden em plear un sistem a de recom binasa en el que el casete está flanqueado en am bos lados por sitios de reconocim iento de recom binasa y puede elim inarse m ediante el uso de una recom binasa expresada en el tipo celular deseado, expresada en la etapa del desarro llo deseada, o expresada o activada tras la inducción. Tales casetes pueden constru irse adem ás de modo que incluyan una serie de pares de sitios de reconocim iento de recom binasa diferentes que se colocan de manera que puedan generarse alelos nulos, condicionales, o una combinación de condlclonales/nulos, como se describe en el documento US 2011/0104799. La regulación de genes de recombinasa puede controlarse de varias maneras, tal como mediante la unión operativa de un gen de recombinasa a un promotor (u otro elemento regulador) específico de célula, específico de tejido, o regulado por el desarrollo, o mediante la unión operativa de un gen de recombinasa a una 3'-UTR que comprende un sitio de reconocimiento de un miARN que es activo solamente en tipos celulares, tipos de tejidos, o etapas del desarrollo particulares. Una recombinasa puede regularse además, por ejemplo, mediante el empleo de una proteína de fusión que coloca la recombinasa bajo el control de un efector o metabolito (por ejemplo, CreERT2, cuya actividad es controlada positivamente por tamoxifeno), o mediante la colocación del gen de recombinasa bajo el control de un promotor inducible (por ejemplo, uno cuya actividad es controlada por doxiciclina y TetR o variantes de TetR). Los ejemplos de varias formas de casetes y medios para regular genes de recombinasa se proporcionan, por ejemplo, en los documentos US 8,518,392; US 8,354,389; y US 8,697,851.
G. Células y animales
Varias composiciones y métodos proporcionados en la presente descripción emplean células, tales como células de un animal. Tales células pueden ser de un animal no humano. Tales células pueden ser células eucariotas, que incluyen, por ejemplo, células fúngicas (por ejemplo, de levadura), células vegetales, células animales, células de mamífero, y células humanas. Una célula de mamífero puede ser, por ejemplo, una célula de mamífero no humano, una célula humana, una célula de roedor, una célula de rata, una célula de ratón, una célula de hámster, un fibroblasto, o una célula CHO. La célula eucariota puede ser una célula totipotente, una célula pluripotente, tal como una célula pluripotente no humana (por ejemplo, una célula madre embrionaria (ES) de ratón o una célula ES de rata) o una célula pluripotente humana, o una célula no pluripotente. Las células totipotentes incluyen células indiferenciadas que pueden dar lugar a cualquier tipo celular, y las células pluripotentes incluyen células indiferenciadas que poseen la capacidad de desarrollarse a más de un tipo celular diferenciado. Tales células pluripotentes y/o totipotentes pueden ser, por ejemplo, células madre embrionarias (E s ) o células similares a ES, tales como células madre pluripotentes inducidas ( íp S). Las células madre embrionarias incluyen células totipotentes o pluripotentes de origen embrionario que son capaces de contribuir a cualquier tejido del embrión en desarrollo tras la introducción en un embrión. Las células ES pueden derivarse de la masa celular interna de un blastocisto y son capaces de diferenciarse a células de cualquiera de las tres capas germinales de los vertebrados (endodermo, ectodermo, y mesodermo).
Una célula eucariota puede ser además una célula que no es una célula somática primaria. Las células somáticas pueden incluir cualquier célula que no es un gameto, una célula germinal, un gametocito, o una célula madre indiferenciada.
Las células eucariotas incluyen además células primarias. Las células primarias incluyen células o cultivos de células que se han aislado directamente de un organismo, un órgano, o un tejido. Las células primarias incluyen células que no son transformadas ni inmortales. Estas incluyen cualquier célula obtenida de un organismo, un órgano, o un tejido que no se sometió previamente a pases en cultivo de tejidos o se ha sometido previamente a pases en cultivo de tejidos pero no es capaz de someterse a pases indefinidamente en cultivo de tejidos. Tales células pueden aislarse por técnicas convencionales e incluyen, por ejemplo, células somáticas, células hematopoyéticas, células endoteliales, células epiteliales, fibroblastos, células mesenquimales, queratinocitos, melanocitos, monocitos, células mononucleares, adipocitos, preadipocitos, neuronas, células gliales, hepatocitos, mioblastos esqueléticos, y células de músculo liso. Por ejemplo, las células primarias pueden derivarse de tejidos conectivos, tejidos musculares, tejidos del sistema nervioso, o tejidos epiteliales.
Las células eucariotas incluyen además células inmortalizadas. Las células inmortalizadas incluyen células de un organismo multicelular que normalmente no proliferarían indefinidamente pero, debido a mutación o alteración, han evadido la senescencia celular normal y en lugar de esto pueden seguir experimentando división. Tales mutaciones o alteraciones pueden ocurrir de manera natural o inducirse de manera intencional. Los ejemplos de células inmortalizadas incluyen células de ovario de hámster chino (CHO), células embrionarias de riñón humano (por ejemplo, células HEK 293), y células fibroblásticas embrionarias de ratón (por ejemplo, células 3T3). Numerosos tipos de células inmortalizadas se conocen bien en la técnica.
Las células inmortalizadas o primarias incluyen células que se usan típicamente para el cultivo o para expresar genes o proteínas recombinantes.
Las células eucariotas pueden incluir además embriones en etapa de una célula (es decir, oocitos fertilizados o cigotos). Tales embriones en etapa de una célula pueden ser de cualquier fondo genético (por ejemplo, BALB/c, C57BL/6, 129, o una combinación de estos), pueden ser frescos o congelados, y pueden derivarse de cruzamiento natural o fertilización in vitro.
El término "animal," en referencia a células, células pluripotentes y/o totipotentes, células ES, células donantes, y/o embriones huésped, incluyen mamíferos, peces, y aves. Los mamíferos incluyen, por ejemplo, seres humanos, primates no humanos, monos, simios, gatos perros, caballos, toros, ciervo, bisonte, oveja, roedores (por ejemplo, ratones, ratas, hámsteres, cobayas), ganado (por ejemplo, especies bovinas tales como vacas, buey, etc.; especies ovinas tales como oveja, cabras, etc.; y especies porcinas tales como cerdos y verracos). Las aves incluyen, por ejemplo, pollos, pavos, avestruz, gansos, patos, etc. Los animales domésticos y Ios animales de uso agrícola también se incluyen. El término "animal no humano" excluye a Ios seres humanos.
Las células pluripotentes y/o totipotentes de ratón pueden ser de una cepa 129, una cepa C57BL/6, una mezcla de 129 y C57BL/6, una cepa BA l B/c, o una cepa Swíss Webster. Los ejemplos de cepas 129 incluyen 129P1, 129P2, 129P3, 129X1, 129S1 (por ejemplo, 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/Sv Ev H, 129S6 (129/Sv EvT ac ), 129S7, 129S8, 129T1, y 129T2. Ver, por ejemplo, Festing y otros (1999) Mammalian Genome 10:836. Los ejemplos de cepas C57BL incluyen C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScS n C57BL/10Cr, y C57BL/Ola. Las células pluripotentes y/o totipotentes de ratón también pueden ser de una mezcla de una cepa 129 mencionada anteriormente y una cepa C57BL/6 mencionada anteriormente (por ejemplo, 50 % 129 y 50 % C57BL/6). Del mismo modo, las células pluripotentes y/o totipotentes de ratón pueden ser de una mezcla de cepas 129 mencionadas anteriormente o una mezcla de cepas BL/6 mencionadas anteriormente (por ejemplo, la cepa 129S6 (129/Sv EvT ac )) Un ejemplo específico de una célula e S de ratón es una célula ES de ratón v G f 1. Ver, por ejemplo, Auerbach y otros (2000) Biotechniques 29, 1024-1028, 1030, 1032.
Una célula pluripotente y/o totipotente de rata puede ser de cualquier cepa de rata, que incluye, por ejemplo, una cepa de rata ACI, una cepa de rata Dark Agouti (DA), una cepa de rata Wistar, una cepa de rata LEA, una cepa de rata Sprague Dawley (SD), o una cepa de rata Fischertal como Fisher F344 o Fisher F6. Las células pluripotentes y/o totipotentes de rata pueden obtenerse, además, a partir de cepas derivadas de una mezcla de dos o más cepas mencionadas anteriormente. Por ejemplo, la célula pluripotente y/o totipotente de rata puede ser de una cepa DA o de una cepa ACI. La cepa de rata ACI se caracteriza por tener agutí negro, con patas y vientre blanco y un haplotipo RT1av1. Tales cepas están disponibles a partir de una diversidad de fuentes que incluyen Ios laboratorios Harían. Un ejemplo de una línea celular ES de rata de una rata ACI es una línea celular ES ACI.G1 de rata. Una cepa de rata Dark Agouti (DA) se caracteriza por tener un pelaje agutí y un haplotipo RT1av1. Tales ratas están disponibles a partir de una diversidad de fuentes que incluyen Ios laboratorios Charles River y Harían. Los ejemplos de una línea celular ES de rata a partir de una rata DA son la línea celular ES de rata DA.2B y la línea celular ES de rata DA.2C. En algunos casos, las células pluripotentes y/o totipotentes de rata son de una cepa de rata endogámica. Ver, por ejemplo, el documento U.S. 20 i 4/0235933 A l, presentado el 20 de febrero de 2014.
Los ejemplos de células pluripotentes humanas incluyen células ES humanas, células madre adultas humanas, células progenitoras humanas restringidas por el desarrollo, y células madre pluripotentes inducidas (iPS) humanas, tales como células iPS humanas activadas y células iPS humanas vírgenes. Las células madre pluripotentes inducidas incluyen células madre pluripotentes que pueden derivarse directamente de una célula adulta diferenciada. Las células iPS humanas pueden generarse mediante la introducción de conjuntos específicos de factores de reprogramación en una célula que pueden incluir, por ejemplo, Oct3/4, factores de transcripción de la familia S ox (por ejemplo, S ox1, S ox2, S ox3, S ox15), factores de transcripción de la familia Myc (por ejemplo, c-Myc, 1-Myc, n-Myc), factores de transcripción de la familia similar a Krüppel (KLF) (por ejemplo, KLFl, KLF2, KLF4, KLF5), y/o factores de transcripción relacionados, tales como NANOG, LIN28, y/o G lisl. Las células iPS humanas pueden generarse además, por ejemplo, mediante el uso de miARN, moléculas pequeñas que imitan las acciones de Ios factores de transcripción, o especificadores de linaje. Las células iPS humanas se caracterizan por su capacidad de diferenciarse a cualquier célula de las tres capas germinales de Ios vertebrados, por ejemplo, el endodermo, el ectodermo, o el mesodermo. Las células iPS humanas se caracterizan además por su capacidad de propagarse indefinidamente en condiciones de cultivo in vitro adecuadas. Ver, por ejemplo, Takahashi y Yamanaka (2006) Cell 126:663-676. Las células ES humanas activadas y las células iPS humanas activadas incluyen células que expresan características similares a las de las células epiblásticas después de la implantación y están comprometidas para la especificación del linaje y la diferenciación. Las células ES humanas vírgenes y las células iPS humanas vírgenes incluyen células que expresan características similares a las de las células ES de la masa celular interna de un embrión antes de la implantación y no están comprometidas para la especificación del linaje. Ver, por ejemplo, Nichols y Smith (2009) Cell Stem Cell 4:487-492.
Las células que se han implantado en un embrión huésped pueden referirse como "células donantes." La célula pluripotente y/o totipotente genéticamente modificada puede ser de la misma cepa que el embrión huésped o de una cepa diferente. Del mismo modo, la madre sustituta puede ser de la misma cepa que la célula pluripotente y/o totipotente genéticamente modificada y/o el embrión huésped, o la madre sustituta puede ser de una cepa diferente a la de la célula pluripotente y/o totipotente genéticamente modificada y/o el embrión huésped.
Una variedad de embriones huésped puede emplearse en Ios métodos y composiciones descritos en la presente descripción. Por ejemplo, las células pluripotentes y/o totipotentes que tienen la modificación genética dirigida pueden introducirse en un embrión en etapa de premórula (por ejemplo, un embrión en etapa de 8 células) de un organismo correspondiente. Ver, por ejemplo, Ios documentos US 7,576,259, US 7,659,442, US 7,294,754, y US 2008/0078000 A l. En otros casos, las células ES donantes pueden implantarse en un embrión huésped en la etapa de 2 células, la etapa de 4 células, la etapa de 8 células, la etapa de 16 células, la etapa de 32 células, o la etapa de 64 células. El embrión huésped puede ser además un blastocisto o puede ser un embrión preblastocisto, un embrión en etapa de premórula, un embrión en etapa de mórula, un embrión en etapa de mórula descompactada, o un embrión en etapa de mórula compactada. Cuando se emplea un embrión de ratón, la etapa del embrión huésped puede ser una Etapa 1 de Theiler (TS1), una TS2, una TS3, una TS4, una TS5, y una TS6, con referencia las etapas de Theiler descritas en Theiler (1989) "The House Mouse: Atlas of Mouse Development," Springer-Verlag, Nueva York. Por ejemplo, la Etapa de Theiler puede seleccionarse de TS1, TS2, TS3, y TS4. En algunos casos, el embrión huésped comprende una zona pelúcida, y la célula donante es una célula ES que se Introduce en el embrión huésped a través de un agujero en la zona pelúcida. En otros casos, el embrión huésped es un embrión sin zona. Aún en otros casos, el embrión huésped en etapa de mórula se encuentra agregado.
H. Métodos para identificar células con genomas modificados
Algunos de los métodos anteriores comprenden además identificar una célula que tiene un genoma modificado. Varios métodos pueden usarse para identificar las células que tienen una modificación dirigida, tal como una deleción o una inserción. Tales métodos pueden comprender identificar una célula que tiene la modificación dirigida en un Iocus diana (por ejemplo, entre la primera y segunda secuencias de reconocimiento de ARN de CRISPR). El tamizaje puede hacerse para identificar tales células con loci genómicos modificados.
La etapa de tamizaje puede comprender un ensayo cuantitativo para evaluar la modificación de alelo (MOA) de un cromosoma progenitor. Por ejemplo, el ensayo cuantitativo puede llevarse a cabo por medio de una PCR cuantitativa, tal como una PCR en tiempo real (qPCR). La PCR en tiempo real puede utilizar un primer conjunto de cebadores que reconoce el Iocus diana y un segundo conjunto de cebadores que reconoce un Iocus de referencia no transformado. El conjunto de cebadores puede comprender una sonda fluorescente que reconoce la secuencia amplificada.
La etapa de tamizaje puede comprender además un ensayo de retención, que es un ensayo usado para distinguir entre las inserciones dirigidas correctas de un inserto de ácido nucleico en un Iocus genómico diana de inserciones transgénicas aleatorias del inserto de ácido nucleico en ubicaciones genómicas fuera del Iocus genómico diana. Los ensayos convencionales para tamizar modificaciones dirigidas, tales como PCR de largo alcance o transferencia Southern, vinculan el vector de transformación insertado con el Iocus diana. Debido a sus tamaños grandes de Ios brazos de homología, sin embargo, Ios LTVEC no permiten el tamizaje mediante tales ensayos convencionales. Para tamizar la transformación por LTVEC, pueden usarse ensayos de modificación de alelo (MOA) que incluyen ensayos de pérdida de alelo (LOA) y ganancia de alelo (GOA) (ver, por ejemplo, el documento US 2014/0178879 y Frendewey y otros (2010) Methods Enzymol.
476:295-307). El ensayo de pérdida de alelo (LOA) invierte la lógica del tamizaje convencional y cuantifica el número de copias del Iocus nativo al que se dirigió la mutación. En un clon de células transformado correctamente, el ensayo LOA detecta uno de Ios dos alelos nativos (para genes que no están en el cromosoma X o y ), el otro alelo se encuentra interrumpido por la modificación dirigida. El mismo principio puede aplicarse a la inversa como un ensayo de ganancia de alelo (g Oa ) para cuantificar el número de copias del vector de transformación insertado. Por ejemplo, el uso combinado de ensayos GOA y LOA revelará que un clon heterocigótico transformado correctamente ha perdido una copia del gen diana nativo y ganado una copia del gen de resistencia a fármaco u otro marcador insertado.
A modo de ejemplo, la reacción en cadena de la polimerasa (qPCR) cuantitativa puede usarse como el método de cuantificación de alelos, pero cualquier método que pueda distinguir de manera confiable la diferencia entre cero, una, y dos copias del gen diana o entre cero, una, y dos copias del inserto de ácido nucleico puede usarse para desarrollar un ensayo MOA. Por ejemplo, TaqMan® puede usarse para cuantificar el número de copias de una plantilla de ADN en una muestra de ADN genómico, especialmente por comparación con un gen de referencia (ver, por ejemplo, el documento US 6,596,541). El gen de referencia se cuantifica en el mismo ADN genómico que el(los) gen(es) o Iocus(IocI) diana. Por lo tanto, se realizan dos amplificaciones TaqMan® (cada una con su sonda respectiva). Una sonda TaqMan® determina el "Ct" (ciclo umbral) del gen de referencia, mientras que la otra sonda determina el Ct de la región del(de Ios) gen(es) o Iocus(IocI) diana que se reemplaza(n) por transformación exitosa (es decir, un ensayo LOA). El Ct es una cantidad que refleja la cantidad de ADN inicial para cada una de las sondas TaqMan®, es decir una secuencia menos abundante requiere más ciclos de PCR para alcanzar el ciclo umbral. La disminución a la mitad del número de copias de la secuencia plantilla para una reacción TaqMan® dará como resultado un aumento de aproximadamente una unidad de Ct. Las reacciones TaqMan® en células donde un alelo del(de Ios) gen(es) o Iocus(IocI) diana se ha reemplazado por recombinación homóloga dará como resultado un aumento de un Ct para la reacción TaqMan® de la diana sin un aumento en el Ct del gen de referencia en comparación con el ADN de células no transformadas. Para un ensayo GOA, puede usarse otra sonda TaqMan® para determinar el Ct del inserto de ácido nucleico que reemplaza el(los) gen(es) o Iocus(IocI) diana por transformación exitosa.
Debido a que Ios pares de ARNg pueden crear deleciones grandes mediadas por Cas en un Iocus genómico diana, puede ser útil aumentar Ios ensayos LOA y GOA estándar para comprobar la transformación correcta por LTVEC (es decir, en células distintas a Ios embriones en etapa de una célula). Por ejemplo, Ios ensayos LOA y GOA so Ios pueden no distinguir Ios clones de células transformados correctamente de Ios clones en Ios que una deleción grande Inducida por Cas del Iocus genómico diana coincide con la Integración aleatoria de un LTVEC en otra parte en el genoma, particularmente si el ensayo GOA emplea una sonda contra un casete de selección dentro del Inserto de LTVEC. Debido a que la presión de selección en la célula transformada se basa en el casete de selección, la Integración transgénica aleatoria del LTVEC en otra parte en el genoma generalmente Incluirá el casete de selección y las regiones adyacentes del LTVEC pero excluirá regiones más distales del LTVEC. Por ejemplo, si una porción de un LTVEC se Integra aleatoriamente en el genoma, y el LTVEC comprende un Inserto de ácido nucleico de alrededor de 5 kb o más de longitud con un casete de selección adyacente al brazo de homología 3', generalmente el brazo de homología 3' pero no el brazo de homología 5' se Integrará transgénicamente con el casete de selección. Alternativamente, si el casete de selección adyacente al brazo de homología 5', generalmente el brazo de homología 5' pero no el brazo de homología 3' se Integrará transgénicamente con el casete de selección. A modo de ejemplo, si se usan ensayos LOA y GOA para evaluar la Integración dirigida del LTVEC, y el ensayo GOA utiliza sondas contra el casete de selección, una deleción heterocigótica en el Iocus genómico diana combinada con una integración transgénica aleatoria del LTVEC proporcionará la misma lectura que una integración dirigida heterocigótica del LTVEC en el Iocus genómico diana. Para comprobar la transformación correcta por el LTVEC, pueden usarse ensayos de retención, so Ios o junto con ensayos LOAy/o GOA.
Los ensayos de retención determinan Ios números de copias de una plantilla de ADN en la secuencia diana 5' (correspondiente al brazo de homología 5' del LTVEC) y/o la secuencia diana 3' (correspondiente al brazo de homología 3' del LTVEC). En particular, es útil la determinación del número de copias de una plantilla de ADN en la secuencia diana correspondiente al brazo de homología que es adyacente al casete de selección. En células diploides, Ios números de copias mayores que dos generalmente indican la integración transgénica del LTVEC aleatoriamente fuera del Iocus genómico diana en lugar de en el Iocus genómico diana, lo que no es conveniente. Los clones transformados correctamente retendrán un número de copias de dos. Además, Ios números de copias de menos de dos en tales ensayos de retención generalmente indican deleciones grandes mediadas por Cas que se extienden más allá de la región reconocida para la deleción, lo que tampoco es conveniente.
En un ensayo de retención ilustrativo para identificar una inserción dirigida de un inserto de ácido nucleico en un Iocus genómico diana en una célula diploide, el ADN se obtiene primero de una célula que se ha puesto en contacto con un vector de transformación grande (l TVEC) que comprende el inserto de ácido nucleico flanqueado por un primer brazo de homología que se hibrida con una primera secuencia diana y un segundo brazo de homología que se hibrida con una segunda secuencia diana, en donde el inserto de ácido nucleico comprende un casete de selección adyacente al primer brazo de homología. Opcionalmente, el casete de selección puede comprender un gen de resistencia a fármaco. Después el ADN se expone a una sonda que se une dentro de la primera secuencia diana, una sonda que se une dentro del inserto de ácido nucleico, y una sonda que se une dentro de un gen de referencia que tiene un número de copias conocido, en donde cada sonda genera una señal detectable tras la unión. Después se detectan las señales de la unión de cada una de las sondas. La señal de la sonda del gen de referencia se compara con la señal de la sonda de la primera secuencia diana para determinar un número de copias de la primera secuencia diana, y la señal de la sonda del gen de referencia se compara con la señal de la sonda del inserto de ácido nucleico para determinar un número de copias del inserto de ácido nucleico. Un número de copias del inserto de ácido nucleico de uno o dos y un número de copias de la primera secuencia diana de dos generalmente indica la inserción dirigida del inserto de ácido nucleico en el Iocus genómico diana, y un número de copias del inserto de ácido nucleico de uno o más y un número de copias de la primera secuencia diana de tres o más generalmente indica una inserción aleatoria del inserto de ácido nucleico en un Iocus genómico distinto al Iocus genómico diana.
La señal de la unión de la sonda de la primera secuencia diana puede usarse para determinar un valor de ciclo umbral (Ct) de la primera secuencia diana, la señal de la unión de la sonda del gen de referencia puede usarse para determinar un valor de ciclo umbral (Ct) del gen de referencia, y el número de copias de la primera secuencia diana puede determinarse mediante la comparación del valor de Ct de la primera secuencia diana y el valor de Ct del gen de referencia. Del mismo modo, la señal de la unión de la sonda del inserto de ácido nucleico puede usarse para determinar un valor de ciclo umbral (Ct) del inserto de ácido nucleico, y el número de copias del inserto de ácido nucleico puede determinarse mediante la comparación del valor de Ct de la primera secuencia diana y el valor de Ct del gen de referencia.
El inserto de ácido nucleico en el LTVEC puede ser, por ejemplo, de al menos 5 kb, al menos 10 kb, al menos 20 kb, al menos 30 kb, al menos 40 kb, al menos 50 kb, al menos 60 kb, al menos 70 kb, al menos 80 kb, al menos 90 kb, al menos 100 kb, al menos 150 kb, al menos 200 kb, al menos 250 kb, al menos 300 kb, al menos 350 kb, al menos 400 kb, al menos 450 kb, o al menos 500 kb. La distancia entre las secuencias a las que se unen las sondas en la primera secuencia diana y el casete de selección puede ser, por ejemplo, de no más de 100 nucleótidos, 200 nucleótidos, 300 nucleótidos, 400 nucleótidos, 500 nucleótidos, 600 nucleótidos, 700 nucleótidos, 800 nucleótidos, 900 nucleótidos, 1 kb, 1,5 kb, 2 kb, 2,5 kb, 3 kb, 3,5 kb, 4 kb, 4,5 kb, o 5 kb.
Tales métodos pueden comprender además ensayos de retención adicionales para determinar el número de copias de la segunda secuencia diana. Por ejemplo, tales métodos pueden comprender además exponer el ADN de la célula a una sonda que se une a la segunda secuencia diana, detectar la señal de la unión de la sonda de la segunda secuencia diana, y comparar la señal de la sonda del gen de referencia con la señal de la sonda de la segunda secuencia diana para determinar un número de copias de la segunda secuencia diana.
Del mismo modo, tales métodos pueden comprender además ensayos GOA adicionales para determinar el número de copias de una o más secuencias adicionales dentro del inserto de ácido nucleico. Por ejemplo, tales métodos pueden comprender además exponer el ADN de la célula a una o más sondas adicionales que se unen al inserto de ácido nucleico, detectar la señal de la unión de la una o más sondas adicionales, y comparar la señal de la sonda del gen de referencia con la señal de la una o más sondas del inserto de ácido nucleico adicionales para determinar Ios números de copias de la una o más secuencias adicionales dentro del inserto de ácido nucleico.
Del mismo modo, cuando el LTVEC se diseña para eliminar una secuencia endógena del Iocus genómico diana o cuando se usan pares de ARNg (por ejemplo, para crear pares de rupturas bicatenarias en sitios diferentes dentro de un solo Iocus genómico diana y eliminar la secuencia endógena intermedia), tales métodos pueden comprender además un ensayo LOA para determinar el número de copias de las secuencias endógenas en el Iocus genómico diana. Por ejemplo, tales métodos pueden comprender además exponer el ADN de la célula a una sonda que se une a la secuencia endógena en el Iocus genómico diana, detectar la señal de la unión de la sonda de la secuencia endógena, y comparar la señal de la sonda del gen de referencia con la señal de la sonda de la secuencia endógena para determinar un número de copias de la secuencia endógena.
Otros ejemplos de ensayos cuantitativos adecuados incluyen hibridación in situ mediada por fluorescencia (FISH), hibridación genómica comparativa, amplificación de ADN isotérmica, hibridación cuantitativa a una(s) sonda(s) Ínmovilizada(s), sondas Invader®, ensayos MMP®, TaqMan® Molecular Beacon, o tecnología de sondas Eclipse™ (ver, por ejemplo, el documento US2005/0144655).
Para las modificaciones genéticas dirigidas generadas sin el uso de LTVEC, pueden usarse ensayos convencionales para tamizar las modificaciones dirigidas, tales como PCR de largo alcance, transferencia Southern, o secuenciación de Sanger. Tales ensayos se usan típicamente para obtener evidencias de una unión entre el vector de transformación insertado y el Iocus genómico diana. Por ejemplo, para un ensayo de PCR de largo alcance, un cebador puede reconocer una secuencia dentro del ADN insertado mientras el otro reconoce una secuencia del Iocus diana más allá de Ios extremos de Ios brazos de homología del vector de transformación.
Si diferentes versiones de una secuencia se asocian con un número de acceso en momentos diferentes, se entiende que es la versión asociada con el número de acceso en la fecha de presentación efectiva de esta solicitud. La fecha de presentación efectiva quiere decir la de antes de la fecha de presentación actual o la fecha de presentación de una solicitud de prioridad que hace referencia al número de acceso si es aplicable. Del mismo modo, si diferentes versiones de una publicación, sitio web o similar se publican en momentos diferentes, se entiende que es la versión de publicación más reciente en la fecha de presentación efectiva de la solicitud a menos que se indique de otra manera. Cualquier característica, etapa, elemento, modalidad, o aspecto de la invención puede usarse en combinación con cualquier otro a menos que se indique específicamente de otra manera.
Tabla 1. Descripción de las secuencias.
Figure imgf000056_0001
Figure imgf000057_0001
Figure imgf000058_0001
Figure imgf000059_0001
Figure imgf000060_0001
Figure imgf000061_0001
e j e m p l o s
Ejem plo 1. Transform ación m ediada por CR ISPR/Cas9 m ediante el uso de un ARN guía o dos ARN guías.
M ateriales y m étodos
Cultivo de células ES, tam izaje, y electroporación
Los experim entos descritos en la presente descripción se realizaron con VGF1, nuestra línea de células ES XY híbrida C 57B L6NTac/129S6S v Ev F 1 (Poueym irou y otros (2007) Nat. B iotechnol. 25:91-99; Valenzuela y otros (2003) Nat. Biotechnol. 21:652-659). Las células ES se cultivaron com o se describ ió previam ente (M atise y otros (2000) en Joyner, A.L. ed. Gene Targeting: a practical approach, pp. 100-132, Oxford University Press, Nueva York).
Las electroporaciones (EP) se realizaron con 7,5 m illones de células en una cubeta de 2 mm de ranura en un volum en final de 0 , l2 ml. Las condiciones eléctricas para la EP fueron 700 V, 400 ohm de resistencia, y 25 m icroF de capacitancia m ediante el uso de un sistem a de electroporación BTX ECM 630 (Harvard Apparatus, Holliston, MA). La cantidad de LTVEC por EP fue 0,0015 mg, de plásrnido que expresa Cas9 fue 0,005 mg y de plásm ido que expresa los ARN gs fue 0,010 mg. A lgunas EP se realizaron con la adición de 100 ng de un plásm ido que confiere resistencia a purom icina para perm itir la selección de clones sin seleccionar la resistencia a neom icina expresada por el LTVEC. Después de la EP, las células se sem braron en dos placas ge latinizadas de 15 cm y el m edio se cam bió diariamente. El medio de selección que contiene ya sea G-418 sulfato a 100 ug/ml o purom icina a 0,0015 mg/ml se inició 48 horas después de la EP y continuó hasta 10 días después de la EP. Las colonias se seleccionaron en PBS y se añadieron a una placa de 96 pocilios que contiene tripsina al 0,05 % y se perm itió la disociación durante 15 minutos, se neutralizó con medio y se usó para el aislam iento de ADN para el tam izaje.
El m étodo de m odificación de alelo (Frendewey y otros (2010) M ethods Enzymol. 476:295-307) se usó para identificar los clones de células ES transform ados correctam ente y para determ inar los genotipos del alelo de ratón.
Diseño de secuencias guías
Aproxim adam ente 200 pb de ADN que rodean la posición de 50 pb, 100 pb, 500 pb, o 1 kb dentro de la porción elim inada de Lrp5 u otros genes diana, tanto corriente arriba com o corriente abajo, se introdujeron en la herram ienta de diseño de CR ISPR (crispr.m it.edu) para obtener las secuencias de ARNg posibles. Después las secuencias de ARNg potenciales se filtraron para garantizar que solo perm itirán el corte del ADN endógeno y no del inserto de hum anización en el LTVEC. C lonación de ARN guías simples
Los ARNgs se clonaron com o dúplex de oligos (IDT) en pM B_sgRNA (prom otor U6) en sitios Bsmbl fusionados al andam io de 77 pb para la expresión continua del ARN, o se adquirieron com o plásm idos de expresión validados de GeneCopoeia (guías A, B, B2, E2, E, y F de LRP5). Los plásm idos producidos internam ente se confirm aron por PCR y secuenciación de Sanger.
P lantilla de ADN para la confirm ación del genotipo
El ADN se purificó a partir de la célula ES, clones derivados de células ES que se habían som etido a electroporación con un vector de transform ación y un plásm ido que expresa Cas9 y un plásm ido que expresa uno de varios ARN guías (ARNg) o dos plásm idos que expresan com binaciones de ARNg diferentes. Los clones identificados por ensayos de PCR cuantitativa de m odificación de alelo (es decir, pérdida de alelo o ganancia de alelo) que tienen una deleción dirigida del Iocus diana de ratón e inserción del vector de transform ación o que tienen deleciones inducidas por Cas9/ARNg se seleccionaron para ensayos de PCR convencionales com plementarios.
Diseño de oligonucleótidos
Se diseñaron dos ensayos de PCR para cada combinación de ARNg. La primera PCR fue un ensayo de deleción para detectar el colapso entre las secuencias de reconocimiento de ARN de CRISPR de combinaciones de ARNg diferentes. El segundo ensayo de PCR, que es un ensayo 5', incluyó dos ensayos de PCR. El primero fue un ensayo de 5' humano para alelos humanizados y se diseñó a través de la unión entre ratón y humano. El segundo fue un ensayo de 5' de ratón para alelos endógenos de ratón y se diseñó a través de la unión 5' de la deleción dirigida.
Reacción de PCR y clonación TOPO
Se usó TaKaRa LA Taq ADN polimerasa (# de Cat. RR002M) para amplificar la plantilla de ADN de células ES. Cada mezcla de reacción del ensayo de PCR se analizó con un control negativo de agua. Las mezclas de ensayo contenían lo siguiente: 0,005 ml de plantilla de ADN de células ES; tampón IX LA PCR Buffer II (Mg2+plus); 0,01 mM mezcla de dNTP; 0,0075 mM Oligo directo (cada una); 0,0075 mM Oligo inverso (cada una); 5000 unidades/ml LATaq polimerasa; y ddH20 hasta 0,025 ml.
El programa de termociclado de la PCR consistió en 94 °C durante un minuto; seguido de 35 ciclos de 94 °C durante 30 segundos, gradiente de hibridación a 60 °C durante 30 segundos, y 68 °C durante un minuto por kb amplificada; seguido de polimerización a 72 °C durante 10 minutos.
Los productos de PCR se fraccionaron por electroforesis en un gel de agarosa al 2 % con una escalera de ADN de 1 kb plus de Invitrogen (# de Cat. 10787-018) y/o escalera de ADN de 50 pb de Invitrogen (# de Cat. 10416-014). Los productos de PCR restantes se clonaron en el vector pCR4-TOPO según las instrucciones del kit de clonación TOPO TA de Invitrogen (# de Cat. K4575-02) para su secuenciación. Las reacciones de clonación se transformaron químicamente en células One Shot ToplO y estas se sembraron en placas de agar con X-gal a 0,06 mg/ml y kanamicina a 0,025 mg/ml.
Secuenciación
Las colonias blancas se inocularon en LB que contiene kanamicina a 0,025 mg/ml y se incubaron durante toda la noche con agitación a 37 °C. Cada colonia representó un amplicón de una población de productos ensayados. Se extrajo el ADN de cada cultivo bacteriano mediante el uso del kit de purificación de plásmidos a escala minipreparativa de Q IA G e N (# de Cat. 12123). La secuencia de ADN de los insertos se determinó en una mezcla de reacción de secuenciación que incluía O,OO2 ml de producto de PCR clonado en TOPO, solución potenciadora PCRx 1x (solución madre 10x ) (Cat. X11495-O17), O,OO75 mM oligo (M13F o M13R), y ddH20 hasta O,O15 ml.
Análisis de la secuenciación
Se descartaron las secuencias indeterminadas y la secuencia del vector pCR4-TOPO de los resultados de la secuenciación, para aislar la secuencia de los insertos de PCR. Después los fragmentos secuenciados se alinearon con una referencia y se analizaron las variaciones.
Secuenciación de clones colapsados
Los productos de PCR de los clones positivos colapsados se clonaron en el vector pCR4-TOPO según las instrucciones del fabricante (Invitrogen # de Cat. K4575-O2), después se transformaron químicamente en células One Shot ToplO y estas se sembraron en placas de agar con X-gal a O,O6O mg/ml y kanamicina a 0,025 mg/ml. Se extrajo el ADN de los cultivos bacterianos mediante el uso del kit de purificación de plásmidos a escala minipreparativa de Q IA g EN (# de Cat.
12123). Después los resultados de la secuenciación de los insertos se alinearon con una referencia de colapso predicha y se analizaron las variaciones de indel. Se predijo que Cas9 escinde a 3 pares de bases del PAM en la secuencia reconocida por el ARNg. La secuencia dentro de la escisión predicha se eliminó de la referencia y el resto se usó para el alineamiento con los resultados.
Ensayos de discriminación alélica TaqMan® de variantes de nucleótido simple (SNV)
La reacción de discriminación alélica TaqMan® fue de O,OO8 ml que contiene ADN genómico, sondas/cebadores específicos para cada polimorfismo, y mezcla maestra de PCR de expresión génica TaqMan®. Las sondas se encargaron a Life Technologies (Thermo) y los cebadores a IDT. La sonda del alelo 129 se etiquetó con colorante VIC; la sonda del alelo B6 se etiquetó con colorante FAM. Cada ensayo alélico TaqMan® se realizó por cuadruplicado en una placa de 384 pocilios y se ejecutó en una plataforma ViiA 7 de Applied BioSystems. El programa de ciclos de PCR de SNV fue el siguiente: 95 °C durante 10 minutos seguido de 40 ciclos de lo siguiente: 95 °C durante 15 segundos, 60 °C durante 60 segundos, y 60 °C durante 30 segundos. El análisis de la corrida y la evaluación de los resultados se hicieron mediante el uso del software de ViiA 7 v 1.1.
Análisis FISH
Clones de células ES seleccionados se analizaron en Cell Line Genetics (Madison, Wisconsin) o en el Instituto Van Andel (Grand Rapids, Michigan) mediante el uso de hibridación fluorescente in situ (FISH) por sus procedimientos estándar. Se proporcionaron Ios BAC de ratón y humano como sondas para el análisis con 2 colores.
Mejora del colapso del genoma y/o la humanización de Ios Iocí diana
Para efectuar una deleción precisa, en una etapa de la totalidad o parte de un gen de roedor y opcionalmente su reemplazo simultáneo con la totalidad o parte de su homólogo humano, las siguientes moléculas de ácidos nucleicos se introdujeron por electroporación en células ES de roedor: (1) un LTVEC; (2) un plásmido o ARNm que codifica una endonucleasa Cas9; y (3) uno o más plásmidos que codifican uno o más ARN guías simples de CRISPR (ARNg) o Ios ARNg como tal. En cada experimento, el LTVEC se linealizó. En algunos experimentos, el LTVEC comprendía la totalidad o parte de un gen humano que codifica el producto génico (proteína o a Rn ) flanqueado por brazos de homología de ADN de roedor diseñados para dirigir un evento de recombinación homóloga que elimina el gen de roedor e inserta el gen humano. En otros experimentos, el LTVEC se diseñó para transformar un Iocus separado tal como el Iocus Ch25h. En cualquier caso, el LTVEC también portaba un casete de selección por fármaco que dirige la expresión de una enzima (por ejemplo, neomicina fosfotransferasa) que imparte resistencia a un fármaco antibiótico (por ejemplo, G418).
Las células ES que captaron el LTVEC y lo incorporaron en sus genomas fueron capaces de crecer y formar colonias en una placa de cultivo de tejidos en un medio de crecimiento que contiene el fármaco antibiótico. Debido a que se introdujeron 500 a 1000 veces más moléculas de ácido nucleico que codifican CRISPR/Cas9 y que codifican ARNg que moléculas de LTVEC, la mayor parte de las colonias resistentes a fármaco que contienen LTV e C también contenían, al menos de manera transitoria, Ios componentes de CRISPR/Cas9. Se seleccionaron colonias resistentes a fármaco y se tamizaron por el método de modificación de alelo (Valenzuela y otros (2003) Nat. Biotech. 21:652-660; Frendewey y otros (2010) Methods Enzymol. 476:295-307) para identificar Ios clones que tenían el alelo humanizado transformado correctamente. Además, se usaron ensayos de PCR en tiempo real que reconocen secuencias en Ios brazos de homología del LTVEC, referidos como ensayos de retención, para comprobar la transformación correcta del LTVEC en el genoma de ratón. La determinación del número de copias de estos ensayos de retención proporcionó más claridad para ayudar a distinguir Ios clones de ES transformados correctamente, que retuvieron un número de copias de dos, de Ios clones en Ios que una deleción grande inducida por Cas9 del Iocus diana de ratón coincide con la integración aleatoria del LTVEC en otra parte en el genoma, en cuyo caso Ios ensayos de retención tuvieron un número de copias de tres (o más). La capacidad de Ios pares de ARNg de crear deleciones grandes mediadas por Cas9 en el Iocus diana de ratón significa que podría añadirse ensayos de retención a Ios ensayos LOA y GOA estándar como se describió previamente para proporcionar más claridad y comprobar la transformación correcta. Por lo tanto, Ios ensayos de retención se diseñaron y se usaron junto con Ios ensayos LOAy GOA.
En cada experimento, se usaron uno o dos ARNg. Los ARNg usados individualmente dirigieron la escisión por Cas9 cerca del extremo 5' del Iocus diana (es decir, la deleción dirigida del gen de ratón), el medio del Iocus diana, o el extremo 3' del Iocus diana. Cuando se usaron dos ARNg, un ARNg dirigió la escisión por Cas9 cerca del extremo 5' del Iocus diana y el otro ARNg dirigió la escisión por Cas9 en el medio del Iocus diana o cerca del extremo 3' del Iocus diana.
Locus Lrp5
En un conjunto de experimentos, el LTVEC se diseñó para crear una deleción de 68 kb de la porción del gen Lrp5 de ratón (proteína 5 relacionada con el receptor de lipoproteínas de baja densidad) que codifica el ectodominio y un reemplazo simultáneo con un fragmento de 91 kb de la secuencia homóloga del gen l RP5 humano (Figura 1). El LTVEC comprendía el fragmento de 91 kb del gen LRP5 humano flanqueado por brazos de homología que contienen 7 kb y 33 kb de ADN genómico derivado de partes del Iocus Lrp5 de ratón que flanquean la secuencia de 68 kb del gen Lrp5 de ratón prevista para la deleción. En experimentos separados, el LTVEC de humanización de Lrp5 se combinó con un plásmido que codifica Cas9 y un segundo plásmido que codifica uno de ocho ARNg (A, B, B2, C, D, E2, E, F) diseñados para crear rupturas bicatenarias dentro de la región del gen Lrp5 de ratón reconocida para la deleción. Los ARNg se diseñaron de modo que eviten el reconocimiento de cualquier secuencia en la porción insertada del gen LRP5 humano. En otros experimentos, se combinó el LTVEC y el plásmido que codifica Cas9 con plásmidos que codifican dos ARNg diferentes que reconocen sitios diferentes dentro de la región del gen Lrp5 de ratón reconocida para la deleción.
Los clones de células ES resistentes a fármaco se tamizaron en cuanto a las humanizaciones dirigidas por ensayos de modificación de alelo (Valenzuela y otros (2003) Nat. Biotechnol. 21:652-659; Frendewey y otros (2010) Methods Enzymol.
476:295-307) para secuencias dentro de la deleción y para secuencias dentro del casete de selección por fármaco y el inserto de gen humano. Los clones se calificaron como transformados correctamente si tenían pérdida de una de las dos secuencias del gen endógeno de ratón y ganaban una copia del inserto humano, y además retenían dos copias de secuencias de retención (ubicadas en el brazo de homología del LTV e C). Los dos ensayos de retención para este tamizaje fueron ensayos TaqMan® que usan Ios siguientes cebadores y sondas: cebador directo de 7064retU CCTCCTGAGCTTTCCTTTGCAG (SEQ ID NO: 119); cebador inverso de 7064retU CCTAGACAACACAGACACTGTATCA (SEQ ID NO: 120); sonda TaqMan® de 7064retU TTCTGCCCTTGAAAAGGAGAGGC (SEQ ID NO: 121); cebador directo de 7064retD CCTCTGAGGCCACCTGAA (SEQ ID NO: 122); cebador inverso de 7064retD CCCTGACAAGTTCTGCCTTCTAC (SEQ ID NO: 123); sonda TaqMan® de 7064retD TGCCCAAGCCTCTGCAGCTTT (SEQ ID NO: 124).
Los resultados de la hum anización asistida por CR ISPR/Cas9 del gen Lrp5 se resumen en la Tabla 2. Cuando se Introdujo el LTVEC solo en células ES, 1,9 % de los clones resistentes a fárm aco tam izados portaban un alelo hum anizado heterocigótico transform ado correctam ente (ver la colum na Het. Transf. en la Tabla 2, que incluye clones en los que el alelo que no es diana no se m utó en absoluto o tenía una m utación inducida por CRISPR pequeña tal com o una deleción pequeña causada por NHEJ). Por el contrario, la com binación del LTVEC con endonucleasas Cas9 guiadas por siete de los ocho ARNg probados (A, B, B2, C, D, E2, E y F; ver la Tabla 1) produjo m utaciones heterocigóticas m onoalélicas transform adas correctam ente a eficiencias en el in tervalo de 2,1 a 7,8 %. Para la escisión por Cas9 guiada por B2 y D, adem ás de la transform ación monoalélica, se detectó hum anización hom ocigótica bialélica a una frecuencia de 1,0-2,1 %. Nunca se ha observado transform ación bialélica con un LTVEC por sí solo, incluso para alelos con deleción sim ple y pequeña. Las células ES con hum anización hom ocigótica de Lrp5 pueden convertirse d irectam ente m ediante el m étodo V E LO C IM O U SE® (Poueym irou y otros (2007) Nat. Biotech. 25 :91-99) en ratones com pletam ente derivados de células ES listos para estudios fenotíp icos y de eficacia de fármacos.
Los ensayos M O A concebidos para detectar m utaciones de NHEJ inducidas por ARN g/Cas9 en o cerca de los sitios de escisión predichos dem ostraron actividad de m utación para todos los ARNg probados (no se m uestran los datos). La proporción de m utaciones inducidas por ARNg ya sean m onoalélicas o bialélicas detectadas entre todos los clones ensayados varió por Iocus y posición. No hubo una corre lación fuerte entre la actividad de mutación de los ARNg y la transform ación con LTVEC, pero las eficiencias de transform ación más bajas se asociaron frecuentem ente con Ios ARNg que tenían las frecuencias de m utación más bajas.
La com binación de dos ARNg que reconocen extrem os diferentes de la región del gen Lrp5 reconocida para la deleción aum entó la eficiencia de transform ación de hum anización total, predom inantem ente m ediante el aum ento de la frecuencia de eventos de transform ación hom ocigóticos para tres de las cinco com binaciones probadas (Tabla 2). Debido a que la com binación de Ios ARNg tiene el potencial de crear deleciones grandes entre Ios sitios de escisión de Cas9 program ados por Ios ARNg, tam bién se observaron clones de células ES hem icigóticas que portaban una hum anización dirigida en un alelo de Lrp5 y una deleción grande inducida por CRISPR en el otro alelo (com binación de ARNg A F, Tabla 2). Además, para dos de las com binaciones de ARNg (A F y A E2), se identificaron clones de células ES con un genotipo único: deleciones grandes m ediadas por CRISPR en am bos alelos de Lrp5.
Tabla 2. Resultados del tam iza je de la hum anización asistida por CR ISPR/Cas9 del ectodom inio de Lrp5 m ediante el uso de ARNg individuales y ARNg combinados.
Figure imgf000064_0001
Ninguna
Figure imgf000065_0001
1,9
Figure imgf000065_0002
1,9
Figure imgf000065_0003
Com o se dem uestra en la Tabla 2, se observó un aum ento significativo en el porcentaje de clones que tenían transform ación bialélica cuando se usaron dos ARNg que reconocen un solo Iocus en lugar de un ARNg (ver la Figura 2A), Io que indica que el uso de com binaciones de ARNg prom ueve las m odificaciones bialélicas. La Figura 2A m uestra una representación esquem ática general de la deleción sim ultánea de un gen de ratón y su reem plazo con una versión hum ana correspondiente m ediante el uso de un LTVEC y dos ARN guías (A y B). Los tipos de alelos mutantes únicos que se observan a una frecuencia m ucho m ayor cuando se usan dos ARNg incluyen alelos con colapso hom ocigótico (Figura 2B; A/A), alelos con transform ación hom ocigótica (F igura 2C; Hum/Hum), alelos con transform ación hem icigótica (Figura 2D; (Hum/A)), y otros alelos con transform ación heterocigótica com binada (por ejemplo, un alelo tiene una hum anización dirig ida por LTV e C y el otro alelo tiene una m utación inducida por CRISPR tal com o una deleción pequeña) (F igura 2E).
Se realizaron varios ensayos de PCR para respaldar y confirm ar Ios genotipos en base a Ios ensayos MOA. Los cebadores se m uestran en la F igura 1 y pueden encontrarse en la Tabla 1. El LTVE c de Lrp5 tenía un brazo de hom ología 5' que era lo suficientem ente corto (6,9 kb) para dem ostrar la transform ación m ediante una PCR ensayada para detectar una conexión física entre el inserto hum ano y la secuencia genóm ica de ratón adyacente (F igura 1). Se observó el producto de PCR esperado de 7,5 kb con ADN de Ios clones calificados com o heterocigóticos, hem icigóticos, u hom ocigóticos pero no con el A d N de la línea de células ES progenitoras o de clones calificados com o con deleciones bialé licas grandes (F igura 3A), Io que confirm a por lo tan to las in terpretaciones de transform ación hechas por el tam iza je con M O A (es decir, LO A y GOA) y respalda las deleciones bialé licas grandes inferidas. El ensayo de PCR 5'-Del-J, que exam inó las secuencias en las uniones de la deleción y la inserción (Figura 3B), produjo un producto de 330 pb con el ADN de la línea de células ES progenitoras y de la m ayoría de Ios clones hum anizados heterocigóticos (no se m uestran Ios datos). Para el clon heterocigótico AW -C3, el ensayo 5'-Del-J produjo un producto más pequeño que lo esperado (F igura 3B), Io que sugiere que la escisión por ARNg A /Cas9 indujo una mutación de deleción pequeña en el alelo que no es diana, que tam bién se detectó por un ensayo M O A para la escisión con ARNg A (no se m uestran Ios datos). Como se esperaba, el ensayo 5'-Del-J fue negativo para Ios clones con alelos con deleción hemicigótica, homocigótica, y bialélica. La PCR 5'-Ins-J (F igura 3B), que exam inó las secuencias en la unión entre el extrem o 5' del inserto de ADN hum ano y la secuencia flanqueante de ratón adyacente, produjo un producto de 478 pb en clones heterocigóticos, hem icigóticos, y homocigóticos, dado que estos tienen al menos un alelo con hum anización dirigida. El ensayo 5'-lns-J PCR no produjo producto para clones con deleciones bialélicas grandes (F igura 3B). Para confirm ar las deleciones grandes en clones con deleción hem icigótica y bialélica, se realizaron PCR con cebadores que reconocen secuencias fuera de Ios sitios diana de Ios pares de ARNg. La PCR Del(A F), que ensayó una deleción entre Ios sitios de Ios ARNg A y F (F igura 1), produjo un solo producto de aproxim adam ente 360 pb con el ADN de Ios clones AW -A8 y BO -FIO (F igura 3B), Io que confirm ó que al m enos uno de Ios alelos de Lrp5 ten ía una deleción grande. Del m ism o modo, la PCR Del(A e 2), que ensayó una deleción grande entre Ios sitios de Ios ARNg A y E2, produjo un solo producto de aproxim adam ente 25O pb con el ADN del clon BA-A7. Las PCR de deleción, jun to con Ios ensayos de unión, LOA, y GOA, respaldan el genotipo de deleción bialélica grande. Los resultados de Ios ensayos que se m uestran en la Figura 3A y 3B son ejem plos representativos de ensayos sim ilares que se realizaron adem ás de la hibridación fluorescente in s itu (FISH; Figura 4A-C) para confirm ar Ios genotipos bialélicos resum idos en la Tabla 2.
La hibridación fluorescente in s itu (FISH) se usó para confirm ar la hum anización dirigida hom ocigótica del gen Lrp5. Los clones de células ES calificados m ediante ensayos de PCR cuantitativos y convencionales com o con transform ación hom ocigótica de experim entos de transform ación en Ios que el LTVEC de hum anización de Lrp5 (F igura 1) se com binó con Cas9 y dos ARNg (A más F o A más E2) se enviaron a un servicio com ercial de citología para FISH y análisis de cariotipo. Un crom osom a artificial bacteriano (BAC) que porta el gen Lrp5 de ratón se etiquetó con un m arcador fluorescente rojo y se usó como sonda para identificar loci Lrp5 endógenos, y un BAC que porta el gen LRP5 hum ano se etiquetó con un m arcador fluorescente verde y se usó com o sonda para identificar las crom átidas transform adas con el inserto humano. Las sondas BAC etiquetadas se hibridaron con frotis en m etafase de Ios clones transform ados y se v isualizaron por m icroscopía de fluorescencia. Los crom osom as en Ios frotis se visualizaron por tinción con DAPI (4',6-d iam idino-2-fenilindol), y Ios cariotipos separados de cada clon se determ inaron por tinción G iemsa. Un resultado típ ico se m uestra en la Figura 4A para el clon AW -D9, que se encontró que tiene un cariotipo normal 4OXY (no se muestra). La fotografía com puesta en la Figura 4A m uestra que la señal roja de la sonda de BAC de ratón y la señal verde de la sonda de BAC hum ano se colocalizan en la banda citológica B en am bas copias del crom osom a 19 de ratón, la ubicación conocida del gen Lrp5. La fotografía com puesta en la Figura 4C m uestra la m ism a transform ación hom ocigótica para otro clon (BA-D5). Estos resultados confirm an que el fragm ento de 91 kb del gen LRP5 humano en el LTVE c de hum anización (F igura 1) se insertó correctam ente en el Iocus Lrp5 de ratón previsto en ambos crom osom as 19 hom ólogos en Ios clones AW -D 9 y BA-D5. Por el contrario, la fotografía com puesta en la Figura 4B m uestra que la señal roja de la sonda de BAC de ratón y la señal verde de la sonda de BAC humano se colocalizan en la banda citológica B en una sola copia del crom osom a 19 de ratón (flecha sólida), m ientras que solo la señal roja de la sonda de BAC de ratón se localiza en la banda citológica B en la otra copia del crom osom a 19 de ratón. Estos resultados confirm an que el fragm ento de 91 kb del gen LRP5 humano en el LTV e C de hum anización (F igura 1) se insertó correctam ente en el Iocus Lrp5 de ratón previsto solam ente en una copia del crom osom a 19 (transform ación heterocigótica). Tam bién indican (junto con otros controles que no se m uestran) que la sonda de BAC hum ano no se hibrida de m anera cruzada con el Iocus Lrp5 de ratón sino que solo reconoce el inserto LRP5 humano.
La presencia en ciertos clones de m utaciones de indel inducidas por CRISPR idénticas form adas en am bos alelos por reparación por unión de extrem os no hom ólogos evidente sugirió la ocurrencia de eventos de conversión génica en células híbridas F1H4 (que se com ponen de 50 % de la cepa 129Sv S6 y 50 % de la cepa C57BL/6N). Para ganar conocim ientos del m ecanism o que fundam enta la transform ación bialélica m ejorada cuando se usan dos ARNg, se tam izaron siete clones que tenían hum anizaciones dirig idas hom ocigóticas o deleciones hom ocigóticas grandes inducidas por CR ISPR seguido de la transform ación con el LTVEC y cualquiera de las com binaciones de ARNg A más F o A más E2.
La Figura 5 m uestra ejem plos de ensayos diseñados para exam inar eventos de conversión génica m ediados por dos ARN guías. Específicam ente, la posibilidad de conversión génica se exam inó m ediante el análisis de la pérdida de heterocigosidad (LO H) en células ES híbridas F1H4 (que se com ponen de 50 % de la cepa 129 SvS6 y 50 % de la cepa C57BL/6N). La conversión génica puede dem ostrarse por la pérdida de heterocigosidad en polim orfism os conocidos entre 129Sv S6 (129) y C57BL/6N (B6), y por lo tan to los ensayos de PCR se diseñaron para d iferenciar entre estos dos tipos de alelo. Los polim orfism os de variantes estructurales (SV) se ensayaron por PCR convencionales diseñadas para detectar las diferencias entre los alelos 129 y B6. Aunque solo uno de los ensayos de SV usados a continuación se m uestra en la F igura 5, el concepto es el m ism o para cada uno. Los cebadores se diseñaron en base a las variaciones estructurales (SV) entre las cepas B6 y 129 de ratón y se m uestran en la Tabla 1. Las condiciones de diseño de los cebadores se restringieron para identificar SV -25 pb y producir productos de PCR -300 pb; estas condiciones se seleccionaron de m anera que cualquier cam bio sería v isib le por e lectroforesis en gel.
Antes de ejecutar las PCR de los clones, los ensayos se validaron y optim izaron contra ADN de células ES de tipo silvestre de las cepas B6, 129 y de la línea de células ES F1H4. Los conjuntos de cebadores que produjeron bandas de PCR distinguib les específicas para los alelos B6 o 129 y fueron consistentes en la producción de estas dos m ism as bandas distinguib les m ediante el uso de ADN de F1H4 se seleccionaron para la prueba en clones. Para el crom osom a 19 (la ubicación del gen Lrp5), se seleccionaron seis conjuntos de cebadores-lD 190045, 190061, 190068, 19003o , 190033, 190013-para el uso en clones con Lrp5 hum anizado genotip ificados com o "con transform ación hom ocigótica" o "con colapso hom ocigótico" por ensayos de m odificación de alelo (M OA) y PCR convencional. Los ensayos de PCR de SV se espaciaron a lo largo del crom osom a 19 desde el Iocus Lrp5 hasta el extrem o te lom érico del cromosoma, en el intervalo de -13,7 a -56,2 Mb del Iocus Lrp5. Las distancias aproxim adas (en Mb) de Ios ensayos de SV en el crom osom a 19 desde el Iocus Lrp5 son las siguientes: 13,7 para el ensayo 190045, 19,0 para el ensayo 190061, 35,0 para el ensayo 190068, 37,4 para el ensayo 19003o , 48,3 para el ensayo 190033, y 56,2 para el ensayo 190013. S oIo el ensayo 190033 se m uestra en la Figura 5 (m ostrado com o SV 48,3), pero Ios cebadores para Ios ensayos 190045, 190061, 190o68, 19003o , 190033, y 190013 se m uestran en la Tabla 1.
Las PCR se ejecutaron en el ADN de estos clones así com o en ADN contro l de F1H4, ADN control de 129, y ADN control de B6. Los productos de PCR se fraccionaron por e lectroforesis en geles de po liacrilam ida al 6 %, que posteriorm ente se tiñeron con GeIRed. Los clones que producen dos bandas coincid ieron con el control de F1H4, que desde la optim ización anterio r m ostró que la banda superior era específica para el alelo 129 y la banda in ferior era específica para el alelo B6. Los clones que produjeron solam ente una banda m ostraron solo la banda de B6 o la de 129. Los clones AW -A7, AW -F10, BA-D5, BA-F2, BC-H9, y BR-B4 m ostraron solam ente la banda de B6 para Ios seis ensayos, m ientras que el clon BO-A8 m ostró solam ente la banda de 129 para Ios seis ensayos. Com o se m encionó previamente, estos clones se genotipificaron com o con transform ación hom ocigótica o con colapso hom ocigótico por M O A y/o PCR, e involucraron varias com binaciones de ARNg (A más F, A más E2, B2, y D). La presencia de solo una única banda alélica sugirió que está ten iendo lugar un evento de conversión génica, si no hubiera conversión, am bas bandas aún estarían presentes com o en el control de F1H4.
Adem ás, las variantes de nucleótido sim ple (SNV) entre Ios alelos 129 y B6 se ensayaron por ensayos de discrim inación alélica TaqM an®. Las posiciones aproxim adas de Ios ensayos de SNV en el m apa del crom osom a 19 en la Figura 5 se m uestran con puntas de flecha con sus d istancias (en Mb) del Iocus Lrp5 proporcionadas debajo. Las distancias (en Mb) del Iocus Lrp5 son las siguientes: 0,32 centrom érica de Lrp5 (C2), 1,2 te lom érica de Lrp5(T3), 11,1 te lom érica de Lrp5 (T6), 13,2 te lom érica de Lrp5 (T7), 17,5 te lom érica de Lrp5 (t 8), 25,8 te lom érica de Lrp5 (T9), 33,0 te lom érica de Lrp5(T10), 38,3 te lom érica de Lrp5 ( T i l ) , 49,6 te lom érica de Lrp5 (T13), y 57,2 te lom érica de Lrp5 (T14). Las sondas específicas para 129 y específicas para B6 y Ios pares de cebadores se m uestran en la Tabla i .
La Tabla 3 m uestra siete e jem plos de clones de células ES que exhib ieron eventos de conversión génica evidentes en el brazo largo del crom osom a 19 en una dirección te lom érica del Iocus diana Lrp5 por LOH tanto para alelos con SV como con SNV. Los clones de células ES se derivaron de experim entos de transform ación independientes que com binaron el LTVEC de hum anización de Lrp5 (F igura i ) con uno o dos ARNg, como se indicó. Las posiciones de Ios sitios de reconocim iento de ARNg se m uestran encim a de la representación del gen Lrp5 en la Figura 5 (flecha gruesa que apunta hacia la izquierda). Los ensayos de genotipificación indicaron que seis de Ios siete clones tenían hum anizaciones con transform ación hom ocigótica del gen Lrp5, m ientras que uno tenía un colapso hom ocigótico (deleción grande entre Ios sitios de Ios ARNg). En seis de Ios siete clones, Ios alelos 129 se perdieron, dejando solam ente Ios alelos B6. En el otro clon, Ios alelos B6 se perdieron, dejando solam ente Ios alelos 129. Todos Ios clones se m antuvieron heterocigóticos para Ios alelos ensayados en el lado centrom érico del Iocus Lrp5 (es decir, todos Ios clones eran heterocigóticos para B6/129 con el ensayo de SNV C2). La LOH observada en Ios siete clones indica que un m ecanism o m ediante el cual se obtienen alelos hom ocigóticos genéticam ente m odificados cuando un LTVEC se com bina con uno, o con m ayor frecuencia, dos ARNg es una primera m odificación genética dirigida en un alelo seguido de un evento de conversión génica por recom binación dirigida por hom ología que copia la m odificación genética dirigida de un crom osom a a su homólogo.
Tabla 3. Resultados del ensayo de pérdida de heterocigosidad.
Figure imgf000067_0001
Locus C5 (H c)
En otro conjunto de experimentos, el LTVEC se diseñó para crear una deleción de 76 kb del gen de ratón del com ponente 5 del com plem ento (C5 o Hc (com plem ento hem olítico)) y un reem plazo sim ultáneo con un fragm ento de 97 kb del gen C5 hum ano hom ólogo (F igura 6). El Iocus diana com prendía el exón 2 hasta el codón de term inación del gen C5 (H c). El LTVEC com prendía el fragm ento de 97 kb del gen c 5 humano flanqueado por brazos de hom ología que contienen 35 kb y 31 kb de ADN genóm ico derivado de partes del Iocus C5 (H c) de ratón que flanquean la secuencia de 76 kb del gen C5 (H c) de ratón prevista para la deleción. En experim entos separados, el LTVEC de hum anización de C5 (H c) se com binó con un plásm ido que codifica Cas9 y un segundo plásm ido que codifica uno de seis ARNg (A, B, C, D, E, y E2; ver la Tabla 1) diseñados para crear rupturas bicatenarias dentro de la región del gen C5 (H c) de ratón reconocida para la deleción. Los ARNg se diseñaron de modo que eviten el reconocim iento de cualquier secuencia en la porción insertada del gen C5 humano. En otros experimentos, se com binó el LTVEC y el plásm ido que codifica Cas9 con plásm idos que codifican dos ARNg diferentes que reconocen sitios diferentes dentro de la región del gen C5 (H c) de ratón reconocida para la deleción. En algunos experimentos, se usó un LTVEC de contro l que transform a el Iocus Ch25h en lugar del LTVEC de hum anización de C5 (H c). El LTVEC de control, que se diseña para e lim inar la secuencia codificante com pleta de Ch25h (~1 kb) e insertar Ios casetes de selección de purom icina y neom icina en el Iocus Ch25h, se usó com o medio para seleccionar clones resistentes a fárm aco que no se transform aron por recom binación hom óloga en el Iocus C5 (H c).
Los resultados de la hum anización asistida por CR ISPR/Cas9 del gen C5(H c) se m uestran en la Tabla 4 y son sim ilares a Ios resultados obtenidos para la hum anización asistida por CR ISPR /C as9 del gen Lrp5. La eficiencia de transform ación con el LTVEC so Io fue m ayor (6,1 %) para la hum anización de C5 (H c) que para Lrp5, pero la adición de Cas9 y ARNg m ejoró la eficiencia de transform ación para cuatro de Ios seis ARNg probados. Al igual que para Lrp5, la com binación de ARNg (es decir, el uso de dos ARNg) para la hum anización de C5 (H c) aum entó aún más la efic iencia de transform ación total, predom inantem ente m ediante el aum ento la frecuencia de eventos de transform ación hem icigóticos y homocigóticos. Se encontraron adem ás clones de células ES con deleciones grandes inducidas por CRISPR en am bos alelos (observadas a frecuencias de 1,8 % a 3,6 %). Adem ás, cuando el LTVEC que transform a el Iocus Ch25h se usó en com binación con dos ARNg de C 5 (H c), Ios clones con alelos hom ocigóticos que colapsaron entre las dos secuencias de reconocim iento de ARN de CRISPR de Ios ARNg se observaron a frecuencias de 1,2 % a 6 %, lo que indica que Ios eventos de colapso ocurren independientem ente de Ios eventos de recom binación hom óloga en el Iocus diana. Al igual que para Lrp5, se usaron ensayos de retención para confirm ar Ios clones transform ados correctam ente. Los dos ensayos de retención para este tam iza je fueron ensayos TaqM an® que usan Ios siguientes cebadores y sondas: cebador directo de 7140retU CC CAG CATCTG AC G AC ACC (SEQ ID NO: 125); cebador inverso de 7140retU G ACCAC TG TG G G CATCTG TAG (SEQ ID NO: 126); sonda TaqM an® de 7140retU C C G A G TC TG C TG TTAC TG TTAG C ATC A (SEQ ID NO: 127); cebador directo de 7140retD CC CG ACACC TTCTG AG C ATG (SEQ ID NO: 128); cebador inverso de 7140retD TG CAG G CTG AG TCAG G ATTTG (SEQ ID NO: 129); sonda TaqM an® de 7140retD TA G TC AC G TTTTG TG AC AC C C C AG A (SEQ ID NO: 130).
Tabla 4. Resultados del tam iza je de la hum anización asistida por CR ISPR/Cas9 del gen C5 (H c) m ediante el uso de ARNg individuales y ARNg combinados.
Figure imgf000068_0001
Se usó hibridación fluorescente in s itu (FISH) para confirm ar la hum anización dirigida hom ocigótica del gen C5 (H c). Los clones de células ES calificados m ediante ensayos de PCR cuantitativos y convencionales com o con transform ación hom ocigótica de los experim entos de transform ación en los que el LTVEC de hum anización de C5 (H c) (F igura 6) se com binó con Cas9 y dos ARNg se enviaron a un servicio com ercial de cito logía para FISH y análisis de cariotipo. Un crom osom a artificial bacteriano (BAC) que porta el gen C5 (H c) de ratón se etiquetó con un m arcador fluorescente rojo y se usó com o sonda para identificar loci endógenos, y un BAC que porta el gen C5 humano se etiquetó con un m arcador fluorescente verde y se usó com o sonda para identificar crom átidas transform adas con el inserto humano. Las sondas BAC etiquetadas se hibridaron con frotis en m etafase de los clones transform ados y se v isualizaron por m icroscopía de fluorescencia. Los crom osom as en los frotis se visualizaron por tinción con D A P i (4 ',6-diam idino-2-fenilindol), y los cariotipos separados de cada clon se determ inaron por tinción G iemsa. Un resultado típ ico se m uestra en la Figura 7B para el clon O-E. La fotografía com puesta en la Figura 7B m uestra que la señal roja de la sonda de BAC de ratón y la señal verde de la sonda de BAC humano se colocalizan en el Iocus C5 (H c) en ambas copias del crom osom a 2 de ratón, la ubicación conocida del gen C5 (H c). Estos resultados confirm an que el fragm ento de 97 kb del gen C5 hum ano en el LTVEC de hum anización (F igura 6) se insertó correctam ente en el Iocus C5 (H c) de ratón previsto en am bos crom osom as 2 hom ólogos en el clon 0 -E 3. Por el contrario, la fotografía com puesta en la Figura 7A m uestra que la señal roja de la sonda de BAC de ratón y la señal verde de la sonda de BAC hum ano se colocalizan en una sola copia del crom osom a 2 de ratón (flecha sólida), m ientras que solo la señal roja de la sonda de BAC de ratón se localiza en el Iocus C5 (H c) en la otra copia del crom osom a 2 de ratón. Estos resultados confirm an que el fragm ento de 97 kb del gen C5 humano en el LTVEC de hum anización (F igura 6) se insertó correctam ente en el Iocus C5 (H c) de ratón previsto solam ente en una copia del crom osom a 2 (transform ación heterocigótica) en el clon Q-E9.
Locus R o rl
En otro conjunto de experimentos, el LTVEC se diseñó para crear una deleción de 110 kb del gen R o rl (receptor transm em brana de proteína quinasa d e tiros ina ROR1) de ratón y un reem plazo sim ultáneo con un fragm ento de 134 kb del gen ROR1 humano hom ólogo (F igura 8). El LTVEC com prendía el fragm ento de 134 kb del gen ROR1 humano flanqueado por brazos de hom ología que contienen 41,8 kb y 96,4 kb de ADN genóm ico derivado de partes del Iocus R o rl de ratón que flanquean la secuencia de 110 kb del gen R o rl de ratón prevista para la deleción. En experim entos separados, el LTVE c de hum anización de R o rl se com binó con un plásm ido que codifica Cas9 y un segundo plásm ido que codifica uno de seis ARNg (A, B, C, D, E, y F; ver la Tabla 1) diseñados para crear rupturas bicatenarias dentro de la región del gen R o rl de ratón reconocida para la deleción. Los ARNg se diseñaron de modo que eviten el reconocim iento de cua lquier secuencia en la porción insertada del gen ROR1 humano. En otros experimentos, se com binó el LTVE c y el plásm ido que codifica Cas9 con plásm idos que codifican dos ARNg diferentes que reconocen sitios diferentes dentro del gen R o rl reconocido para la deleción.
Los resultados de la hum anización asistida por CRISPR/Cas9 del gen R o rl se m uestran en la Tabla 5 y son sim ilares a Ios resultados obtenidos para la hum anización asistida por CR ISPR/Cas9 de Ios genes Lrp5 y C5 (H c). La eficiencia de transform ación con LTVE c so Io fue 0,3 %, y la adición de Cas9 y ARNg aum entó ligeram ente la eficiencia de transform ación de dos de Ios seis ARNg probados. La com binación de Ios ARNg A y F aum entó la efic iencia de transform ación de R o rl total a 6,3 % m ediante el aum ento la frecuencia de Ios eventos de transform ación heterocigóticos y hem icigóticos. Se encontraron adem ás clones de células ES con deleciones grandes inducidas por CRISPR en am bos alelos (observadas a una frecuencia de 1,6 %).
Tabla 5. Resultados del tam iza je de la hum anización asistida por CR ISPR/Cas9 del gen R o rl m ediante el uso de ARNg individuales y ARNg combinados.
Figure imgf000069_0001
Locus T rp a l
En otro conjunto de experimentos, el LTVEC se diseñó para crear una deleción de 45,3 kb del gen T rp a l (canal catiónico receptor de potencial transitorio, subfam ilia A, m iem bro 1) de ratón y un reem plazo sim ultáneo con un fragm ento de 54,5 kb del gen TRPA1 humano hom ólogo (F igura 9). El LTVEC com prendía el fragm ento de 54,5 kb del gen TRPA1 humano flanqueado por brazos de hom ología que contienen 41,0 kb y 58,0 kb de ADN genóm ico derivado de partes del Iocus T rp a l de ratón que flanquean la secuencia de 45,3 kb del gen T rp a l de ratón prevista para la deleción. En experim entos separados, el l Tv EC de hum anización de T rp a l se com binó con un plásm ido que codifica Cas9 y un segundo plásm ido que codifica uno de ocho ARNg (A, A2, B, C, D, E2, E, y F; ver la Tabla 1) d iseñados para crear rupturas bicatenarias dentro de la región del gen T rp a l de ratón reconocida para la deleción. Los ARNg se diseñaron de modo que eviten el reconocim iento de cualquier secuencia en la porción insertada del gen TRPA1 humano. En otros experimentos, se com binó el LTVEC y el plásm ido que codifica Cas9 con plásm idos que codifican dos ARNg diferentes que reconocen sitios diferentes dentro del gen T rp a l reconocido para la deleción.
Los resultados de la hum anización asistida por CR ISPR/Cas9 del gen T rp a l se m uestran en la Tabla 6 y son sim ilares a Ios resultados obtenidos para la hum anización asistida por CR ISPR/Cas9 de Ios genes Lrp5 y C5 (H c). La eficiencia de transform ación con LTVEC so Io fue 0,3 %, y la adición de Cas9 y ARNg aum entó la eficiencia de transform ación de seis de Ios ocho ARNg probados. La com binación de Ios ARNg B y F aum entó la eficiencia de transform ación de T rp a l tota l a 3,4 % m ediante el aum ento la frecuencia de Ios eventos de transform ación heterocigóticos, hem icigóticos, y hom ocigóticos. Se encontraron adem ás clones de células ES con deleciones grandes inducidas por CRISPR en am bos alelos (observadas a una frecuencia de 0,3 %).
Tabla 6. Resultados del tam iza je de la hum anización asistida por CR ISPR/Cas9 del gen T rp a l m ediante el uso de ARNg individuales y ARNg combinados.
Figure imgf000069_0002
Figure imgf000070_0001
Tal com o ilustran estos ejemplos, el uso de pares de ARN guías en sitios am pliam ente separados m ejoró el aum ento de la hum anización heterocigótica en com paración con los ARNg individuales. Adem ás, el uso de pares de ARN guías prom ovió eventos bialé licos en com paración con los ARNg individuales. Por el contrario a la transform ación con un ARNg, la transform ación con dos ARNg da com o resultado la creación de células con transform ación hom ocigótica (Hum /Hum ) en las que am bos alelos tienen una hum anización dirigida, células con deleción hom ocigótica (A/A) en las que ningún alelo se transform ó con el LTVEC de hum anización pero ambos tienen deleciones grandes, y células con transform ación hem icigótica (Hum /A) en las que un alelo tiene una hum anización dirigida y el otro tiene una deleción grande inducida por el par de ARNg/Cas9. En prim er lugar, se encontraron clones transform ados correctam ente que tenían hum anizaciones m uy grandes precisas e idénticas en am bos alelos diana (por ejemplo, células que eran hom ocigóticas para la m odificación génica dirigida). Aunque tam bién se observaron clones con transform ación hom ocigótica cuando se usó un ARNg para lograr la hum anización de Lrp5, estos aparecieron a una frecuencia m ucho m enor que cuando se em plearon dos ARNg (ver la Tabla 2). Del m ism o modo, no se observó transform ación hom ocigótica cuando se usó un ARNg para lograr la hum anización de C5 (H c) o la hum anización de T rp a l, pero se observó transform ación hom ocigótica cuando se usaron dos ARNg con el vecto r de transform ación (ver las Tablas 4 y 6). De m anera similar, se encontraron clones transform ados correctam ente que eran hem icigóticos para la m odificación génica (es decir, tenían una hum anización dirigida con precisión en un alelo y una deleción m uy grande, en ocasiones con elim inación del gen, en el otro alelo) para la transform ación de Lrp5, la transform ación de C5 (H c), la transform ación de R o rl, y la transform ación de T rp a l. Tales m odificaciones no ocurrieron en absoluto cuando se usó un ARNg para lograr la hum anización de Lrp5, C5 (H c), R o rl, o T rp a l (ver las Tablas 2, 4, 5, y 6, respectivam ente).
En segundo lugar, se encontraron clones que tenían deleciones m uy grandes idénticas (>45 kb) inducidas por eventos de escisión por Cas9 guiados por ambos ARNg en am bos alelos diana (es decir, las células eran hom ocigóticas para una deleción grande, en ocasiones con elim inación del gen, en el Iocus diana). Estos tipos de m utaciones no requieren que el vecto r de transform ación se dirija contra el m ism o gen. Por ejemplo, com o se m uestra en la Tabla 4, se han obtenido células ES con deleciones hom ocigóticas inducidas por C R IS P r m ediante la com binación de Cas9 y dos ARNg con un vecto r de transform ación dirigido contra un gen diferente no relacionado con el reconocido por Ios ARNg. Por lo tanto, una nucleasa Cas9 guiada por dos ARNg puede inducir una deleción grande en las células sin adición de un vecto r de transform ación. En tales casos, la selección por fárm aco transitoria o estable proporcionada por un vecto r que expresa un gen de resistencia a fárm aco puede fac ilita r el aislam iento de clones con deleción hom ocigótica poco frecuentes por enriquecim iento de las células ES que han captado el ADN.
E jem plo 2. Análisis de deleciones grandes inducidas por ARNg combinados.
Estructuras alélicas para deleciones grandes inducidas por ARNg com binados
Se realizó un análisis de secuencias adicional en Ios clones que com prenden deleciones grandes inducidas por eventos de escisión por Cas9 guiados por dos ARNg (ver la Tabla 7). Estas deleciones grandes parecían ser independientes de Ios eventos de recom binación hom óloga dirig idos por LTVEC en el m ism o Iocus en el que se obtuvieron deleciones grandes en el Iocus Lrp5 aproxim adam ente a la m isma frecuencia cuando se com binaron Ios ARNg con un LTVEC de Lrp5 o uno que transform a el gen Ch25h a casi 30 Mb de distancia (no se m uestran Ios datos). Para caracterizar las deleciones grandes, se realizaron PCR que abarcan la deleción en 37 clones, 15 hem icigóticos y 22 con deleciones bialé licas grandes, de cuatro hum anizaciones, y Ios clones individuales de Ios productos de PCR se secuenciaron. Las secuencias confirm aron las deleciones grandes, que estaban en el in tervalo de 38 kb a 109 kb. Dos de Ios clones de células ES (clones de Lrp5 AW -A8 y BP-D3) tenían deleciones precisas perfectam ente reparadas (68,2 kb) entre Ios sitios de escisión de Cas9 predichos, m ientras que un clon (clon de Hc P-B12) ten ía una inserción de un solo par de bases adem ás de la deleción de 38,1 kb. Veintisiete de Ios clones de células ES tenían deleciones que se extendían más allá de Ios sitios de escisión de Cas9, consistentes con la reparación im precisa por unión de extrem os no hom ólogos (NHEJ). Los siete clones de células ES restantes tenían m utaciones que com binaban deleciones e inserciones inducidas por NHEJ evidentes (por ejemplo, el clon de Lrp5 BP-F6 y el clon de Hc 0 -E 4 ), cuatro de Ios cuales tenían inserciones de más de 200 pb que pudieron ubicarse en el mapa de sus IocI genóm icos de origen (no se m uestran Ios datos). La inserción de 210 pb en el clon de Lrp5 BO-E9 estaba en una orientación invertida con respecto a una secuencia idéntica que reside aproxim adam ente 2600 pb fuera del sitio diana del ARNg F en la dirección centrom érica (crom osom a 19 , 3589138­ 3589347). Esta secuencia estaba presente en el brazo de hom ología 3' largo del LTVEC de Lrp5. Los clones de Lrp5 BP F6 y BP-G7 se derivaron de un experimento en el que se combinaron Ios ARNg A y F de Lrp5 con Cas9 y un LTVEC que transformó el gen Ch25h a 30 Mb de distancia de Lrp5 en la dirección telomérica. El clon BP-F6 tenía una inserción de 266 pb que parecía derivarse de un extremo del LTVE c de Ch25h dado que estaba formada por un fragmento de 103 pb idéntico a parte de la cadena principal del vector unido a un fragmento de 163 pb que era idéntico a una secuencia cercana a Ch25h y presente además en el brazo largo del LTVE c (cromosoma 19+, 34478136-34478298); este fragmento se insertó en la deleción en una orientación invertida con respecto a la secuencia cromosómica endógena. El clon de Hc O-E4 tenía una inserción de 254 pb que estaba invertida con respecto a una secuencia idéntica encontrada dentro de la secuencia eliminada aproximadamente 3,1 kb de distancia del sitio de reconocimiento de ARNg A. La inserción de 1304 pb en el clon Hc S-D5 estaba formada por dos fragmentos: un pedazo de 1238 pb que estaba en la misma orientación que una secuencia idéntica encontrada dentro de la secuencia eliminada aproximadamente 1,4 kb de distancia del sitio predicho de escisión de Cas9 dirigida por ARNg E2 y un segundo pedazo de 66 pb que era una duplicación en una orientación invertida de una secuencia de 25 pb idéntica fuera del sitio de corte de ARNg E2.
Tabla 7. Estructuras alélicas de deleciones grandes inducidas por ARNg combinados.
Figure imgf000071_0001
Figure imgf000072_0001
Evidencias de conversión génica en alelos homocigóticos
Veintiuno de Ios 22 clones de células ES con deleciones bialélicas grandes tenían solamente una secuencia individual, única (Tabla 7), lo que indica que eran alelos homocigóticos. Para el clon de Hc S-A11, se encontró la misma secuencia en 11 de 12 clones de PCR. El único clon con una secuencia diferente pudiera sugerir la deleción de dos alelos diferentes, pero también se encontró el mismo resultado para dos de Ios clones de Hc hemicigóticos, N-D11 y 0-F12. Los distintos alelos con deleción homocigótica en múltiples clones sugieren que pudieran haber surgido de un mecanismo de conversión génica en el que una deleción en un cromosoma sirvió como plantilla para la reparación por recombinación homóloga de las escisiones por Cas9 en el cromosoma homólogo. Nos beneficiamos de la composición híbrida F1 129S6Sv EvT ac (129) y C57BL/6NTac (B6) de la línea de células ES VGF1 (Poueymirou y otros (2o07) Nat. Biotechnol.
25:91-99; Valenzuela y otros (2003) Nat. Biotechnol. 21:652-659) para ensayar la conversión génica como pérdida de heterocigosidad (Lefebvre y otros (2001) Nat. Genet. 27:257-258) para variantes estructurales (SV) y de nucleótido simple (SNV) entre las cepas alrededor del Iocus Lrp5 en el cromosoma 19 (ver la Figura 5 para Ios cinco ensayos de SV y Ios diez ensayos de SNV que se usan a continuación) y el Iocus Hc en el cromosoma 2 (no se muestra). Para confirmar que cualquier pérdida de heterocigosidad no era el resultado de la pérdida de cromosomas completos, se realizaron ensayos de número de copias cromosómicas (CCN) en Ios sitios que eran idénticos entre las cepas 129 y B6. Para Ios alelos de Lrp5 humanizados o con deleción se ensayaron múltiples SV y SNV posicionadas desde 1,2 Mb de distancia de Lrp5 en la dirección telomérica hasta el extremo del brazo largo del cromosoma 19 (Figura 5). Debido a la ubicación de Lrp5 cercana al centrómero, no se encontraron SV y solamente se encontró una SNV en el lado centromérico del gen. Para Hc, fue posible ensayar múltiples SV y SNV en cualquier lado del gen en el cromosoma 2 (no se muestra). Los resultados de seis de Ios clones de Lrp5 se muestran en las Figuras 10A-E y 11A-C.
La Figura 10A-E muestra Ios resultados de cinco ensayos de SV, cuyas posiciones estaban en el intervalo de 13,7 Mb de distancia de Lrp5 a 56,7 Mb de distancia cerca del extremo telomérico del brazo largo. Los cinco ensayos de SV produjeron dos productos de tamaños diferentes para Ios alelos 129 (mayor) y B6 (menor) en Ios controles de 129, B6, y VGF1. Las posiciones aproximadas de Ios ensayos de SV en el mapa del cromosoma 19 se muestran en la Figura 5 (ver el ensayo SV 13,7, ensayo SV 20,0, ensayo SV 36,9, ensayo SV 48,3, y ensayo SV 56,7). El número del ensayo representa el número de Mb teloméricas respecto a Lrp5. Los cebadores de estos ensayos se muestran en la Tabla 1, y Ios resultados se muestran en la Figura 1oA-E. Dos de Ios clones, BC-H9 (Lrp5Hum/Hum, ARNg B2) y BR-B4 (Lrp5Hum/Hum, ARNg D), mostraron una pérdida de heterocigosidad que retenía la totalidad de Ios alelos de SV de B6, mientras que un tercer clon, BO-A8 (Lrp5Hum/Hum, ARNg A F), retuvo la totalidad de Ios alelos 129. Los otros tres clones, BO-FIO (Lrp5Hum/Hum, ARNg A F), BO-G11 (Lrp5Hum/Hum, ARNg A F), y BP-G7 (Lrp5A/A, ARNg A F), se mantuvieron heterocigóticos.
Además, las variantes de nucleótido simple (SNV) entre Ios alelos 129 y B6 se ensayaron por ensayos de discriminación alélica TaqMan®. Las posiciones aproximadas de Ios ensayos de SNV en el mapa del cromosoma 19 en la Figura 5 se muestran con puntas de flecha con Ios números de ensayo debajo, y sus distancias (en Mb) del Iocus Lrp5 se proporcionan debajo. Las distancias (en Mb) del Iocus Lrp5 son las siguientes: 0,32 centromérica de Lrp5 (C2), 1,2 telomérica de Lrp5 (T3), 11,1 telomérica de Lrp5 (T6), 13,2 telomérica de Lrp5 (T7), 17,5 telomérica de Lrp5 (T8), 25,8 telomérica de Lrp5 (t 9), 33,0 telomérica de Lrp5 (TlO), 38,3 telomérica de Lrp5 (T il) , 49,6 telomérica de Lrp5 (T i 3), y 57,2 telomérica de Lrp5(T14). Las sondas específicas para 129 y específicas para B6 y Ios pares de cebadores se muestran en la Tabla i. Los resultados de tres clones (BC-H9, BO-A8, y BR-B4) que mostraron pérdida de heterocigosidad (LOH) telomérica por ensayos de SV se muestran en la Figura 1lA-C. Los ensayos de s Nv (Figura 11A-C y datos que no se muestran) confirmaron Ios eventos de conversión génica en el brazo largo del cromosoma 19 en el lado telomérico de Lrp5 (SNV 1,2 y SNV 57,2; ve r la Figura 11B y la F igura 11C, respectivam ente), pero el ensayo de SNV 0,32 (ver la F igura 11A) m ostró que todos los clones se m antenían heterocigóticos para un alelo a 320 kb de distancia de Lrp5 en el lado centromérlco. De los 24 clones de Lrp5Hum/Hum o Lrp5ñ/ñ ensayados, se encontraron seis que tenían evidencias de pérdida de heterocigosidad en el brazo largo com pleto del crom osom a 19 en el lado te lom érico de Lrp5. Cinco de los clones (cuatro Lrp5Hum/Hum y uno Lrp5ñ/ñ) se convirtieron de heterocigóticos a hom ocigóticos para B6, m ientras que un sexto clon (Lrp5Hum/Hum) se convirtió a hom ocigótico para 129. Los ensayos de CCN dem ostraron la retención de dos copias del crom osom a 19. Los ensayos de pérdida de heterocigosidad sim ilares de 21 clones hom ocigóticos para He revelaron que dos, R-E2 (H cHum/Hum, ARNg A F) y R-E8 (Heñ/ñ, ARNg A F), m ostraron pérdida de heterocigosidad a hom ocigóticos para 129 para todas las SV y SNV en el lado te lom érico del gen He m ientras retuvieron la heterocigosidad para todos los alelos en el lado eentromérieo. Los ensayos de CCN indicaron que no hay pérdida del crom osom a 2.
Los resultados dem uestran por primera vez que CRISPR/Cas9 puede m ejorar la reparación dirigida por hom ología de hum anizaciones grandes en una sola etapa de más de 100 kb, lo que expande las posib ilidades de la m odificación genética del genom a a gran escala. El beneficio más notable e inesperado de la com binación de LTVEC y ARNg/Cas9 fue su capacidad de prom over hum anizaciones dirig idas hom ocigóticas. Aunque se han inform ado m utaciones bialélieas y eventos de transform ación hom ocigóticos en otros experim entos con CRISPR/Cas9, la m ayor parte de estas m odificaciones e inserciones génieas han sido órdenes de magnitud m enores que nuestros alelos humanizados. Antes del uso de CRISPR/Cas9, nunca se había encontrado transform ación homoeigótiea por un LTVEC, ni se había observado transform ación sim ultánea de más de un gen cuando se com binaban múltiples LTVEC que transform an genes separados. Dada esta experiencia, la transform ación homoeigótiea inducida por ARN g/Cas9 sugirió que en lugar de dos LTV e C que transform an ambos alelos por separado, un evento de transform ación inicial en un alelo pudiera servir com o plantilla para la conversión hom óloga del otro alelo prom ovida por uno o más cortes de Cas9. La revelación de que las deleeiones bialélieas grandes inducidas por pares de ARN g/C as9 tam bién eran hom ocigóticas (Tabla 7) proporcionó apoyo adicional para un m ecanism o de conversión géniea.
Los ensayos de pérdida de heterocigosidad (F igura 5) dem ostraron que la conversión géniea a gran escala de m últiples alelos que cubren un fragm ento grande del crom osom a en el lado te lom érico del gen diana era responsable de algunas de las hum anizaciones y deleeiones grandes hom ocigóticas. Este tipo de conversión géniea direeeional de largo alcance es consistente con la recom binación m itótiea entre las erom átidas replicadas de crom osom as hom ólogos en la fase G2 del cielo celu lar (Lefebvre y otros (2001) Nat. Genet. 27 :257-258) (F igura 12). Aunque explicó solam ente una m inoría de los eventos hom ocigóticos, este m ecanism o podría proporcionar un medio por el cual la escisión por ARN g/Cas9 puede usarse para prom over la conversión a gran escala de heteroeigótieo a hom ocigótico para múltiples alelos en una porción grande de un crom osom a. La m ayor parte de los eventos hom ocigóticos, sin embargo, parece haber sido el resultado de la conversión géniea local cuyo m ecanism o m erece investigación adicional.
Evidencias adicionales de la conversión géniea direeeional de largo alcance fueron proporcionadas por el análisis de tres clones obtenidos después de la eleetroporaeión de células ES híbridas F1H4 (que se com ponen de 50 % de la cepa 129Sv S6 y 50 % de la cepa C57BL/6N) con plásm idos que codifican los ARNg A y F de Lrp5, un plásm ido que codifica Cas9, y un LTVEC que transform a el gen Ch25h a 30 Mb de distancia de Lrp5 en la dirección telom ériea. Tres clones se calificaron in icia lm ente com o de tipo silvestre después del tam iza je prim ario m ediante el uso de ensayos TaqM an® dentro de la deleeión predicha entre los 2 ARNg (500 pb de distancia en el extrem o 5' y 2 kb en el extrem o 3'), pero ensayos de discrim inación aléliea TaqM an® posteriores que ensayan variantes de nueleótido sim ple (SNV) entre los alelos 129 y B6 revelaron sorprendentem ente pérdida de heterocigosidad. Los ensayos de SNV usados fueron un ensayo eentromérieo (SNV 0,32) y dos ensayos telom érieos (SNV 1,2 y SNV 57,2) (ver la Figura 5). Com o se m uestra en la Tabla 8, el ensayo de SNV eentrom érieo (0,32 Mb) confirm ó la retención de la heterocigosidad en los tres clones. Sin embargo, ambos ensayos de SNV telom érieos m ostraron que BP-E7 y BP-H4 eran hom ocigóticos para el alelo 129, y am bos ensayos de SNV telom érieos m ostraron que BP-E6 era hom ocigótico para el alelo B6. Los tres clones m ostraron retención de dos copias del crom osom a 19, y los tres clones fueron transgénieos para la transform ación con LTVEC (es decir, el Iocus C h25h se transform ó). Estos resultados abren la posibilidad a la hom oeigosidad forzada m ediante el uso de escisión dirig ida por CRISPR/Cas9.
Tabla 8. Resultados del tam iza je de ensayos de discrim inación aléliea de SNV.
Figure imgf000073_0001
Varios posibles m ecanism os pueden exp licar Ios resultados observados en Ios experim entos de hum anización con LTVEC asistida por CR ISPR/Cas9 en células ES híbridas F1H4 de ratón (que se com ponen de 50 % de la cepa 129Sv S6 y 50 % de la cepa C57BL/6N) (ver la Figura 16A-F). Tales m ecanism os podrían ocurrir a través del in tercam bio recíproco de erom átidas por entrecruzam iento m itótieo (ver la Figura 16A-C), o m ediante copia de erom átidas por replieaeión inducida por ruptura (ver la Figura 16D-E). En cualquier caso, podría ocurrir una m odificación heteroeigótiea en la que el crom osom a 129 o el crom osom a B6 se transform a con el LTVEC antes de la replieaeión del genom a (ver la Figura 16A y 16D).
Alternativamente, una sola cromátida de 129 o una sola cromátida de B6 podría transformarse con el LTVEC después de la replicación del genoma, seguido de conversión génica entre cromátidas (ver la Figura 16B y 16E). Alternativamente, puede existir falta de transformación con LTVEC en el Iocus genómico diana, pero puede ocurrir la escisión por Cas9 en el cromosoma 129 o B6 (ver la Figura 16C y 16F). Esta última posibilidad puede explicar Ios resultados observados con Ios clones BP-E7, BP-H4, y BP-E6. Los resultados potenciales se muestran en las Figuras 16A-F. Para la Figura 16F, también es posible observar pérdida de heterocigosidad (LOH) que retiene Ios alelos B6 si la Cas9 escinde una cromátida de 129. En Ios experimentos descritos anteriormente, se han observado eventos de pérdida de heterocigosidad que dan como resultado la transformación de ambos alelos (Hum/Hum) o que ambos alelos sean alelos de tipo silvestre (+/+).
Ejemplo 3. Efecto de Ios tamaños de Ios brazos de homología de LTVEC sobre la eficiencia de transformación
Para determinar el efecto del tamaño de Ios brazos de homología sobre la eficiencia de transformación, se compararon dos LTVEC diseñados para crear una deleción de 76 kb del gen de ratón para el componente 5 del complemento (C5 o Hc (complemento hemolítico)) y un reemplazo simultáneo con un fragmento de 97 kb del gen C5 humano homólogo (Figura 13). El Iocus diana comprendía el exón 2 hasta el codón de terminación del gen C5 (H c). El primer LTVEC comprendía el fragmento de 97 kb del gen C5 humano flanqueado por brazos de homología que contienen 35 kb y 31 kb de ADN genómico derivado de partes del Iocus C5 (H c) de ratón que flanquean la secuencia de 76 kb del gen C5 (H c) de ratón prevista para la deleción (ver el vector de transformación etiquetado como LTVEC en la Figura 13). El segundo LTVEC comprendía el fragmento de 97 kb del gen C5 humano flanqueado por brazos de homología que contienen 5 kb cada uno de ADN genómico derivado de partes del Iocus C5 (H c) de ratón que flanquean la secuencia de 76 kb del gen C5 (H c) de ratón prevista para la deleción (ver el vector de transformación etiquetado como sTVEC en la Figura 13).
En experimentos separados, Ios LTVEC de humanización de C5 (H c) se combinaron con un plásmido que codifica Cas9 y un segundo plásmido que codifica uno o dos de seis ARNg (A, B, C, D, E, y E2; ver la Tabla 1) diseñados para crear rupturas bicatenarias dentro de la región del gen C5 (H c) de ratón reconocida para la deleción. Los ARNg se diseñaron de modo que eviten el reconocimiento de cualquier secuencia en la porción insertada del gen C5 humano.
Los resultados de la humanización asistida por CRISPR/Cas9 del gen C 5(H c) se muestran en la Tabla 9. La eficiencia de transformación del primer LTVEC so Io (brazos de homología de 35 kb y 31 kb) fue mayor que la eficiencia de transformación del segundo LTVEC so Io (brazos de homología de 5 kb y 5 kb). Sin embargo, las eficiencias de transformación totales de cada LTVEC cuando se combinó con Ios ARNg A y E2 fueron casi idénticas (ver la Tabla 9), lo que indica que Ios tamaños de Ios brazos de homología de 5 kb (es decir, suma total de 10 kb) son suficientes para facilitar el aumento de la eficiencia de transformación observada cuando se transforma el Iocus C5 (H c) mediante el uso de CRISPR/Cas9 en combinación con la transformación con LTVEC.
Tabla 9. Resultados del tamizaje de la humanización asistida por CRISPR/Cas9 del gen C5 (H c) mediante el uso de LTVEC con diferentes tamaños de Ios brazos de homología.
Figure imgf000074_0001
Ejemplo 4. Efecto de distancias más cortas entre las secuencias de reconocimiento de ARN de CRISPR sobre la eficiencia de transformación
Para determinar el efecto de distancias más cortas entre las secuencias de reconocimiento de ARN de CRISPR y Ios sitios de escisión sobre la eficiencia de transformación, se diseñó un LTVEC para crear una deleción de 18,2 kb del gen de ratón para la hidroxilasa de ácido citidina monofosfato-N-acetilneuramínico (Cmah) y un reemplazo simultáneo con un inserto que comprende un reportero lacZ y un casete de selección de resistencia a higromicina. El LTVEC se usó con dos ARNg que reconocen secuencias poco separadas (Figura 14). El Iocus diana comprendía Ios cinco primeros exones del gen Cmah. El LTVEC comprendía el inserto lacZ-hygr de 8,8 kb flanqueado por brazos de homología que contienen 120 kb y 57 kb de ADN genómico derivado de partes del Iocus Cmah de ratón que flanquean la secuencia de 18,2 kb del gen Cmah de ratón prevista para la deleción. El LTVEC se combinó con plásmidos que codifican Cas9 y dos ARNg (A y B) diseñados para crear rupturas bicatenarias cerca del extremo 5' de la región del gen Cmah de ratón reconocida para la deleción. Los dos ARNg reconocieron secuencias poco separadas cerca del ATG en el extremo 5' de la secuencia prevista para la deleción, con Ios sitios de escisión a 27 pb de separación (ver la Figura 15). La escisión con Cas9 guiada por Ios dos ARNg produce una secuencia de 27 pb suprimida que tiene extremos romos. Se usó LTVEC so Io como control.
Los clones de células ES resistentes a fármaco se tamizaron en cuanto a las humanizaciones dirigidas por ensayos de modificación de alelo (Valenzuela y otros (2003) Nat. Biotechnol. 21:652-659; Frendewey y otros (2010) Methods Enzymol.
476:295-307) para secuencias dentro de la deleción y para secuencias dentro del casete de selección por fárm aco y el inserto de gen humano. Los clones se calificaron com o transform ados correctam ente si habían perdido una de las dos secuencias del gen endógeno de ratón y ganado una copia del inserto lacZ-hygr. Adem ás, se usaron ensayos de PCR en tiem po real que reconocen secuencias en los brazos de hom ología del LTVEC, referidos com o ensayos de retención, para com probar la transform ación correcta del LTVEC en el genom a de ratón. La determ inación del número de copias de estos ensayos de retención proporcionó más claridad para ayudar a distinguir los clones de ES transform ados correctam ente, que retuvieron un número de copias de dos, de los clones en los que una deleción grande inducida por Cas9 del Iocus diana de ratón coincide con la integración aleatoria del LTVEC en otra parte en el genoma, en cuyo caso Ios ensayos de retención tuvieron un número de copias de tres (o más). La capacidad de Ios pares de ARNg de crear deleciones grandes m ediadas por Cas9 en el Iocus diana de ratón significa que podría añadirse ensayos de retención a Ios ensayos LOA y G O A estándar com o se describ ió previam ente para proporcionar más claridad y com probar la transform ación correcta. Por lo tanto, Ios ensayos de retención se diseñaron y se usaron Junto con Ios ensayos LOA y GOA.
Los resultados del experim ento de transform ación de Cmah se resumen en la Tabla 10. En el experim ento de transform ación de control con LTVEC soIo , 5,4 % (3/56) de Ios clones tam izados tenían una mutación heterocigótica de deleción y reem plazo (Het); 95 % de Ios clones se m antuvieron de tipo silvestre (W T) en el Iocus Cmah. En el experim ento de transform ación con CRISPR, se observaron cinco tipos de alelos m utantes diferentes adem ás de algunos clones WT. Se observaron tres tipos de alelos con transform ación por LTVEC: (1) Het; (2) Hom (deleción y reem plazo homocigótico); y (3) Hemi (deleción y reem plazo en un alelo y una m utación inducida por ARN g/Cas9 en el otro alelo). Estos tres tipos constituyen el 43,5 % (106/244) de todos Ios clones tam izados. En com paración con LTVEC soIo, se observó un aum ento en 8 veces de la transform ación del gen Cmah en el que se transform ó al m enos un alelo. Se observaron adem ás dos tipos de alelos que portaban solam ente m utaciones indel por ARNg/Cas9: (1) Het, en el que se detectó un indel en uno de Ios dos alelos W T; y (2) m utaciones bialélicas de indel, que podían ser hom ocigóticas (Hom ) o hem icigóticas (Hemi). S o Io 3,7 % de Ios clones tam izados se m antuvieron W T sin mutación detectable en el Iocus Cmah. En general, más de 94 % de Ios clones tenían m utaciones inducidas por Cas9 cuando se usó la com binación de ARNg A y B.
Tabla 10. Resultados del tamizaJe de la trasform ación de Cmah.
Figure imgf000075_0001
E jem plo 5. Colapso grande m ediante el uso de pares de ARNg en em briones en etapa de una célula
Para lograr una deleción dirigida grande en em briones en etapa de una célula, se diseñó un experim ento para crear una deleción de 68 kb de la porción del gen Lrp5 (proteína 5 relacionada con el receptor de lipoproteínas de baja densidad) de ratón que codifica el ectodom inio y opcionalm ente un reem plazo sim ultáneo con una inserción de 4 nucleótidos a través del uso de una secuencia donante de A d N m onocatenario (124 nucleótidos de longitud) con un inserto de 4 nucleótidos flanqueado por dos brazos de hom ología de 60 nucleótidos. El inserto de 4 nucleótidos creó un sitio de enzim a de restricción tras la inserción en el Iocus diana. En experim entos separados, la proteína Cas9 en form a de proteína se sum inistró por inyección citop lasm ática (Cl), o Cas9 en form a de ARNm se sum inistró por inyección pronuclear (PNI) o e lectroporación (EP). La Cas9 se com binó con dos ARNg (A F) diseñados para crear rupturas bicatenarias dentro de la región del gen Lrp5 de ratón reconocida para la deleción, y opcionalm ente con un donante de recom binación homóloga. Los ARNg se inyectaron en form a de ARN. Después se evaluó la frecuencia de m utaciones m onoalélicas y bialélicas resultantes.
Los resultados se resumen en la Tabla 11, que incluye la deleción m ediada por NHEJ entre Ios sitios diana de Ios dos ARN guías o la deleción asistida por reparación dirigida por hom ología con el donante de ADNm c. Las m utaciones bialé licas se observaron cuando Ios pares de ARN guías y Cas9 se introdujeron Junto con el donante de A D N m c por m edio de inyección citoplasm ática. En cada mutación bialélica observada, un crom osom a se m odificó por medio de deleción m ediada por NHEj y un crom osom a se m odificó por medio de deleción asistida por HDR. Estos resultados indican que las piezo inyecciones citop lasm áticas de ARNm dan com o resultado la reparación dirigida por hom ología consistente con el potencial para la recom binación hom ocigótica con un donante.
Tabla 11. Com paración de m étodos de sum inistro de Cas9.
Figure imgf000076_0001
Ejem plo 6. Ensayos de retención para distinguir entre inserciones dirig idas e inserciones transgén icas y entre deleciones dirig idas y deleciones que se extienden m ás allá de la región diana
Las estrategias de tam iza je de m odificación de alelo (MOA) estándar (ver, por ejemplo, F igura 17A) determ inan el número de copias TaqM an® m ediante la com paración de un prom edio de valores de Ct de cuatro réplicas biológicas para cada m uestra con el Ct m edio de todas las muestras. Para la pérdida de alelo, se usan sondas TaqM an® contra las regiones corriente arriba (m TU) y corriente abajo (m TD) de la región del Iocus genóm ico diana que se reconoce para la deleción. Para la ganancia de alelo, se usan sondas TaqM an® contra el casete de resistencia a neomicina. Sin embargo, tales sondas podrían diseñarse contra cualquier región del inserto de ácido nucleico. Para un clon diploide, con transform ación heterocigótica, el núm ero de copias TaqM an® para cada una de las sondas de mTU, mTD, y Neo debe ser uno. Para Ios clones diploides, con transform ación hom ocigótica, el número de copias TaqM an® para cada uno de mTU y mTD debe ser cero, y el número de copias TaqM an® para Neo debe ser dos. Del m ismo modo, para Ios clones diploides, no transform ados, el núm ero de copias TaqM an® para cada uno de mTU y mTD debe ser dos, y el número de copias TaqM an® para Neo debe ser cero. Para Ios clones diploides, con colapso heterocigótico, el número de copias TaqM an® para mTU y mTD debe ser uno, y el número de copias para Neo debe ser cero. Para Ios clones diploides, con colapso hom ocigótico, el número de copias TaqM an® para cada uno de mTU, mTD, y Neo debe ser cero.
Debido a que Ios pares de ARNg pueden crear deleciones grandes m ediadas por Cas en un Iocus genóm ico diana, sin embargo, puede ser útil aum entar Ios ensayos LOA y G OA estándar para com probar la transform ación correcta por LTVEC. Por ejemplo, Ios ensayos LOA y G O A so Ios pueden no distinguir Ios clones de células transform ados correctam ente de Ios clones en Ios que una deleción grande inducida por Cas del Iocus genóm ico diana coincide con la integración aleatoria de un LTVEC en otra parte en el genoma. Debido a que la presión de selección en la célula transform ada se basa en el casete de selección, la integración transgénica aleatoria del LTVEC en otra parte en el genoma generalm ente incluirá el casete de selección y las regiones adyacentes del LTVEC pero excluirá regiones m ás distales del LTVEC. Por ejemplo, si Ios ensayos LOA y G O A se usan para evaluar la integración dirigida del LTVEC, y el ensayo G O A utiliza sondas contra el casete de selección, una deleción heterocigótica en el Iocus genóm ico diana com binada con una integración transgénica aleatoria del LTVEC proporcionará la m ism a lectura que una integración dirigida heterocigótica del LTVEC en el Iocus genóm ico diana. Para com probar la transform ación correcta por el LTVEC, pueden usarse ensayos de retención, so Ios o jun to con ensayos LO A y/o GOA.
Cuando se usan ensayos de retención TaqM an®, se usan las sondas corriente arriba y corriente abajo correspondientes a la secuencia diana 5' del brazo de hom ología 5' (sonda retU) y la secuencia diana 3' del brazo de hom ología 3' (sonda retD) (ver la Figura 17B, que m uestra el uso de ensayos de retención TaqM an® en com binación con ensayos G O A y LOA para tam izar la hum anización asistida por CR ISPR/Cas9 m ediante el uso de selección con neomicina). La F igura 17B m uestra adem ás cóm o pueden usarse las diferentes sondas dentro del inserto de ácido nucleico para ensayos G O A (ver sonda hTU corriente arriba y sonda hTD corriente abajo). Los resultados de Ios ensayos GOA, l Oa , y de retención para d iferentes tipos de m odificaciones dirig idas e inserciones transgén icas se m uestran en la Tabla 12.
Tabla 12. Lecturas de núm eros de copias predichos de ensayos GOA, LOA, y de retención de Ios diferentes tipos de m odificación.
Figure imgf000076_0002
Figure imgf000077_0001
Los ensayos de retención TaqM an pueden usarse adem ás en com binación con ensayos LOA para tam izar las deleciones asistidas por CR ISPR/Cas9 m ediante el uso de pares de ARNg (ver la Figura 17C). En tales ensayos, los núm eros de copias de retU y retD deben m antenerse en dos en todos los casos. Los núm eros de copias de m enos de dos indican deleciones grandes m ediadas por Cas9 que se extienden más allá de la región que se reconoce para la deleción. Los resultados de los ensayos LOA y de retención de los diferentes tipos de m odificaciones relacionadas con colapso se m uestran en la Tabla l3.
Tabla 13. Lecturas de los núm eros de copias predichos de ensayos L O A y de retención para diferentes m odificaciones de colapso.
Figure imgf000077_0002
E jem plo 7. Transform ación m ediada por CR ISPR/Cas9 m ediante el uso de cuatro ARN guías.
Para efectuar una deleción precisa, en una sola etapa de una región de aproxim adam ente 900 kb de un Iocus de cadena pesada de inm unoglobulina de ratón m odificado y su reem plazo sim ultáneo con un inserto Pgk-Neo (prom otor de fosfog licerato quinasa I unido operativam ente al gen de neom icina fosfotransferasa) flanqueado por sitios IoxP, las siguientes m oléculas de ácidos nucle icos se introdujeron por e lectroporación en células ES de ratón: (1) un LTVEC (2) un plásm ido que codifica una endonucleasa Cas9; y (3) uno o más plásm idos que codifican cuatro ARN guías sim ples de CR ISPR (ARNg). En cada experimento, el LTVEC se linealizó. El Iocus diana de la m odificación era una región de aproxim adam ente 900 kb de un Iocus de cadena pesada de inm unoglobulina de ratón con segm entos génicos de región variab le (V h, Dh, J h) reem plazados con equivalentes humanos (ver la Figura 18). El LTVEC com prendía el inserto Pgk-Neo que tiene una longitud de aproxim adam ente 2 kb flanqueado por un brazo de hom ología 5' de 19 kb y un brazo de hom ología 3' de 13 kb diseñado para dirig ir un evento de recom binación hom óloga que elim ina la región de aproxim adam ente 900 kb del Iocus diana e inserta el casete de selección por fárm aco que dirige la expresión de neom icina fosfotransferasa para im partir resistencia a G418.
De Ios cuatro ARNg que se usaron, dos se dirigían a la escisión por Cas9 cerca del extrem o 5' del Iocus diana (5' ARN g_l y 5' A R N g_ ll en la Figura 18), y dos se dirigían a la escisión por Cas9 cerca del extrem o 3' del Iocus diana (3' ARN g_l y 3' A R N g_ ll en la Figura 18). Las secuencias diana de 5 'ARNg_l y 5 'A R N g_ ll estaban aproxim adam ente 150 pb separadas entre s í, y las secuencias diana de 3' ARN g_l y 3' AR N g_ll se solapaban, con el sitio diana de 3' A R N g_ll desplazado 1 pb con relación al sitio diana de 3' ARNg_l.
Las células ES que captaron el LTVEC y lo incorporaron en sus genom as fueron capaces de crecer y form ar colonias en una placa de cultivo de te jidos en un medio de crecim iento que contiene el fárm aco antibiótico. Se seleccionaron colonias resistentes a fárm aco y se tam izaron por el m étodo de m odificación de alelo (Valenzuela y otros (2003) Nat. Biotech.
21:652-660; Frendewey y otros (201o) M ethods Enzymol. 476:295-307) para identificar Ios clones que tenían el alelo hum anizado transform ado correctam ente (ver la Tabla 14 a continuación). Adem ás, Ios ensayos de PCR en tiem po real que reconocen secuencias en Ios brazos de hom ología del LTVEC, referidos com o ensayos de retención, se usaron para com probar la transform ación correcta del LTVEC en el genom a de ratón (ver la Tabla 14 a continuación).
Tabla 14. Sondas usadas para confirm ar la transform ación con LTVEC y 4 ARNg.
Figure imgf000077_0003

Claims (1)

  1. r e iv in d ic a c io n e s
    Un m étodo para hacer una m odificación bialélica a un Iocus genóm ico diana en un genom a dentro de una célula, que comprende:
    (I) in troducir en una población de células:
    (a) una proteína Cas;
    (b) un prim er ARN guía que se hibrida con una prim era secuencia de reconocim iento de ARN de CRISPR dentro del Iocus genóm ico diana;
    (c) un segundo ARN guía que se hibrida con una segunda secuencia de reconocim iento de ARN de CRISPR dentro del Iocus genóm ico diana; y
    (d) un vecto r de transform ación que com prende un inserto de ácido nucleico flanqueado por un brazo de hom ología 5' que se hibrida con una secuencia diana 5' dentro del Iocus genóm ico diana y un brazo de hom ología 3' que se hibrida con una secuencia diana 3' dentro del Iocus genóm ico diana, en donde si la célula es un embrión en etapa de una célula el vecto r de transform ación tiene una longitud de no más de 5 kb;
    en donde el genom a com prende un par de prim er y segundo crom osom as hom ólogos que com prenden el Iocus genóm ico diana, opcionalm ente en donde la primera y segunda secuencias de reconocim iento de ARN de CRISPR flanquean la totalidad o parte de una secuencia codificante de un gen; y
    en donde la proteína Cas escinde al m enos una de la primera y segunda secuencias de reconocim iento de ARN de CRISPR para generar al m enos una ruptura bicatenaria en cada uno del prim er y segundo crom osom as homólogos, opcionalm ente en donde la introducción del prim er y segundo ARN guías da com o resultado el aum ento de la efic iencia de m odificación bialélica en com paración con la introducción del prim er ARN guía o el segundo ARN guía soIos; y
    (II) identificar una célula que com prende un Iocus genóm ico diana m odificado que com prende una deleción y/o una inserción, en donde la identificación com prende rea lizar un ensayo cuantitativo de m odificación de alelo y un ensayo de retención, en donde el ensayo de m odificación de alelo comprende:
    (a) un ensayo de ganancia de alelo para determ inar el número de copias de una plantilla de ADN de inserto de ácido nucleico en una m uestra de ADN genóm ico de la célula; y/o
    (b) un ensayo de pérdida de alelo para determ inar el número de copias en la m uestra de ADN genóm ico de una plantilla de A d N dentro de una región del Iocus genóm ico diana reconocida para la deleción, y
    en donde el ensayo de retención determ ina el núm ero de copias en la m uestra de ADN genóm ico de una plantilla de ADN de la secuencia diana 5' que se pretende retener en el Iocus genóm ico diana m odificado y/o una plantilla de ADN de la secuencia diana 3' que se pretende retener en el Iocus genóm ico diana modificado,
    en donde la célula no se produce m ediante el uso de un proceso que involucra la m odificación de la identidad genética de la línea germ inal de seres hum anos o que involucra el uso de un em brión hum ano para fines industria les o com erciales, y
    en donde el m étodo no es un m étodo para el tratam iento del cuerpo hum ano o animal m ediante terap ia o cirugía.
    El m étodo de la reivindicación 1, en donde el ensayo de retención determ ina el número de copias de la plantilla de ADN de la secuencia diana 5' en la m uestra de ADN genóm ico y la plantilla de ADN de la secuencia diana 3' en la m uestra de ADN genómico, y opcionalm ente en donde el ensayo de m odificación de alelo com prende el ensayo de pérdida de alelo y el ensayo de ganancia de alelo.
    El m étodo de la reivindicación 2, en donde el inserto de ácido nucleico com prende un casete de selección adyacente a un prim er brazo de hom ología que se hibrida con una primera secuencia diana,
    en donde el prim er brazo de hom ología es el brazo de hom ología 5' y la primera secuencia diana es la secuencia diana 5', o en donde el prim er brazo de hom ología es el brazo de hom ología 3' y la prim era secuencia diana es la secuencia diana 3',
    en donde la identificación comprende:
    (a) obtener ADN de la célula;
    (b) exponer el ADN de la célula a una sonda que se une dentro de la primera secuencia diana, una sonda que se une dentro del inserto de ácido nucleico, y una sonda que se une dentro de un gen de referencia que tiene un núm ero de copias conocido, en donde cada sonda genera una señal detectable tras la unión;
    (c) detectar las señales de la unión de cada una de las sondas; y
    (d) com parar la señal de la sonda del gen de referencia con la señal de la sonda de la primera secuencia diana para determ inar un núm ero de copias de la primera secuencia diana, y com parar la señal de la sonda del gen de referencia con la señal de la sonda del inserto de ácido nucleico para determ inar un número de copias del inserto de ácido nucleico,
    en donde un número de copias del inserto de ácido nucleico de uno o dos y un núm ero de copias de la primera secuencia diana de dos indica la inserción dirigida del inserto de ácido nucleico en el Iocus genóm ico diana, y en donde un núm ero de copias del inserto de ácido nucleico de uno o m ás y un núm ero de copias de la primera secuencia diana de tres o más indica una inserción aleatoria del inserto de ácido nucleico en un Iocus genóm ico distinto al Iocus genóm ico diana.
    El m étodo de cualquier reivindicación precedente, en donde:
    (a) la proteína Cas escinde la prim era y segunda secuencias de reconocim iento de ARN de CRISPR en cada uno del prim er y segundo crom osom as hom ólogos para generar al m enos dos rupturas bicatenarias en cada uno del prim er y segundo crom osom as homólogos; o
    (b) la proteína Cas escinde la primera y segunda secuencias de reconocim iento de ARN de CRISPR en al menos uno del prim er y segundo crom osom as hom ólogos para generar al m enos dos rupturas bicatenarias en al menos uno del prim er y segundo crom osom as homólogos.
    5. El m étodo de cualquier reivindicación precedente, en donde la etapa (I) com prende adem ás in troducir en la población de células:
    (e) un te rcer ARN guía que se hibrida con una tercera secuencia de reconocim iento de ARN de CRISPR dentro del Iocus genóm ico diana; y
    (f) un cuarto ARN guía que se hibrida con una cuarta secuencia de reconocim iento de ARN de CRISPR dentro del Iocus genóm ico diana.
    6. El m étodo de la reivindicación 5, en donde:
    (a) la primera secuencia de reconocim iento de ARN de CRISPR y la tercera secuencia de reconocim iento de ARN de CRISPR se encuentran separadas por aproxim adam ente 25 pb a aproxim adam ente 1 kb; y/o
    (b) la segunda secuencia de reconocim iento de ARN de CRISPR y la cuarta secuencia de reconocim iento de ARN de CRISPR se encuentran separadas por aproxim adam ente 25 pb a aproxim adam ente 1 kb; y/o
    (c) la primera y tercera secuencias de reconocim iento de ARN de CRISPR son un prim er par de secuencias de reconocim iento de ARN de CRISPR, y la segunda y cuarta secuencias de reconocim iento de ARN de CRISPR son un segundo par de secuencias de reconocim iento de ARN de CRISPR, en donde el prim er par y el segundo par se encuentran separados por aproxim adam ente 25 pb a aproxim adam ente 100 Mb, opcionalm ente en donde la proteína Cas escinde al m enos dos de la primera, segunda, tercera y cuarta secuencias de reconocim iento de ARN de CRISPR para generar al m enos dos rupturas bicatenarias en al m enos uno del prim er y segundo crom osom as homólogos, opcionalm ente en donde la proteína Cas escinde al m enos dos de la primera, segunda, tercera y cuarta secuencias de reconocim iento de ARN de CRISPR para generar al m enos dos rupturas bicatenarias en el primer y segundo crom osom as homólogos.
    7. El m étodo de cua lquier reivindicación precedente, en donde el inserto de ácido nucleico se inserta entre las secuencias diana 5' y 3'.
    8. El m étodo de cualquier reivindicación precedente, en donde la célula es diploide, y la m odificación bialélica da com o resultado homocigosidad, heterocigosidad combinada, o hem icigosidad en el Iocus genóm ico diana.
    9. El m étodo de cualquier reivindicación precedente, en donde la m odificación bialélica com prende una deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el prim er crom osom a homólogo, opcionalm ente en donde:
    (a) la m odificación bialélica com prende la deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el prim er y segundo crom osom as homólogos; opcionalm ente en donde la m odificación bialélica com prende adem ás la inserción del inserto de ácido nucle ico entre las secuencias diana 5' y 3' en el primer y segundo crom osom as homólogos;
    (b) la deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el prim er y segundo crom osom as homólogos, y la inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el prim er crom osom a hom ólogo pero no en el segundo crom osom a homólogo;
    (c) la deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el primer crom osom a homólogo, y la interrupción del Iocus genóm ico diana en el segundo crom osom a homólogo, en donde la interrupción es de reparación m ediada por unión de extrem os no hom ólogos (NHEJ) de la al m enos una ruptura bicatenaria;
    (d) la deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el primer crom osom a homólogo, una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer crom osom a homólogo, y la interrupción del Iocus genóm ico diana en el segundo crom osom a homólogo, en donde la interrupción es de reparación m ediada por unión de extrem os no hom ólogos (NHEJ) de la al m enos una ruptura bicatenaria;
    (e) la deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el primer crom osom a homólogo, y una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el primer crom osom a homólogo, en donde la secuencia del inserto de ácido nucleico es hom óloga u ortóloga a la secuencia elim inada;
    (f) el ácido nucleico elim inado es de aproxim adam ente 5 kb a aproxim adam ente 3 Mb; o
    (g) el ácido nucleico elim inado es de al m enos 20 kb.
    10. El m étodo de cualquier reivindicación precedente, en donde:
    (a) la primera y segunda secuencias de reconocim iento de ARN de CRISPR se ubican cada una al m enos 50 pb de am bas secuencias diana 5' y 3';
    (b) la primera y segunda secuencias de reconocim iento de ARN de CRISPR se ubican cada una entre aproxim adam ente 50 pb a aproxim adam ente 100 kb de am bas secuencias diana 5' y 3';
    (c) la prim era y segunda secuencias de reconocim iento de ARN de CRISPR se encuentran separadas por aproxim adam ente 1 kb a aproxim adam ente 3 Mb;
    (d) la primera y segunda secuencias de reconocim iento de ARN de CRISPR se encuentran separadas por al m enos 1 kb;
    (e) la primera y segunda secuencias de reconocim iento de ARN de CRISPR se encuentran separadas por aproxim adam ente 25 pb a aproxim adam ente 1 kb; o
    (f) la primera y segunda secuencias de reconocim iento de ARN de CRISPR se encuentran separadas por m enos de 25 pb.
    11. El m étodo de cualquier reivindicación precedente, en donde el vecto r de transform ación está en form a lineal, y/o en donde el vecto r de transform ación es m onocatenario o bicatenario.
    12. El m étodo de cua lquier reivindicación precedente, en donde la célula es una célula eucariota, opcionalm ente en donde la célula eucariota es una célula de mamífero, una célula humana, una célula no humana, una célula de roedor, una célula de ratón, una célula de rata, una célula pluripotente, una célula no pluripotente, una célula p luripotente no humana, una célula p luripotente humana, una célula pluripotente de roedor, una célula pluripotente de ratón, una célula p luripotente de rata, una célula madre em brionaria (e s ) de ratón, una célula ES de rata, una célula ES humana, una célula m adre adulta humana, una célula progenitora hum ana restringida por el desarrollo, una célula madre pluripotente inducida (iPS) humana, o un em brión no hum ano en etapa de una célula, o un em brión de ratón en etapa de una célula.
    13. El m étodo de la reivindicación 12, en donde la célula es un embrión no hum ano en etapa de una célula, y en donde:
    (a) el vector de transform ación es de entre aproxim adam ente 50 nucleótidos a aproxim adam ente 5 kb de longitud; (b) el vecto r de transform ación es ADN m onocatenario y es de entre aproxim adam ente 60 a aproxim adam ente 200 nucleótidos de longitud;
    (c) la proteína Cas, el prim er ARN guía, y el segundo ARN guía se introducen cada uno en el em brión en etapa de una célula por m icroinyección; o
    (d) la proteína Cas, el prim er ARN guía, y el segundo ARN guía se introducen cada uno en el em brión en etapa de una célula en form a de ARN por m icroinyección en el citoplasma.
    14. El m étodo de la reivindicación 12, en donde la célula no es un em brión en etapa de una célula, y en donde:
    (a) el vecto r de transform ación es un vecto r de transform ación grande (l T v EC) que es de al menos 10 kb, opcionalm ente en donde el LTVEC es de aproxim adam ente 50 kb a aproxim adam ente 300 kb; o
    (b) el vecto r de transform ación es un vector de transform ación grande (LTVEC), en donde la sum a total de los brazos de hom ología 5' y 3' del LTVEC es de al m enos 10 kb, opcionalm ente en donde la sum a total de los brazos de hom ología 5' y 3' del LTVEC es de aproxim adam ente 10 kb a aproxim adam ente 200 kb.
    15. El m étodo de cualquiera de las reivindicaciones 1-12 y 14, en donde la célula no es un em brión en etapa de una célula,
    en donde el vecto r de transform ación es un vecto r de transform ación grande (LTVEC), en donde los brazos de hom ología 5' y 3' tienen una sum a total de al m enos 10 kb;
    en donde la prim era y segunda secuencias de reconocim iento de ARN de CRISPR se ubican cada una más de 200 pb de am bas secuencias diana 5' y 3';
    en donde la proteína Cas escinde la primera y segunda secuencias de reconocim iento de ARN de CRISPR en al m enos uno del prim er y segundo crom osom as hom ólogos para generar al m enos dos rupturas bicatenarias en al m enos uno del prim er y segundo crom osom as homólogos; y
    en donde la m odificación bialélica com prende la deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el prim er crom osom a hom ólogo y una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el prim er crom osom a homólogo, en donde la secuencia del inserto de ácido nucleico es hom óloga u ortóloga a la secuencia elim inada.
    16. El m étodo de cualquier reivindicación precedente, en donde la proteína Cas es Cas9, opcionalm ente en donde la proteína Cas tiene actividad nucleasa en ambas cadenas de a D n bicatenario,
    u opcionalm ente en donde la proteína Cas es una nickasa, y en donde el m étodo com prende adem ás in troducir en la célula:
    (e) un te rcer ARN guía que se hibrida con una tercera secuencia de reconocim iento de ARN de CRISPR; y (f) un cuarto ARN guía que se hibrida con una cuarta secuencia de reconocim iento de ARN de CRISPR;
    en donde la proteína Cas form a una mella en una primera cadena de ADN genóm ico dentro de la primera y segunda secuencias de reconocim iento de ARN de CRISPR, y la proteína Cas form a una mella en una segunda cadena de ADN genóm ico dentro de la tercera y cuarta secuencias de reconocim iento de ARN de CRISPR, en donde las mellas dentro de la primera y tercera secuencias de reconocim iento de ARN de CRISPR son m ellas desplazadas para crear una primera ruptura bicatenaria que tiene extrem os escalonados, y las mellas dentro de la segunda y cuarta secuencias de reconocim iento de ARN de CRISPR son m ellas desplazadas para crear una segunda ruptura bicatenaria que tiene extrem os escalonados.
    17. El m étodo de cualquier reivindicación precedente, en donde:
    (a) el prim er ARN guía com prende un prim er ARN de CRISPR y un prim er A R N tracr fusionados entre s í, y/o el segundo ARN guía com prende un segundo ARN de CRISPR y un segundo A R N tracr fusionados entre s í;
    (b) el prim er ARN guía com prende un prim er ARN de CRISPR y un prim er ARNtracr, en donde el prim er ARN de CRISPR y el prim er AR N tracr son m oléculas de ARN separadas, y/o el segundo ARN guía com prende un segundo ARN de CRISPR y un segundo ARNtracr, en donde el segundo ARN de CRISPR y el segundo A R N tracr son m oléculas de ARN separadas;
    (c) la proteína Cas se introduce en la célula en form a de una proteína, un ARN m ensajero (ARNm ) que codifica la proteína Cas, o un ADN que codifica la proteína Cas;
    (d) el prim er ARN guía se introduce en la célula en form a de un ARN o en form a de un ADN que codifica el primer A R n guía;
    (e) el segundo ARN guía se introduce en la célula en form a de un ARN o en form a de un ADN que codifica el segundo ARN guía;
    (f) la proteína Cas y el prim er ARN guía se introducen en la célula com o un prim er com plejo de ARN y proteína, y/o la proteína Cas y el segundo ARN guía se introducen en la célula com o un segundo com ple jo de ARN y proteína;
    (g) la proteína Cas, el prim er ARN guía, y el segundo ARN guía se introducen cada uno en la célula en form a de ADN; o
    (h) la proteína Cas, el prim er ARN guía, y el segundo ARN guía se introducen cada uno en la célula en form a de a r n .
    18. El m étodo de cualquier reivindicación precedente, en donde la célula se ha m odificado para d ism inuir la unión de extrem os no hom ólogos (NHEJ) y/o para aum entar la conversión génica o la reparación dirigida por hom ología (HDR), opcionalm ente en donde la célula se ha m odificado para d ism inu ir la expresión y/o la actividad de uno o más de ADN-PK, PARP1, y ligasa IV, y opcionalm ente en donde la dism inución de la expresión o la actividad es inducible, reversible, tem poralm ente específica, y/o espacialm ente específica.
    19. El m étodo de cualquier reivindicación precedente, en donde el m étodo produce:
    (a) una primera subpoblación de células que com prenden una deleción entre la primera y segunda secuencias de reconocim iento de A r n de CRISPR en el prim er y segundo crom osom as homólogos, y la inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el prim er crom osom a hom ólogo pero no en el segundo crom osom a homólogo;
    (b) una segunda subpoblación de células que com prenden una deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR y la inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el prim er y segundo crom osom as homólogos;
    (c) una tercera subpoblación de células que com prenden una deleción entre la primera y segunda secuencias de reconocim iento de A r n de CRISPR en el prim er y segundo crom osom as hom ólogos pero no la inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3';
    (d) una cuarta subpoblación de células que com prenden una deleción entre la primera y segunda secuencias de reconocim iento de ARN de CRISPR en el prim er crom osom a homólogo, y la interrupción del Iocus genóm ico diana en el segundo crom osom a homólogo, en donde la interrupción es de reparación m ediada por unión de extrem os no hom ólogos (NHEJ) de la al menos una ruptura bicatenaria; o
    (e) una quinta subpoblación de células que com prenden una deleción entre la prim era y segunda secuencias de reconocim iento de ARN de CRISPR en el prim er crom osom a homólogo, una inserción del inserto de ácido nucleico entre las secuencias diana 5' y 3' en el prim er crom osom a homólogo, y una interrupción del Iocus genóm ico diana en el segundo crom osom a homólogo, en donde la interrupción es de reparación m ediada por unión de extrem os no hom ólogos (NHEJ) de la al menos una ruptura bicatenaria,
    opcionalm ente en donde el m étodo produce la primera subpoblación de células, la segunda subpoblación de células, la tercera subpoblación de células, la cuarta subpoblación de células, y la quinta subpoblación de células.
    20. El m étodo de cua lquier reivindicación precedente, en donde la célula es una célula m adre em brionaria (ES) de ratón o rata, y el m étodo com prende adem ás in troducir la célula ES de ratón o rata en un em brión huésped.
ES15804289T 2014-11-21 2015-11-20 Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías Active ES2731437T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462083005P 2014-11-21 2014-11-21
US201562182314P 2015-06-19 2015-06-19
US201562211421P 2015-08-28 2015-08-28
PCT/US2015/062023 WO2016081923A2 (en) 2014-11-21 2015-11-20 METHODS AND COMPOSITIONS FOR TARGETED GENETIC MODIFICATION USING PAIRED GUIDE RNAs

Publications (1)

Publication Number Publication Date
ES2731437T3 true ES2731437T3 (es) 2019-11-15

Family

ID=54771219

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15804289T Active ES2731437T3 (es) 2014-11-21 2015-11-20 Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías

Country Status (24)

Country Link
US (4) US10457960B2 (es)
EP (2) EP3221457B1 (es)
JP (2) JP6727199B2 (es)
KR (3) KR102683423B1 (es)
CN (2) CN113444747A (es)
AU (2) AU2015349692B2 (es)
BR (1) BR112017010547A2 (es)
CA (2) CA3176380A1 (es)
CY (1) CY1121738T1 (es)
DK (1) DK3221457T3 (es)
ES (1) ES2731437T3 (es)
HR (1) HRP20190949T1 (es)
HU (1) HUE044907T2 (es)
IL (3) IL283585B2 (es)
LT (1) LT3221457T (es)
MX (2) MX2017006670A (es)
NZ (1) NZ731962A (es)
PL (1) PL3221457T3 (es)
PT (1) PT3221457T (es)
RS (1) RS58893B1 (es)
RU (2) RU2734770C2 (es)
SG (2) SG11201703747RA (es)
SI (1) SI3221457T1 (es)
WO (1) WO2016081923A2 (es)

Families Citing this family (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
EP2395016A3 (en) 2003-05-30 2012-12-19 Merus B.V. Design and use of paired variable regions of specific binding molecules
US20100069614A1 (en) 2008-06-27 2010-03-18 Merus B.V. Antibody producing non-human mammals
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
JP6475172B2 (ja) 2013-02-20 2019-02-27 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ラットの遺伝子組換え
RS62263B1 (sr) 2013-04-16 2021-09-30 Regeneron Pharma Ciljana modifikacija genoma pacova
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
CA2930015A1 (en) 2013-11-07 2015-05-14 Editas Medicine, Inc. Crispr-related methods and compositions with governing grnas
RU2725520C2 (ru) 2013-12-11 2020-07-02 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP3708671A1 (en) 2014-06-06 2020-09-16 Regeneron Pharmaceuticals, Inc. Methods and compositions for modifying a targeted locus
US9902971B2 (en) 2014-06-26 2018-02-27 Regeneron Pharmaceuticals, Inc. Methods for producing a mouse XY embryonic (ES) cell line capable of producing a fertile XY female mouse in an F0 generation
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
ES2741387T3 (es) 2014-10-15 2020-02-10 Regeneron Pharma Métodos y composiciones para generar o mantener células pluripotentes
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
SI3221457T1 (sl) 2014-11-21 2019-08-30 Regeneron Pharmaceuticals, Inc. Postopki in sestavki za ciljno genetsko modifikacijo z uporabo vodilnih RNK v parih
WO2016100819A1 (en) 2014-12-19 2016-06-23 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modification through single-step multiple targeting
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
US10285388B2 (en) 2015-05-29 2019-05-14 Regeneron Pharmaceuticals, Inc. Non-human animals having a disruption in a C9ORF72 locus
JP7396783B2 (ja) 2015-06-09 2023-12-12 エディタス・メディシン、インコーポレイテッド 移植を改善するためのcrispr/cas関連方法および組成物
CN108291218B (zh) 2015-07-15 2022-08-19 新泽西鲁特格斯州立大学 核酸酶非依赖性靶向基因编辑平台及其用途
US11667911B2 (en) 2015-09-24 2023-06-06 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/CAS-mediated genome editing
WO2017066497A2 (en) 2015-10-13 2017-04-20 Duke University Genome engineering with type i crispr systems in eukaryotic cells
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
EP3370513A1 (en) * 2015-11-06 2018-09-12 The Jackson Laboratory Large genomic dna knock-in and uses thereof
CA3011359A1 (en) 2016-01-13 2017-07-20 Regeneron Pharmaceuticals, Inc. Rodents having an engineered heavy chain diversity region
US11666666B2 (en) * 2016-02-11 2023-06-06 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP4047092A1 (en) 2016-04-13 2022-08-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
AU2017268458B2 (en) * 2016-05-20 2022-07-21 Regeneron Pharmaceuticals, Inc. Methods for breaking immunological tolerance using multiple guide RNAS
US20210010022A1 (en) * 2016-05-27 2021-01-14 Cambridge Enterprise Limited Novel nucleic acid construct
US20190323038A1 (en) * 2016-06-17 2019-10-24 Montana State Univesity Bidirectional targeting for genome editing
WO2017220527A1 (en) * 2016-06-20 2017-12-28 Glycotope Gmbh Means and methods for modifying multiple alleles
EP3476865B1 (en) * 2016-06-28 2023-09-13 Biocytogen Pharmaceuticals (Beijing) Co., Ltd. Method for constructing pd-1 gene-modified humanized animal model and use thereof
US11124805B2 (en) 2016-07-13 2021-09-21 Vertex Pharmaceuticals Incorporated Methods, compositions and kits for increasing genome editing efficiency
CN109563505A (zh) 2016-07-28 2019-04-02 帝斯曼知识产权资产管理有限公司 用于真核细胞的组装系统
AU2017302657A1 (en) 2016-07-29 2019-02-14 Regeneron Pharmaceuticals, Inc. Mice comprising mutations resulting in expression of c-truncated fibrillin-1
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CA3038548A1 (en) 2016-09-30 2018-04-05 Regeneron Pharmaceuticals, Inc. Non-human animals having a hexanucleotide repeat expansion in a c9orf72 locus
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
MX2019005256A (es) 2016-11-04 2019-08-05 Regeneron Pharma Animales no humanos que tienen un locus de la cadena ligera lambda de inmunoglobulina modificado geneticamente.
CN106520831B (zh) * 2016-11-18 2020-05-26 青岛市畜牧兽医研究所 一种哺乳动物基因组修饰方法
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US12065666B2 (en) 2017-01-05 2024-08-20 Rutgers, The State University Of New Jersey Targeted gene editing platform independent of DNA double strand break and uses thereof
EP4095263A1 (en) 2017-01-06 2022-11-30 Editas Medicine, Inc. Methods of assessing nuclease cleavage
CN110446781A (zh) 2017-02-15 2019-11-12 蓝鸟生物公司 供体修复模板多重基因组编辑
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
JP7191388B2 (ja) 2017-03-23 2022-12-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
KR20200010311A (ko) * 2017-05-16 2020-01-30 제네로스 바이오파마 리미티드 알츠하이머병의 치료를 위한 조성물 및 방법
WO2018227114A1 (en) 2017-06-09 2018-12-13 Editas Medicine, Inc. Engineered cas9 nucleases
SG11201911886PA (en) 2017-06-27 2020-01-30 Regeneron Pharma Non-human animals comprising a humanized asgr1 locus
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US11021719B2 (en) 2017-07-31 2021-06-01 Regeneron Pharmaceuticals, Inc. Methods and compositions for assessing CRISPER/Cas-mediated disruption or excision and CRISPR/Cas-induced recombination with an exogenous donor nucleic acid in vivo
CA3067872A1 (en) 2017-07-31 2019-02-07 Regeneron Pharmaceuticals, Inc. Cas-transgenic mouse embryonic stem cells and mice and uses thereof
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
BR112020003609A2 (pt) 2017-09-29 2020-09-01 Regeneron Pharmaceuticals, Inc. sistema e método para formar uma emulsão
WO2019072241A1 (en) 2017-10-13 2019-04-18 Beijing Biocytogen Co., Ltd NON-HUMAN ANIMAL GENETICALLY MODIFIED WITH PD-1 HUMAN OR CHIMERIC
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
US20190141966A1 (en) 2017-11-10 2019-05-16 Regeneron Pharmaceuticals, Inc. Non-Human Animals Comprising SLC30A8 Mutation And Methods Of Use
KR102709884B1 (ko) 2017-11-30 2024-09-26 리제너론 파마슈티칼스 인코포레이티드 인간화된 trkb 유전자좌를 포함하는 비인간 동물
JP7430636B2 (ja) 2017-12-05 2024-02-13 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 操作された免疫グロブリンラムダ軽鎖を有する非ヒト動物及びその使用
MA51619A (fr) 2018-01-17 2021-04-14 Vertex Pharma Inhibiteurs de la protéine kinase dépendante de l'adn
CN111741955B (zh) * 2018-01-17 2024-02-23 沃泰克斯药物股份有限公司 Dna-pk抑制剂
WO2019148166A1 (en) * 2018-01-29 2019-08-01 Massachusetts Institute Of Technology Methods of enhancing chromosomal homologous recombination
JP7334178B2 (ja) 2018-03-19 2023-08-28 リジェネロン・ファーマシューティカルズ・インコーポレイテッド CRISPR/Cas系を使用した動物での転写モジュレーション
US20210071202A1 (en) 2018-03-29 2021-03-11 Jichi Medical University Genome editing method, composition, cell, cell preparation, and method for producing cell preparation
WO2019213183A1 (en) * 2018-04-30 2019-11-07 The Trustees Of The University Of Pennsylvania In utero crispr-mediated therapeutic editing of genes
US20210230637A1 (en) * 2018-05-08 2021-07-29 Osaka University Method for producing homozygous cells
KR20210045360A (ko) 2018-05-16 2021-04-26 신테고 코포레이션 가이드 rna 설계 및 사용을 위한 방법 및 시스템
IL305557A (en) 2018-06-14 2023-10-01 Regeneron Pharma Non-human animals with transgenic DH–DH rearrangement capacity, and their uses
BR112021003380A2 (pt) * 2018-08-28 2021-05-18 Flagship Pioneering Innovations Vi, Llc métodos e composições para modulação de um genoma
JPWO2020050294A1 (ja) * 2018-09-05 2021-08-30 学校法人慶應義塾 相同組換え効率上昇剤及びその使用
US11845958B2 (en) * 2018-09-05 2023-12-19 Wisconsin Alumni Research Foundation Genetically modified genes and cells, and methods of using same for silencing virus gene expression
CA3112612C (en) 2018-09-13 2024-02-27 Regeneron Pharmaceuticals, Inc. Complement factor h gene knockout rat as a model of c3 glomerulopathy
WO2020067004A1 (ja) * 2018-09-25 2020-04-02 公益財団法人微生物化学研究会 新規ウイルスベクターおよびその製造方法と使用方法
CA3120799A1 (en) 2018-12-20 2020-06-25 Regeneron Pharmaceuticals, Inc. Nuclease-mediated repeat expansion
WO2020191243A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
SG11202108454RA (en) 2019-04-04 2021-09-29 Regeneron Pharma Non-human animals comprising a humanized coagulation factor 12 locus
JP2022534867A (ja) 2019-06-04 2022-08-04 リジェネロン・ファーマシューティカルズ・インコーポレイテッド ベータスリップ変異を有するヒト化ttr遺伝子座を含む非ヒト動物と使用方法
MA56117A (fr) 2019-06-05 2022-04-13 Regeneron Pharma Animaux non humains ayant un répertoire de chaînes légères lambda limité exprimé à partir du locus kappa et leurs utilisations
CN113939595A (zh) 2019-06-07 2022-01-14 瑞泽恩制药公司 包括人源化白蛋白基因座的非人动物
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
EP4096396A1 (en) 2020-01-28 2022-12-07 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized pnpla3 locus and methods of use
WO2021158883A1 (en) 2020-02-07 2021-08-12 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized klkb1 locus and methods of use
US20210292754A1 (en) * 2020-03-16 2021-09-23 Pairwise Plants Services, Inc. Natural guide architectures and methods of making and using the same
US20230102342A1 (en) 2020-03-23 2023-03-30 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
JP6867635B1 (ja) * 2020-04-06 2021-04-28 株式会社Logomix ゲノム改変方法及びゲノム改変キット
WO2021222327A1 (en) * 2020-04-27 2021-11-04 Duke University A high-throughput screening method to discover optimal grna pairs for crispr-mediated exon deletion
DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
EP4171215A2 (en) 2020-06-26 2023-05-03 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ace2 locus
CN112481297A (zh) * 2020-11-02 2021-03-12 深圳先进技术研究院 一种制造染色体结构变异的方法
CN112382339B (zh) * 2020-11-17 2024-08-13 中国人民解放军军事科学院军事医学研究院 一种识别合子型基因激活zga基因的方法及装置
US20240317849A1 (en) 2020-12-23 2024-09-26 Regeneron Pharmaceuticals, Inc. Nucleic acids encoding anchor modified antibodies and uses thereof
WO2022251179A1 (en) * 2021-05-26 2022-12-01 Inscripta, Inc. Crispr editing in diploid genomes
CN113832189B (zh) * 2021-09-06 2022-10-21 中国人民解放军军事科学院军事医学研究院 一种用于敲除猪免疫球蛋白重链IGHG区的gRNA及其应用
CN118043456A (zh) * 2021-09-30 2024-05-14 国立大学法人大阪大学 在同源染色体的一方具有特异性的dna缺失的细胞的制造方法
CN118251491A (zh) 2021-10-28 2024-06-25 瑞泽恩制药公司 用于敲除C5的CRISPR/Cas相关方法及组合物
KR20240117571A (ko) 2021-12-08 2024-08-01 리제너론 파마슈티칼스 인코포레이티드 돌연변이 마이오실린 질환 모델 및 이의 용도
WO2023122506A1 (en) 2021-12-20 2023-06-29 Regeneron Pharmaceuticals, Inc. Non-human animals comprising humanized ace2 and tmprss loci
WO2023150798A1 (en) 2022-02-07 2023-08-10 Regeneron Pharmaceuticals, Inc. Compositions and methods for defining optimal treatment timeframes in lysosomal disease
US20230257432A1 (en) 2022-02-11 2023-08-17 Regeneron Pharmaceuticals, Inc. Compositions and methods for screening 4r tau targeting agents
WO2023250511A2 (en) 2022-06-24 2023-12-28 Tune Therapeutics, Inc. Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression
US20240224964A9 (en) 2022-09-29 2024-07-11 Regeneron Pharmaceuticals, Inc. Correction of hepatosteatosis in humanized liver animals through restoration of il6/il6r/gp130 signaling in human hepatocytes

Family Cites Families (181)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4516228A (en) 1983-08-25 1985-05-07 Mobil Oil Corporation Acoustic well logging device for detecting compressional and shear waves
US5830729A (en) 1996-04-18 1998-11-03 Institut Pasteur I Sce I-induced gene replacement and gene conversion in embryonic stem cells
AU8587598A (en) 1997-07-26 1999-02-16 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
JP2002533130A (ja) 1998-12-31 2002-10-08 ザ ジェイ. デビッド グラッドストーン インスティテューツ Hiv共受容体を発現するトランスジェニック齧歯類動物および齧歯類細胞株
US6503717B2 (en) 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
JP2002535995A (ja) 1999-02-03 2002-10-29 ザ チルドレンズ メディカル センター コーポレイション 染色体標的部位での二本鎖dna切断の誘導を含む遺伝子修復
CA2410516A1 (en) 2000-05-31 2001-12-06 Chiron Corporation Compositions and methods for treating neoplastic disease using chemotherapy and radiation sensitizers
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US6586251B2 (en) * 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7105348B2 (en) 2000-10-31 2006-09-12 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
AU2003251286B2 (en) 2002-01-23 2007-08-16 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
US20030175968A1 (en) 2002-10-30 2003-09-18 Golic Kent G. Gene targeting method
EP1587545A2 (en) 2003-01-13 2005-10-26 Mahendra S. Rao Persistent expression of candidate molecule in proliferating stem and progenitor cells for delivery of therapeutic products
SG150548A1 (en) 2003-12-01 2009-03-30 Kudos Pharm Ltd Dna damage repair inhibitors for treatment of cancer
ES2463476T3 (es) 2004-10-19 2014-05-28 Regeneron Pharmaceuticals, Inc. Método para generar un ratón homocigótico para una modificación genética
FR2879622B1 (fr) 2004-12-17 2008-02-01 Agronomique Inst Nat Rech Procede in vitro de production d'ovocytes ou d'oeufs presentant une modification genomique ciblee
GB0615327D0 (en) 2006-03-30 2006-09-13 Univ Edinburgh Culture medium containing kinase inhibitors and uses thereof
EP2505058A1 (en) 2006-03-31 2012-10-03 Medarex, Inc. Transgenic animals expressing chimeric antibodies for use in preparing human antibodies
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
US7771967B2 (en) 2006-12-22 2010-08-10 The J. David Gladstone Institutes Nucleic acid encoding apolipoprotein E-I3
CN101679977B (zh) 2007-04-26 2013-05-01 桑格摩生物科学股份有限公司 向ppp1r12c基因座的靶向整合
AU2008259939B2 (en) 2007-06-01 2014-03-13 Open Monoclonal Technology, Inc. Compositions and methods for inhibiting endogenous immunoglobulin genes and producing transgenic human idiotype antibodies
KR20160015400A (ko) 2008-08-22 2016-02-12 상가모 바이오사이언스 인코포레이티드 표적화된 단일가닥 분할 및 표적화된 통합을 위한 방법 및 조성물
CN102625655B (zh) 2008-12-04 2016-07-06 桑格摩生物科学股份有限公司 使用锌指核酸酶在大鼠中进行基因组编辑
US20110041195A1 (en) * 2009-08-11 2011-02-17 Sangamo Biosciences, Inc. Organisms homozygous for targeted modification
US8518392B2 (en) 2009-08-14 2013-08-27 Regeneron Pharmaceuticals, Inc. Promoter-regulated differentiation-dependent self-deleting cassette
CA2779337A1 (en) 2009-10-28 2011-05-05 Helmholtz Zentrum Muenchen Deutsches Forschungszentrum Fuer Gesundheit U Nd Umwelt (Gmbh) Homologous recombination in the oocyte
AU2010319894B2 (en) 2009-10-29 2015-03-05 Regeneron Pharmaceuticals, Inc. Multifunctional alleles
US20120315670A1 (en) 2009-11-02 2012-12-13 Gen9, Inc. Compositions and Methods for the Regulation of Multiple Genes of Interest in a Cell
WO2011068103A1 (ja) 2009-12-01 2011-06-09 独立行政法人国立がん研究センター ラット胚性幹細胞を用いたキメララットの作製法
ES2583060T3 (es) 2009-12-21 2016-09-16 Keygene N.V. Técnicas mejoradas para la transfección de protoplastos
UA113493C2 (xx) 2010-01-22 2017-02-10 Спосіб видалення ділянки днк в рослині
JP2013518602A (ja) 2010-02-09 2013-05-23 サンガモ バイオサイエンシーズ, インコーポレイテッド 部分的に一本鎖のドナー分子による標的化ゲノム改変
EP3156062A1 (en) 2010-05-17 2017-04-19 Sangamo BioSciences, Inc. Novel dna-binding proteins and uses thereof
GB201009732D0 (en) 2010-06-10 2010-07-21 Gene Bridges Gmbh Direct cloning
CN104711218B (zh) 2010-06-11 2018-09-25 瑞泽恩制药公司 由xy es细胞制备能育的xy雌性动物
EP2596011B1 (en) 2010-07-21 2018-10-03 Sangamo Therapeutics, Inc. Methods and compositions for modification of a hla locus
WO2012018726A1 (en) 2010-08-02 2012-02-09 Cellectis Sa Method for increasing double-strand break-induced gene targeting
WO2012129198A1 (en) 2011-03-23 2012-09-27 Transposagen Biopharmaceuticals, Inc. Genetically modified rat models for obesity and diabetes
WO2012168307A2 (en) 2011-06-07 2012-12-13 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Improved recombination efficiency by inhibition of nhej dna repair
PL3424947T3 (pl) 2011-10-28 2021-06-14 Regeneron Pharmaceuticals, Inc. Myszy z genetycznie zmodyfikowanym receptorem komórek t
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
ES2683071T3 (es) 2012-04-25 2018-09-24 Regeneron Pharmaceuticals, Inc. Direccionamiento mediado por nucleasas con grandes vectores de direccionamiento
CN104471067B (zh) 2012-05-07 2020-08-14 桑格摩生物治疗股份有限公司 用于核酸酶介导的转基因靶向整合的方法和组合物
DK2800811T3 (en) 2012-05-25 2017-07-17 Univ Vienna METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
BR112014031080A2 (pt) 2012-06-12 2018-05-08 Genentech Inc métodos e composições de geração de alelos knock-out condicionais.
JP2015527889A (ja) 2012-07-25 2015-09-24 ザ ブロード インスティテュート, インコーポレイテッド 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用
JP5952141B2 (ja) * 2012-08-31 2016-07-13 京セラメディカル株式会社 人工心肺ポンプ用駆動装置
SG11201503059XA (en) 2012-10-23 2015-06-29 Toolgen Inc Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
KR102243092B1 (ko) 2012-12-06 2021-04-22 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP4286402A3 (en) 2012-12-12 2024-02-14 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US20140310830A1 (en) * 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
SG11201504523UA (en) 2012-12-12 2015-07-30 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
DK3064585T3 (da) 2012-12-12 2020-04-27 Broad Inst Inc Konstruering og optimering af forbedrede systemer, fremgangsmåder og enzymsammensætninger til sekvensmanipulation
CN105121641A (zh) 2012-12-17 2015-12-02 哈佛大学校长及研究员协会 Rna-引导的人类基因组工程化
FI3491915T3 (fi) * 2012-12-27 2023-08-29 Keygene Nv Menetelmä kohdistetun translokaation indusointiin kasvissa
WO2014127287A1 (en) 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
JP6475172B2 (ja) 2013-02-20 2019-02-27 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ラットの遺伝子組換え
US10227610B2 (en) 2013-02-25 2019-03-12 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
US10612043B2 (en) * 2013-03-09 2020-04-07 Agilent Technologies, Inc. Methods of in vivo engineering of large sequences using multiple CRISPR/cas selections of recombineering events
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
WO2014153470A2 (en) 2013-03-21 2014-09-25 Sangamo Biosciences, Inc. Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases
WO2014165825A2 (en) 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
US20160186208A1 (en) 2013-04-16 2016-06-30 Whitehead Institute For Biomedical Research Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal
RS62263B1 (sr) 2013-04-16 2021-09-30 Regeneron Pharma Ciljana modifikacija genoma pacova
EP2986709A4 (en) 2013-04-16 2017-03-15 University Of Washington Through Its Center For Commercialization Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
AU2014262867B2 (en) 2013-05-10 2019-12-05 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
CA2913865C (en) 2013-05-29 2022-07-19 Cellectis A method for producing precise dna cleavage using cas9 nickase activity
US20140359795A1 (en) 2013-05-31 2014-12-04 Recombinetics, Inc. Genetic techniques for making animals with sortable sperm
WO2014201015A2 (en) 2013-06-11 2014-12-18 The Regents Of The University Of California Methods and compositions for target dna modification
CA2915845A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
CN106062197A (zh) 2013-06-17 2016-10-26 布罗德研究所有限公司 用于序列操纵的串联指导系统、方法和组合物的递送、工程化和优化
KR20160056869A (ko) 2013-06-17 2016-05-20 더 브로드 인스티튜트, 인코퍼레이티드 바이러스 구성성분을 사용하여 장애 및 질환을 표적화하기 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료 적용
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
CA2915842C (en) 2013-06-17 2022-11-29 The Broad Institute, Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
BR112015031639A2 (pt) 2013-06-19 2019-09-03 Sigma Aldrich Co Llc integração alvo
US10011850B2 (en) 2013-06-21 2018-07-03 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
EP3019595A4 (en) 2013-07-09 2016-11-30 THERAPEUTIC USES OF A GENERIC CHANGE WITH CRISPR / CAS SYSTEMS
US11060083B2 (en) 2013-07-19 2021-07-13 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
CN105392885B (zh) 2013-07-19 2020-11-03 赖瑞克斯生物科技公司 用于产生双等位基因敲除的方法和组合物
JP2016525004A (ja) 2013-07-24 2016-08-22 メディック アクティフ フェアトリープス ゲーエムベーハー 食材細断装置
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
MX2016002306A (es) * 2013-08-22 2016-07-08 Du Pont Promotor u6 de polimerasa iii de soja y metodos de uso.
WO2015031775A1 (en) 2013-08-29 2015-03-05 Temple University Of The Commonwealth System Of Higher Education Methods and compositions for rna-guided treatment of hiv infection
DE202014010413U1 (de) 2013-09-18 2015-12-08 Kymab Limited Zellen und Organismen
WO2015048690A1 (en) 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
WO2015048577A2 (en) 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
WO2015052231A2 (en) 2013-10-08 2015-04-16 Technical University Of Denmark Multiplex editing system
ES2881473T3 (es) 2013-10-17 2021-11-29 Sangamo Therapeutics Inc Métodos de suministro y composiciones para la modificación por ingeniería genética del genoma mediada por nucleasas
WO2015068785A1 (ja) 2013-11-06 2015-05-14 国立大学法人広島大学 核酸挿入用ベクター
CA2930015A1 (en) 2013-11-07 2015-05-14 Editas Medicine, Inc. Crispr-related methods and compositions with governing grnas
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
JP2016538001A (ja) 2013-11-28 2016-12-08 ホライズン・ジェノミクス・ゲーエムベーハー 体細胞半数体ヒト細胞株
RU2725520C2 (ru) 2013-12-11 2020-07-02 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
CN106536729A (zh) 2013-12-12 2017-03-22 布罗德研究所有限公司 使用粒子递送组分靶向障碍和疾病的crispr‑cas系统和组合物的递送、用途和治疗应用
KR20160097327A (ko) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법
AU2014361784A1 (en) 2013-12-12 2016-06-23 Massachusetts Institute Of Technology Delivery, use and therapeutic applications of the CRISPR-Cas systems and compositions for HBV and viral diseases and disorders
WO2015089462A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing
CA2932472A1 (en) 2013-12-12 2015-06-18 Massachusetts Institute Of Technology Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
EP4219699A1 (en) 2013-12-12 2023-08-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
KR102274445B1 (ko) 2013-12-19 2021-07-08 아미리스 인코퍼레이티드 게놈 삽입을 위한 방법
JP6747974B2 (ja) 2014-01-08 2020-08-26 プレジデント アンド フェローズ オブ ハーバード カレッジ Rna誘導型遺伝子ドライブ
JP6479024B2 (ja) 2014-01-24 2019-03-06 ザ チルドレンズ メディカル センター コーポレーション 抗体親和性の最適化のための高スループットマウスモデル
WO2015117041A1 (en) 2014-01-30 2015-08-06 Nair Ramesh B Gene modification-mediated methods and compositions for generating dominant traits in eukaryotic systems
US10233456B2 (en) 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
EP3114227B1 (en) 2014-03-05 2021-07-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
WO2015138510A1 (en) 2014-03-10 2015-09-17 Editas Medicine., Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
EP3116533B1 (en) 2014-03-12 2020-08-12 Precision Biosciences, Inc. Dystrophin gene exon deletion using engineered nucleases
IL247679B1 (en) 2014-03-14 2024-07-01 Cibus Europe Bv Methods and compositions for increasing the efficiency of targeted gene modification through the use of oligonucleotide-mediated gene repair
EP3122877B1 (en) 2014-03-26 2023-03-22 University of Maryland, College Park Targeted genome editing in zygotes of domestic large animals
GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
WO2015163733A1 (en) 2014-04-24 2015-10-29 Institute For Basic Science A method of selecting a nuclease target sequence for gene knockout based on microhomology
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
US20170088819A1 (en) 2014-05-16 2017-03-30 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
JP2017518372A (ja) 2014-05-30 2017-07-06 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 潜伏性ウイルス感染用の処置剤を送達するための組成物および方法
EP3708671A1 (en) 2014-06-06 2020-09-16 Regeneron Pharmaceuticals, Inc. Methods and compositions for modifying a targeted locus
AU2015277369B2 (en) 2014-06-16 2021-08-19 The Johns Hopkins University Compositions and methods for the expression of CRISPR guide RNAs using the H1 promoter
US9902971B2 (en) 2014-06-26 2018-02-27 Regeneron Pharmaceuticals, Inc. Methods for producing a mouse XY embryonic (ES) cell line capable of producing a fertile XY female mouse in an F0 generation
KR20170032406A (ko) 2014-07-15 2017-03-22 주노 쎄러퓨티크스 인코퍼레이티드 입양 세포 치료를 위한 조작된 세포
US9944933B2 (en) 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
WO2016011428A1 (en) 2014-07-17 2016-01-21 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Methods of treating cells containing fusion genes
ES2730378T3 (es) 2014-08-27 2019-11-11 Caribou Biosciences Inc Procedimientos para incrementar la eficiencia de la modificación mediada por Cas9
EP3188763B1 (en) 2014-09-02 2020-05-13 The Regents of The University of California Methods and compositions for rna-directed target dna modification
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
AU2015323973A1 (en) 2014-09-29 2017-04-20 The Jackson Laboratory High efficiency, high throughput generation of genetically modified mammals by electroporation
AU2015324935B2 (en) 2014-10-01 2021-04-08 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
EP3204496A1 (en) 2014-10-10 2017-08-16 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
WO2016061073A1 (en) 2014-10-14 2016-04-21 Memorial Sloan-Kettering Cancer Center Composition and method for in vivo engineering of chromosomal rearrangements
ES2741387T3 (es) 2014-10-15 2020-02-10 Regeneron Pharma Métodos y composiciones para generar o mantener células pluripotentes
WO2016061481A1 (en) 2014-10-17 2016-04-21 The Penn State Research Foundation Methods and compositions for multiplex rna guided genome editing and other rna technologies
US20170306306A1 (en) 2014-10-24 2017-10-26 Life Technologies Corporation Compositions and Methods for Enhancing Homologous Recombination
WO2016073955A2 (en) 2014-11-06 2016-05-12 President And Fellows Of Harvard College Cells lacking b2m surface expression and methods for allogeneic administration of such cells
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
SI3221457T1 (sl) 2014-11-21 2019-08-30 Regeneron Pharmaceuticals, Inc. Postopki in sestavki za ciljno genetsko modifikacijo z uporabo vodilnih RNK v parih
KR20170081268A (ko) 2014-11-27 2017-07-11 단지거 이노베이션즈 엘티디. 게놈 편집용 핵산 구조체
US20170266320A1 (en) 2014-12-01 2017-09-21 President And Fellows Of Harvard College RNA-Guided Systems for In Vivo Gene Editing
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
EP3230452A1 (en) 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
WO2016097751A1 (en) 2014-12-18 2016-06-23 The University Of Bath Method of cas9 mediated genome engineering
WO2016100819A1 (en) 2014-12-19 2016-06-23 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modification through single-step multiple targeting
EP3239298A4 (en) 2014-12-26 2018-06-13 Riken Gene knockout method
WO2016112242A1 (en) 2015-01-08 2016-07-14 President And Fellows Of Harvard College Split cas9 proteins
EP3242938B1 (en) 2015-01-09 2020-01-08 Bio-Rad Laboratories, Inc. Detection of genome editing
CN107429263A (zh) 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
WO2016130697A1 (en) 2015-02-11 2016-08-18 Memorial Sloan Kettering Cancer Center Methods and kits for generating vectors that co-express multiple target molecules
GB2535532B (en) 2015-02-23 2021-05-12 Knorr Bremse Systeme Fuer Nutzfahrzeuge Gmbh Brake valve arrangement
EP3262171A2 (en) 2015-02-23 2018-01-03 Crispr Therapeutics AG Materials and methods for treatment of hemoglobinopathies
US20180200387A1 (en) 2015-02-23 2018-07-19 Crispr Therapeutics Ag Materials and methods for treatment of human genetic diseases including hemoglobinopathies
US11261466B2 (en) 2015-03-02 2022-03-01 Sinai Health System Homologous recombination factors
GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
WO2016154579A2 (en) 2015-03-26 2016-09-29 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
MX2017012407A (es) 2015-03-27 2018-03-07 Harvard College Celulas t modificadas y métodos para hacer y usar las mismas.
EP3277816B1 (en) 2015-04-01 2020-06-17 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
US20180346879A1 (en) 2015-04-22 2018-12-06 Genea Ip Holdings Pty Limited Generation of muscle-lineage clels from stem cells
EP3289081B1 (en) 2015-04-27 2019-03-27 Genethon Compositions and methods for the treatment of nucleotide repeat expansion disorders
WO2016176690A2 (en) 2015-04-30 2016-11-03 The Trustees Of Columbia University In The City Of New York Gene therapy for autosomal dominant diseases
CN107849547B (zh) 2015-05-16 2022-04-19 建新公司 深内含子突变的基因编辑
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
KR20180054871A (ko) 2015-10-08 2018-05-24 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 다중화 게놈 편집
AU2016341041A1 (en) 2015-10-20 2018-03-15 Pioneer Hi-Bred International, Inc. Methods and compositions for marker-free genome modification
EP3370513A1 (en) 2015-11-06 2018-09-12 The Jackson Laboratory Large genomic dna knock-in and uses thereof
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017173004A1 (en) 2016-03-30 2017-10-05 Mikuni Takayasu A method for in vivo precise genome editing
EP3443080B1 (en) 2016-04-13 2021-08-11 University of Massachusetts Repairing compound heterozygous recessive mutations by allele exchange
AU2017268458B2 (en) 2016-05-20 2022-07-21 Regeneron Pharmaceuticals, Inc. Methods for breaking immunological tolerance using multiple guide RNAS
WO2019148166A1 (en) 2018-01-29 2019-08-01 Massachusetts Institute Of Technology Methods of enhancing chromosomal homologous recombination

Also Published As

Publication number Publication date
HRP20190949T1 (hr) 2019-07-26
AU2021290301A1 (en) 2022-01-27
AU2015349692B2 (en) 2021-10-28
PT3221457T (pt) 2019-06-27
AU2015349692A1 (en) 2017-06-08
HUE044907T2 (hu) 2019-11-28
JP2017535271A (ja) 2017-11-30
KR102531016B1 (ko) 2023-05-10
NZ731962A (en) 2022-07-01
EP3221457B1 (en) 2019-03-20
CY1121738T1 (el) 2020-07-31
KR102415093B1 (ko) 2022-07-04
LT3221457T (lt) 2019-06-10
PL3221457T3 (pl) 2019-09-30
JP6727199B2 (ja) 2020-07-22
IL283585B1 (en) 2023-05-01
US10457960B2 (en) 2019-10-29
IL252181B (en) 2021-06-30
MX2017006670A (es) 2018-03-01
SG11201703747RA (en) 2017-06-29
EP3521437A1 (en) 2019-08-07
EP3221457A2 (en) 2017-09-27
DK3221457T3 (da) 2019-06-03
CA3176380A1 (en) 2016-05-26
JP7101211B2 (ja) 2022-07-14
SI3221457T1 (sl) 2019-08-30
KR20230070319A (ko) 2023-05-22
IL301900A (en) 2023-06-01
US11697828B2 (en) 2023-07-11
WO2016081923A2 (en) 2016-05-26
RU2017121367A3 (es) 2019-11-05
CN107208078B (zh) 2021-07-16
WO2016081923A3 (en) 2016-07-07
JP2020191880A (ja) 2020-12-03
CN107208078A (zh) 2017-09-26
US20160145646A1 (en) 2016-05-26
IL283585B2 (en) 2023-09-01
RS58893B1 (sr) 2019-08-30
KR102683423B1 (ko) 2024-07-10
MX2022000378A (es) 2022-02-10
US20200002731A1 (en) 2020-01-02
IL252181A0 (en) 2017-07-31
IL283585A (en) 2021-07-29
CN113444747A (zh) 2021-09-28
SG10201913829YA (en) 2020-03-30
RU2020134412A (ru) 2020-11-11
AU2021290301B2 (en) 2024-02-29
RU2734770C2 (ru) 2020-10-23
RU2017121367A (ru) 2018-12-21
KR20220093013A (ko) 2022-07-04
US20200002730A1 (en) 2020-01-02
US20230332185A1 (en) 2023-10-19
BR112017010547A2 (pt) 2018-02-27
KR20170102234A (ko) 2017-09-08
CA2968440A1 (en) 2016-05-26

Similar Documents

Publication Publication Date Title
ES2731437T3 (es) Métodos y composiciones para la modificación genética dirigida mediante el uso de pares de ARN guías
ES2947714T3 (es) Métodos y composiciones para la modificación genética dirigida a través de múltiples direccionamientos en un solo paso
ES2901074T3 (es) Métodos y composiciones para modificaciones genéticas objetivo y métodos de uso
BR112016030147B1 (pt) Método para modificar um locus-alvo genômico em um cromossomo y em uma célula tronco embrionária de camundongo (es)