ES2902338T3 - Método para modificar una secuencia genómica que convierte específicamente una nucleobase de una secuencia de ADN diana, y complejo molecular utilizado en dicho método - Google Patents

Método para modificar una secuencia genómica que convierte específicamente una nucleobase de una secuencia de ADN diana, y complejo molecular utilizado en dicho método Download PDF

Info

Publication number
ES2902338T3
ES2902338T3 ES16844434T ES16844434T ES2902338T3 ES 2902338 T3 ES2902338 T3 ES 2902338T3 ES 16844434 T ES16844434 T ES 16844434T ES 16844434 T ES16844434 T ES 16844434T ES 2902338 T3 ES2902338 T3 ES 2902338T3
Authority
ES
Spain
Prior art keywords
target
deaminase
dna
nucleic acid
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16844434T
Other languages
English (en)
Inventor
Keiji Nishida
Satomi Kojima
Akihiko Kondo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe University NUC
Original Assignee
Kobe University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe University NUC filed Critical Kobe University NUC
Application granted granted Critical
Publication of ES2902338T3 publication Critical patent/ES2902338T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1024In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Un método no terapéutico para modificar un sitio diana de un ADN bicatenario en una célula hospedadora, comprendiendo el método, introducir (a) un ADN que codifica un ARNcr que comprende una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana en el ADN bicatenario dado, y (b) un ADN que codifica un grupo proteico que constituye Cascade y una desaminasa, en el que la desaminasa es capaz de formar un complejo con CasE en el grupo proteico en la célula hospedadora para convertir uno o más nucleótidos en el sitio diana en uno o más nucleótidos distintos sin escindir el ADN bicatenario en el sitio diana, en donde el complejo carece de Cas3, Cas1, Cas2 y Cas4, y en donde el grupo proteico que constituye Cascade comprende CasA, CasB, CasC, CasD y CasE, y en donde el método no es un procedimiento para modificar la identidad genética de la estirpe germinal de seres humanos.

Description

DESCRIPCIÓN
Método para modificar una secuencia genómica que convierte específicamente una nucleobase de una secuencia de ADN diana, y complejo molecular utilizado en dicho método
[Campo técnico]
La presente invención se refiere a un método para modificar una secuencia genómica sin escindir un ADN bicatenario ni insertar un fragmento de ADN exógeno y permitir la modificación de una base de ácido nucleico dentro de una región particular del genoma, y a un complejo de un módulo de secuencias de reconocimiento de ácido nucleico y una desaminasa que se utilizará para ello.
[Antecedentes de la técnica]
En los últimos años, la edición genómica está atrayendo la atención como una técnica para modificar el gen y la región genómica diana en varias especies. Convencionalmente, como método de edición genómica, se ha propuesto un método que utiliza una nucleasa artificial que comprende una molécula que tiene la capacidad de escindir ADN independiente de la secuencia y una molécula que tiene la capacidad de reconocer una secuencia en combinación (documento no de patente 1).
Por ejemplo, se ha informado acerca de un método para llevar a cabo la recombinación en un locus de un gen diana en el ADN de una célula vegetal o de insecto como hospedador, usando una nucleasa con dedos de zinc (ZFN, zinc finger nuclease) en donde se unen un dominio de unión a ADN con dedos de zinc y un dominio de escisión de ADN inespecífico (documento de patente 1), un método para escindir o modificar un gen diana en una secuencia de nucleótidos particular o en un sitio adyacente a la misma utilizando TALEN (siglas del inglés, transcription activatorlike effector nuclease, nucleasa efectora con actividad similar al activador de la transcripción), en donde están unidos un efector similar a un activador de la transcripción (TAL, siglas del inglés transcription activator-like), que es un módulo de unión al ADN que tiene la bacteria fitopatógena, Xanthomonas, y una ADN endonucleasa (documento de patente 2), un método que utiliza el sistema CRISPR-Cas9 en donde se combinan una secuencia de ADN CRISPR (siglas del inglés clustered regularly interspaced short palindromic repeats, repeticiones palindrómicas cortas agrupadas regularmente interespaciadas) que funciona en un sistema inmunitario adquirido que poseen las eubacterias y las arqueobacterias, y la familia de proteínas nucleasas Cas (asociadas a CRISPR) que tienen una función importante junto con CRISPR (documento de patente 3) y métodos similares. Además, también se ha informado acerca de un método de escisión de un gen diana en las proximidades de una secuencia particular, usando una nucleasa artificial en donde se unen una proteína con PPR constituida para reconocer a una secuencia de nucleótidos particular mediante una continuación de motivos PPR que consisten en 35 aminoácidos cada uno de ellos y que reconoce una base de ácido nucleico, y la nucleasa (documento de patente 4).
Las técnicas de edición genómica propuestas hasta ahora presuponen básicamente roturas de ADN bicatenario (DSB, siglas del inglés double stranded DNA breaks). Sin embargo, dado que incluyen modificaciones genómicas inesperadas, se producen efectos secundarios, tales como fuerte citotoxicidad, reordenamiento cromosómico y efectos similares, y acarrean problemas comunes que influyen en la fiabilidad de la terapia génica, un número extremadamente pequeño de células supervivientes por modificación de nucleótidos, y dificultad en la propia modificación genética en óvulos de primates y microorganismos unicelulares.
Como técnica de edición genómica no acompañada por DSB, se ha propuesto una enzima artificial obtenida combinando una molécula que tiene una capacidad de reconocimiento de secuencias, tal como un motivo de dedo de zinc (ZF, zinc finger) y similar y una desaminasa que convierte un grupo amino de una base de ácido nucleico en un grupo carbonilo (documento de patente 5). Sin embargo, no existen pruebas experimentales, y no está claro si la modificación genética es del todo posible, por no hablar de la eficacia de la introducción de mutaciones. De hecho, como un sistema que tampoco viene acompañado de escisión genómica, un método que utiliza ADN glucosilasa que cataliza la reacción de desaminación en la cadena de ADN, muestra una eficiencia de introducción de mutaciones extremadamente baja incluso cuando se usa como hospedador una levadura mutante con un mecanismo de reparación de ADN atenuado (documento no de patente 2), y la puesta en práctica de la terapia génica, la reproducción molecular de organismos útiles y similares está más lejos, tal como está la situación. En el documento WO 2013/098244 (documento de patente 6) se desvelan ribonucleoproteínas Cascade modificadas y usos de las mismas. En el documento WO 2015/089406 (documento de patente 7) se desvelan variantes de CAS para la edición génica, tales como proteínas de fusión de CAS9 y enzimas de edición de ácidos nucleicos. En el documento WO 2015/035136 (documento de patente 8) se desvelan sistemas de suministro de proteínas efectoras funcionales que utilizan lípidos catiónicos y polímeros catiónicos.
[Lista de documentos]
[Documentos de patente]
documento de patente 1: JP-B-4968498
documento de patente 2: publicación nacional de solicitud de patente internacional n.° 2013-513389
documento de patente 3: publicación nacional de solicitud de patente internacional n.° 2010-519929
documento de patente 4: JP-A-2013-128413
documento de patente 5: US-A-2011/0104787
documento de patente 6: WO 2013/098244
documento de patente 7: WO 2015/089406
documento de patente 8: WO 2015/035136
[documento no de patente]
documento no de patente 1: Kelvin M Esvelt, Harris H Wang (2013) Genome-scale engineering for systems and synthetic biology, Molecular Systems Biology 9: 641
documento no de patente 2: Prashant Mali, Kevin M Esvelt, George M Church (2013) Nucleic Acids Res. 41: e99
[Sumario de la invención]
[Problemas a resolver con la invención]
Por lo tanto, un objeto de la presente invención es proporcionar un nuevo método de edición genómica para convertir una base de ácido nucleico en una secuencia particular de un gen sin DSB ni inserción de un fragmento de ADN exógeno, y un complejo de un módulo de secuencias de reconocimiento de ácido nucleico y una desaminasa para ello.
[Medios para resolver los problemas]
Los presentes inventores ya han logrado modificar eficazmente, sin acompañamiento de DSB, una secuencia genómica en una región que contiene una secuencia de ADN particular, usando un sistema CRISPR-Cas de Tipo II que tiene una Cas9 mutante, en el que se ha inactivado la capacidad de escisión de una o de las dos cadenas de un ADN bicatenario, como un módulo de secuencias de reconocimiento de ácido nucleico y una desaminasa como una enzima convertidora de bases de ácido nucleico (documento WO 2015/133554). Sin embargo, dado que la proteína Cas reconoce y se une a una secuencia denominada motivo adyacente de protoespaciador (PAM, siglas de inglés protospacer adjacent motif) en una cadena de ADN, el sitio de introducción de la mutación estará limitado por la presencia o no de PAM. Cas9 (SpCas9) procedente de Streptococcus pyogenes en el sistema CRISPR-Cas de tipo II, que actualmente se usa con frecuencia para la edición genómica, reconoce NGG (N es cualquier base) como PAM. La investigación realizada por los presentes inventores también ha esclarecido que la secuencia de nucleótidos que se dirigirá en el CRISPR de tipo II (es decir, la secuencia de nucleótidos en la cadena complementaria de ADN al ARN guía) tiene una longitud de PAM de 18-25 nucleótidos cadena arriba en dirección 5' y, a pesar de su longitud, la conversión de bases se produce con mayor frecuencia en las posiciones de 2 - 5 nucleótidos desde el extremo 5' de la secuencia de nucleótidos diana.
Por otra parte, se sabe, que en el sistema CRISPR-Cas de tipo I-E de Escherichia coli y similar, ATG, AAG, AGG o GAG adyacentes al lado 5' de la secuencia de nucleótidos diana con una longitud de 32 - 33 nucleótidos, se reconocen como secuencia PAM (véase la figura 1; en las figuras 1D y E, se muestra el caso de AAG como secuencia PAM), y otros sistemas CRISPR-Cas de Tipo I también reconocen secuencias PAM específicas de 2 o 3 bases. Por lo tanto, si el sistema CRISPR-Cas de Tipo I puede usarse como módulo de secuencias de reconocimiento de ácido nucleico, la conversión de bases puede realizarse en un sitio donde la introducción de la mutación es difícil para Cas9 debido a la restricción de la secuencia PAM y al sitio de introducción de la mutación.
En el sistema CRISPR/Cas de Tipo II, un módulo de secuencias de reconocimiento de ácido nucleico podría estar constituido solo por un ARN quimérico de ARNcr complementario a la secuencia de nucleótidos diana y al ARNcr que actúa en trans (ARNcrtra) para el reclutamiento de Cas 9 y Cas9. Sin embargo, por ejemplo, en el sistema CRISPR-Cas de Tipo I-E de Escherichia coli, un complejo de ribonucleoproteína complicado compuesto por 5 tipos de proteínas Cas (CasA, CasB, CasC, CasD y CasE) que presentan ARNcr, que se denomina complejo asociado a CRISPR para la defensa antivírica (Cascade), reconoce la secuencia de nucleótidos diana y la secuencia PAM. Combinado con Cas3 que tiene actividades nucleasa y helicasa, el complejo presenta una función de reconocimiento y escisión de ADN similar a la de Cas9 en el sistema CRISPR-Cas de Tipo II (véase la figura 1). Debido a dicha constitución tan complicada, el sistema CRISPR-Cas de Tipo I apenas se ha utilizado como nucleasa artificial ni siquiera en la técnica de edición genómica.
Los presentes inventores prepararon un ADN que codifica un ARN CRISPR (siglas del inglés Clustered Regularly Interspaced Short Palindromic Repeats, repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas) genómico específico en el que el asa 5' y el asa 3', necesarios para la correcta presentación en Cascade, están unidos en ambos extremos de una secuencia complementaria a la cadena diana de la secuencia de nucleótidos diana del gen rpoB, que es un gen esencial de Escherichia coli (ARNcr). Por otra parte, aislaron el grupo de genes casA - casE necesarios para la constitución de Cascade a partir del operón Cas de Escherichia coli, unieron un gen de desaminasa al mismo para producir un ADN, e introdujeron estos ADN en una Escherichia coli hospedadora que contenía un gen a modificar. Como resultado, introdujeron con éxito una mutación en la secuencia de nucleótidos diana del gen de interés y en sus proximidades, sin acompañamiento de escisión de ADN genómico. Además, se descubrió que la citosina a 32-44 bases en dirección 3' de la secuencia PAM, se edita principalmente cuando la longitud de la secuencia de nucleótidos diana se establece a 32 nucleótidos, a diferencia del uso de Cas9.
Los presentes inventores han realizado estudios adicionales basados en estos hallazgos y han completado la presente invención.
Es decir, la presente invención es como se describe a continuación.
[1] Un método no terapéutico para modificar un sitio diana de un ADN bicatenario en una célula hospedadora, comprendiendo el método, introducir
(a) un ADN que codifica un ARNcr que comprende una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana en el ADN bicatenario dado, y
(b) un ADN que codifica un grupo proteico que constituye Cascade y una desaminasa, en el que la desaminasa está constituida en una forma capaz de formar un complejo con CasE en el grupo proteico en la célula hospedadora para convertir uno o más nucleótidos en el sitio diana en otro o más nucleótidos sin escindir el ADN bicatenario en el sitio diana, en donde el complejo carece de Cas3, Cas1, Cas2 y Cas4, y en donde el grupo proteico mencionado anteriormente que constituye Cascade comprende CasA, CasB, CasC, CasD y CasE, en donde el método no es un procedimiento para modificar la identidad genética de la estirpe germinal de seres humanos.
[2] El método del punto [1] mencionado anteriormente, en donde la Cascade mencionada anteriormente procede de Escherichia coli.
[3] El método de los puntos [1] o [2] mencionados anteriormente, en donde la desaminasa mencionada anteriormente es citidina desaminasa.
[4] El método de cualquiera de los puntos [1] a [3] mencionados anteriormente, en donde la célula hospedadora mencionada anteriormente es una célula procariota.
[5] El método de cualquiera de los puntos [1] a [4] mencionados anteriormente, que comprende un etapa de introducir un vector de expresión que comprende los ADN de los apartados (a) y (b) mencionados anteriormente en una forma capaz de controlar un período de expresión en la célula hospedadora mencionada anteriormente, e inducir la expresión de los ADN durante un período necesario para fijar la modificación del sitio diana en el ADN bicatenario.
[6] El método del punto [5] mencionado anteriormente, en donde la secuencia de nucleótidos diana en el ADN bicatenario está presente en un gen que es esencial para la célula hospedadora mencionada anteriormente.
[7] Un complejo enzimático modificador de ácido nucleico para modificar un sitio diana de un ADN bicatenario en una célula hospedadora, comprendiendo el complejo
(a) un ARNcr que comprende una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana en el ADN bicatenario dado, y
(b) un complejo enzimático modificador de ácido nucleico que comprende un grupo proteico que constituye Cascade, y una desaminasa que ha formado un complejo con CasE en el grupo proteico, en donde el complejo carece de Cas3, Cas1, Cas2 y Cas4, y en donde el grupo proteico mencionado anteriormente que constituye Cascade comprende CasA, CasB, CasC, CasD y CasE.
[8] El complejo enzimático modificador de ácido nucleico según el punto [7] mencionado anteriormente, en donde el complejo Cascade procede de Escherichia coli.
[9] El complejo enzimático modificador de ácido nucleico según los puntos [7] u [8] mencionados anteriormente, en donde la desaminasa es citidina desaminasa.
[10] Un ADN que codifica el complejo enzimático modificador de ácido nucleico de cualquiera de los puntos [7] a [9] mencionados anteriormente.
[Efecto de la invención]
La técnica de edición genómica de la presente invención no acompaña a la inserción de un ADN exógeno ni a la escisión de ADN bicatenario. Por lo tanto, es superior en cuanto a seguridad y tiene no pocas posibilidades de convertirse en una solución a los casos asociados a las disputas biológicas o legales de la recombinación de genes en los métodos convencionales. Además, utilizando Cascade como un módulo de secuencias de reconocimiento de ácido nucleico, puede utilizarse la secuencia PAM, que es diferente de la de Cas9, e introducirse una mutación sumamente frecuente en un sitio diferente, lo que amplía la elección del sitio en el que puede introducirse una mutación en el gen diana.
[Breve descripción de los dibujos]
En la figura 1 se muestra esquemáticamente el operón de cas en el genoma de Escherichia coli y el locus del gen CRISPR (A), la estructura de ARNcr (B), la estructura de Cascade (C), la estructura del bucle R producido cuando Cascade reconoce y se une a la secuencia de nucleótidos diana (D), y la comparación de las secuencias de nucleótidos diana y las secuencias PAM de Cas9 y Cascade (E).
En la figura 2 se muestra la constitución de los subtipos (I-A a I-F) respectivos del grupo de genes cas en el sistema CRISPR-Cas de Tipo I.
La figura 3 es una representación esquemática que muestra la estructura (parte superior) de la mayor parte del vector representativo utilizado en la presente invención, y la modificación genética (parte inferior) por el complejo enzimático modificador de ácido nucleico de la presente invención producido a partir del vector.
La figura 4 hace referencia a un mapa físico y a la información de secuencia detallada del vector utilizado en los ejemplos.
En la figura 5-1 se muestran los resultados de secuenciación de la secuencia de nucleótidos diana y sus proximidades en la colonia resistente a rifampicina obtenida mediante la modificación del gen rpoB utilizando un complejo Cascade-desaminasa. Se utilizaron las dianas 3r y 5r.
En la figura 5-2 se muestran los resultados de secuenciación de la secuencia de nucleótidos diana y sus proximidades en la colonia resistente a rifampicina obtenida mediante la modificación del gen rpoB utilizando un complejo Cascade-desaminasa. Se utilizó la diana 4r.
[Descripción de las realizaciones]
La presente invención proporciona un método no terapéutico para modificar un sitio diana de un ADN bicatenario mediante la conversión de la secuencia de nucleótidos y de los nucleótidos diana en las proximidades de la misma en el ADN bicatenario, en otros nucleótidos, sin escindir el ADN bicatenario que se va a modificar en la célula hospedadora (en lo sucesivo en el presente documento también se denominará "el método de la presente invención"). El método de la presente invención no es un procedimiento para modificar la identidad genética de la estirpe germinal de seres humanos. El método contiene característicamente una etapa de puesta en contacto de un complejo en donde un módulo de secuencias de reconocimiento de ácido nucleico que se une específicamente a la secuencia de nucleótidos diana en el ADN bicatenario en la célula hospedadora y una desaminasa se unen con el ADN bicatenario para convertir el sitio diana, es decir, la secuencia de nucleótidos y los nucleótidos diana en sus proximidades, en otros nucleótidos.
En la presente invención, la "modificación" de un ADN bicatenario significa que, en una cadena de ADN, un nucleótido (p. ej., dC) se convierte en otro nucleótido (p. ej., dT, dA o dG). Aunque el ADN bicatenario que se va a modificar no está particularmente limitado siempre que sea un ADN bicatenario presente en la célula hospedadora, este es, preferentemente, un ADN genómico. La expresión "sitio diana" de un ADN bicatenario significa la "secuencia de nucleótidos diana" total o parcial, que reconoce específicamente un módulo de secuencias de reconocimiento de ácido nucleico y que se une a la secuencia de nucleótidos diana o a las proximidades de la misma (una o ambas cadena arriba en dirección 5' y cadena abajo en dirección 3').
En la presente invención, la expresión "módulo de secuencias de reconocimiento de ácido nucleico" significa una molécula o complejo de moléculas que tiene la capacidad de reconocer y unirse específicamente a una secuencia de nucleótidos particular (es decir, secuencia de nucleótidos diana) en una cadena de ADN. La unión del módulo de secuencias de reconocimiento de ácido nucleico a una secuencia de nucleótidos diana permite que una desaminasa unida al módulo actúe específicamente en un sitio diana de un ADN bicatenario.
En la presente divulgación, la expresión "enzima convertidora de bases de ácido nucleico" significa una enzima capaz de convertir un nucleótido diana en otro nucleótido catalizando una reacción para convertir un sustituyente en un anillo de purina o pirimidina en una base de ADN en otro grupo o átomo, sin escindir la cadena de ADN.
En la presente invención, la expresión "complejo enzimático modificador de ácido nucleico" significa un complejo molecular que comprende un complejo en donde el módulo de secuencias de reconocimiento de ácido nucleico mencionado anteriormente y una desaminasa están unidos, cuyo complejo molecular cuenta con una capacidad de reconocimiento de secuencias de nucleótidos particular y actividad desaminasa. En el presente documento, "complejo" no solo incluye uno constituido por múltiples moléculas, sino también uno que tiene un módulo de secuencias de reconocimiento de ácido nucleico y una desaminasa en una sola molécula, como una proteína de fusión.
La desaminasa que se utiliza en la presente invención no está particularmente limitada siempre que pueda catalizar la reacción mencionada anteriormente, y como ejemplos de la misma se incluyen una desaminasa perteneciente a la superfamilia de ácido nucleico/nucleótido desaminasa, que cataliza una reacción de desaminación que convierte un grupo amino en un grupo carbonilo. Como ejemplos preferentes de la misma se incluyen citidina desaminasa capaz de convertir citosina o 5-metilcitosina en uracilo o timina, respectivamente, adenosina desaminasa capaz de convertir adenina en hipoxantina, guanosina desaminasa capaz de convertir guanina en xantina y similares. Como citidina desaminasa, se prefiere más la citidina desaminasa inducida por activación (en lo sucesivo también denominada AID, por las siglas del inglés activation-induced cytidine deaminase), que es una enzima que introduce una mutación en un gen de inmunoglobulina en el sistema de inmunidad adquirida de vertebrados o similares.
Aunque la procedencia de la desaminasa no está particularmente limitada, puede utilizarse, por ejemplo, PmCDA1 (por las siglas del inglés Petromyzon marinus cytidine deaminase 1, citosina desaminasa 1 procedente de Petromyzon marinus) o AID (por las siglas del inglés, activation-induced cytidine deaminase; AICDA) procedente de vertebrados (p. ej., de mamíferos, tales como, ser humano, cerdo, bovino, perro, chimpancé y similares, aves, tales como pollo y similares, anfibios, tales como los del género Xenopus y similares, peces, tales como, pez cebra, ayu, pez gato de canal y similares). En las SEQ ID NO: 1 y 2 se muestra la secuencia de bases y la secuencia de aminoácidos de la CDS (por las siglas del inglés, Coding Sequence, secuencia codificante) de PmCDA1 (citosina desaminasa 1 procedente de Petromyzon marinus).
Como módulo de secuencias de reconocimiento de ácido nucleico en el complejo enzimático modificador de ácido nucleico de la presente invención, se utiliza específicamente un sistema CRISPR-Cas de Tipo I.
Como moléculas que tienen la capacidad de ser secuencias de reconocimiento de ácido nucleico, se conocen motivos de dedo de zinc (ZF), efectores TAL, motivos de PPR y similares. Sin embargo, la eficiencia de producción de ZF de un motivo de ZF que se una específicamente a la secuencia de nucleótidos diana no es alta y la selección de ZF que tenga una alta especificidad de unión es complicada y, por lo tanto, no es fácil producir una gran cantidad de motivos de ZF que realmente funcionen. Por otra parte, aunque el efector TAL y el motivo de PPR tienen un alto grado de libertad en el reconocimiento de la secuencia de ácido nucleico diana en comparación con ZF, dado que cada vez es necesario diseñar y construir una proteína de gran tamaño de acuerdo con la secuencia de nucleótidos diana, existe un problema en cuanto a eficiencia. En cambio, el sistema CRISPR-Cas, que es un mecanismo en el sistema de inmunidad adquirida muy distribuido en eubacterias y arqueobacterias, puede dirigirse a cualquier secuencia simplemente sintetizando un oligoADN capaz de formar específicamente un híbrido con la secuencia de nucleótidos diana ya que el CRISPR-ARN (ARNcr) complementario a la secuencia de nucleótidos diana, reconoce la secuencia del ADN bicatenario diana.
En la presente memoria descriptiva, la expresión "secuencia de nucleótidos diana" significa una secuencia de ADN bicatenario a la que se une un módulo de secuencias de reconocimiento de ácido nucleico (específicamente, CRISPR-Cas de tipo I), y una cadena que se hibrida con ARNcr se denomina "cadena diana", y una cadena opuesta a la misma que se convierte en monocatenaria por hibridación con una cadena diana y ARNcr se denomina "cadena no diana". Dado que con frecuencia, generalmente se produce una reacción de conversión de bases de ácido nucleico en una cadena monocatenaria, no diana, cuando la secuencia de nucleótidos diana se va a expresar mediante una sola cadena (p. ej., cuando se indica una secuencia PAM, cuando se muestra una relación posicional de la secuencia de nucleótidos diana y PAM, etc.), esta se representa mediante una secuencia de una cadena no diana.
El sistema CRISPR-Cas se divide en gran parte en tres tipos. Uno de los más utilizados en la actualidad para la edición genómica es el sistema CRISPR-Cas de tipo II, en el que Cas9 tiene tanto una capacidad de reconocer secuencias de ADN como una actividad nucleasa. Por otra parte, en el sistema CRISPR-Cas de Tipo II, la función se comparte entre el complejo de proteínas Cas, Cascade, que presenta ARNcr que contiene una secuencia complementaria a la secuencia de nucleótidos diana y que reconoce la secuencia de nucleótidos diana, y Cas3 que tiene actividades nucleasa y helicasa. Por lo tanto, la DSB con fuerte citotoxicidad puede impedirse simplemente eliminando Cas3 del operón de Cas incluso sin tener que utilizar un mutante con capacidad de escisión inactivada de al menos una cadena de un ADN bicatenario de tipo Cas9. Es decir, (a) un ADN que codifica un ARNcr quimérico en el que el asa 5' y el asa 3' del ARNcr están unidos en una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana (secuencia diana), y (b) un ADN que codifica un grupo proteico que constituye un complejo Cascade y una desaminasa se introducen en una célula hospedadora que tiene un ADN bicatenario que va a modificarse y expresarse para formar un complejo Cascade compuesto por el ARNcr que contiene la secuencia diana y el grupo proteico en la célula hospedadora, mediante lo cual la secuencia de nucleótidos diana puede identificarse en el ADN bicatenario. El ADN que codifica la desaminasa se dispone en el ADN del apartado (b) mencionado anteriormente de tal manera que, en este caso, la desaminasa se expresa en una forma capaz de formar un complejo con CasE en el grupo proteico que constituye el complejo Cascade. De este modo, la desaminasa puede convertir la secuencia de nucleótidos y las bases de ácido nucleico diana reconocidas en sus proximidades y unirse a través del complejo Cascade a otras bases.
Se sabe que el sistema CRISPR-Cas de Tipo I contiene seis subtipos de A a F. En la figura 2 se muestra esquemáticamente los operones de Cas de los subtipos I-A a I-F. En el operón de cada subtipo, excluyendo a Cas3 que es una nucleasa/helicasa, Cas1 participa en la escisión de genes exógenos durante la adquisición de la inmunidad, Cas2 y Cas4 constituyen el complejo Cascade. En los subtipos I-E, Cse1, Cse2, Cas7, Cas5 y Cas6e también se denominan, respectivamente, CasA, CasB, CasC, CasD y CasE (véase la figura 1; en la presente memoria descriptiva se utilizan los últimos nombres). En el subtipo I-E, un complejo Cascade está formado por una molécula de CasA, CasB, CasC, CasD y CasE, respectivamente, a una proporción 1:2:6:1:1 de molécula de ARNcr (véase la figura 1). En el subtipo I-E, se considera que CasA juega un papel importante en la identificación de la secuencia PAM (ATG, AAG, AGG o GAG).
En las arqueobacterias se distribuyen relativamente muchos subtipos I-A, I-B e I-D mientras que en las eubacterias se distribuyen relativamente muchos subtipos I-C, I-E e I-F. El subtipo I-A se analiza en S. solfataricus, T. tenaxy especies similares, El subtipo I-B se analiza en Haloferax volcanii y especies similares, El subtipo de I-C se analiza en B. halodurans y especies similares, El subtipo I-E se analiza en Escherichia coli y especies similares, y el subtipo I-F se analiza en P. aeruginosa, Escherichia coli, P. atospeticum y especies similares.
Por lo tanto, un ADN que codifique un grupo proteico que constituya un complejo Cascade puede obtenerse, por ejemplo, aislando una región que contenga el ORF (open reading frame, marco abierto de lectura) de cas5 a partir de csa5 en el caso del subtipo I-A, una región que contenga el ORF de cas5 a partir de csa6 en el caso del subtipo I-B, una región que contenga el ORF de cas7 a partir de csa5 en el caso del subtipo I-C, una región que contenga el ORF de casE a partir de casA en el caso del subtipo I-E, una región que contenga el ORF de cas6f de csy1 en el caso del subtipo I-F, a partir del operón de cas mediante PCR genómica usando, como molde, ADN genómico procedente de la cepa bacteriana mencionada anteriormente. Preferentemente, los grupos proteicos que constituyen los complejos Cascade son CasA, CasB, CasC, CasD y CasE que constituyen complejos Cascade de los subtipos I-E, más preferentemente CasA, CasB, CasC, CasD y CasE procedentes de Escherichia coli. Las secuencias del ORF (marco abierto de lectura) de casA, casB, casC, casD y casE procedentes de Escherichia coli son, respectivamente, las secuencias 5933.a - 7441.a, 5458.a - 5940.a, 4341.a- 5432.a, 3664.a- 4338.a y 3081.a - 3677.a (todas cadenas opuestas) de la secuencia de nucleótidos mostrada en la SEQ ID NO: 4.
Un grupo proteico que constituya un ADN que codifique un complejo Cascade puede obtenerse sintetizando químicamente la cadena de ADN, o poniendo en contacto cadenas cortas de oligoADN parcialmente superpuestas sintetizadas utilizando el método de PCR y el método de ensamblaje de Gibson, para construir un ADN que codifique su longitud completa. La ventaja de construir un ADN de longitud completa mediante síntesis química o mediante una combinación del método de PCR o el método de ensamblaje de Gibson, es que el codón que se utilice puede diseñarse en la CDS de longitud completa según el hospedador en el que se introduzca el ADN. En la expresión de un ADN heterólogo, se espera que el nivel de expresión de la proteína aumente al convertir su secuencia de ADN en un codón que se usa con mucha frecuencia en el organismo hospedador. Como datos frecuencia de uso de codones en el hospedador a utilizar, puede usarse, por ejemplo, la base de datos de frecuencia de uso del código genético (http://www.kazusa.or.jp/codon/index.html) desvelada en la página principal de Kazusa DNA Research Institute, o se puede hacer referencia a los documentos que muestran la frecuencia de uso de codones en cada hospedador. En referencia a los datos obtenidos y a la secuencia de ADN que se va a introducir, los codones que muestran una frecuencia de uso baja en el hospedador de entre los usados para la secuencia de ADN, pueden convertirse en un codón que codifique el mismo aminoácido y que muestre una frecuencia de uso alta.
De manera similar, también puede clonarse un ADN que codifique una desaminasa a partir de las células productoras de enzimas. Por ejemplo, se puede clonar un ADN que codifique PmCDAI de Petromyzon marinus diseñando cebadores adecuados de la CDS en dirección 5' y en dirección 3' basándose en la secuencia de ADNc (n.° de registro EF094822) registrada en la base de datos del NCBI, y clonando ARNm procedente de Petromyzon marinus mediante el método de RT-PCR (siglas del inglés reverse transcription-polymerase chain reaction, reacción en cadena de la polimerasa con retrotranscripción). Se puede clonar un a Dn que codifique la AID diseñando cebadores adecuados de la CDS en dirección 5' y en dirección 3' basándose en la secuencia de ADNc (n.° de registro AB040431) registrada en la base de datos del NCBI, y clonando, por ejemplo, ARNm procedente de ganglio linfático humano mediante el método de RT-PCR. De la misma manera que la comentada anteriormente, basándose en información de secuencias de ADNc conocidas, también pueden clonarse homólogos de AID procedentes de otros vertebrados (p. ej., de porcino (n.° de registro CU582981), bovino (n.° de registro NM_110138682), perro (n.° de registro NM_0oi0o338O), chimpancé (n.° de registro NM_001071809), pollo (n.° de registro NM_00l243222), Xenopus (n.° de registro NM_001095712), pez cebra (n.° de registro AAI62573), ayu (n.° de registro AB619797) y pez gato de canal (n.° de registro NM_001200185), etc.).
De manera alternativa, similar a lo anterior, también puede construirse como un ADN que muestre un uso de codones adecuado para la expresión en una célula hospedadora que se vaya a utilizar, mediante una combinación de síntesis química o método de PCR o método de ensamblaje de Gibson.
Un ADN que codifica una desaminasa clonada o sintetizada puede unirse directamente, o si se desea después de la digestión con una enzima de restricción, o después de la adición de un enlazador y/o una señal de localización nuclear adecuados (cada señal de transferencia de orgánulo cuando el ADN bicatenario diana es ADN mitocondrial o cloroplástico), a un ADN que codifique una o más proteínas seleccionadas de un grupo de proteínas que constituyen el complejo Cascade. Aunque el enlazador a utilizar no está particularmente limitado, pueden mencionarse, por ejemplo, la etiqueta Flag, el enlazador GS, la etiqueta Strep y similares, y las repeticiones en tándem de estos también se incluyen en el mismo.
De manera alternativa, cada uno de un ADN que codifique una proteína que constituye el complejo Cascade y un ADN que codifique una desaminasa, puede fusionarse con un ADN que codifique un dominio de unión (p. ej., dominio SH3, dominio PDZ, dominio GK, dominio GB, etc.) o con un compañero de unión del mismo, o ambos ADN pueden fusionarse con un ADN que codifique una inteína de separación, de modo que la proteína que constituye el complejo Cascade y la desaminasa se traducen en una célula hospedadora para formar un complejo. Además, una desaminasa y una proteína constitutiva Cascade pueden unirse usando un armazón de ARN mediante aptámeros de ARN (MS2F6, PP7, etc.) y sus proteínas de unión. También en estos casos, cuando se desee, puede unirse un enlazador y/o una señal de localización nuclear a una posición adecuada de uno o de ambos ADN.
Aunque la proteína constitutiva Cascade que forma un complejo con la desaminasa no está particularmente limitada, cuando se expresa como una proteína de fusión, en el caso del subtipo I-E, para la manipulación de genes, es fácil unir la proteína al extremo del operón (dirección 3' de CasE en el lado carboxiterminal (véase la figura 3).
De manera similar, también puede formarse un complejo de una enzima convertidora de bases de ácido nucleico y una proteína constitutiva Cascade usando un dominio de unión y similar, uniendo un ADN que codifique un dominio de unión o un compañero de unión del mismo, al extremo o dentro del operón y uniendo el compañero de unión o dominio de unión a un ADN que codifique la enzima convertidora de bases de ácido nucleico.
El ADN que codifica un ARNcr quimérico en el que el asa 5' y el asa 3' del ARNcr están unidos en una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana (secuencia diana), puede sintetizarse químicamente diseñando una secuencia de oligo ADN en la que se sabe que el asa 5' y el asa 3' (p. ej., ataaaccg como asa 5' y gagttccccgcgccagcgggg (SEQ ID NO: 3) como asa 3', cuando se utiliza el subtipo I-E procedente de Escherichia coli como complejo Cascade) están unidos respectivamente a la secuencia diana cadena arriba en dirección 5' y cadena abajo en dirección 3' y utilizando un sintetizador de ADN/ARN. El asa 5' y el asa 3' descritos en J. Biol. Chem. 286(24): 21643-21656 (2011), pueden utilizarse cuando se utiliza el subtipo I-A procedente de S. solfataricus, el asa 5' y el asa 3' descritos en J. Biol. Chem. 287(40): 33351-33365 (2012), pueden utilizarse cuando se utiliza el subtipo I-B procedente de H. volcanii, el asa 5' y el asa 3' descritos en Structure 20: 1574-1584 (2012), pueden utilizarse cuando se utiliza el subtipo I-C procedente de B. halodurans y el asa 5' y el asa 3' descritos en PNAS 108(25): 10092-10097 (2011) pueden, utilizarse cuando se utiliza el subtipo I-F procedente de P. aeruginosa.
La longitud de la secuencia diana no está particularmente limitada siempre que se presente correctamente en un complejo Cascade y pueda unirse específicamente a una cadena diana de una secuencia de nucleótidos diana. Esta longitud es, por ejemplo, de 30 a 45 nucleótidos, preferentemente de 32 a 33 nucleótidos para los subtipos I-C, I-E e I-F, y preferentemente, de 34 a 44 nucleótidos para los subtipos I-A e I-B.
La secuencia de nucleótidos diana en el sistema CRISPR-Cas de Tipo I está sujeta a restricción por la secuencia PAM específica del subtipo. En el subtipo I-E, cualquiera de AAG, ATG, AGG, GAG debe estar adyacente a la cadena no diana en el lado cadena arriba en dirección 5' de la secuencia de nucleótidos diana en la dirección 5' ^ 3 '. Por ejemplo, en el subtipo I-E, cuando se usa una secuencia diana con una longitud de 32 nucleótidos en combinación con desaminasa, como se muestra en los ejemplos mencionados a continuación, la citosina presente en 32-44 bases en dirección 3' de la secuencia PAM causa la conversión de bases y se introduce una mutación sumamente frecuente.
Dado que el complejo enzimático modificador de ácido nucleico de la presente invención, en el que se combinan el sistema CRISPR-Cas de Tipo I y una desaminasa, no acompaña a roturas de ADN bicatenario (DSB), es posible la edición genómica con baja toxicidad, y el método de modificación genética de la presente invención se puede aplicar a una amplia gama de materiales biológicos. Por lo tanto, las células en las que se introduce (a) un ADN que codifica un ARNcr quimérico en el que el asa 5' y el asa 3' del ARNcr se unen a la secuencia diana y (b) un ADN que codifica un grupo proteico que constituye un complejo Cascade y una desaminasa, pueden abarcar células de cualquier especie, desde bacterias de Escherichia coli y similares, que son procariotas, células de microorganismos tales como levaduras, que son eucariotas inferiores, hasta células de vertebrados, incluidos los mamíferos, como el ser humano (con la condición de que se excluya la modificación de la identidad de la estirpe germinal del ser humano), y células de eucariotas superiores, tales como insectos y plantas.
Se puede producir un vector de expresión que contenga los ADN de los apartados (a) y (b) mencionados anteriormente, por ejemplo, uniendo el ADN en la dirección 3' de un promotor en un vector de expresión adecuado. Los ADN de los apartados (a) y (b) pueden combinarse en el mismo vector o en vectores distintos.
Como vector de expresión, se utilizan plásmidos procedentes de Escherichia coli (p. ej., pBR322, pBR325, pUC12, pUC13); plásmidos procedentes de Bacillus subtilis (p. ej., pUB110, pTP5, pC194); plásmidos procedentes de levaduras (p. ej., pSH19, pSH15); plásmidos de expresión de células de insectos (por ejemplo, pFast-Bac); plásmidos de expresión de células de animales (p. ej., pA1-11, pXT1, pRc/CMV, pRc/RSV, pcD-NAI/Neo); bacteriófagos como el fago A; vectores de virus de insectos, tales como baculovirus (p. ej., BmNPV, AcNPV); vectores de virus animales, tales como retrovirus, virus variolovacunal y adenovirus.
Como promotor, se puede utilizar cualquier promotor apropiado para un hospedador que se utilizará para la expresión génica. En un método convencional que utiliza DSB, dado que la tasa de supervivencia de la célula hospedadora a veces disminuye notablemente debido a la toxicidad, es deseable aumentar el número de células al comienzo de la inducción utilizando un promotor inductor. Sin embargo, dado que también se puede lograr una proliferación celular suficiente expresando el complejo enzimático modificador de ácido nucleico de la presente invención, también puede utilizarse sin limitación, un promotor constitutivo.
Cuando el hospedador es Escherichia coli, se prefiere utilizar el promotor de trp, el promotor de lac, el promotor de recA, el promotor de APl, el promotor de APr, el promotor de lpp y el promotor de T7.
Cuando el hospedador pertenece al género Bacillus, se prefiere utilizar el promotor de SPO1, el promotor de SPO2 y el promotor de penP.
Cuando el hospedador es una levadura, se prefiere utilizar el promotor de Gal1/10, el promotor de PHO5, el promotor de PGK, el promotor de GAP y el promotor de ADH.
Cuando el hospedador es una célula de insecto, se prefiere utilizar el promotor de polihedrina y el promotor de P10.
Por ejemplo, cuando el hospedador es una célula animal, se utilizará el promotor de SRa, el promotor de SV40, el promotor de LTR, el promotor de CMV (citomegalovirus), el promotor del r Sv (virus del sarcoma de Rous), el promotor del MoMuLV (virus murino de la leucemia de Moloney) y el promotor de HSV-TK (timidina cinasa del virus del herpes simple). De estos, se prefieren el promotor de CMV y el promotor de SRa.
Cuando el hospedador es una célula vegetal, se prefiere el promotor del CaMV35S, el promotor de CaMV19S y el promotor de n Os .
Un ADN que codifica el ARNcr quimérico también puede usar, como promotor, un promotor del sistema pol III (p. ej., los promotores de SNR6, SNR52, SCR1, RPR1, U6, H1, etc.) y un terminador (p. ej., la secuencia T6).
Cuando como hospedador se utiliza una célula procariota o una célula eucariota inferior, tal como una levadura y células similares, un ADN que codifique un grupo proteico constitutivo Cascade puede expresarse policistrónicamente (véase la figura 3). Cuando como hospedador se utiliza una célula eucariota superior, como una célula animal y similares, se puede insertar una secuencia intermedia (p. ej., la secuencia IRES, la secuencia 2A procedente del virus de la fiebre aftosa y similares) que permite la expresión policistrónica entre los ADN respectivos que codifican las proteínas Cas. De manera alternativa, para provocar la expresión monocistrónica, puede insertarse un promotor en dirección 5' de cada ADN.
Los ADN que codifican el ARNcr quimérico también pueden insertarse en tándem en la dirección 3' de un promotor (véase la figura 3). En este caso, las secuencias diana generadas en los ARNcr quiméricos respectivos pueden ser iguales o diferentes. Cuando las secuencias son diferentes, como secuencia de nucleótidos diana puede usarse una región diferente en el mismo gen o como secuencia de nucleótidos diana puede usarse una región en un gen diferente. El sitio de unión entre las unidades de ARNcr quimérico respectivas es una secuencia repetida de ARNcr asa 3'-asa 5' que tiene una estructura secundaria parcial de una estructura en horquilla característica. Por tanto, se considera que es escindido por una RNasa inespecífica endógena a la célula hospedadora. La secuencia también puede escindirse intracelularmente en cada unidad de ARNcr quimérico incluso en una célula hospedadora sin un sistema CRISPR-Cas de Tipo I endógeno. Por supuesto, es posible expresar cada ARNcr quimérico individualmente insertando un promotor en la dirección 5' del ARNcr quimérico.
Como vector de expresión, además de los mencionados anteriormente, uno que contenga un potenciador, una señal de corte y empalme, un terminador, una señal de adición de poliA, un marcador de selección, tal como un gen de resistencia a fármacos, un gen complementario auxotrófico y similares, puede utilizar el origen de replicación y similares a demanda.
Un complejo enzimático modificador de ácido nucleico de la presente invención puede expresarse intracelularmente introduciendo, en una célula hospedadora, un vector de expresión que contenga (a) un ADN que codifique un ARNcr quimérico y (b) un ADN que codifique un grupo proteico constitutivo Cascade y una desaminasa, y cultivar la célula hospedadora.
Como hospedador se utilizan bacterias de los géneros Escherichia y Bacillus, levaduras, células de insecto, células animales y similares.
Como bacterias del género Escherichia, se utilizan Escherichia coli K12-DH1 [Proc. Natl. Acad. Sci. EE.UU, 60: 160 (1968)); Escherichia coli JM103 Nucleic Acids Research, 9, 309 (1981)], Escherichia coli JA221 [Journal of Molecular Biology, 120, 517 (1978)], Escherichia coli HB101 [Journal of Molecular Biology, 41,459 (1969)], Escherichia coli C600 [Genetics, 39, 440 (1954)] y similares.
Como bacterias del género Bacillus, se utilizan Bacillus subtilis MI114 [Gen, 24: 255 (1983)); Bacillus subtilis 207-21 [Journal of Biochemistry, 95, 87 (1984)] y similares.
Como bacteria que tiene un sistema CRISPR-Cas de Tipo I endógeno, es deseable utilizar una cepa mutante deficiente en Cas3 endógena.
Como levadura, se utiliza Saccharomyces cerevisiae AH22, AH22R', NA87-11A, DKD-5D, 20B-12, Schizosaccharomyces pombe NCYC1913, NCYC2036, Pichia pastoris KM71 y similares.
Como células de insecto, cuando el virus es AcNPV, se utilizan células de la línea establecida procedente de la larva del gusano cogollero de la col (células de Spodoptera frugiperda; células Sf), células MG1 procedentes del intestino medio de Trichoplusia ni, células High Five™ procedentes de un huevo de Trichoplusia ni, células procedentes de Mamestra brassicae, células procedentes de Estigmena acrea y similares. Como células de insecto, cuando el virus es BmNPV, se utilizan células de la línea establecida procedente de Bombyx mori (células de Bombyx mori; células BmN) y similares. Como célula Sf, se utiliza, por ejemplo, la célula Sf9 (ATCC CRL1711), la célula Sf21 [todas las anteriores, In vivo, 13, 213-217 (1977)] y similares.
Como insecto, se utiliza, por ejemplo, una larva de Bombyx mori, de Drosophila, de grillo y similares [Nature, 315, 592 (1985)].
Como célula animal, se utiliza líneas celulares tales como células COS-7 de mono, células Vero de mono, células de ovario de hámster chino (CHO), células CHO deficientes en el gen dhfr, células L de ratón, células AtT-20 de ratón, células de mieloma de ratón, células GH3 de rata, células FL humanas, células madre pluripotentes tales como, células iPS, células ES de seres humanos y de otros mamíferos y células primarias cultivadas preparadas a partir de diversos tejidos (con la condición de que se excluya la modificación de la identidad de la estirpe germinal humana de seres humanos). Además, también pueden utilizarse embriones de pez cebra y ovocitos del género Xenopus.
Como células vegetales, se utilizan células cultivadas en suspensión, callos, protoplastos, partes foliares, partes radiculares y similares que se preparan a partir de diversas plantas (por ejemplo, granos, tales como arroz, trigo, maíz y similares, cultivos de productos tales como tomate, pepino, berenjena y similares, plantas ornamentales tales como clavel, la especie Eustoma russellianum y similares, plantas de laboratorio, tales como tabaco, la especie Arabidopsis thaliana y similares).
Todas las células hospedadoras mencionadas anteriormente pueden ser haploides (monoploides) o poliploides (p. ej., diploides, triploides, tetraploides y similares). En los métodos convencionales de introducción de mutaciones, en principio, la mutación se introduce en un solo cromosoma homólogo para producir un tipo heterogéneo. Por lo tanto, el fenotipo deseado no se expresa a menos que se produzca una mutación dominante, y la homocigosis requiere inconvenientemente esfuerzo y tiempo. En cambio, según la presente invención, dado que la mutación puede introducirse en cualquier alelo del cromosoma homólogo en el genoma, el fenotipo deseado puede expresarse en una sola generación incluso en el caso de mutación recesiva, y pueden resolverse los problemas de los métodos convencionales.
Un vector de expresión puede introducirse mediante un método conocido (p. ej., método con lisozimas, método con células competentes, método con PEG, método de coprecipitación con CaCh, método de electroporación, método de microinyección, método con cañón de partículas, método de lipofección, método con Agrobacterium y similares) según el tipo de hospedador.
Escherichia coli puede transformarse según los métodos descritos, por ejemplo, en Proc. Natl. Acad. Sci. USA, 69, 2110 (1972), Gene, 17, 107 (1982) y similares.
Se puede introducir un vector en el género Bacillus según los métodos descritos, por ejemplo, en Molecular & General Genetics, 168, 111 (1979) y similares.
Se puede introducir un vector en una levadura según los métodos descritos, por ejemplo, en Methods in Enzymology, 194, 182-187 (1991), Proc. Natl. Acad. Sci. USA, 75, 1929 (1978) y similares.
Se puede introducir un vector en una célula de insecto y en un insecto según los métodos descritos, por ejemplo, en Bio/Technology, 6, 47-55 (1988) y similares.
Se puede introducir un vector en una célula animal según métodos descritos, por ejemplo, en Cell Engineering volumen adicional 8, New Cell Engineering Experiment Protocol, 263-267 (1995) (publicado por Shujunsha) y en Virology, 52, 456 (1973).
Una célula introducida con un vector puede cultivarse según un método conocido en función del tipo de hospedador.
Por ejemplo, cuando se cultiva la especie Escherichia coli o especies del género Bacillus, es preferible utilizar un medio líquido como medio de cultivo. El medio contiene, preferentemente, una fuente de carbono, una fuente de nitrógeno, sustancias inorgánicas y similares, que son necesarias para el crecimiento del transformante. Como ejemplos de fuente de carbono se incluyen glucosa, dextrina, almidón soluble, sacarosa y similares; como ejemplos de fuente de nitrógeno se incluyen sustancias inorgánicas u orgánicas tales como sales de amonio, sales de nitrato, solución de maíz macerado, peptona, caseína, extracto de carne, tarta de soja, extracto de patata y similares; y como ejemplos de sustancias inorgánicas se incluyen cloruro de calcio, dihidrógeno fosfato de sodio, cloruro de magnesio y similares. El medio puede contener extracto de levadura, vitaminas, factor promotor del crecimiento y similares. El pH del medio varía, preferentemente, de aproximadamente 5 a aproximadamente 8.
Como un medio para el cultivo de Escherichia coli, se prefiere, por ejemplo, medio M9 que contiene glucosa y casaminoácidos [Journal of Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, Nueva York 1972]. Cuando sea necesario, pueden añadirse al medio, por ejemplo, agentes tales como ácido 3p-indolilacrílico para garantizar una función eficaz de un promotor. Escherichia coli se cultiva generalmente a una temperatura de aproximadamente 15 a aproximadamente 43 °C. Cuando es necesario, puede realizarse oxigenación y agitación.
Las especies del género Bacillus se cultivan generalmente a una temperatura de aproximadamente 30 a aproximadamente 40 °C. Cuando es necesario, puede realizarse oxigenación y agitación.
Como ejemplos de medios para el cultivo de levaduras se incluyen medio mínimo de Burkholder [Proc. Natl. Acad. Sci. EE.UU, 77, 4505 (1980)], medio SD que contiene casaminoácidos al 0,5 % [Proc. Natl. Acad. Sci. EE.UU, 81, 5330 (1984)] y similares. El pH del medio varía, preferentemente, de aproximadamente 5 a aproximadamente 8. El cultivo se realiza generalmente a una temperatura de aproximadamente 20 °C a aproximadamente 35 °C. Cuando es necesario, puede realizarse oxigenación y agitación.
Como medio para cultivar una célula de insecto o un insecto, se utiliza, por ejemplo, medio de Grace para insectos [Nature, 195, 788 (1962)] que contiene un aditivo tal como suero bovino al 10 % inactivado y similar según sea apropiado y similares. El pH del medio varía, preferentemente, de aproximadamente 6,2 a aproximadamente 6,4. El cultivo se realiza generalmente a una temperatura de aproximadamente 27 °C. Cuando es necesario, puede realizarse oxigenación y agitación.
Como medio para cultivar una célula animal, se utiliza, por ejemplo, medio esencial mínimo (MEM) que contiene de aproximadamente 5 a aproximadamente 20 % de suero fetal bovino [Science, 122, 501 (1952)], medio de Eagle modificado por Dulbecco (DMEM), 8, 396 (1959)], Medio RPMI 1640 [The Journal of the American Medical Association, 199, 519 (1967)], medio 199 [Proceeding of the Society for the Biological Medicine, 73, 1 (1950)] y similares. El pH del medio varía, preferentemente, de aproximadamente 6 a aproximadamente 8. El cultivo se realiza generalmente a una temperatura de aproximadamente 30 °C a aproximadamente 40 °C. Cuando es necesario, puede realizarse oxigenación y agitación.
Como medio para cultivar una célula vegetal, se utiliza, por ejemplo, medio MS, medio LS, medio B5 y similares. El pH del medio varía, preferentemente, de aproximadamente 5 a aproximadamente 8. El cultivo se realiza generalmente a una temperatura de aproximadamente 20 °C a aproximadamente 30 °C. Cuando es necesario, puede realizarse oxigenación y agitación.
Como se ha mencionado anteriormente, un complejo de un módulo de secuencias de reconocimiento de ácido nucleico (CRISPR-Cas de Tipo I) y una desaminasa, es decir, un complejo enzimático modificador de ácido nucleico, puede expresarse intracelularmente.
Cuando (a) un ARNcr quimérico y (b) un complejo de un grupo proteico constitutivo Cascade y una desaminasa se expresan a partir de un vector de expresión introducido en una célula, el grupo proteico forma un complejo Cascade y presenta el ARNcr quimérico. Cuando el complejo Cascade reconoce y se une específicamente a una secuencia de nucleótidos diana en el ADN bicatenario (p, ej., ADN genómico) de interés, debido a la acción de la desaminasa unida al grupo proteico constitutivo Cascade, la conversión de bases se produce en la cadena de sentido o en la cadena de antisentido del sitio diana (secuencia de nucleótidos diana total o parcial o en sus proximidades) y se produce un emparejamiento erróneo en el ADN bicatenario (p. ej., cuando una citidina desaminasa, tal como PmCDA1, AID y similares, se utilizan como una desaminasa, la citosina en la cadena de sentido o en la cadena de antisentido en el sitio diana se convierte en uracilo para producir un emparejamiento erróneo U:G o G:U). Cuando el emparejamiento erróneo no se repara correctamente, y cuando se repara de tal manera que una base de la cadena opuesta forma un par con una base de la cadena convertida (T-A o A-T en el ejemplo mencionado anteriormente), o cuando adicionalmente se sustituye otro nucleótido (p. ej., U ^A , G) o cuando durante la reparación se delecionan o insertan de una a varias docenas de bases, se introducen varias mutaciones.
Dado que la nucleasa artificial convencional acompaña a roturas de ADN bicatenario (DSB), la inhibición del crecimiento y la muerte celular, supuestamente causadas por una escisión desordenada del cromosoma (escisión colateral), se producen mediante el direccionamiento de una secuencia en el genoma. Su efecto es particularmente letal para muchos microorganismos y procariotas e impide su aplicabilidad. En la presente invención, la mutación no se introduce mediante escisión del ADN sino mediante una reacción de conversión de sustituyentes (particularmente una reacción de desaminación) en las bases del ADN y, por lo tanto, puede obtenerse una reducción drástica de toxicidad.
En la presente invención, la modificación del ADN bicatenario no impide la aparición de escisión del ADN bicatenario en un sitio distinto del sitio diana. Sin embargo, una de las mayores ventajas de la presente invención es evitar la toxicidad por escisión colateral, que es generalmente aplicable a cualquier especie. Por lo tanto, en una realización preferida, en la presente invención, la modificación del ADN bicatenario no acompaña a la escisión de la cadena de ADN no solo en un sitio diana de un ADN bicatenario dado, sino en un sitio distinto de la misma.
Los presentes inventores ya han descubierto que, cuando el sistema CRIPR-Cas de Tipo II se utiliza como un módulo de secuencias de reconocimiento de ácidos nucleicos y AID se utiliza como una desaminasa, se prefiere diseñar la secuencia de nucleótidos diana de tal manera que C (o G en la cadena opuesta) en la que se desea introducir una mutación, esté a 2-5 nucleótidos del extremo 5' de la secuencia de nucleótidos diana. En el sistema CRISPR/Cas de Tipo II, la longitud de la secuencia diana puede determinarse adecuadamente para que esté entre 15 y 30 nucleótidos, preferentemente entre 18 y 25 nucleótidos. Dado que la secuencia diana es una secuencia complementaria a la cadena diana de la secuencia de nucleótidos diana, la longitud de la secuencia de nucleótidos diana cambia al cambiar la longitud de la secuencia de diana; sin embargo, independientemente de la longitud del nucleótido, se mantiene la regularidad de que se introduzca una mutación fácilmente en C o G a 2-5 nucleótidos desde el extremo 5'. Por lo tanto, determinando apropiadamente la longitud de la secuencia de nucleótidos diana (secuencia diana como una cadena complementaria de la misma), puede desplazarse el sitio de una base en el que se puede introducir una mutación. Como resultado, la restricción mediante PAM (motivo adyacente de protoespaciador) (NGG en el caso de SpCas9) puede eliminarse parcialmente, pero no por completo. Por otra parte, cuando se utilizó el sistema CRISPR-Cas de Tipo I-E (secuencia diana de 32 nucleótidos) como módulo de secuencias de reconocimiento de ácido nucleico y se utilizó AID como desaminasa, se introdujo una mutación principalmente en el intervalo de 32 a 44 bases cadena abajo de PAM (AAG, ATG, AGG, GAG en el subtipo I-E procedente de Escherichia coli). Como se ha mencionado anteriormente, la secuencia PAM varía según el subtipo de Tipo I y tiene un alto grado de libertad de 2 a 3 nucleótidos (p. ej., CCN en el subtipo I-A, CC en el subtipo I-F). Además, muestra una introducción de mutaciones muy frecuente en un intervalo más amplio que mediante el uso del sistema CRISPR-Cas de Tipo II. Si bien la tolerancia de la longitud de la secuencia diana tiene un margen de consideración, puede determinarse una secuencia de nucleótidos diana más larga utilizando el subtipo I-A o I-B.
Al utilizar el sistema CRISPR-Cas de Tipo I como módulo de secuencias de reconocimiento de ácidos nucleicos de esta manera, se puede introducir una mutación incluso en un sitio difícil para la introducción de la mutación en el sistema CRISPR-Cas de Tipo II, y los sistemas se pueden utilizar de forma complementaria.
Como se muestra en la figura 3, en una célula hospedadora, puede introducirse un ARNcr quimérico que contenga múltiples secuencias diana. Los presentes inventores ya han descubierto que, cuando se utiliza el sistema CRISPR-Cas de Tipo II y se producen módulos de secuencias de reconocimiento correspondientes a las múltiples secuencias de nucleótidos diana adyacentes y se utilizan simultáneamente, la eficacia de la introducción de mutaciones aumenta notablemente en comparación con cuando, como diana, se utiliza una sola secuencia de nucleótidos. Como efecto de la misma, de manera similar, la inducción de mutaciones se realiza incluso cuando ambas secuencias de nucleótidos diana se solapan parcialmente o cuando ambas están separadas por aproximadamente 600 pb. La introducción de mutaciones puede ocurrir tanto cuando las secuencias de nucleótidos diana están en la misma dirección (las cadenas diana están presentes en la misma cadena) como cuando están opuestas (la cadena diana está presente en cada cadena de ADN bicatenario).
Por lo tanto, se puede esperar una mejora adicional de la eficacia de inducción de mutaciones en la presente invención usando el sistema CRISPR-Cas de Tipo I direccionando múltiples secuencias de nucleótidos.
Como se ha mencionado anteriormente, para expresar el complejo enzimático modificador de ácido nucleico de la presente invención en una célula hospedadora, en dicha célula se introduce un vector de expresión que contenga un ADN que codifique el complejo enzimático modificador de ácido nucleico. Para una introducción eficaz de la mutación, es deseable mantener una expresión del complejo enzimático modificador de ácido nucleico de un nivel determinado o superior durante un periodo no inferior al establecido. Desde este punto de vista, se garantiza la introducción de un vector de expresión (plásmido, etc.) que pueda replicarse de forma autónoma en una célula hospedadora. Sin embargo, dado que el plásmido, etc. son ADN exógenos, se prefiere eliminarlos rápidamente después de introducir satisfactoriamente la mutación. Por lo tanto, aunque sujeto a cambios dependiendo del tipo de célula hospedadora y similares, por ejemplo, deseablemente, el plásmido introducido se elimina de la célula hospedadora después de un intervalo de 6 horas a 2 días desde la introducción de un vector de expresión utilizando diversos métodos de eliminación de plásmidos bien conocidos en la técnica.
De manera alternativa, siempre que se obtenga la expresión de un complejo enzimático modificador de ácido nucleico, que sea suficiente para la introducción de la mutación, se prefiere introducir la mutación en el ADN bicatenario objeto mediante expresión transitoria utilizando un vector de expresión sin replicabilidad autónoma en una célula hospedadora (p. ej., vector, etc., que carezca de origen de replicación que funcione en la célula hospedadora y/o un gen que codifique la proteína necesaria para la replicación).
La expresión del gen diana se suprime mientras que el complejo enzimático modificador de ácido nucleico de la presente invención se expresa en una célula hospedadora para realizar una reacción de conversión de bases de ácido nucleico. Por lo tanto, como gen diana, fue difícil editar directamente un gen esencial para la supervivencia de la célula hospedadora (debido a efectos secundarios tales como la inhibición del crecimiento del hospedador, eficacia de introducción de mutación inestable, mutación de un sitio diferente al de la diana y similares). En la presente invención, la edición directa de un gen esencial se realiza satisfactoriamente provocando una reacción de conversión de bases de ácido nucleico en una fase deseada, y expresando transitoriamente el complejo enzimático modificador de ácido nucleico de la presente invención en una célula hospedadora durante un período necesario para fijar la modificación del sitio diana. Aunque el período necesario para una reacción de conversión de bases de ácido nucleico y la fijación de la modificación del sitio diana varía según el tipo de célula hospedadora, las condiciones de cultivo y similares, por lo general se considera que son necesarias entre 2 a 20 generaciones. Por ejemplo, cuando la célula hospedadora es una levadura o una bacteria (p. ej., Escherichia coli), la expresión de un complejo enzimático modificador de ácido nucleico debe inducirse durante 5 a 10 generaciones. Los expertos en la técnica pueden determinar de manera apropiada un período de inducción de expresión preferible basándose en el tiempo de duplicación de la célula hospedadora en las condiciones de cultivo que se utilizarán. El período de inducción de expresión del ácido nucleico que codifica el complejo enzimático modificador de ácido nucleico de la presente invención, puede ampliarse más allá del "período necesario para fijar la modificación del sitio diana" mencionado anteriormente, siempre que la célula hospedadora esté exenta de efectos secundarios.
Como medio para expresar transitoriamente el complejo enzimático modificador de ácido nucleico de la presente invención en una fase deseada durante un período deseado, puede mencionarse un método que incluye la producción de una construcción (vector de expresión) que contiene un ADN que codifica el complejo enzimático modificador de ácido nucleico, en una forma capaz de controlar el período de expresión, introduciendo la construcción en una célula hospedadora. La "forma capaz de controlar el período de expresión" es específicamente, por ejemplo, un ADN que codifica el complejo enzimático modificador de ácido nucleico de la presente invención colocado bajo la regulación de una región reguladora inducible. Aunque la "región reguladora inducible" no está particularmente limitada, esta es, por ejemplo, en células microbianas de bacterias (p. ej., Escherichia coli), levaduras y similares, un operón de un represor de mutación sensible a la temperatura (ts, temperature sensitive) y un operador regulado de este modo (véase la figura 4). Como ejemplos del represor de mutación ts se incluyen, pero sin limitación, la mutación ts del represor cI procedente del fago A. En el caso del represor cl del fago A (ts), este está unido a un operador para suprimir la expresión del gen cadena abajo a una temperatura inferior a 30 °C (por ejemplo, 28 °C). A una temperatura elevada no inferior a 37 °C (por ejemplo, 42 °C), se disocia del operador para permitir la inducción de la expresión génica. Por lo tanto, el período en el que se suprime la expresión del gen diana, puede minimizarse cultivando una célula hospedadora introducida con un ADN que codifica un complejo enzimático modificador de ácido nucleico, generalmente a una temperatura inferior a 30 °C, elevando la temperatura a no menos de 37 °C en una fase apropiada, cultivando durante un período determinado para llevar a cabo una reacción de conversión de bases de ácido nucleico base y, después de la introducción de una mutación en el gen diana, disminuyendo rápidamente la temperatura a no más de 30 °C. Por tanto, incluso cuando la diana es un gen esencial para la célula hospedadora, se puede editar de manera eficaz mientras se suprimen los efectos secundarios.
Por ejemplo, cuando se utiliza una mutación sensible a la temperatura, se genera un mutante sensible a la temperatura de una proteína necesaria para la replicación autónoma de un vector en un vector que contiene un ADN que codifica el complejo enzimático modificador de ácidos nucleicos de la presente invención. Como resultado, después de la expresión del complejo enzimático modificador de ácido nucleico, no puede producirse rápidamente la replicación autónoma y el vector se desprende de manera natural junto con la división celular. Como ejemplos de proteína mutante sensible a la temperatura se incluyen, pero sin limitación, un mutante sensible a la temperatura de ori Rep101 necesario para la replicación de ori pSC101 (véase la figura 4). Ori Rep101 (ts) actúa sobre ori pSC101 permitiendo la replicación autónoma del plásmido a una temperatura inferior a 30 °C (por ejemplo, 28 °C), pero pierde su función a no menos de 37 °C (por ejemplo, 42 °C) y el plásmido no puede replicarse de forma autónoma. Por lo tanto, un uso combinado con el represor cl (ts) del fago A mencionado anteriormente, permite simultáneamente la expresión transitoria del complejo enzimático modificador de ácido nucleico de la presente invención y la eliminación del plásmido.
Por otra parte, cuando una célula eucariota superior, tal como una célula animal, una célula de insecto, una célula vegetal y similar, se utiliza como célula hospedadora, un ADN que codifica el complejo enzimático modificador de ácido nucleico de la presente invención, se introduce en una célula hospedadora bajo la regulación de un promotor inductor (p. ej., un promotor de metalotioneína (inducido por iones de metales pesados), un promotor de proteínas de choque térmico (inducido por choque térmico), un promotor del sistema Tet-ON/Tet-OFF (inducido por la adición o eliminación de tetraciclina o un derivado de la misma), un promotor sensible a esteroides (inducido por la hormona esteroidea o un derivado de la misma), etc.), la sustancia inductora se añade al medio (o se elimina del medio) en una fase apropiada para inducir la expresión del complejo enzimático modificador de ácido nucleico, el cultivo se realiza durante un período determinado para llevar a cabo una reacción de conversión de ácido nucleico base y, la introducción de mutaciones en el gen diana, la expresión transitoria del complejo enzimático modificador de ácidos nucleicos puede realizarse eliminando (o volviendo a añadir) las sustancias inductoras.
Las células procariotas tales como Escherichia coli y similares pueden utilizar un promotor inductor. Como ejemplos del promotor inductor se incluyen, pero sin limitación, el promotor lac (inducido por IPTG), el promotor cspA (inducido por choque frío), promotor de araBAD (inducido por arabinosa) y similares.
De manera alternativa, el promotor inductor mencionado anteriormente también puede utilizarse como un mecanismo de eliminación de vectores cuando como células hospedadoras se utilizan células eucariotas superiores, tales como células animales, células de insecto, células vegetales y similares. Es decir, se genera un vector con un origen de replicación que funciona en una célula hospedadora, y un ácido nucleico que codifica una proteína necesaria para la replicación (p. ej., ori de SV40 y antígeno T grande, oriP y EBNA-1, etc. para células animales), de la expresión del ácido nucleico que codifica la proteína está regulado por el promotor inductor mencionado anteriormente. Como resultado, mientras que el vector puede replicarse de forma autónoma en presencia de una sustancia inductora, cuando se elimina la sustancia inductora, la replicación autónoma no está disponible y el vector se desprende de manera natural junto con la división celular (la replicación autónoma no es posible por la adición de tetraciclina y

Claims (10)

REIVINDICACIONES
1. Un método no terapéutico para modificar un sitio diana de un ADN bicatenario en una célula hospedadora, comprendiendo el método, introducir
(a) un ADN que codifica un ARNcr que comprende una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana en el ADN bicatenario dado, y
(b) un ADN que codifica un grupo proteico que constituye Cascade y una desaminasa, en el que la desaminasa es capaz de formar un complejo con CasE en el grupo proteico en la célula hospedadora para convertir uno o más nucleótidos en el sitio diana en uno o más nucleótidos distintos sin escindir el ADN bicatenario en el sitio diana,
en donde el complejo carece de Cas3, Cas1, Cas2 y Cas4, y
en donde el grupo proteico que constituye Cascade comprende CasA, CasB, CasC, CasD y CasE, y en donde el método no es un procedimiento para modificar la identidad genética de la estirpe germinal de seres humanos.
2. El método según la reivindicación 1, en donde el complejo Cascade procede de Escherichia coli.
3. El método según la reivindicación 1 o 2, en donde la desaminasa es citidina desaminasa.
4. El método según una cualquiera de las reivindicaciones 1 a 3, en donde la célula hospedadora es una célula procariota.
5. El método según una cualquiera de las reivindicaciones 1 a 4, que comprende un etapa de introducir un vector de expresión que comprende los ADN de (a) y (b) en una forma capaz de controlar un período de expresión en la célula hospedadora y de inducir la expresión de los ADN durante un período necesario para fijar la modificación del sitio diana en el a Dn monocatenario.
6. El método según la reivindicación 5, en donde la secuencia de nucleótidos diana en el ADN bicatenario está presente en un gen que es esencial para la célula hospedadora.
7. Un complejo enzimático modificador de ácido nucleico para modificar un sitio diana de un ADN bicatenario en una célula hospedadora, comprendiendo el complejo
(a) un ARNcr que comprende una secuencia complementaria a una cadena diana de una secuencia de nucleótidos diana en el ADN bicatenario dado, y
(b) un complejo enzimático modificador de ácido nucleico que comprende un grupo proteico que constituye Cascade, y una desaminasa que ha formado un complejo con CasE en el grupo proteico,
en donde el complejo carece de Cas3, Cas1, Cas2 y Cas4, y
en donde el grupo proteico que constituye Cascade comprende CasA, CasB, CasC, CasD y CasE.
8. El complejo enzimático modificador de ácido nucleico según la reivindicación 7, en donde el complejo Cascade procede de Escherichia coli.
9. El complejo enzimático modificador de ácido nucleico según la reivindicación 7 u 8, en donde la desaminasa es citidina desaminasa.
10. Un ADN que codifica el complejo enzimático modificador de ácido nucleico según una cualquiera de las reivindicaciones 7 a 9.
ES16844434T 2015-09-09 2016-09-08 Método para modificar una secuencia genómica que convierte específicamente una nucleobase de una secuencia de ADN diana, y complejo molecular utilizado en dicho método Active ES2902338T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015178023 2015-09-09
PCT/JP2016/076448 WO2017043573A1 (ja) 2015-09-09 2016-09-08 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体

Publications (1)

Publication Number Publication Date
ES2902338T3 true ES2902338T3 (es) 2022-03-28

Family

ID=58239796

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16844434T Active ES2902338T3 (es) 2015-09-09 2016-09-08 Método para modificar una secuencia genómica que convierte específicamente una nucleobase de una secuencia de ADN diana, y complejo molecular utilizado en dicho método

Country Status (10)

Country Link
US (1) US20190024098A1 (es)
EP (1) EP3348636B1 (es)
JP (4) JP6780860B2 (es)
CN (1) CN108271385A (es)
CA (1) CA2998087A1 (es)
DK (1) DK3348636T3 (es)
ES (1) ES2902338T3 (es)
HK (1) HK1253540A1 (es)
SG (1) SG11201801809VA (es)
WO (1) WO2017043573A1 (es)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
CN111471675A (zh) 2014-03-05 2020-07-31 国立大学法人神户大学 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
JP6664693B2 (ja) 2015-09-09 2020-03-13 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
DK3382019T3 (da) 2015-11-27 2022-05-30 Univ Kobe Nat Univ Corp Fremgangsmåde til omdannelse af enkimet plantegenomsekvens, hvori nukleinsyrebase i målrettet DNA-sekvens specifikt omdannes, og molekylært kompleks anvendt deri
DK3447139T3 (da) * 2016-04-21 2022-07-04 Univ Kobe Nat Univ Corp Fremgangsmåde til øgning af mutationsindføringseffektivitet i genomsekvensmodificeringsteknik, og molekylært kompleks til anvendelse dertil
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
JP7191388B2 (ja) 2017-03-23 2022-12-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11807869B2 (en) * 2017-06-08 2023-11-07 Osaka University Method for producing DNA-edited eukaryotic cell, and kit used in the same
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
MX2020001998A (es) 2017-08-21 2020-10-05 Univ Tokushima Tecnología de alteración específica de secuencia objetivo utilizando reconocimiento de objetivos del nucleotído.
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
SG11202009319YA (en) 2018-03-26 2020-10-29 Univ Kobe Nat Univ Corp Method for modifying target site in double-stranded dna in cell
BR112021001904A2 (pt) * 2018-08-03 2021-05-04 Beam Therapeutics Inc. editores de nucleobase multiefetores e métodos de usar os mesmos para modificar uma sequência alvo de ácido nucleico
WO2020191243A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
US20220333133A1 (en) 2019-09-03 2022-10-20 Voyager Therapeutics, Inc. Vectorized editing of nucleic acids to correct overt mutations
CN115461441A (zh) * 2020-03-16 2022-12-09 杜克大学 用于改善基于i-e型crispr的基因沉默的方法和组合物
DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110104787A1 (en) * 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
GB201122458D0 (en) * 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US20150315576A1 (en) * 2012-11-01 2015-11-05 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
US9737604B2 (en) * 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US11053481B2 (en) * 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains

Also Published As

Publication number Publication date
US20190024098A1 (en) 2019-01-24
EP3348636A4 (en) 2019-03-13
EP3348636A1 (en) 2018-07-18
WO2017043573A1 (ja) 2017-03-16
HK1253540A1 (zh) 2019-06-21
JPWO2017043573A1 (ja) 2018-06-21
JP6780860B2 (ja) 2020-11-04
EP3348636B1 (en) 2021-12-01
DK3348636T3 (da) 2022-02-28
SG11201801809VA (en) 2018-04-27
CA2998087A1 (en) 2017-03-16
JP2024133660A (ja) 2024-10-02
JP2021019615A (ja) 2021-02-18
CN108271385A (zh) 2018-07-10
JP2022123889A (ja) 2022-08-24

Similar Documents

Publication Publication Date Title
ES2902338T3 (es) Método para modificar una secuencia genómica que convierte específicamente una nucleobase de una secuencia de ADN diana, y complejo molecular utilizado en dicho método
ES2752175T3 (es) Método de modificación de la secuencia genómica para convertir específicamente bases de ácido nucleico de una secuencia de ADN seleccionada como diana, y complejo molecular para su uso en el mismo
ES2919961T3 (es) Método para aumentar la eficiencia de introducción de mutaciones en una técnica de modificación de secuencias genómicas, y complejo molecular para su uso en la misma
US20240117384A1 (en) Method for converting nucleic acid sequence of cell specifically converting nucleic acid base of targeted dna using cell endogenous dna modifying enzyme, and molecular complex used therein