ES2689256T3 - Ribonucleoproteínas Cascada modificadas y usos de las mismas - Google Patents

Ribonucleoproteínas Cascada modificadas y usos de las mismas Download PDF

Info

Publication number
ES2689256T3
ES2689256T3 ES16169431.0T ES16169431T ES2689256T3 ES 2689256 T3 ES2689256 T3 ES 2689256T3 ES 16169431 T ES16169431 T ES 16169431T ES 2689256 T3 ES2689256 T3 ES 2689256T3
Authority
ES
Spain
Prior art keywords
dna
cascade
cas3
sequence
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16169431.0T
Other languages
English (en)
Inventor
Stan Johan Jozef BROUNS
John Van Der Oost
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Caribou Biosciences Inc
Original Assignee
Caribou Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Caribou Biosciences Inc filed Critical Caribou Biosciences Inc
Application granted granted Critical
Publication of ES2689256T3 publication Critical patent/ES2689256T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/22Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a Strep-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

Una proteína de fusión artificial de una subunidad proteica Cse1 asociada a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) de tipo I y una endonucleasa FokI.

Description

5
10
15
20
25
30
35
40
45
50
55
DESCRIPCION
Ribonucleoproteínas Cascada modificadas y usos de las mismas
La invención se refiere al campo de la ingeniería genética y más particularmente al área de modificación génica y/o genómica de organismos, que incluyen procariotas y eucariotas. La invención también se refiere a procedimientos de fabricación de herramientas específicas de sitio para su uso en procedimientos de análisis genómico y modificación genética, ya sea in vivo o in vitro. La invención se refiere más particularmente al campo de ribonucleoproteínas que reconocen y asocian secuencias de ácido nucleico de una manera específica de secuencia.
Las bacterias y arqueas tienen una amplia variedad de mecanismos de defensa contra el ADN invasivo. Los denominados sistemas de defensa CRISPR/Cas proporcionan inmunidad adaptativa al integrar los fragmentos de ADN plasmídico y viral en loci de repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) en el cromosoma del huésped. Las secuencias virales o derivadas del plásmido, conocidas como espaciadores, están separadas entre sí mediante la repetición de secuencias derivadas del huésped. Estos elementos repetitivos son la memoria genética de este sistema inmunitario y cada locus CRISPR contiene un repertorio diverso de secuencias únicas "espadadoras" adquiridas durante encuentros previos con elementos genéticos extraños.
La adquisición de ADN extraño es la primera etapa de la inmunización, pero la protección requiere que el CRISPR se transcriba y que estos transcritos largos se procesen en ARN cortos derivados de CRISPR (ARNcr) que contienen una secuencia espaciadora única complementaria a un provocador de ácido nucleico extraño.
Además del ARNcr, los experimentos genéticos en varios organismos han revelado que se requiere un conjunto único de proteínas (Cas) asociadas a CRISPR para las etapas de adquisición de inmunidad, para la biogénesis de ARNcr y para la interferencia dirigida. Asimismo, se ha demostrado que un subconjunto de proteínas Cas de sistemas CRISPR filogenéticamente distintos se ensamblan en complejos grandes que incluyen un ARNcr.
Una reciente reevaluación de la diversidad de los sistemas CRISPR/Cas ha dado lugar a una clasificación de tres tipos distintos (Makarova K. y col (2011) Nature Reviews Microbiology - AOP 9 de mayo de 2011; doi:10.1038/nrmicro2577) que varían en el contenido del gen cas y muestran diferencias importantes a lo largo de la vía de defensa de CRISPR. (La clasificación de Makarova y la nomenclatura para genes asociados a CRISPR se adopta en la presente memoria descriptiva) Los transcritos de ARN de los loci de CRISPR (pre-ARNcr) se escinden específicamente en las secuencias repetidas mediante endorribonucleasas (Cas) asociadas a CRISPR en sistemas de tipo I y tipo III o mediante RNasa III en sistemas de tipo II; los ARNcr generados son utilizados por un complejo de proteínas Cas como ARN guía para detectar secuencias complementarias de ADN o ARN invasor. La escisión de los ácidos nucleicos objetivo se ha demostrado in vitro para el sistema B tipo III de Pyrococcus furiosus, que escinde ARN en un mecanismo anclado a la regla y, más recientemente, in vivo para el sistema tipo II de Streptococcus thermophiles, que escinde ADN en la secuencia objetivo complementaria (protoespaciadora). Por el contrario, para los sistemas de tipo I, el mecanismo de interferencia de CRISPR sigue siendo en gran parte desconocido.
El organismo modelo de la cepa K12 de Escherichia coli posee un CRISPR/Cas tipo I-E (anteriormente conocido como CRISPR subtipo E (Cse)). Contiene ocho genes cas (casi, cas2, cas3 y csel, cse2, cas7, cas5, cas6e) y un CRISPR corriente abajo (repeticiones tipo 2). En K12 de Escherichia coli, los ocho genes cas están codificados corriente arriba del locus de CRISPR. Cas1 y Cas2 no parecen ser necesarios para la interferencia del objetivo, pero es probable que participen en la adquisición de una nueva secuencia objetivo. Por el contrario, seis proteínas Cas: Cse1, Cse2, Cas3, Cas7, Cas5 y Cas6e (anteriormente también conocidas como CasA, CasB, Cas3, CasC/Cse4, CasD y CasE/Cse3, respectivamente) son esenciales para la protección contra la estimulación del fago lambda. Cinco de estas proteínas: Cse1, Cse2, Cas7, Cas5 y Cas6e (anteriormente conocidas como CasA, CasB, CasC/Cse4, CasD y CasE/Cse3, respectivamente) se ensamblan con un ARNcr para formar una ribonucleoproteína (RNP) de múltiples subunidades denominada Cascada.
En E. coli, Cascada es un complejo ribonucleoproteico de 405 kDa compuesto por una estequiometría desigual de cinco proteínas Cas funcionalmente esenciales: Cse1-iCse22Cas76Cas5-iCas6e1 (es decir, bajo la nomenclatura previa CasA^CaD-iE-i) y un ARN derivado de CRISPR de 61 nt. Cascada es una RNP forzada que depende del ARNcr para ensamblaje y estabilidad del complejo, y para la identificación de secuencias de ácidos nucleicos invasoras. Cascada es un complejo de vigilancia que encuentra y une ácidos nucleicos extraños que son complementarios a la secuencia espaciadora del ARNcr.
Jore y col. (2011) titulado "Structural basis for CRISP RNA-guided DNA recognition by Cascade" Nature Structural & Molecular Biology 18: 529-537 describe cómo se produce una escisión del transcrito de pre-ARNcr por la subunidad Cas6e de Cascada, lo que resulta en un ARNcr maduro de 61 nt que es retenido por el complejo CRISPR. El ARNcr sirve como un ARN guía para la unión específica de secuencia de Cascada a moléculas de ADN bicatenario (bc) a través del emparejamiento de bases entre el espaciador de ARNcr y el protoespaciador complementario, formando así el llamado bucle R. Se sabe que esto es un proceso independiente de ATP.
Brouns S.J.J., y col (2008) titulado "Small CRISP RNAs guide antiviral defense in prokaryotes" Science 321: 960-964 enseña que Cascada cargada con un ARNcr requiere Cas3 para la resistencia a fagos in vivo.
5
10
15
20
25
30
35
40
45
50
55
Marraffini L. y Sontheimer E. (2010) titulado "CRISP interference: RNA-directed adaptive immunity in bacteria and archaea" Nature Reviews Genetics 11: 181-190 es un artículo de revisión que resume el estado del conocimiento en la técnica en el campo. Se han planteado algunas sugerencias sobre las aplicaciones y tecnologías basadas en CRISPR, pero se trata principalmente de generar cepas resistentes a fagos de bacterias domesticadas para la industria láctea. La escisión específica de las moléculas de ARN in vitro por un complejo RNPcr en Pyrococcus furiosus se sugirió como algo que espera un mayor desarrollo. La manipulación de los sistemas CRISPR también se sugiere como una posible forma de reducir la transmisión de cepas bacterianas resistentes a los antibióticos en los hospitales. Los autores enfatizan que se necesitarán más esfuerzos de investigación para explorar la utilidad potencial de la tecnología en estas áreas.
El documento US2011236530 A1 (Manoury y col.) titulado "Genetic cluster of strains of Streptococcus thermophilus having unique rheological properties for dairy fermentaron" desvela ciertas cepas de S. themophilus que fermentan la leche de modo que sea altamente viscosa y débilmente glutinosa. Se desvela un locus de CRISPR específico de secuencia definida.
El documento US2011217739 A1 (Terns y col.) titulado "Cas6 polypeptides and methods of use" desvela polipéptidos que tienen actividad endorribonucleasa Cas6. Los polipéptidos escinden un polinucleótido de ARN objetivo que tiene un dominio de reconocimiento de Cas6 y un sitio de escisión. La escisión se puede llevar a cabo in vitro o in vivo. Microbios tales como E. coli o Haloferax volcanii se modifican genéticamente para expresar la actividad de la endorribonucleasa Cas6.
El documento WO2010054154 (Danisco) titulado "Bifidobacteria CRISPR sequences" desvela diversas secuencias CRISPR halladas en bifidobacterias y su uso en la fabricación de cepas genéticamente alteradas de las bacterias que están alteradas en sus características de resistencia a fagos.
El documento US2011189776 A1 (Terns y col.) titulado "Prokaryotic RNAi-like system and methods of use" describe procedimientos de inactivación de polinucleótidos objetivo in vitro o en microbios procariotas in vivo. Los procedimientos utilizan un ARNsip que tiene una región 5' de 5-10 nucleótidos seleccionados entre una repetición de un locus de CRISPR inmediatamente corriente arriba de un espaciador. La región 3' es esencialmente complementaria a una porción del polinucleótido objetivo. También se describen polipéptidos que tienen actividad endonucleasa en presencia de ARNsip y polinucleótido objetivo.
El documento EP2341149 A1 (Danisco) titulado "Use of CRISPR associated genes (CAS)" describe cómo pueden utilizarse uno o más genes Cas para modular la resistencia de las células bacterianas contra bacteriófagos, particularmente bacterias que proporcionan un cultivo iniciador o cultivo probiótico en productos lácteos.
El documento WO2010075424 (The Regents of the University of California) titulado "Compositions and methods for downregulating prokaryotic genes" desvela un polinucleótido aislado que comprende una matriz CRISPR. Al menos un espaciador del CRISPR es complementario a un gen de una procariota, por lo que puede regular negativamente la expresión del gen; particularmente cuando el gen está asociado con la producción de biocombustibles.
El documento WO2008108989 (Danisco) titulado "Cultures with improved phage resistance" desvela la selección de cepas bacterianas resistentes a bacteriófagos y también la selección de las cepas que tienen un espaciador adicional que tiene una identidad del 100% con una región del ARN del fago. Se describen combinaciones mejoradas de cepas y rotaciones de cultivos iniciadores para su uso en la industria láctea. Ciertos fagos se describen para su uso como agentes de biocontrol.
El documento WO2009115861 (Institut Pasteur) titulado "Molecular typing and subtyping of Salmonella by Identification of the variable nucleotide sequences of the CRISP loci' desvela procedimientos de detección e identificación de bacterias del género Salmonella utilizando sus secuencias de nucleótidos variables contenidas en loci de CRISPR.
El documento WO2006073445 (Danisco) titulado "Detection and typing of bacterial strains" describe la detección y tipificación de cepas bacterianas en productos alimenticios, suplementos dietéticos y muestras ambientales. Las cepas de Lactobacillus se identifican a través de secuencias específicas de nucleótidos CRISPR.
Urnov F y col. (2010) titulado "Genome editing with engineered zinc finger nucleases" Nature 11: 636-646 es un artículo de revisión sobre nucleasas con dedos de cinc y cómo han sido fundamentales en el campo de la genética inversa en una variedad de organismos modelo. Las nucleasas con dedos de cinc se han desarrollado de modo que es posible orientar con precisión la escisión del genoma seguido de modificación génica en el procedimiento de reparación posterior. Sin embargo, las nucleasas con dedos de cinc se generan fusionando una serie de dominios de unión al ADN con dedos de cinc a un dominio de escisión del ADN. La especificidad de la secuencia de ADN se logra mediante el acoplamiento de varios dedos de cinc en serie, cada uno de los cuales reconoce un motivo de tres nucleótidos. Un inconveniente significativo con la tecnología es que se deben desarrollar nuevos dedos de cinc para cada nuevo locus de ADN que requiere ser escindido. Esto requiere una ingeniería de proteínas y una identificación sistemática exhaustiva para garantizar la especificidad de la unión al ADN.
El documento WO2011097036 A1 describe fusiones TALEN que comprenden variantes FokI. También se desvelan
5
10
15
20
25
30
35
40
45
50
55
endonucleasas dirigidas a ZNF.
Wiedenheft y col. (2011) titulado "Structures of the RNA-guided surveillance complex from a bacterial immune system" Nature 477(7369):486-489 describe un complejo de vigilancia de múltiples subunidades bacterianas llamado Cascada (complejo asociado a CRISPR para defensa antiviral) requerido para la protección contra bacteriófagos.
En los campos de la ingeniería genética e investigación genómica existe una necesidad continua de agentes mejorados para la detección y/o escisión de ácidos nucleicos específica de secuencia/sitio.
Los inventores han realizado un descubrimiento sorprendente en el sentido de que ciertas bacterias que expresan Cas3, que tienen actividad helicasa-nucleasa, expresan Cas3 como una fusión con Cse1. Los inventores también han podido inesperadamente producir fusiones artificiales de Cse1 con otras enzimas nucleasa.
Los inventores también han descubierto que el reconocimiento de ADN objetivo independiente de Cas3 por Cascada marca el ADN para la escisión por Cas3, y que la unión al ADN de Cascada se rige por los requisitos topológicos del ADN objetivo.
Los inventores han descubierto además que Cascada es incapaz de unirse a plásmidos objetivo relajados, pero sorprendentemente Cascada muestra una gran afinidad por los objetivos que tienen una topología negativamente superenrrollada (nSE).
La invención se define en las reivindicaciones adjuntas. Por consiguiente, la invención proporciona una proteína de fusión artificial de una subunidad proteica Cse1 asociada a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISP) de tipo I y una endonucleasa Fokl; una molécula de ácido nucleico que codifica dicha proteína de fusión; un vector de expresión que comprende una molécula de ácido nucleico; un complejo proteico Cascada que comprende dicha proteína de fusión; un complejo ribonucleoproteico que comprende dicha proteína de fusión y una molécula de ARN CRISP (ARNcr); así como una célula eucariota que comprende dicho complejo ribonucleoproteico, en el que la célula es diferente a una célula madre embrionaria humana o célula germinal humana y en el que la célula no forma parte del cuerpo humano o animal. En otro aspecto, la invención proporciona un procedimiento de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico objetivo in vitro que comprende la puesta en contacto del ácido nucleico objetivo con dicho complejo ribonucleoproteico.
Se desvela un complejo asociado a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) para la defensa antiviral (Cascada), el complejo proteico Cascada, o una porción del mismo, que comprende al menos las subunidades proteicas asociadas a CRISPR:
- Cas7 (o COG 1857) que tiene una secuencia de aminoácidos de SEQ ID NO: 3 o una secuencia de al menos un 18 % de identidad con la misma,
- Cas5 (o COG1688) que tiene una secuencia de aminoácidos de SEQ ID NO: 4 o una secuencia de al menos un 17 % de identidad con la misma, y
- Cas6 (o COG 1583) que tiene una secuencia de aminoácidos de la SEQ ID NO: 5 o una secuencia de al menos un 16 % de identidad con la misma,
y en la que al menos una de las subunidades incluye una secuencia de aminoácidos adicional que proporciona la actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina.
Una subunidad que incluye una secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina es un ejemplo de lo que se puede denominar "una subunidad ligada a al menos una fracción funcional"; una fracción funcional es el polipéptido o proteína constituido por la secuencia de aminoácidos adicional. La actividad de activación de la transcripción puede ser la que conduce a la activación o regulación positiva de un gen deseado; la actividad de represión de la transcripción conduce a la represión o regulación negativa de un gen deseado. La selección del gen se debe a la orientación del complejo Cascada de la invención con una molécula de ARN, como se describe más adelante.
La secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina está formada preferentemente por restos de aminoácidos contiguos. Estos aminoácidos adicionales se pueden ver como un polipéptido o proteína que es contiguo y forma parte de la(s) subunidad(es) Cas o Cse afectadas. Dicha secuencia de polipéptido o proteína preferentemente no forma normalmente parte de ninguna secuencia de aminoácidos de la subunidad Cas o Cse. En otras palabras, la secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina puede ser distinta de una secuencia de aminoácidos de la subunidad Cas o Cse, o porción de la misma, es decir, puede ser distinta de una secuencia de aminoácidos de la subunidad Cas3 o porción de la misma.
La secuencia de aminoácidos adicional con actividad de modificación, visualización, activación de la transcripción o
5
10
15
20
25
30
represión de la transcripción de un ácido nucleico o cromatina puede, según se desee, obtenerse o derivarse del mismo organismo, p. ej., E. coli, como la(s) subunidad(es) Cas o Cse.
Adicionalmente y/o alternativamente a lo anterior, la secuencia de aminoácidos adicional que actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina puede ser "heteróloga" a la secuencia de aminoácidos de la(s) subunidad(es) Cas o Cse. Por lo tanto, la secuencia de aminoácidos adicional puede obtenerse o derivarse de un organismo diferente del organismo del cual se deriva(n) o se origina(n) la(s) subunidad(es) Cas y/o Cse.
De principio a fin, la identidad de secuencia se puede determinar por medio de BLAST y posterior alineamiento múltiple de secuencias de Cobalt en el servidor web del Centro Nacional para la Información Biotecnológica, en el que la secuencia en cuestión se compara con una secuencia de referencia (p. ej., SEQ ID NO: 3, 4 o 5). Las secuencias de aminoácidos se pueden definir en términos de porcentaje de similitud de secuencia en base a una matriz BLOSUM62 o identidad porcentual con una secuencia de referencia dada (p. ej., SEQ ID NO: 3, 4 o 5). La similitud o identidad de una secuencia implica una etapa inicial de realizar el mejor alineamiento antes de calcular el porcentaje de conservación con la referencia y refleja una medida de la relación evolutiva de las secuencias.
Cas7 puede tener una similitud de secuencia de al menos 31 % con SEQ ID NO: 3; Cas5 puede tener una similitud de secuencia de al menos 26 % con SEQ ID NO: 4. Cas6 puede tener una similitud de secuencia de al menos 27 % con SEQ ID NO: 5.
Para Cse1/CasA (502 AA):
>gi|16130667|ref|NP_417240.1| ARN CRISP (ARNcr) que contiene una proteína del complejo antiviral Cascada [cepa K-12 de Escherichia coli sustr. MG1655]
MNLLIDNWIPVRPRNGGKVQIINLQSLYCSRDQWRLSLPRDDMELAALALLVCIGQII
APAKDDVEFRHRJMNPLTEDEFQQLIAPWIDMFYLNHAEHPFMQTKGYKANDVTPM
EKLLAGVSGATNCAFVNQPGQGEALCGGCTAIALFNQANQAPGFGGGFKSGLRGGT
PVTTFVRGIDLRSTVLLNVLTLPRLQKQFPNESHTENQPTWIKPIKSNESIPASSIGFYR
GLFWQPAHIELCDPIGIGKCSCCGQESNRRYTGFRKEKFTFTVNGLWPHPHSPCRVTV
KKGEVEEKFLAFTTSAPSWTQISRVWDKIIQNENGNRVAAVVNQFRNIAPQSPLELI
MGGYRNNQASILERRHDVLMFNQGWQQYGNVINEIVTVGLGYKTALRKALYTFAE
GFKNKDFKGAGVSVHETAERHFYRQSELLIPDVLANVNFSQADEVIADLRDKLHQL
CEMLFNQSVAPYAHHPKLISTLALARATLYKHLRELKPQGGPSNG [SEQ ID NO: 1]
Para Cse2/CasB (160 AA):
>gi|16130666|ref|NP_417239.1| ARN CRISP (ARNcr) que contiene una proteína del complejo antiviral Cascada [cepa K-12 de Escherichia coli sustr. MG1655]
MADEIDAMALYRAWQQLDNGSCAQIRRVSEPDELRDIPAFYRLVQPFGWENPRHQQ ALLRMVFCLSAGKNVIRHQDKKSEQTTGISLGRALANSGRINERRIFQLIRADRTADM VQLRRLLTHAEPVLDWPLMARMLTWWGKRERQQLLEDFVLTTNKNA [SEQ ID NO: 2]
Para Cas7/CasC/Cse4 (363 AA):
>gi|16130665|ref|NP_417238.1| ARN CRISP (ARNcr) que contiene una proteína del complejo antiviral Cascada [cepa K-12 de Escherichia coli sustr. MG1655]
MSNFINIHVLISHSPSCLNRDDMNMQKDAIFGGKRRVRISSQSLKRAMRKSGYYAQN
IGESSLRTIHLAQLRDVLRQKLGERFDQKIIDKTLALLSGKSVDEAEKISADAVTPWV
VGEIAWFCEQVAKAEADNLDDKKLLKVLKEDIAAIRVNLQQGVDIALSGRMATSGM
MTELGKVDGAMSIAHAITTHQVDSDIDWFTAVDDLQEQGSAHLGTQEFSSGVFYRY
ANINLAQLQENLGGASREQALEIATHVVHMLATEVPGAKQRTYAAFNPADMVMVN
FSDMPLSMANAFEKAVKAKDGFLQPSIQAFNQYWDRVANGYGLNGAAAQFSLSDV
DPITAQVKQMPTLEQLKSWVRNNGEA [SEQ ID NO: 3]
Para Cas5/CasD (224 AA):
>gi|90111483|ref|NP_417237.2| ARN CRISP (ARNcr) que contiene una proteína del complejo antiviral Cascada [cepa K-12 de Escherichia coli sustr. MG1655]
5
10
15
20
25
30
35
40
MRSYLILRLAGPMQAWGQPTFEGTRPTGRFPTRSGLLGLLGACLGIQRDDTSSLQAL
SESVQFAVRCDELILDDRRVSVTGLRDYHTVLGAREDYRGLKSHETIQTWREYLCD
ASFTVALWLTPHATMYISELEKAVLKPRYTPYLGRRSCPLTHPLFLGTCQASDPQKA
LLNYEPVGGDIYSEESVTGHHLKFTARDEPMITLPRQFASREWYVIKGGMDVSQ
[SEQ ID NO: 4]
Para Cas6e/CasE (199 AA):
>gi|16130663|ref|NP_417236.1| Enzima de escisión del precursor de ARN CRISPR; ARN CRISP (ARNcr) que contiene una proteína del complejo antiviral Cascada [cepa K-12 de Eschenchia coli sustr. MG1655]
MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQS
AQMPVSTAVATVIKTKQVEFQLQVGVPLYFRLRANPIKTÍLDNQKRLDSKGNIKRCR VPLIKEAEQIAWLQRKLGNAARVEDVHPISERPQYFSGDGKSGKIQTVCFEGVLTIND APALIDLVQQGIGPAKSMGCGLLSLAPL [SEQ ID NO: 5]
Al definir el intervalo de variantes de secuencia, para que no quede ninguna duda, cada uno de los siguientes límites opcionales sobre el grado de variación, se aplica a cada SEQ ID NO: 1, 2, 3, 4 o 5 comenzando desde el intervalo de variantes más amplio según se especifica en términos del porcentaje de identidad respectivo anterior. Por lo tanto, el intervalo de variantes puede incluir: al menos 16 %, o al menos 17 %, o al menos 18 %, o al menos 19 %, o al menos 20 %, o al menos 21 %, o al menos 22 %, o al menos 2 3%, o al menos 24 %, o al menos 25 %, o al menos 26 %, o al menos 27 %, o al menos 28 %, o al menos 29 %, o al menos 30 %, o al menos 31 %, o al menos 32 %, o al menos 33 %, o al menos 34 %, o al menos 35 %, o al menos 36 %, o al menos 37 %, o al menos 38 %, o al menos 39 %, o al menos 40 %, o al menos 41 %, o al menos 42 %, o al menos 43 %, al menos 44 %, o al menos 45 %, o al menos 46 %, o al menos 47 %, o al menos 48 %, o al menos 49 %, o al menos 50 %, o al menos 51 %, o al menos 52 %, o al menos 53 %, o al menos 54 %, o al menos 55 %, o al menos 56 %, o al menos 57 %, o al menos 58 %, o al menos 59 %, o al menos 60 %, o al menos 61 %, o al menos 62 %, o al menos 63 %, o al menos 64 %, o al menos el 65 %, o al menos 66 %, o al menos 67 %, o al menos 68 %, o al menos 69 %, o al menos 70 %, o al menos 71 %, al menos 72 %, o al menos 73 %, o al menos 74 %, o al menos 75 %, o al menos 76 %, o al menos 77 %, o al menos 78 %, o al menos 79 %, o al menos 80 %, o al menos 81 %, o al menos 82 %, o al menos 83 %, o al menos 84 %, o al menos 85 %, o al menos 86 %, o al menos 87 %, o al menos 88 %, o al menos 89 %, o al menos 90 %, o al menos 91 %, o al menos 92 %, o al menos 93 %, o al menos 94 %, o al menos 95 %, o al menos 96%, o al menos 97%, o al menos 98%, o al menos 99%, o 100% de identidad de secuencia de aminoácidos.
De principio a fin, la nomenclatura de Makarova y col. (2011) se está utilizando en la definición de las subunidades proteicas Cas. La Tabla 2 en la página 5 del artículo de Makarova y col. enumera los genes Cas y los nombres de las familias y superfamilias a las que pertenecen. De principio a fin, la referencia a una proteína Cas o subunidad proteica Cse incluye una referencia cruzada a la familia o superfamilia de la cual estas subunidades forman parte.
De principio a fin, las secuencias de referencia de las subunidades Cas y Cse de la invención se pueden definir como una secuencia de nucleótidos que codifica la secuencia de aminoácidos. Por ejemplo, la secuencia de aminoácidos de la SEQ ID NO: 3 para Cas7 también incluye todas las secuencias de ácidos nucleicos que codifican esa secuencia de aminoácidos. Las variantes de Cas7 incluidas dentro del alcance de la invención incluyen por lo tanto secuencias de nucleótidos de al menos las identidades o similitudes porcentuales de aminoácidos definidas con la secuencia de ácido nucleico de referencia; así como todas las posibles identidades o similitudes porcentuales entre ese límite inferior y 100 %.
Los complejos Cascada de la invención pueden estar constituidos por subunidades derivadas o modificadas a partir de más de una procariota bacteriana o arquea diferente. Además, las subunidades de diferentes subtipos de Cas pueden mezclarse.
En un aspecto preferente, la subunidad Cas6 es una subunidad Cas6e de SEQ ID NO: 17 a continuación, o una secuencia de al menos un 16 % de identidad con la misma.
La secuencia de una subunidad Cas6e preferente es >gi|16130663|ref|NP_417236.1| enzima de escisión del precursor de ARN CRISPR; ARN CRISP (ARNcr) que contiene una proteína del complejo antiviral Cascada [cepa K- 12 de Eschenchia coli sustr. MG1655]:
MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQS
AQMPVSTAVATVIKTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCR
VPLIKEAEQIAWLQRKLGNAARVEDVHPISERPQYFSGDGKSGKIQTVCFEGVLTIND
APALIDLVQQGIGPAKSMGCGLLSLAPL [SEQ ID NO: 17]
5
10
15
20
25
30
35
40
45
50
55
Los complejos de Cascada, o porciones de la misma, que comprenden al menos una subunidad que incluye una secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina, pueden comprender además una subunidad Cse2 (o similar a YgcK) que tiene una secuencia de aminoácidos de SEQ ID NO: 2 o una secuencia de al menos 20 % de identidad con la misma, o una porción de la misma. Alternativamente, la subunidad Cse se define como aquella que tiene al menos un 38 % de similitud con SEQ ID NO: 2. Opcionalmente, dentro del complejo proteico de la invención, es la subunidad Cse2 la que incluye la secuencia de aminoácidos adicional que tiene actividad de modificación de un ácido nucleico o cromatina.
Los complejos Cascada de la invención pueden comprender una subunidad Cse1 (o similar a YgcL) que tiene una secuencia de aminoácidos de SEQ ID NO: 1 o una secuencia de al menos 9 % de identidad con la misma, o una porción de la misma. Opcionalmente dentro del complejo proteico de la invención, es la subunidad Cse1 la que incluye la secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina.
Un complejo de Cascada es un complejo proteico del sistema CRISPR-Cas tipo I; más preferentemente un complejo proteico de CRISPR-Cas del subtipo I-E o puede estar basado en un complejo tipo I-A o tipo I-B. Un complejo tipo I- C, D o F es posible. En realizaciones particularmente preferentes basadas en el sistema de E. coli, las subunidades pueden tener las siguientes estequiometrías: Cse11Cse22Cas76Cas5-iCas61 o Cse11Cse22Cas76Cas5-iCas6e1.
La secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina puede fusionarse de forma traduccional mediante la expresión a través de sistemas de expresión de proteínas naturales o artificiales, o unirse covalentemente mediante una etapa de síntesis química a la al menos una subunidad; preferentemente, a la al menos una fracción funcional está fusionada o unida a al menos la región del extremo N terminal y/o la región del extremo C terminal de al menos una de las subunidades Cse1, Cse2, Cas7, Cas5, Cas6 o Cas6e. En una realización, la secuencia de aminoácidos adicional que tiene actividad de modificación de un ácido nucleico o cromatina está fusionada o unida al extremo N terminal o al extremo C terminal de una subunidad Cse1, preferentemente, el enlace está en la región del extremo N terminal de una subunidad Cse1.
La secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina es una nucleasa Fokl, o un mutante o una porción activa de la misma.
La proteína en cuestión puede ser una proteína heteróloga de una especie distinta de la especie bacteriana de la cual las subunidades de la proteína Cascada tienen su origen de secuencia.
Preferentemente, un complejo proteico de la invención se puede fusionar con el dominio N terminal de FokI y otro complejo proteico de la invención se puede fusionar con el dominio C terminal de FokI. Estos dos complejos proteicos pueden utilizarse en conjunto para lograr un corte bicatenario específico de locus ventajoso en un ácido nucleico, por lo que la ubicación del corte en el material genético reside en el diseño y elección del usuario, guiado por el componente de ARN (definido y descrito a continuación) y debido a la presencia de una secuencia denominada "motivo adyacente al protoespaciador" (MAP) en la cadena de ácido nucleico objetivo (también descrita con más detalle a continuación).
En una realización preferente, un complejo proteico de la invención tiene una secuencia de aminoácidos adicional que es una endonucleasa de restricción modificada, p. ej., FokI. La modificación está preferentemente en el dominio catalítico. En realizaciones preferentes, la FokI modificada es KKR Sharkey o ELD Sharkey que está fusionada a la proteína Cse1 del complejo proteico. En una aplicación preferente de estos complejos de la invención, dos de estos complejos (KKR Sharkey y ELD Sharkey) pueden estar juntos en combinación. Un par de heterodímeros de complejos proteicos que emplean FokI modificada de forma diferente tiene una ventaja particular en el corte bicatenario dirigido de ácido nucleico. Si se utilizan homodímeros, entonces es posible que exista más escisión en sitios no objetivo debido a la actividad no específica. Un enfoque heterodimérico aumenta ventajosamente la fidelidad de la escisión en una muestra de material.
El complejo Cascada con secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina definido y descrito anteriormente es una parte componente de un sistema general de la invención que permite ventajosamente al usuario seleccionar en una materia predeterminada un locus genético preciso que se desea escindir, marcar o alterar de alguna manera, p. ej., metilación, utilizando cualquiera de las entidades de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina definidas en la presente memoria. La otra parte componente del sistema es una molécula de ARN que actúa como una guía para dirigir el complejo Cascada de la invención al locus correcto en el ADN o ARN que tiene por objeto modificarse, cortarse o marcarse.
El complejo Cascada de la invención también comprende preferentemente una molécula de ARN que comprende una secuencia de ribonucleótidos de al menos 50 % de identidad con una secuencia de ácido nucleico objetivo
5
10
15
20
25
30
35
40
45
50
55
60
deseada, y en la que el complejo proteico y la molécula de ARN forman un complejo ribonucleoproteico. Preferentemente, el complejo ribonucleoproteico se forma cuando la molécula de ARN se híbrida con su secuencia deseada de ácido nucleico objetivo. El complejo ribonucleoproteico se forma cuando los componentes necesarios de la combinación de la fracción funcional Cascada y la molécula de ARN y el ácido nucleico (ADN o ARN) están presentes en conjunto en condiciones fisiológicas adecuadas, ya sea in vivo o in vitro. Sin desear quedar ligado a teoría alguna particular, los inventores creen que en el contexto de ADNbc, particularmente ADN negativamente superenrollado, el complejo Cascada que se asocia con el ADNbc provoca un desenrollamiento parcial de las cadenas dúplex que luego permite que el ARN se asocie con una cadena; todo el complejo ribonucleoproteico luego migra a lo largo de la cadena de ADN hasta que se alcanza una secuencia objetivo esencialmente complementaria a al menos una porción de la secuencia de ARN, momento en el que se produce una interacción estable entre ARN y la cadena de ADN y surte efecto la función de la fracción funcional, ya sea modificando, cortando nucleasa o marcando el ADN en ese locus.
En realizaciones preferentes, una porción de la molécula de ARN tiene al menos un 50 % de identidad con la secuencia de ácido nucleico objetivo; más preferentemente al menos un 95 % de identidad con la secuencia objetivo. En realizaciones más preferentes, la porción de la molécula de ARN es esencialmente complementaria a lo largo de su longitud con respecto a la secuencia de ADN objetivo; es decir, solo hay uno, dos, tres, cuatro o cinco desapareamientos que pueden ser contiguos o no contiguos. La molécula de ARN (o porción de la misma) puede tener al menos 51 %, o al menos 52 %, o al menos 53 %, o al menos 54 %, o al menos 55 %, o al menos 56 %, o al menos 57 %, o al menos 58 %, o al menos 59 %, o al menos 60 %, o al menos 61 %, o al menos 62 %, o al menos 63 %, o al menos 64 %, o al menos 65 %, o al menos 66 %, o al menos 67 %, o al menos 68 %, o al menos 69 %, o al menos 70 %, o al menos 71 %, o al menos 72 %, o al menos 73 %, o al menos 74 %, o al menos 75 %, o al menos 76 %, o al menos 77 %, o al menos 78 %, o al menos 79 %, o al menos 80 %, o al menos 81 %, o al menos 82 %, o al menos 83 %, o al menos 84 %, o al menos 85 %, o al menos 86 %, o al menos 87 %, o al menos 88 %, o al menos 89 %, o al menos 90 %, o al menos 91 %, o al menos 92 %, o al menos 93 %, o al menos 94 %, o al menos 95 %, o al menos 96 %, o al menos 97 %, o al menos 98 %, o al menos 99 %, o 100 % de identidad con la secuencia objetivo.
El ácido nucleico objetivo puede ser ADN (mc o bc) o ARN.
En otras realizaciones preferentes, la molécula de ARN o porción de la misma tiene al menos un 70 % de identidad con el ácido nucleico objetivo. En tales niveles de identidad, el ácido nucleico objetivo es preferentemente ADNbc.
La molécula de ARN requerirá preferentemente una alta especificidad y afinidad por la secuencia de ácido nucleico objetivo. Es deseable una constante de disociación (Kd) en el intervalo de 1 pM a pM, preferentemente 1-100 nM como se determina mediante electroforesis en gel preferentemente nativa, o alternativamente calorimetría de titulación isotérmica, resonancia de plasmón superficial o procedimientos de titulación basados en fluorescencia. La afinidad puede determinarse utilizando un ensayo de desplazamiento de movilidad electroforética (EDME), también llamado ensayo de retardo en gel (véase Semenova E y col. (2011) Proc. Natl. Acad. Sci. USA 108: 10098-10103).
La molécula de ARN se modela preferentemente en lo que se conoce en la naturaleza en procariotas como moléculas de ARN CRISPR (ARNcr). La estructura de las moléculas de ARNcr ya está establecida y explicada con más detalle en Jore y col. (2011) Nature Structural & Molecular Biology 18: 529-537. En resumen, un ARNcr maduro de tipo I-E a menudo tiene 61 nucleótidos de longitud y consiste en una región de 5’"mango" de 8 nucleótidos, la secuencia "espadadora" de 32 nucleótidos y una secuencia 3' de 21 nucleótidos que forma una horquilla con un bucle tetranucleotídico. Sin embargo, el ARN utilizado en la invención no tiene que diseñarse estrictamente respecto al diseño de ARNcr de origen natural, ya sea en longitud, regiones o secuencias de ARN específicas. Lo que está claro, sin embargo, es que las moléculas de ARN para su uso en la invención pueden diseñarse basándose en la información de la secuencia génica en las bases de datos públicas o descubrirse recientemente, y luego fabricarse artificialmente, p. ej., por síntesis química en su conjunto o en parte. Las moléculas de ARN de la invención también se pueden diseñar y producir por medio de expresión en células genéticamente modificadas o sistemas de expresión libre de células y esta opción puede incluir la síntesis de parte o la totalidad de la secuencia de ARN.
La estructura y los requisitos de ARNcr también se han descrito en Semenova E y col. (2011) Proc. Natl. Acad. Sci. EE.UU. 108: 10098-10103. Hay una porción denominada "SEMILLA" que forma el extremo 5' de la secuencia espaciadora y que está flanqueada en 5' a ella por 5' mango de 8 nucleótidos. Semenova y col. (2011) han hallado que todos los residuos de la secuencia semilla deben ser complementarios a la secuencia objetivo, aunque para el residuo en la posición 6, se puede tolerar un desapareamiento. De forma similar, cuando se diseña y fabrica un componente de ARN de un complejo ribonucleoproteico de la invención dirigido a un locus objetivo (es decir, secuencia), se pueden aplicar las reglas necesarias de coincidencia y falta de coincidencia para la secuencia SEMILLA.
La invención incluye por lo tanto un procedimiento de detección y/o localización de un único cambio de base en una molécula de ácido nucleico objetivo que comprende la puesta en contacto de una muestra de ácido nucleico con un complejo ribonucleoproteico de la invención como se ha descrito anteriormente, o con un complejo Cascada y un componente de ARN distinto de la invención como se ha descrito anteriormente, y en el que la secuencia del componente de ARN (que incluye el complejo ribonucleoproteico) es tal que discrimina entre un alelo normal y un
5
10
15
20
25
30
35
40
45
50
55
alelo mutante en virtud de un único cambio de base en la posición 6 de una secuencia contigua de 8 residuos nucleotídicos.
En realizaciones de la invención, la molécula de ARN puede tener una longitud en el intervalo de 35-75 residuos. En realizaciones preferentes, la porción del ARN que es complementaria y se utiliza para dirigir una secuencia de ácido nucleico deseada es de 32 o 33 residuos de longitud. (En el contexto de un ARNcr de origen natural, esto correspondería a la porción espaciadora, como se muestra en la figura 1 de Semenova y col. (2011)).
Un complejo ribonucleoproteico de la invención puede tener adicionalmente un componente de ARN que comprende 8 residuos en 5' en la secuencia de ARN que tiene al menos una complementariedad sustancial con la secuencia objetivo de ácido nucleico. (Se entenderá que la secuencia de ARN que tiene al menos una complementariedad sustancial con la secuencia objetivo de ácido nucleico se corresponde en el contexto de un ARNcr como la secuencia espaciadora. Se consideraría que la secuencia flanqueante 5' del ARN corresponde al 5' mango de un ARNcr. Esto se muestra en la figura 1 de Semenova y col. (2011)).
Un complejo ribonucleoproteico de la invención puede tener una secuencia 3' que forma una horquilla y un bucle tetranucleótido en la secuencia de ARN que tiene al menos una complementariedad sustancial con la secuencia objetivo de ADN. (En el contexto de ARNcr, esto correspondería a un mango 3' que flanquea la secuencia espaciadora como se muestra en la figura 1 de Semenova y col. (2011)).
En algunas realizaciones, el ARN puede ser un ARN CRISPR (ARNcr).
Las proteínas y complejos Cascada de la invención se pueden caracterizar in vitro en términos de su actividad de asociación con el componente de guiado de ARN para formar un complejo ribonucleoproteico en presencia del ácido nucleico objetivo (que puede ser ADN o ARN). Puede utilizarse un ensayo de desplazamiento de movilidad electroforética (EMDE) como ensayo funcional para la interacción de complejos de la invención con sus objetivos de ácido nucleico. Básicamente, el complejo Cascada-fracción funcional de la invención se mezcla con objetivos de ácido nucleico y la interacción estable del complejo Cascada-fracción funcional se controla por EMDE o mediante lectura específica de la fracción funcional, por ejemplo, escisión endonucleolítica del ADN objetivo al deseado sitio. Esto puede determinarse mediante un análisis adicional de la longitud del fragmento de restricción utilizando enzimas comercialmente disponibles con especificidades conocidas y sitios de escisión en una molécula de ADN objetivo.
La visualización de la unión de las proteínas o los complejos Cascada de la invención a ADN o ARN en presencia de ARN guía se puede lograr utilizando imágenes de exploración/microscopía de fuerzas atómicas (SFM/AFM) y esto puede proporcionar un ensayo para la presencia de complejos funcionales de la invención.
Se desvela una molécula de ácido nucleico que codifica al menos una subunidad proteica asociada a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISP) seleccionada entre:
a. una subunidad Cse1 que tiene una secuencia de aminoácidos de SEQ ID NO: 1 o una secuencia de al menos un 9 % de identidad con la misma;
b. una subunidad Cse2 que tiene una secuencia de aminoácidos de SEQ ID NO: 2 o una secuencia de al menos un 20 % de identidad con la misma;
c. una subunidad Cas7 que tiene una secuencia de aminoácidos de SEQ ID NO: 3 o una secuencia de al menos un 18 % de identidad con la misma;
d. una subunidad Cas5 que tiene una secuencia de aminoácidos de SEQ ID NO: 4 o una secuencia de al menos un 17 % de identidad con la misma;
e. una subunidad Cas6 que tiene una secuencia de aminoácidos de SEQ ID NO: 5 o una secuencia de al menos un 16 % de identidad con la misma; y
en el que al menos a, b, c, d o e incluye una secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina.
La secuencia de aminoácidos adicional que tiene actividad de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico o cromatina se fusiona preferentemente con la subunidad de la proteína asociada a CRISPR.
En los ácidos nucleicos, la secuencia de nucleótidos puede ser la que codifica la SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 o SEQ ID NO: 5, respectiva o al definir el intervalo de secuencias variantes de la misma, puede ser una secuencia hibridable con esa secuencia de nucleótidos, preferentemente en condiciones rigurosas, más preferentemente en condiciones de rigurosidad muy alta. Una variedad de condiciones de hibridación rigurosa será familiar para el lector experto en el campo. La hibridación de una molécula de ácido nucleico se produce cuando dos moléculas de ácido nucleico complementarias experimentan una cantidad de enlaces de hidrógeno entre sí conocida como emparejamiento de bases Watson-Crick. La rigurosidad de la hibridación puede variar en función de las condiciones ambientales (es decir, químicas/físicas/biológicas) que rodean los ácidos nucleicos, la temperatura, la naturaleza del procedimiento de hibridación y la composición y longitud de las moléculas de ácido
5
10
15
20
25
30
35
40
45
50
nucleico utilizadas. Los cálculos con respecto a las condiciones de hibridación requeridas para alcanzar grados particulares de rigurosidad se discuten en Sambrook y col., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001); y Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes Part I, Capítulo 2 (Elsevier, Nueva York, 1993). Tm es la temperatura a la que el 50 % de una cadena dada de una molécula de ácido nucleico se hibrida con su cadena complementaria. Lo siguiente es un conjunto a modo de ejemplo de condiciones de hibridación y no es limitante:
Muy alta rigurosidad (permite secuencias que comparten al menos 90 % de identidad para hibridarse)
Hibridación: 5x SSC a 65 °C durante 16 horas
Lavar dos veces: 2x SSC a temperatura ambiente (TA) durante 15 minutos cada vez
Lavar dos veces: 0,5x SSC a 65 °C durante 20 minutos cada vez
Alta rigurosidad (permite secuencias que comparten al menos 80 % de identidad) para hibridarse)
Hibridación: 5x-6x SSC a 65 °C durante 16-20 horas
Lavar dos veces: 2x SSC a TA durante 5-20 minutos cada vez
Lavar dos veces: 1x SSC a 55 °C-70 °C durante 30 minutos cada vez
Baja rigurosidad (permite secuencias que comparten al menos 50 % de identidad para hibridarse)
Hibridación: 6x SSC a TA a 55 °C durante 16-20 horas
Lavar al menos dos veces: 2x-3x SSC a TA durante 20-30 minutos cada vez
La molécula de ácido nucleico puede ser una molécula de ácido nucleico aislada y puede ser un ARN o una molécula de ADN.
La secuencia de aminoácidos adicional puede seleccionarse entre una helicasa, una nucleasa, una nucleasa- helicasa (p. ej., Cas3), una ADN metiltransferasa (p. ej., Dam), una ADN desmetilasa, una histona metiltransferasa, una histona desmetilasa, una acetilasa, una desacetilasa, una fosfatasa, una quinasa, un (co)activador de la transcripción, una subunidad de ARN polimerasa, un represor de la transcripción, una proteína de unión al ADN, una proteína estructural del ADN, una proteína marcadora, una proteína indicadora, una proteína fluorescente, una proteína de unión al ligando (p. ej., mCherry o una proteína de unión a metales pesados), un péptido señal (p. ej., una secuencia de señal Tat), una secuencia de localización subcelular (p. ej., secuencia de localización nuclear) o un epítopo de anticuerpo. La secuencia de aminoácidos adicional puede ser, o de una proteína diferente del organismo del que se deriva(n) la(s) subunidad(es) de proteína Cascada relevante(s).
La invención incluye un vector de expresión que comprende una molécula de ácido nucleico como se ha definido anteriormente. Un vector de expresión puede contener la secuencia de nucleótidos que codifica una única subunidad de la proteína Cascada y también la secuencia de nucleótidos que codifica la secuencia de aminoácidos adicional, por lo que durante la expresión, la subunidad y la secuencia adicional se fusionan. Otros vectores de expresión pueden comprender secuencias de nucleótidos que codifican solo una o más subunidades de la proteína Cascada que no están fusionadas con ninguna secuencia de aminoácidos adicional.
La secuencia de aminoácidos adicional con actividad de modificación de un ácido nucleico o cromatina puede fusionarse a cualquiera de las subunidades Cascada a través de un polipéptido enlazador. El enlazador puede tener cualquier longitud hasta aproximadamente 60 o hasta aproximadamente 100 restos aminoácidos. Preferentemente, el enlazador tiene un número de aminoácidos en el intervalo de 10 a 60, más preferentemente 10-20. Los aminoácidos son preferentemente aminoácidos polares y/o pequeños y/o cargados (p. ej., Gln, Ser, Thr, Pro, Ala, Glu, Asp, Lys, Arg, His, Asn, Cys, Tyr). El péptido enlazador está diseñado preferentemente para obtener el espaciado y el posicionamiento correctos de la fracción funcional fusionada y la subunidad de Cascada a la que se fusiona la fracción para permitir una interacción apropiada con el nucleótido objetivo.
Un vector de expresión de la invención (con o sin secuencia de nucleótidos que codifica restos aminoácidos que en la expresión se fusionará con una subunidad de proteína Cascada) puede comprender además una secuencia que codifica una molécula de ARN como se ha definido anteriormente. Por consiguiente, dichos vectores de expresión se pueden utilizar en un huésped apropiado para generar una ribonucleoproteína de la invención que puede dirigirse a una secuencia de nucleótidos deseada.
Por consiguiente, la invención también proporciona un procedimiento de modificación, visualización o activación o represión de la transcripción de un ácido nucleico objetivo que comprende la puesta en contacto del ácido nucleico con un complejo ribonucleoproteico como se ha definido anteriormente. La modificación puede efectuarse mediante la escisión del ácido nucleico o la unión al mismo.
La invención también incluye un procedimiento de modificación, visualización o activación o represión de la transcripción de un ácido nucleico objetivo que comprende la puesta en contacto del ácido nucleico con un complejo proteico Cascada como se ha definido anteriormente, más una molécula de ARN como se ha definido anteriormente.
5
10
15
20
25
30
35
40
45
50
55
Según los procedimientos anteriores, la modificación, visualización o activación o represión de la transcripción de un ácido nucleico objetivo puede por lo tanto llevarse a cabo in vitro y en un entorno libre de células; es decir, el procedimiento se lleva a cabo como una reacción bioquímica ya sea libre en solución o si implica una fase sólida. El ácido nucleico objetivo se puede unir a una fase sólida, por ejemplo.
En un entorno libre de células, el orden de adición de cada uno de los ácidos nucleicos objetivo, el complejo proteico Cascada y la molécula de ARN queda a opción del experto en la materia. Los tres componentes se pueden añadir simultáneamente, secuencialmente en cualquier orden deseado, o por separado en diferentes momentos y en el orden deseado. De este modo, es posible añadir el ácido nucleico objetivo y el ARN simultáneamente a una mezcla de reacción y luego añadir el complejo proteico Cascada de la invención por separado y más tarde en una secuencia de etapas de procedimiento específicas.
La modificación, visualización o activación o represión de la transcripción de un ácido nucleico objetivo se puede realizar in situ en una célula, ya sea una célula aislada o como parte de un tejido, órgano u organismo multicelular. Por lo tanto, en el contexto de tejidos y órganos completos, y en el contexto de un organismo, el procedimiento puede llevarse a cabo in vivo o puede llevarse a cabo aislando una célula del tejido, órgano completo u organismo y luego devolviendo la célula tratada con un complejo ribonucleoproteico a su ubicación anterior, o una ubicación diferente, ya sea dentro del mismo organismo u organismo diferente. Por lo tanto, el procedimiento incluiría aloinjertos, autoinjertos, isoinjertos y xenoinjertos.
En estas realizaciones, el complejo ribonucleoproteico o el complejo proteico Cascada de la invención requiere una forma apropiada de administración a la célula, que será bien conocida por los expertos en la materia, incluyendo la microinyección, ya sea en el citoplasma celular o en el núcleo.
Además, cuando se presenta por separado, la molécula de ARN requiere una forma apropiada de administración a una célula, ya sea simultánea, separada o secuencialmente con el complejo proteico Cascada. Tales formas de introducir aRn en las células son bien conocidas por los expertos en la materia y pueden incluir la administración in vivo o ex vivo por procedimientos de transfección convencionales. Pueden utilizarse procedimientos físicos, tales como microinyección y electroporación, así como coprecipitación de calcio, y polímeros y lípidos catiónicos disponibles comercialmente, y péptidos que penetran en la célula, partículas que penetran en la célula (pistola de genes). Por ejemplo, los virus pueden utilizarse como vehículos de administración, ya sea al citoplasma y/o al núcleo, p. ej., a través de la fusión (reversible) del complejo proteico Cascada de la invención o un complejo ribonucleoproteico de la invención con la partícula viral. Se puede utilizar administración viral (p. ej., administración de adenovirus) o administración mediada por Agrobacterium.
La invención también incluye un procedimiento de modificación, visualización, o activación o represión de la transcripción de un ácido nucleico objetivo en una célula, que comprende transfectar, transformar o transducir la célula con cualquiera de los vectores de expresión como se ha descrito anteriormente. Los procedimientos de transfección, transformación o transducción son de los tipos bien conocidos por un experto en la materia. Cuando existe un vector de expresión utilizado para generar la expresión de un complejo Cascada de la invención y cuando el ARN se añade directamente a la célula, entonces se puede utilizar el mismo procedimiento o un procedimiento diferente de transfección, transformación o transducción. De forma similar, cuando se utiliza un vector de expresión para generar expresión de un complejo Cascada-fusión funcional de la invención y cuando se utiliza otro vector de expresión para generar la expresión del ARN in situ, entonces puede ser utilizado el mismo procedimiento o un procedimiento diferente de transfección, transformación o transducción.
En otras realizaciones, el ARNm que codifica el complejo Cascada de la invención se introduce en una célula de modo que el complejo Cascada se expresa en la célula. El ARN que guía el complejo Cascada a la secuencia objetivo deseada también se introduce en la célula, ya sea de manera simultánea, por separado o secuencialmente a partir del ARNm, de manera que se forma el complejo ribonucleoproteico necesario en la célula.
En los procedimientos mencionados anteriormente de modificación o visualización de un ácido nucleico objetivo, la secuencia de aminoácidos adicional puede ser un marcador y el marcador se asocia con el ácido nucleico objetivo; preferentemente en el que el marcador es una proteína; opcionalmente una proteína fluorescente, p. ej., proteína verde fluorescente (VPF) o proteína amarilla fluorescente (PAF) o mCherry. Ya sea in vitro, ex vivo o in vitro, los procedimientos de la invención pueden utilizarse para visualizar directamente un locus objetivo en una molécula de ácido nucleico, preferentemente en la forma de una estructura de orden superior tal como un plásmido o cromosoma superenrollado o un ácido nucleico objetivo monocatenario tal como ARNm. La visualización directa de un locus objetivo puede utilizar micrografía electrónica o microscopía de fluorescencia.
Se pueden utilizar otros tipos de marcadores para marcar el ácido nucleico objetivo incluyendo moléculas de colorante orgánico, marcadores radiactivos y marcadores de espín que pueden ser moléculas pequeñas.
En los procedimientos de la invención descritos anteriormente, el ácido nucleico objetivo es ADN; preferentemente ADNbc aunque el objetivo puede ser ARN; preferentemente ARNm.
En los procedimientos de la invención de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico objetivo en el que el ácido nucleico objetivo es ADNbc, la secuencia de
5
10
15
20
25
30
35
40
45
50
55
aminoácidos adicional con actividad de modificación de un ácido nucleico o cromatina es una endonucleasa Fokl. De esta forma, el corte de ADN específico de secuencia única se puede modificar por ingeniería utilizando los complejos Cascada-fracciones funcionales. La secuencia elegida del componente de ARN del complejo ribonucleoproteico final proporciona la especificidad de secuencia deseada para la acción de la secuencia de aminoácidos adicional.
Por lo tanto, la invención también proporciona un procedimiento de unión final no homóloga de una molécula de ADNbc en una célula en un locus deseado para eliminar al menos una parte de una secuencia de nucleótidos de la molécula de ADNbc; opcionalmente para bloquear la función de un gen o genes, en el que el procedimiento comprende realizar roturas bicatenarias utilizando cualquiera de los procedimientos de modificación de un ácido nucleico objetivo como se ha descrito anteriormente.
La invención proporciona además un procedimiento de recombinación homóloga de un ácido nucleico en una molécula de ADNbc en una célula en un locus deseado para modificar una secuencia de nucleótidos existente o insertar una secuencia de nucleótidos deseada, en el que el procedimiento comprende realizar una rotura monocatenaria o bicatenaria en el locus deseado utilizando cualquiera de los procedimientos de modificación de un ácido nucleico objetivo como se ha descrito anteriormente.
Por lo tanto, la invención también proporciona un procedimiento de modificación, activación o represión de la expresión génica en un organismo que comprende modificar, activar la transcripción o reprimir la transcripción de una secuencia de ácido nucleico objetivo según cualquiera de los procedimientos descritos anteriormente, en el que el ácido nucleico es ADNbc y la fracción se selecciona entre una enzima modificadora del ADN (p. ej., una desmetilasa o desacetilasa), un activador de la transcripción o un represor de la transcripción.
La invención proporciona adicionalmente un procedimiento de modificación, activación o represión de la expresión génica en un organismo que comprende modificar, activar la transcripción o reprimir la transcripción de una secuencia de ácido nucleico objetivo según cualquiera de los procedimientos descritos anteriormente, en el que el ácido nucleico es un ARNm y la fracción funcional es una ribonucleasa; opcionalmente seleccionado entre una endonucleasa, una exonucleasa 3' o una exonucleasa 5'.
En cualquiera de los procedimientos de la invención como se ha descrito anteriormente, la célula que se somete al procedimiento puede ser una procariota. De forma similar, la célula puede ser una célula eucariota, p. ej., una célula vegetal, una célula de insecto, una célula de levadura, una célula fúngica, una célula de mamífero o una célula humana. Cuando la célula es de un mamífero o ser humano, puede ser una célula madre (pero puede no ser una célula madre embrionaria humana). Dichas células madre para su uso en la invención son preferentemente células madre aisladas. Opcionalmente según cualquier procedimiento de la invención, una célula se transfecta in vitro.
Preferentemente, sin embargo, en cualquiera de los procedimientos de la invención, el ácido nucleico objetivo tiene una estructura terciaria específica, opcionalmente superenrollada, más preferentemente en la que el ácido nucleico objetivo está negativamente superenrrollado. Ventajosamente, los complejos ribonucleoproteico de la invención, ya sea producidos in vitro, o formados dentro de las células, o formados dentro de las células a través de la maquinaria de expresión de la célula, pueden utilizarse para dirigir un locus al que de otro modo sería difícil acceder para aplicar la actividad funcional de un componente deseado, ya sea marcado o etiquetado de una secuencia específica, modificación de la estructura de ácido nucleico, activación o desactivación de la expresión génica o modificación de la secuencia objetivo en sí misma que implica corte monocatenario o bicatenario seguido de inserción de uno o más residuos de nucleótidos o un casete.
La invención también incluye una composición farmacéutica que comprende un complejo proteico Cascada o un complejo ribonucleoproteico de la invención como se ha descrito anteriormente.
Asimismo se desvela una composición farmacéutica que comprende un ácido nucleico aislado o un vector de expresión de la invención como se ha descrito anteriormente.
También se desvela un kit que comprende un complejo proteico Cascada de la invención como se ha descrito anteriormente más una molécula de ARN de la invención como se ha descrito anteriormente.
También se desvela un complejo proteico Cascada o un complejo ribonucleoproteico o un ácido nucleico o un vector, como se ha descrito anteriormente para su uso como medicamento.
La invención permite una variedad de posibilidades para alterar físicamente el ADN de huéspedes procarióticos o eucarióticos en un locus genómico especificado, o cambiar los patrones de expresión de un gen en un locus dado. El ADN genómico del huésped puede escindirse o modificarse mediante metilación, visualizarse mediante fluorescencia, activarse transcripcionalmente o reprimirse por dominios funcionales tales como nucleasas, metilasas, proteínas fluorescentes, activadores o represores de la transcripción, respectivamente, fusionados a subunidades Cascada adecuadas. Además, la capacidad de unión a ARN guiado por ARN de Cascada permite el control del tráfico de ARN en células vivas utilizando proteínas de fusión Cascada fluorescentes, y proporciona formas de secuestrar o destruir ARNm del huésped que causa interferencia con los niveles de expresión génica de una célula huésped.
5
10
15
20
25
30
35
40
45
50
55
60
En cualquiera de los procedimientos de la invención, el ácido nucleico objetivo puede definirse, preferentemente si es ADNbc, mediante la presencia de al menos uno de los siguientes tripletes de nucleótidos: 5-CTT-3', 5'-CAT-3', 5'- CCT-3' o 5'-CTC-3' (o 5'-CUU-3', 5'-CAU-3', 5'-CCU-3 'o 5'-CTC-3' si el objetivo es un ARN). La ubicación del triplete se encuentra en la cadena objetivo adyacente a la secuencia a la que se hibrida el componente de la molécula de ARN de una ribonucleoproteína de la invención. El triplete marca el punto en la secuencia de cadena objetivo en la que el emparejamiento de bases con el componente de la molécula de ARN de la ribonucleoproteína no tiene lugar en una dirección 5' a 3' (corriente abajo) del objetivo (mientras se produce corriente arriba de la secuencia objetivo desde ese punto sometido a la longitud preferente de la secuencia de ARN del componente de la molécula de ARN de la ribonucleoproteína de la invención). En el contexto de un sistema CRISPR de tipo I nativo, los tripletes corresponden a lo que se conoce como "MAP" (motivo adyacente al protoespaciador). Para objetivos ADNmc o ARNmc, la presencia de uno de los tripletes no es tan necesaria.
La invención se describirá ahora en detalle y con referencia a los ejemplos específicos y dibujos en los que:
Las Figuras y los Ejemplos que no pertenecen a la invención reivindicada son solo para fines ilustrativos.
La Figura 1 muestra los resultados de los ensayos de desplazamiento en gel en los que Cascada se une al ADN plasmídico negativamente superenrollado (nSE) pero no al ADN relajado. A) Desplazamiento en gel de ADN plasmídico nSE con J3-Cascada, que contiene un ARNcr dirigido (J3). pUC-A se mezcló con cantidades crecientes 2 veces de J3-Cascada, a partir de una relación molar pUC-A:Cascada de 1:0,5 hasta una relación molar de 1:256. El primer y el último carril contienen solo pUC-A. B) Desplazamiento en gel como en (A) con R44-Cascada que contiene un ARNcr no dirigido (R44). C) Desplazamiento en gel como en (A) con Nt.BspQI escotado con pUC-A. D) Desplazamiento en gel como en (A) con Pdml linearizado con pUC-A. E) El ajuste de la fracción pUC-A unida a J3-Cascada representada frente a la concentración libre de J3-Cascada proporciona la constante de disociación (Kd) para la unión específica. F) El ajuste de la fracción pUC-A unida a R44-Cascada representada frente a la concentración libre de R44-Cascada proporciona la constante de disociación (Kd) para la unión no específica. G) Unión específica de Cascada al protoespaciador controlado por análisis de restricción, utilizando el único sitio de restricción Bsml en la secuencia del protoespaciador. Los carriles 1 y 5 contienen solo pUC-A. Los carriles 2 y 6 contienen pUC-A mezclado con Cascada. Los carriles 3 y 7 contienen pUC-A mezclado con Cascada y la posterior adición de BsmI. Los carriles 4 y 8 contienen pUC-A mezclado con BsmI. H) Desplazamiento en gel de pUC-A unido a Cascada con posterior escisión Nt.BspQI de una cadena del plásmido. Los carriles 1 y 6 contienen solo pUC-A. Los carriles 2 y 7 contienen pUC-A mezclado con Cascada. Los carriles 3 y 8 contienen pUC-A mezclado con Cascada y posterior escotamiento con Nt.BspQI. Los carriles 4 y 9 contienen pUC-A mezclado con Cascada, seguido de la adición de una sonda de ADNmc complementario a la cadena desplazada en el bucle R y posterior escotado con Nt.BspQI. Los carriles 5 y 10 contienen pUC-A escotado con Nt.BspQI. H) Desplazamiento en gel de pUC-A unido a Cascada con subsiguiente escotado con Nt.BspQI del plásmido. Los carriles 1 y 6 contienen solo pUC-A. Los carriles 2 y 7 contienen pUC-A mezclado con Cascada. Los carriles 3 y 8 contienen pUC-A mezclado con Cascada y posterior escisión de Nt.BspQI. Los carriles 4 y 9 contienen pUC-A mezclado con Cascada, seguido de la adición de una sonda de ADNmc complementario a la cadena desplazada en el bucle R y posterior escisión con Nt.BspQI. Los carriles 5 y 10 contienen pUC-A escindido con Nt.BspQI. I) Desplazamiento en gel de pUC-A unido a Cascada con posterior escisión EcoRI de ambas cadenas del plásmido. Los carriles 1 y 6 contienen solo pUC-A. Los carriles 2 y 7 contienen pUC-A mezclado con Cascada. Los carriles 3 y 8 contienen pUC-A mezclado con Cascada y posterior escisión de EcoRI. Los carriles 4 y 9 contienen pUC-A mezclado con Cascada, seguido de la adición de una sonda de ADNmc complementario a la cadena desplazada en el bucle R y posterior escisión con EcoRI. Los carriles 5 y 10 contienen pUC-A escindido con EcoRI.
La Figura 2 muestra micrografías de fuerzas de barrido que demuestran cómo Cascada induce la flexión del ADN objetivo tras la unión del protoespaciador. A-P) Imágenes de microscopía de fuerzas de barrido de ADN plasmídico nSE con J3-Cascada que contiene un ARNcr objetivo (J3). pUC-A se mezcló con J3-Cascada en una relación pUC-A:Cascada de 1:7. Cada imagen muestra una superficie de 500 x 500 nm. Los puntos blancos corresponden a Cascada.
La Figura 3 muestra cómo el análisis de BiFC revela que Cascada y Cas3 interactúan tras el reconocimiento del objetivo. A) fluorescencia de Venus de células que expresan CascadaACse1 y CRISPR 7Tm, que se dirige a 7 protoespaciadores en el genoma del fago A, y a las proteínas de fusión Cse1-N155Venus y Cas3-C85Venus. B) Imagen de campo claro de las células en (A). C) Superposición de (A) y (B). D) Fluorescencia de Venus de células infectadas por fago A que expresan las proteínas de fusión CascadaACse1 y CRISPR 7Tm y Cse1- N155Venus y Cas3-C85Venus. E) Imagen de campo claro de las células en (G). F) Superposición de (G) y (H). G) Fluorescencia de Venus de células infectadas por fago A que expresan las proteínas CascadaACse1 y CRISPR R44 no dirigido y N155Venus y C85Venus. H) Imagen de campo claro de las células en (J). I) Superposición de (J) y (K). J) Promedio de la intensidad de fluorescencia de 4-7 células individuales de cada cepa, según se determina utilizando la herramienta de perfil del visor LSM (Carl Zeiss).
La Figura 4 muestra las actividades de nucleasa y helicasa Cas3 durante la interferencia CRISPR. A) Las células BL21-AI competentes que expresan Cascada, un mutante Cas3 y CRISPR J3 se transformaron con pUC- A. Se representan las unidades formadoras de colonias por microgramo pUC-A (ufc/pg de ADN) para cada una de
5
10
15
20
25
30
35
40
45
50
55
las cepas que expresan un mutante Cas3. Las células que expresan Cas3 y CRISPR J3 o CRISPR R44 ts sirven como controles positivos y negativos, respectivamente. B) Las células BL21-AI que portan plásmidos que codifican Cascada, Cas3 y CRISPR así como pUC-A se cultivan en condiciones que suprimen la expresión de genes cas y CRISPR. En t = 0 la expresión es inducida. Se muestra el porcentaje de células que perdieron pUC- A con el tiempo, según lo determinado por la relación de células resistentes a la ampicilina y sensibles a la ampicilina.
La Figura 5 muestra cómo un complejo de fusión Cascada-Cas3 proporciona resistencia in vivo y tiene actividad de nucleasa in vitro. A) SDS-PAGE teñido con azul de Coomassie de Cascada purificada y complejo de fusión Cascada-Cas3. B) Eficiencia de formación de placas del fago A en células que expresan el complejo de fusión Cascada-Cas3 y un CRISPR dirigido (J3) o no dirigido (R44) y en células que expresan Cascada y Cas3 por separado junto con CRISPR dirigido (J3). C) Desplazamiento en gel (en ausencia de iones metálicos divalentes) del plásmido objetivo nSE con complejo de fusión J3-Cascada-Cas3. pUC-A se mezcló con cantidades crecientes 2 veces de J3-Cascada-Cas3, a partir de una relación molar pUC-A:J3-Cascada-Cas3 de 1:0,5 hasta una relación molar de 1:128. El primer y último carril contienen solo pUC-A. D) Desplazamiento en gel (en ausencia de iones metálicos divalentes) del plásmido no objetivo nSE con complejo de fusión J3-Cascada-Cas3. Se mezcló pUC-p7 con cantidades crecientes 2 veces de J3-Cascada-Cas3, a partir de una relación molar pUC- p7:J3-Cascada-Cas3 de 1:0,5 hasta una relación molar de 1:128. El primer y último carril contienen solo pUC-p7. E) Incubación del plásmido objetivo nSE (pUC-A, izquierda) o plásmido no objetivo nSE (pUC-p7, derecha) con J3-Cascada-Cas3 en presencia de MgCh 10 mM. Los carriles 1 y 7 contienen solo plásmido. F) Ensayo al igual que en (E) en presencia de ATP 2 mM. G) Ensayo al igual que en (E) con el complejo mutante J3-Cascada- Cas3K320N. H) Ensayo al igual que en (G) en presencia de ATP 2 mM.
La Figura 6 es un diagrama esquemático que muestra un modelo de la vía de tipo I de interferencia CRISPR en E. coli.
La Figura 7 es un diagrama esquemático que muestra cómo se utiliza una realización de fusión Cascada-FokI de la invención para crear dímeros FokI que cortan ADNbc para producir extremos romos como parte de un proceso de unión final no homóloga o recombinación homóloga.
La Figura 8 muestra cómo el análisis de BiFC revela que Cascada y Cas3 interactúan tras el reconocimiento del objetivo. Superposición de la imagen de campo claro y fluorescencia de Venus de células que expresan Cascada sin Cse1, Cse1-N155Venus y Cas3-C85Venus ni CRISPR 7Tm, que se dirige a 7 protoespaciadores en el genoma del fago Lambda, o al CRISPR R44 sin dirigir. Las células que expresan CRISPR 7Tm son fluorescentes solo cuando son infectadas por el fago Lambda, mientras que las células que expresan CRISPR R44 no son fluorescentes. Los puntos fluorescentes altamente intensos (fuera de las células) se deben a cristales de sal que reflejan la luz. Las barras blancas corresponden a 10 micrómetros.
La Figura 9 muestra secuencias de pUC-A de 4 clones [SEQ ID NOs: 39-42] que codifican CRISPR J3, Cascada y Cas3 (ts o S483AT485A) indican que estos son mutantes de escape que llevan deleciones (parciales) del protoespaciador o portan una única mutación puntual en la región semilla, lo que explica la incapacidad para curar estos plásmidos.
La Figura 10 muestra los alineamientos de secuencia de genes cas3 de organismos que contienen el sistema CRISPR/Cas de tipo I-E. Alineamiento de genes cas3-cse1 de Streptomyces sp. SPB78 (1a secuencia, número de acceso: ZP_07272643.1) [SEQ ID NO: 43], en Streptomyces griseus (2a secuencia, número de acceso YP_001825054) [SEQ ID nO: 44], y en Catenulispora acidiphila DSM 44928 (3a secuencia, número de acceso YP_003114638) [SEQ ID NO: 45] y una proteína de fusión Cas3-Cse1 de E. coli [SEQ ID NO: 46] que incluye la secuencia de unión de polipéptido de S. griseus.
La Figura 11 muestra el diseño de un par de Cascada nucleasa en el que los dominios de nucleasa FokI están mutados de modo que solo los heterodímeros que consisten en los dominios de nucleasa KKR y ELD son diferentes y la distancia entre los sitios de unión opuestos puede variarse para determinar la distancia óptima entre un par de nucleasas Cascada.
La Figura 12 es un diagrama esquemático que muestra la dirección del genoma mediante un par de nucleasas Cascada-FokI.
La Figura 13 muestra un gel SDS PAGE de complejos Cascada-nucleasa.
KKR/ELD
La Figura 14 muestra geles de electroforesis de ensayos de escisión in vitro de Cascada en ADN
plasmídico.
KKR/ELD
La Figura 15 muestra los patrones de escisión y la frecuencia de Cascada [SEQ ID NO: 47].
Ejemplos - Materiales y procedimientos utilizados Cepas, clonación de genes, plásmidos y vectores
Las cepas BL21-AI de E. coli y BL21 de E. coli (DE3) se utilizaron de principio a fin. La Tabla 1 enumera todos los plásmidos utilizados en este estudio. Los pWUR408, pWUR480, pWUR404 y pWUR547 previamente descritos se utilizaron para la producción de Strep-tag II R44-Cascada, y pWUR408, pWUR514 y pWUR630 se utilizaron para la producción de Strep-tag II J3-Cascada (Jore y coll., (2011) Nature Structural & Molecular Biology 18, 529-536;
5 Semenova y col., (2011) Proceedings of the National Academy of Sciences of The United States of America 108, 10098-10103). puC-A (pWuR610) y pUC-p7 ( pWUR613) se han descrito en otra parte (Jore y col., 2011; Semenova y col., 2011). La proteína C85Venus está codificada por pWUR647, que corresponde a pET52b (Novagen) que contiene la construcción sintética GA1070943 (Tabla 2) (Geneart) clonada entre los sitios BamHI y NotI. La proteína N155Venus está codificada por pWUR648, que corresponde a pRSF1b (Novagen) que contiene la construcción 10 sintética GA1070941 (Tabla 2) (Geneart) clonada entre los sitios NotI y XhoI. La proteína de fusión Cas3-C85Venus está codificada por pWUR649, que corresponde a pWUR647 que contiene el producto de amplificación Cas3 utilizando los cebadores BG3186 y BG3213 (Tabla 3) entre los sitios NcoI y BamHI. La proteína de fusión CasA- N155Venus está codificada por pWUR650, que corresponde a pWUR648 que contiene el producto de amplificación CasA utilizando los cebadores BG3303 y BG3212 (Tabla 3) entre los sitios NcoI y BamHI. CRISPR 7Tm está 15 codificado por pWUR651, que corresponde a pACYCDuet-1 (Novagen) que contiene la construcción sintética GA1068859 (Tabla 2) (Geneart) clonada entre los sitios NcoI y KpnI. Cascada que codifica pWUR400, CascadaACse1 que codifica WUR401 y Cas3 que codifica pWUR397 se han descrito anteriormente (Jore y col., 2011). Cas3H74A que codifica pWUR652 se construyó utilizando mutagénesis dirigida al sitio de pWUR397 con los cebadores BG3093, BG3094 (Tabla 3).
20
Tabla 1 - Plásmidos utilizados
Plásmidos
Descripción y orden de genes (5-3) Sitios de restricción Cebadores Fuente
pWUR397
cas3 en pRSF-1b, sin marcadores 1
pWUR400
casA-casB-casC-casD-casE en pCDF-1b, sin 1
marcadores
pWUR401
casB-casC-casD-casE en pCDF-1b, sin marcadores 1
pWUR404
casE en pCDF-1b, sin marcadores 1
pWUR408
casA en pRSF-1b, sin marcadores 1
pWUR480
casB con Strep-tag II (N-term)-casC-casD en pET52b 1
pWUR514
casB con Strep-tag II (N-term)-casC-casDCasE en pET52b 2
pWUR547
E. coli R44 CRISPR, 7x espaciador n.° 2, en pACYCDuet-1 2
pWUR613
pUC-p7; pUC19 que contiene R44- protoespaciador en un amplicón P7 de fago de 350 pb 2
pWUR630
CRISPR poli J3, 5x espaciador J3 en pACYCDuet-1 NcoI/KpnI Este estudio
pWUR610
pUC-A; pUC19 que contiene J3-protoespaciador en un amplicón de fago A 350 pb 3
p WUR647
C85Venus; GA1070943 (Tabla S1) en pET52b BamHI/NotI Este estudio
pWUR648
N155Venus; GA1070941 (Tabla S1) en pRSF1b NotI/XhoI Este estudio
pWUR649
cas3-C85Venus; pWUR647 que contiene amplicón cas3 NcoI/BamHI BG3186 + BG3213 Este estudio
pWUR650
casA-N155Venus pWUR648 que contiene amplicón casA NcoI/NotI BG3303 + BG3212 Este estudio
pWUR651
CRISPR 7Tm; GA1068859 (Tabla S1) en pACYCDuet-1 NcoI/KpnI Este estudio
casB con Strep-tag II (N-term)-casC-casDCasE en pCDF-1b Este estudio
fusión cas3-casA Este estudio
(continuación)
Plásmidos
Descripción y orden de genes (5-3) Sitios de restricción Cebadores Fuente
fusión cas3H74A-CasA Este estudio
fusión cas3D75A-CasA Este estudio
fusión cas3K320N-CasA Este estudio
fusión cas3D452N-CasA Este estudio
La fuente 1 en la tabla anterior es de Brouns y col (2008) Science 321, 960-964.
La fuente 2 en la tabla anterior es de Jore y col (2008) Nature Structural & Molecular Biology 18, 529-537. 5 Tabla 2 - Construcciones sintéticas
GA1070943
ACT GGAAAGCGGGC AGTGAAAGGAAGGCCC AT GAGGCC AGTT AATT AAGCGG A
TCCTGGCGGCGGCAGCGGCGGCGGCAGCGACAAGCAGAAGAACGGCATCAAGG
CGAACTTCAAGATCCGCCACAACATCGAGGACGGCGGCGTGCAGCTCGCCGACC
ACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACC
ACTACCTGAGCTACCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATC
ACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGA
GCTGTACAAGTAAGCGGCCGCGGCGCGCCTAGGCCTTGACGGCCTTCCTTCAATT
CGCCCTATAGTGAG [SEQ ID NO: 6]
GA1070941
CACTATAGGGCGAATTGGCGGAAGGCCGTCAAGGCCGCATTTAATTAAGCGGCC
GCAGGCGGCGGCAGCGGCGGCGGCAGCATGGTGAGCAAGGGCGAGGAGCTGTT
CACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAA
GTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCT
GAAGCTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACC
ACCCTCGGCTACGGCCTGCAGTGCTTCGCCCGCTACCCCGACCACATGAAGCAGC
ACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTT
CTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGA
C ACCCTGGT GAACCGC ATCGAGCT GAAGGGC ATCGACTT C AAGGAGGACGGC AA
CATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCAC
GGCCTAACTCGAGGGCGCGCCCTGGGCCTCATGGGCCTTCCGCTCACTGCCCGCT
TTCCAG [SEQ ID NO: 7]
10 GA1068859
CACTATAGGGCGAATTGGCGGAAGGCCGTCAAGGCCGCATGAGCTCCATGGAAA
C AAAG AATT AGCT G AT CTTT AAT AAT AAGG AAAT GTT AC ATT AAGGTT GGT GGGT
T GTTTTT ATGGGAAAA AAT GCTTT AAG AAC AAAT GT AT ACTTTT AG AG AGTT C CC
CGCGCCAGCGGGGATAAACCGGGCCGATTGAAGGTCCGGTGGATGGCTTAAAAG
AGTTCCCCGCGCCAGCGGGGATAAACCGCCGCAGGTACAGCAGGTAGCGCAGAT
CATCAAGAGTTCCCCGCGCCAGCGGGGATAAACCGACTTCTCTCCGAAAAGTCA
GGACGCTGTGGCAGAGTTCCCCGCGCCAGCGGGGATAAACCGCCTACGCGCTGA
ACGCCAGCGGTGTGGTGAATGAGTTCCCCGCGCCAGCGGGGATAAACCGGTGTG
GCCATGCACGCCTTTAACGGTGAACTGGAGTTCCCCGCGCCAGCGGGGATAAAC
CGCACGAACTCAGCCAGAACGACAAACAAAAGGCGAGTTCCCCGCGCCAGCGG
GGATAAACCGGCACCAGTACGCGCCCCACGCTGACGGTTTCTGAGTTCCCCGCGC
CAGCGGGGATAAACCGCAGCTCCCATTTTCAAACCCAGGTACCCTGGGCCTCATG
GGCCTTCCGCTCACTGCCCGCTTTCCAG [SEQ ID NO: 8]
GA1047360
GAGCTCCCGGGCTGACGGTAATAGAGGCACCTACAGGCTCCGGTAAAACGGAAA C AGC GCTGGCCT AT GCTT GG AAACTT ATT G AT C AAC AAATT GCGG AT AGT GTT AT TTTTGCCCTCCCAACACAAGCTACCGCGAATGCTATGCTTACGAGAATGGAAGCG AGCGCGAGCCACTTATTTTCATCCCCAAATCTTATTCTTGCTCATGGCAATTCACG GTTT AAC C AC CTCTTT C A AT C AAT AAAAT C ACGCGC G ATT AC T G AAC AGGGGC AA GAAGAAGC GTGGGTT C AGT GTT GT C AGT GGTTGT C ACAA AGC AAT AAGAAAGT G TTT CTT GGGCAAATCGGCGTTT GC ACGATT GAT C AGGT GTT GATTTCGGTATTGCC AGTT AAAC AC CGCTTT ATCC GT GGTTT GGG AATT GGT AG ATCTGTTTT AATT GTT A AT GAAGTT C AT GCTT ACG AC AC CT AT AT G A AC GGCTT GCTCG AGGC AGT GCT CAA GGCT C AGGCTGAT GTGGGAGGGAGT GTT ATTCTT CTTTCCGC AACCCT ACC AAT G AAAC AAAAAC AGAAGCTT CT GGATACTT AT GGT CT GC AT AC AGATCC AGTGGAA AATAACTCCGCATATCCACTCATTAACTGGCGAGGTGTGAATGGTGCGCAACGTT TTGATCTGCTAGCGGATCCGGTACC [SEQ ID NO: 9]
Tabla 3 - Cebadores
BG3186
ATAGCGCCATGGAACCTTTTAAATATATATGCCATTA [SEQ ID NO: 10]
BG3213
ACAGTGGGATCCGCTTTGGGATTTGCAGGGATGACTCTGGT [SEQ ID NO: 11]
BG3303
ATAGCGTCATGAATTTGCTTATTGATAACTGGATTCCTGTACG [SEQ ID NO: 12]
BG3212
ACAGTGGCGGCCGCGCCATTTGATGGCCCTCCTTGCGGTTTTAA [SEQ ID NO: 13]
BG3076
CGTATATCAAACTTTCCAATAGCATGAAGAGCAATGAAAAATAAC [SEQ ID NO: 14]
BG3449
ATGATACCGCGAGACCCACGCTC [SEQ ID NO: 15]
BG3451
CGGATAAAGTTGCAGGACCACTTC [SEQ ID NO: 16]
5
Producción y purificación de proteínas
La cascada se expresó y purificó como se describe (Jore y col., 2011). Durante toda la purificación, se utilizó un tampón que contenía HEPEs 20 mM pH 7,5, NaCl 75 mM, DTT 1 mM, EDTA 2 mM para la resuspensión y el lavado. La elución de proteína se realizó en el mismo tampón que contenía destiobiotina 4 mM. El complejo de fusión 10 Cascada-Cas3 se expresó y purificó de la misma manera, realizándose las etapas de lavado con HEPES 20 mM, pH 7,5, NaCl 200 mM y DtT 1 mM, y elución en HEPES 20 mM, pH 7,5, NaCl 75 mM, DTT 1 mM que contenía 4 mM de destiobiotina.
Ensayo de desplazamiento de movilidad electroforética
5
10
15
20
25
30
35
40
45
50
55
Se mezclaron los subcomplejos Cascada purificada o Cascada con pUC-A en un tampón que contenía HEPES 20 mM, pH 7,5, NaCI 75 mM, DTT 1 mM, eDtA 2 mM, y se incubaron a 37 °C durante 15 minutos. Las muestras se analizaron durante la noche en un gel de agarosa TAE al 0,8 % y se tiñeron posteriormente con una dilución SybR segura (Invitrogen) 1:10000 en TAE durante 30 minutos. La escisión con Bsml (Fermentas) o Nt.BspQI (New England Biolabs) se realizó en el tampón de reacción HEPES suplementado con MgCh 5 mM.
Microscopía de fuerzas de barrido
La Cascada purificada se mezcló con pUC-A (en una relación de 7:1, Cascada 250 nM, ADN 35 nM) en un tampón que contenía HEPES 20 mM, pH 7,5, NaCl 75 mM, DTT 0,2 mM, EDTA 0,3 mM y se incubó a 37 °C durante 15 minutos. Posteriormente, para la preparación de muestra de AFM, la mezcla de incubación se diluyó 10x en agua bidestilada y se añadió MgCh a una concentración final de 1,2 mM. La deposición de los complejos de proteína-ADN y formación de imágenes se llevó a cabo como se ha descrito anteriormente (Dame y col., (2000) Nucleic Acids Res. 28: 3504-3510).
Microscopio fluorescente
Las células BL21-AI portadoras de CRISP en plásmidos codificadores de gen cas se cultivaron durante la noche a 37 °C en caldo Luria-Bertani (LB) que contenía ampicilina (100 pg/ml), kanamicina (50 pg/ml), estreptomicina (50 |jg/ml) y cloranfenicol (34 pg/ml). El cultivo durante la noche se diluyó 1:100 en LB que contenía antibiótico reciente, y se cultivó durante 1 hora a 37 °C. La expresión de los genes cas y CRISPR se indujo durante 1 hora añadiendo L- arabinosa a una concentración final de 0,2 % e IPTG hasta una concentración final de 1 mM. Para la infección, las células se mezclaron con el fago Lambda a una multiplicidad de infección (MDI) de 4. Las células se aplicaron a portaobjetos de microscopio cubiertos con poli-L-lisina y se analizaron utilizando un microscopio de escaneo láser confocal Zeiss LSM510 basado en un microscopio invertido Axiovert, con un objetivo de inmersión en aceite 40x (N.A. de 1.3) y un láser de argón como fuente de excitación (514 nm) y detección a 530-600 nm. El estenopeico se ajustó a 203 pm para todas las mediciones.
Estudios de transformación de pUC-A
Se inoculó LB que contenía kanamicina (50 pg/ml), estreptomicina (50 pg/ml) y cloranfenicol (34 pg/ml) a partir de un preinóculo de una noche y se cultivó hasta una DO600 de 0,3. La expresión de genes cas y CRISPR se indujo durante 45 minutos con 0,2 % de L-arabinosa e IPTG 1 mM. Las células se recogieron por centrifugación a 4 °C y se hicieron competentes por resuspensión en tampón enfriado con hielo que contenía RbCh 100 mM, MnCh 50 mM, acetato de potasio 30 mM, CaCh 10 mM y 15% de glicerol, pH 5,8. Después de una incubación de 3 horas, las células se recogieron y se volvieron a suspender en un tampón que contenía MOPS 10 mM, RbCl 10 mM, CaCl2 75 mM, glicerol al 15 %, pH 6,8. La transformación se realizó añadiendo 80 ng de pUC-A, seguido de un choque térmico de 1 minuto a 42 °C, y 5 minutos de choque frío en hielo. Las células siguientes se cultivaron en LB durante 45 minutos a 37 °C antes de la siembra en placas de LB-agar que contenían 0,2% de L-arabinosa, IPTG 1 mM, ampicilina (100 pg/ml), kanamicina (50 pg/ml), estreptomicina (50 pg/ml) y cloranfenicol (34 pg/ml).
El curado del plásmido se analizó transformando las células BL21-AI que contienen el gen cas y los plásmidos que codifican CRISPR con pUC-A, mientras se cultivan las células en presencia de glucosa al 0,2 % para suprimir la expresión del gen de la polimerasa T7. La expresión de los genes cas y CRISPR se indujo mediante la recogida de las células y la resuspensión en LB que contenía arabinosa al 0,2 % e IPTG 1 mM. Las células se sembraron en placas en agar-LB que contenían estreptomicina, kanamicina y cloranfenicol (no selectivo para pUC-A) o ampicilina, estreptomicina, kanamicina y cloranfenicol (selectivo para pUC-A). Después del crecimiento durante la noche, el porcentaje de pérdida de plásmidos se puede calcular a partir de la relación de unidades formadoras de colonias en las placas selectivas y no selectivas.
Estudios de infección por fago Lambda
La sensibilidad del huésped a la infección por fago se ensayó utilizando un fago virulento Lambda (Avir), como en (Brouns y col (2008) Science 321, 960-964). La sensibilidad del huésped a la infección se calculó como la eficacia de la formación de placas (la relación de recuento de placas de una cepa que contiene un CRISPR anti-A a la de la cepa que contiene un CRISPR R44 no dirigido) como se describe en Brouns y col (2008).
Ejemplo 1 - Cascada se une exclusivamente al ADN objetivo negativamente superenrollado
El plásmido derivado de pUC19 de 3 kb denotado pUC-A, contiene un fragmento de ADN de 350 pb correspondiente a parte del gen J del fago A, que está dirigido por J3-Cascada (Cascada asociada con ARNcr que contiene un espaciador J3 (Westra y col (2010) Molecular Microbiology 77, 1380-1393). Los ensayos de desplazamiento de movilidad electroforética muestran que Cascada tiene una alta afinidad solo por el plásmido objetivo negativamente superenrollado (nSE). En una relación molar de J3-Cascada a pUC-A de 6:1, todo el plásmido nSE estaba unido por Cascada (véase la Fig. 1A), mientras Cascada que porta el ARNcr R44 no dirigido (R44-Cascada) mostró una unión no específica a una relación molar de 128:1 (véase la Fig. 1B). La constante de disociación (Kd) de pUC-A nSE se determinó que era 13 ± 1,4 nM para J3-Cascada (véase la Fig. 1E) y 429 ± 152 nM para R44-Cascada (véase la Fig. 1F).
5
10
15
20
25
30
35
40
45
50
55
J3-Cascada no pudo unir el ADN objetivo relajado con afinidad medible, como pUC-A escotado (véase la Fig. 1C) o lineal (véase la Fig. 1D), que muestra que Cascada tiene una gran afinidad por sustratos de ADN más grandes con una topología nSE.
Para distinguir la unión no específica de la unión específica, se utilizó el sitio de restricción Bsml localizado dentro del protoespaciador. Si bien la adición de la enzima Bsml a pUC-A da un producto lineal en presencia de R44- Cascada (véase la Fig. 1G, carril 4), pUC-A está protegido de la escisión de Bsml en presencia de J3-Cascada (véase la Fig. 1G, carril 7), que indica unión específica al protoespaciador. Esto muestra que Cas3 no se requiere para la unión específica de secuencia in vitro de Cascada a una secuencia de protoespaciador en un plásmido nSE.
La Cascada que se une a pUC-A nSE fue seguido por escotamiento con Nt.BspQI, dando lugar a una topología CA. La Cascada se libera del plásmido después del escotamiento de la cadena, como puede verse por la ausencia de un desplazamiento de la movilidad (véase la Fig. 1H, comparar el carril 8 con el carril 10). Por el contrario, Cascada permanece unida a su objetivo de ADN cuando se añade una sonda de ADNmc complementario a la cadena desplazada con la reacción antes de la escisión del ADN por Nt.BspQI (véase la Fig. 1H, carril 9). La sonda estabiliza artificialmente el bucle R de Cascada en el ADN objetivo relajado. Se realizan observaciones similares cuando ambas cadenas de ADN de pUC-A se escinden después de la unión a Cascada (véase la Fig. 1l, carril 8 y carril 9).
Ejemplo 2 - Cascada induce la flexión del ADN objetivo unido
Se visualizaron complejos formados entre Cascada purificada y pUC-A. Se formaron complejos específicos que contienen un solo complejo de J3-Cascada unido, mientras que R44-Cascada inespecífico no produce complejos unidos a ADN en este ensayo en condiciones idénticas. De las 81 moléculas de ADN observadas, se descubrió que el 76 % tenían J3-Cascada unida (véase la Fig. 2A-P). De estos complejos, en la mayoría de los casos, se descubrió Cascada en el vértice de un bucle (86 %), mientras que solo se encontró una fracción pequeña en posiciones no apicales (14%). Estos datos muestran que la unión de Cascada causa la flexión y posiblemente la envoltura del ADN, probablemente para facilitar la fusión local del dúplex de ADN.
Ejemplo 3: Fusiones naturales de Cas3 y Cse1: Cas3 interactúa con Cascada tras el reconocimiento del protoespaciador
La Figura S3 muestra el análisis de la secuencia de genes cas de organismos que contienen el tipo I-E. El sistema CRISPR/Cas revela que Cas3 y Cse1 aparecen como proteínas de fusión en Streptomyces sp. SPB78 (número de acceso: ZP_07272643.1), en Streptomyces griseus (número de acceso YP_001825054), y en Catenulispora acidiphila DSM 44928 (número de acceso YP_003114638).
Ejemplo 4: La complementación de fluorescencia bimolecular (BiFC) muestra cómo una proteína de fusión Cse1 que forma parte de Cascada continúa interactuando con Cas3.
Los experimentos de BiFC se utilizaron para controlar las interacciones entre Cas3 y Cascada in vivo antes y después de la infección por fago A. Los experimentos de BiFC se basan en la capacidad de las mitades no fluorescentes de una proteína fluorescente, p. ej., la proteína amarilla fluorescente (PAF) para replegarse y formar una molécula fluorescente cuando las dos mitades se encuentran muy cerca. Como tal, proporciona una herramienta para revelar las interacciones proteína-proteína, ya que la eficacia del replegado aumenta mucho si las concentraciones locales son altas, p. ej., cuando las dos mitades de la proteína fluorescente se fusionan con los parejas de interacción. Cse1 se fusionó en el extremo C terminal con los 155 aminoácidos N-terminales de Venus (Cse1-N155Venus), una versión mejorada de PAF (Nagai y col. (2002) Nature Biotechnology 20, 87-90). Cas3 se fusionó C-terminalmente con los 85 aminoácidos C-terminales de Venus (Cas3-C85Venus).
El análisis de BiFC revela que Cascada no interactúa con Cas3 en ausencia de ADN invasor (Fig. 3ABC, Fig. 3P y Fig. 8). Tras la infección por el fago A, sin embargo, las células que expresan CascadaACse1, Cse1-N155Venus y Cas3-C85Venus son fluorescentes si coexpresan el anti-A CRISPR 7Tm (Fig. 3DEF, Fig. 3P y Fig. 8). Cuando coexpresan un CRISPR R44 sin dirigir (Fig. 3GHI, Fig. 3P y Fig. 8), las células permanecen no fluorescentes. Esto muestra que Cascada y Cas3 interactúan específicamente durante la infección en el reconocimiento del protoespaciador y que Cse1 y Cas3 están muy cerca el uno del otro en el complejo efector binario Cascada-Cas3.
Estos resultados también muestran claramente que una fusión de Cse1 con una proteína heteróloga no interrumpe la formación ribonucleoproteica de Cascada y ARNcr, ni interrumpe la interacción de Cascada y Cas3 con el ADN del fago objetivo, incluso cuando el Cas3 mismo es también una proteína de fusión.
Ejemplo 5: La preparación de una fusión diseñada Cas3-Cse1 proporciona una proteína dentro de la actividad funcional in vivo
Proporcionar una evidencia in vitro para la actividad de escisión del ADN de Cas3 requirió Cas3 purificado y activo. A pesar de varias estrategias de solubilización, Cas3 se sobreprodujo (Howard y col (2011) Biochem. J. 439, 85-95) en BL21de E. coli está presente principalmente en agregados inactivos y cuerpos de inclusión. Por lo tanto, Cas3 se produjo como una proteína de fusión Cas3-Cse1, que contiene un enlazador idéntico al de la proteína de fusión
5
10
15
20
25
30
35
40
45
50
55
Cas3-Cse1 en S. griseus (véase la Fig. 10). Cuando se coexpresó con CascadaACsel y CRISPR J3, el complejo de fusión era soluble y se obtuvo en alta pureza con la misma estequiometría aparente que Cascada (Fig. 5A). Cuando se ensayó la funcionalidad de este complejo para proporcionar resistencia contra la infección por fago A, la eficacia de la formación de placas (efp) en las células que expresan el complejo de fusión J3-Cascada-Cas3 fue idéntica a las células que expresan las proteínas distintas (Fig. 5B).
Dado que el complejo de fusión J3-Cascada-Cas3 era funcional in vivo, los ensayos de escisión de ADN in vitro se llevaron a cabo utilizando este complejo. Cuando se incubó J3-Cascada-Cas3 con pUC-A en ausencia de metales divalentes, se observó la unión del plásmido con relaciones molares similares a las observadas para Cascada (Fig. 5C), mientras que una unión específica a un plásmido no objetivo (pUC-p7, un plásmido derivado de pUC19 del mismo tamaño que pUC-A, pero que carece de un protoespaciador) se produjo solo con altas relaciones molares (Fig. 5D), lo que indica que la unión específica al ADN del complejo es también similar a la de Cascada solo.
Curiosamente, el complejo de fusión J3-Cascada-Cas3 muestra actividad de endonucleasa dependiente de magnesio en plásmidos objetivo nSE. En presencia de Mg2+ 10 mM, J3-Cascada-Cas3 fragmenta pUC-A nSE (Fig. 5E, carril 3-7), pero no se observa escisión para los sustratos que no contienen la secuencia objetivo (Fig. 5E, carril 9-13), o que tienen una topología relajada. No se observa desplazamiento de la banda CA resultante, en línea con las observaciones previas de que Cascada se disocia espontáneamente después de la escisión, sin requerir actividad de helicasa Cas3 dependiente de ATP. En cambio, la actividad helicasa de Cas3 parece estar implicada en la degradación del plásmido exonucleolítico. Cuando se añaden tanto magnesio como ATP a la reacción, se produce la degradación completa del plásmido (Fig. 5H).
Los inventores han descubierto que Cascada solo es incapaz de unirse a protoespaciadores en el ADN relajado. Por el contrario, los inventores han descubierto que Cascada localiza de forma eficiente los objetivos en ADN negativamente superenrollado, y posteriormente recluta Cas3 a través de la subunidad Cse1. La escisión endonucleolítica por el dominio de nucleasa HD de Cas3 causa la liberación espontánea de Cascada del ADN a través de la pérdida del superenrrolamiento, lo que permite la reubicación de Cascada para localizar nuevos objetivos. El objetivo se desenrolla progresivamente y se escinde mediante la unión de actividad helicasa dependiente de ATP y la actividad de nucleasa HD de Cas3, lo que conduce a la degradación completa del ADN objetivo y a la neutralización del invasor.
Con referencia a la Figura 6 y sin desear quedar ligado a teoría particular alguna, un mecanismo de operación para la vía de interferencia CRISPR tipo I en E. coli puede implicar (1) en primer lugar, que Cascada que lleva un ARNcr barra el ADN plasmídico nSE para un protoespaciador, con MAP adyacente. Si durante esta etapa se produce la separación de cadena, esto se desconoce. (2) La unión del protoespaciador específico de la secuencia se logra mediante el emparejamiento de bases entre el ARNcr y la cadena complementaria del ADN, formando un bucle R. Al unirse, Cascada induce la flexión del ADN. (3) La subunidad Cse1 de Cascada recluta Cas3 al unirse al ADN. Esto se puede lograr mediante cambios conformacionales de Cascada que tienen lugar tras la unión del ácido nucleico. (4) El dominio HD (parte más oscura) de Cas3 cataliza el escotamiento dependiente de Mg2+ de la cadena desplazada del bucle R, alterando así la topología del plásmido objetivo de nSE a CA relajado. (5a y 5b) La relajación del plásmido provoca la disociación espontánea de Cascada. Mientras tanto, Cas3 muestra actividad de exonucleasa dependiente de ATP en el plásmido objetivo, requiriendo el dominio helicasa para el desenrollamiento de ADNbc objetivo y el dominio de nucleasa HD para la actividad de escisión sucesiva. (6) Cas3 degrada el plásmido completo de una manera dependiente de ATP a medida que avanza, se desenrolla y se escinde el ADNbc objetivo.
Ejemplo 6: Preparación de proteínas artificiales de fusión Cas-strep tag y ensamblaje de complejos Cascada
Los complejos Cascada se producen y purifican como se describe en Brouns y col (2008) Science 321: 960-4 (2008), utilizando los plásmidos de expresión enumerados en la Tabla suplementaria 3 de Jore y col (2011) Nature Structural & Molecular Biology 18: 529-537. Cascada se purifica rutinariamente con un Strep-tag II N-terminal fusionado con CasB (o CasC en CasCDE). La cromatografía de exclusión por tamaños (Superdex 200 HR 10/30 (GE)) se realiza utilizando Tris-HCl 20 mM (pH 8,0), NaCl 0,1 M, ditiotreitol 1 mM. Las preparaciones de Cascada (~0,3 mg) se incuban con DNasa I (Invitrogen) en presencia de MgCl2 2,5 mM durante 15 min a 37 °C antes del análisis de exclusión por tamaños. Los ácidos nucleicos co-purificados se aíslan por extracción utilizando un volumen igual de fenol:cloroformo:alcohol isoamílico (25:24:1) pH 8,0 (Fluka), y se incuban con DNasa I (Invitrogen) suplementado con MgCh 2,5 mM o RNasa A (Fermentas) durante 10 min a 37 °C. Se producen proteínas de la subunidad de Cas fusionadas a la secuencia de aminoácidos de Strep-Tag.
Los ensayos de placa que muestran la actividad biológica de las subunidades Strep-Tag Cascada se realizan utilizando el bacteriófago Lambda y la eficacia de la formación de placas (EFP) se calculó como se describe en Brouns y col (2008).
Para la purificación de ARNcr, las muestras se analizan mediante HPLC de fase inversa de par de iones en un Agilent 1100 HPLC con detector UV260nm (Agilent) utilizando una columna DNAsep de 50 mm x 4,6 mm I. D. (Transgenomic, San Jose, CA). El análisis cromatográfico se realiza utilizando las siguientes condiciones de tampón: A) acetato de trietilamonio 0,1 M (TEAA) (pH 7,0) (Fluka); B) tampón A con acetonitrilo de grado MS LC 25 % (v/v)
5
10
15
20
25
30
35
40
45
50
55
(Fisher). El ARNcr se obtiene inyectando Cascada intacta purificada a 75 °C utilizando un gradiente lineal que comienza con 15 % de tampón B y se extiende hasta 60 % B en 12,5 min, seguido de una extensión lineal hasta 100% B durante 2 min a un caudal de 1,0 ml/min. La hidrólisis del extremo terminal fosfato cíclico se realizó incubando el ARNcr purificado por HPLC en una concentración final de HCl 0,1 M a 4 °C durante 1 hora. Las muestras se concentran a 5-10 pl en un concentrador de vacío (Eppendorf) antes del análisis ESI-MS.
El análisis de espectrometría de masas e ionización por electrospray de ARNcr se realiza en modo negativo utilizando un espectrómetro de masas UHR-TOF (maXis) o un instrumento HCT Ultra PTM Discovery (ambos de Bruker Daltonics), acoplado a un sistema de cromatografía líquida capilar en línea (Ultimate 3000, Dionex, R.U.) Las separaciones de ARN se realizan utilizando una columna capilar monolítica (PS-DVB) (200 pm x 50 mm I.D., Dionex, R.U.). La cromatografía se realiza utilizando las siguientes condiciones de tampón: C) 1,1,1,3,3,3,-hexafluoro-2- propanol 0,4 M (HFIP, Sigma-Aldrich) ajustado con trietilamina (TEA) a pH 7,0 y TeAA 0,1 mM, y D) tampón C con 50 % de metanol (v/v) (Fisher). El análisis de ARN se realiza a 50 °C con 20 % de tampón D, extendiéndose a 40 % D en 5 min seguido de una extensión lineal a 60 % D durante 8 min a un caudal de 2 pl/min.
La proteína de Cascada se analiza por espectrometría de masas nativa en acetato de amonio 0,15 M (pH 8,0) a una concentración de proteína de 5 pM. La preparación de proteína se obtiene mediante cinco etapas secuenciales de concentración y dilución a 4 °C utilizando un filtro centrífugo con un límite de corte de 10 kDa (Millipore). Las proteínas se pulverizan desde los capilares de vidrio de borosilicato y se analizan en un tiempo de vuelo de electrospray LCT o instrumentos de tiempo de vuelo cuadrípolo modificados (ambos Waters, R.U.) ajustados para un rendimiento óptimo en la detección de alta masa (véase Tahallah N y col (2001) Rapid Commun Mass Spectrom 15: 596-601 (2001) y van den Heuvel, R.H. y col. Anal Chem 78: 7473-83 (2006). Las mediciones de masa exactas de las proteínas Cas individuales se adquirieron en condiciones desnaturalizantes (50 % de acetonitrilo, 50 % de MQ, 0,1 % de ácido fórmico). Los subcomplejos en solución se generaron mediante la adición de 2-propanol a la solución de pulverización hasta una concentración final del 5 % (v/v). La configuración del instrumento fue la siguiente; voltaje de la aguja ~1,2 kV, voltaje del cono ~175 V, presión de la fuente 9 mbar. Se utilizó xenón como el gas de colisión para el análisis espectrométrico de masas en tándem a una presión de 1,510-2 mbar. El voltaje de colisión varió entre 10-200 V.
Los ensayos de desplazamiento de movilidad electroforética (EDME) se utilizan para demostrar la actividad funcional de los complejos Cascada para ácidos nucleicos objetivo. EDME se realiza incubando Cascada, CasBCDE o CasCDE con ácido nucleico marcado 1 nM en Tris-Cl 50 mM, pH 7,5, NaCl 100 mM. Se utiliza ADN de esperma de salmón (Invitrogen) como competidor. Las reacciones de EDME se incuban a 37 °C durante 20-30 minutos antes de la electroforesis en geles de poliacrilamida al 5 %. Los geles se secan y se analizan utilizando pantallas de almacenamiento de fósforo y un generador de imágenes de fósforo PMI (Bio-Rad). La actividad de escisión y unión al ADN objetivo de Cascada se ensaya en presencia de Ca 1-10 mM, iones Mg o Mn.
Los objetivos de ADN son oligonucleótidos largos purificados en gel (Isogen Life Sciences o Biolegio), enumerados en la Tabla suplementaria 3 de Jore y col (2011). Los oligonucleótidos se marcan en el extremo utilizando y32P-ATP (PerkinElmer) y T4 quinasa (Fermentas). Los objetivos de ADN bicatenario se preparan hibridando oligonucleótidos complementarios y digiriendo ADNmc restante con exonucleasa I (Fermentas). Los objetivos de ARN marcados se transcriben in vitro utilizando kits T7 Maxiscript o T7 Mega Shortscript (Ambion) con a32P-CTP (PerkinElmer) y eliminando el molde por digestión con DNasa I (Fermentas). Los objetivos de ARN bicatenario se preparan hibridando ARNs complementarios y digiriendo ARNmc excedente con RNasa T1 (Fermentas), seguido de extracción con fenol.
Los ensayos de desplazamiento de movilidad del plásmido se realizan utilizando el plásmido pWUR613 que contiene el protoespaciador R44. El fragmento que contiene el protoespaciador se amplifica por PCR a partir del ADN genómico del bacteriófago P7 utilizando los cebadores BG3297 y BG 3298 (véase la Tabla 3 complementaria de Jore y col. (2011). El plásmido (0,4 pg) y Cascada se mezclaron en una relación molar de 1:10 en un tampón que contenía Tris-HCl 5 mM (pH 7,5) y NaCl 20 mM y se incubaron a 37 °C durante 30 minutos. Las proteínas de Cascada se eliminaron mediante tratamiento con proteinasa K (Fluka) (0,15 U, 15 min, 37 °C) seguido de extracción con fenol/cloroformo. Los complejos de ARN-ADN se trataron posteriormente con RNasaH (Promega) (2 U, 1 h, 37 °C).
Las fusiones de la subunidad proteica Strep-Tag-Cas que forman complejos proteicos Cascada o subcomplejos activos con el componente de ARN (equivalente a un ARNcr) tienen la actividad biológica y funcional esperada de barrido y unión específica y escisión de objetivos de ácido nucleico. Las fusiones de las subunidades Cas con las cadenas de aminoácidos de colorantes fluorescentes también forman complejos Cascada y subcomplejos con el componente ARN (equivalente a ARNcr) que retienen la actividad biológica y funcional y permiten la visualización de la ubicación de una secuencia de ácido nucleico objetivo en ADNbc por ejemplo.
Ejemplo 7 - Un par de Cascada-nucleasa y ensayo de actividad de nucleasa in vitro
Se han introducido seis mutaciones denominadas "Sharkey" por mutagénesis aleatoria e identificación sistemática para mejorar la actividad de la nucleasa y la estabilidad del dominio de nucleasa no específico de la enzima de restricción FokI de Flavobacterium okeanokoites (véase Guo, J., y col. 2010) J. Mol. Biol. 400: 96-107). Se han
introducido otras mutaciones que reducen la actividad de escisión fuera del objetivo. Esto se logra mediante ingeniería de interacciones electrostáticas en la interfaz del dímero FokI de un par ZFN, creando una variante FokI con una interfaz cargada positivamente (KKR, E490K, I538K, H537R) y otra con una interfaz cargada negativamente (ELD, Q486E, I499L, N496D) (véase Doyon, Y., y col. (2011) Nature Methods 8: 74-9). Cada una de estas variantes 5 es catalíticamente inactiva como homodímero, reduciendo así la frecuencia de escisión fuera del objetivo.
Diseño de la Cascada-nucleasa
Se ha fusionado de forma traduccional nucleasas FokI mejoradas al extremo N-terminal de Cse1 para generar
KKR ELD J 1 ^
variantes de Cse1 que son FokI -Cse1 y FokI -Cse1, respectivamente. Estas dos variantes se coexpresan con las subunidades de Cascada (Cse2, Cas7, Cas5 y Cas6e) y uno de dos plásmidos CRISPR distintos con 10 espaciadores uniformes. Esto carga el complejo Cascada con P7-ARNcr uniforme y el complejo Cascada con M13 g8-ARNcr uniforme. Estos complejos se purifican utilizando Cse2 marcada con StrepII N-terminalmente como se describe en Jore, M.M., y col., (2011) Nat. Struct. Mol. Biol. 18(5): 529-536. Además, se puede llevar a cabo una etapa de purificación adicional utilizando una FokI marcada con HIS en el extremo N-terminal, para asegurar la purificación de los complejos de fusión Cascada-nucleasa completos e intactos.
15 Las secuencias de nucleótidos y aminoácidos de las proteínas de fusión utilizadas en este ejemplo fueron las siguientes:
>secuencia de nucleótidos de FokI-(Sharkey-ELD)-Cse1
ATGGCTCAACTGGTTAAAAGCGAACTGGAAGAGAAAAAAAGTGAACTGCGCCAC
AAACT G AAAT AT GT GCC GC AT GAAT AT ATCG AGCT G ATT GAAATT GC ACGT AAT C
CG AC CC AGG ATCGT ATT CT GGAAAT G AAAGT G AT GG AATTTTTT AT G AAAGT GT A
CGGCTATCGCGGTGAACATCTGGGTGGTAGCCGTAAACCGGATGGTGCAATTTAT
ACCGTTGGTAGCCCGATTGATTATGGTGTTATTGTTGATACCAAAGCCTATAGCG
GT GGTT AT AAT CT GCCG ATT GGT C AGGC AG AT G AA AT GGAAC GTT AT GT GG AAG
AAAATCAGACCCGTGATAAACATCTGAATCCGAATGAATGGTGGAAAGTTTATC
CGAGCAGCGTTACCGAGTTTAAATTCCTGTTTGTTAGCGGTCACTTCAAAGGCAA
CT AT AAAGC AC AGCTG AC CC GTCTGAAT C AT ATT AC C AATT GT AAT GGT GC AGTT
CT G AGCGTT G AAG AACT GCT G ATT GGT GGT G AAAT G ATT A AAGC AGGC ACC CT G
ACC CT GGAAG AAGTTCGTCGC AAATTT AAC AAT GGC G AAAT C A ACTTTGC GGAT
C C C AC C AAC C GC GC GAAAGGC C TGG AAGC GGTG AGC GTGGC GAGC atgaatttgct
tattgataactggattcctgtacgcccgcgaaacggggggaaagtccaaatcataaatctgcaatcgctatactgcagtagagatcagt
ggcgattaagtttgccccgtgacgatatggaactggccgctttagcactgctggtttgcattgggcaaattatcgccccggcaaaagatg
acgttgaatttcgacatcgcataatgaatccgctcactgaagatgagtttcaacaactcatcgcgccgtggatagatatgttctaccttaat
cacgcagaacatccctttatgcagaccaaaggtgtcaaagcaaatgatgtgactccaatggaaaaactgttggctggggtaagcggcg
cgacgaattgtgcatttgtcaatcaaccggggcagggtgaagcattatgtggtggatgcactgcgattgcgttattcaaccaggcgaat
caggcaccaggttttggtggtggttttaaaagcggtttacgtggaggaacacctgtaacaacgttcgtacgtgggatcgatcttcgttcaa
cggtgttactcaatgtcctcacattacctcgtcttcaaaaacaatttcctaatgaatcacatacggaaaaccaacctacctggattaaacct
atcaagtccaatgagtctatacctgcttcgtcaattgggtttgtccgtggtctattctggcaaccagcgcatattgaattatgcgatcccatt
gggattggtaaatgttcttgctgtggacaggaaagcaatttgcgttataccggttttcttaaggaaaaatttacctttacagttaatgggctat
ggccccatccgcattccccttgtctggtaacagtcaagaaaggggaggttgaggaaaaatttcttgctttcaccacctccgcaccatcat
ggacacaaatcagccgagttgtggtagataagattattcaaaatgaaaatggaaatcgcgtggcggcggttgtgaatcaattcagaaat
attgcgccgcaaagtcctcttgaattgattatggggggatatcgtaataatcaagcatctattcttgaacggcgtcatgatgtgttgatgttt
aatcaggggtggcaacaatacggcaatgtgataaacgaaatagtgactgttggtttgggatataaaacagccttacgcaaggcgttata
tacctttgcagaagggtttaaaaataaagacttcaaaggggccggagtctctgttcatgagactgcagaaaggcatttctatcgacagag
tgaattattaattcccgatgtactggcgaatgttaatttttcccaggctgatgaggtaatagctgatttacgagacaaacttcatcaattgtgt
gaaatgctatttaatcaatctgtagctccctatgcacatcatcctaaattaataagcacattagcgcttgcccgcgccacgctatacaaaca
tttacgggagttaaaaccgcaaggagggccatcaaatggctga [SEQ ID NO: 18]
>secuencia proteica de FokI-(Sharkey-ELD)-Cse1
MAQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNPTQDRILEMKVMEFFMKVYGY
RGEHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMERYVEENQTR
DKHLNPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEEL
LIGGEMIKAGTLTLEEVRRKFNNGEINFADPTNRAKGLEAVSVASMNLLIDNWIPVRP
RNGGKVQIINLQSLYCSRDQWRLSLPRDDMELAALALLVCIGQIIAPAKDDVEFRHRI
MNPLTEDEFQQLIAPWIDMFYLNHAEHPFMQTKGVKANDVTPMEKLLAGVSGATN
CAFVNQPGQGEALCGGCTAIALFNQANQAPGFGGGFKSGLRGGTPYTTFVRGIDLRS
T VLLN VLTLPRLQKQFPNE SHTEN QPT WIKPIKSNESIP AS S IGF VRGLF W QP AFQELC
DPIGIGKCSCCGQESNLRYTGFLKEKFTFTVNGLWPHPHSPCLVTVKKGEYEEKFLAF
TTSAPSWTQISRVVVDKIIQNENGNRVAAVVNQFRNIAPQSPLELIMGGYRNNQASIL
ERRHDVLMFNQGWQQYGNVINEIVTVGLGYKTALRKALYTFAEGFKNKDFKGAGV
SVHETAERHFYRQSELLIPDVLANVNFSQADEVIADLRDKLHQLCEMLFNQSVAPYA
HHPKLISTLALARATLYKHLRELKPQGGPSNG*[SEQ ID NO: 19]
>secuencia de nucleótidos de FokI-(Sharkey-KKR)-Cse1
AT GGCTC AACT GGTT AAAAGCGAACTGGAAGAGAAAAAAAGT GAACTGCGCC AC
AAACT GAAAT AT GT GCC GC AT G AAT AT ATCG AGCT G ATT G AAATT GC ACGT AAT C
CGACCC AGGATCGT ATTCTGGAAAT GAAAGTG AT GGAATTTTTT ATGAAAGT GTA
CGGCTATCGCGGTGAACATCTGGGTGGTAGCCGTAAACCGGATGGTGCAATTTAT
ACCGTTGGTAGCCCGATTGATTATGGTGTTATTGTTGATACCAAAGCCTATAGCG
GT GGTT AT AAT CT GCCG ATT GGT C AGGC AG AT GAAAT GC AGCGTT AT GT G A A AG
AAAAT C AG ACC CGC AAC AAAC AT ATT AAC C C G A AT G AAT GGTGGAAAGTTT AT C
CGAGCAGCGTTACCGAGTTTAAATTCCTGTTTGTTAGCGGTCACTTCAAAGGCAA
CTATAAAGCACAGCTGACCCGTCTGAATCGTAAAACCAATTGTAATGGTGCAGTT
CT G AGCGTT G AAG AACT GCT G ATT GGTGGT GAAAT G ATT A AAGC AGGC ACC CT G
ACC CT GG AAG AAGTTCGTCGC AAATTT AAC AAT GGC GAAAT C A ACTTT GC GGAT
CCCACCAACCGCGCGAAAGGCCTGGAAGCGGTGAGCGTGGCGAGCatgaatttgct
tattgataactggattcctgtacgcccgcgaaacggggggaaagtccaaatcataaatctgcaatcgctatactgcagtagagatcagt
ggcgattaagtttgccccgtgacgatatggaactggccgctttagcactgctggtttgcattgggcaaattatcgccccggcaaaagatg
acgttgaatttcgacatcgcataatgaatccgctcactgaagatgagtttcaacaactcatcgcgccgtggatagatatgttctaccttaat
cacgcagaacatccctttatgcagaccaaaggtgtcaaagcaaatgatgtgactccaatggaaaaactgttggctggggtaagcggcg
cgacgaattgtgcatttgtcaatcaaccggggcagggtgaagcattatgtggtggatgcactgcgattgcgttattcaaccaggcgaat
caggcaccaggttttggtggtggttttaaaagcggtttacgtggaggaacacctgtaacaacgttcgtacgtgggatcgatcttcgttcaa
cggtgttactcaatgtcctcacattacctcgtcttcaaaaacaatttcctaatgaatcacatacggaaaaccaacctacctggattaaacct
atcaagtccaatgagtctatacctgcttcgtcaattgggtttgtccgtggtctattctggcaaccagcgcatattgaattatgcgatcccatt
gggattggtaaatgttcttgctgtggacaggaaagcaatttgcgttataccggttttcttaaggaaaaatttacctttacagttaatgggctat
ggccccatccgcattccccttgtctggtaacagtcaagaaaggggaggttgaggaaaaatttcttgctttcaccacctccgcaccatcat
ggacacaaatcagccgagttgtggtagataagattattcaaaatgaaaatggaaatcgcgtggcggcggttgtgaatcaattcagaaat
attgcgccgcaaagtcctcttgaattgattatggggggatatcgtaataatcaagcatctattcttgaacggcgtcatgatgtgttgatgttt
aatcaggggtggcaacaatacggcaatgtgataaacgaaatagtgactgttggtttgggatataaaacagccttacgcaaggcgttata
tacctttgcagaagggtttaaaaataaagacttcaaaggggccggagtctctgttcatgagactgcagaaaggcatttctatcgacagag
tgaattattaattcccgatgtactggcgaatgttaatttttcccaggctgatgaggtaatagctgatttacgagacaaacttcatcaattgtgt
gaaatgctatttaatcaatctgtagctccctatgcacatcatcctaaattaataagcacattagcgcttgcccgcgccacgctatacaaaca
tttacgggagttaaaaccgcaaggagggccatcaaatggctga [SEQ ID NO: 20]
>secuencia proteica de FokI-(Sharkey-KKR)-Cse1
MAQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNPTQDRILEMKYMEFFMKYYGY RGEHLGGSRKPDGAIYTVGSPIDYGYIVDTKAYSGGYNLPIGQADEMQRYVKENQT RNKHINPNE W WKV YP S S VTEFKFLF V S GHF KGN YKAQLTRLNRKTN CN G AVLS VEE
LLIGGEMIKAGTLTLEEVRRKFNNGEINFADPTNRAKGLEAVSVASMNLLIDNWIPV
RPRNGGKVQIINLQSLYCSRDQWRLSLPRDDMELAALALLVCIGQIIAPAKDDVEFR
HRIMNPLTEDEFQQLIAPWIDMFYLNHAEHPFMQTKGVKANDVTPMEKLLAGVSGA
TNCAFVNQPGQGEALCGGCTAIALFNQANQAPGFGGGFKSGLRGGTPVTTFVRGIDL
RSTVLLNVLTLPRLQKQFPNESHTENQPTWIKPIKSNESIPASSIGFVRGLFWQPAHIEL
CDPIGIGKCSCCGQESNLRYTGFLKEKFTFTVNGLWPHPHSPCLVTVKKGEVEEKFL
AFTTSAPSWTQISRVVVDKIIQNENGNRVAAVVNQFRNIAPQSPLELIMGGYRNNQA
SILERRHDVLMFNQGWQQYGNVINEIVTVGLGYKTALRKALYTFAEGFKNKDFKGA
G V S VHET AERHF YRQ S ELLIPD VL AN VNFS Q ADE VIADLRDKLFIQLCEMLFN Q S V AP
YAHHPKLISTLALARATLYKHLRELKPQGGPSNG* [SEQ ID NO: 21]
>secuencia de nucleótidos de His6-SLN monopartita dual SV40-FokI-(Sharkey-KKR)-Cse1 ATGcatcaccatcatcaccac CCGAAAAAAAA GCGCAAA GTGGA TCCGAA GAAAAAACGTAAA G 5 TTGAA GATCCGAAAGACATGGCTC AACTGGTTAAAAGCGAACTGGAAGAGAAAA
AAAGTGAACTGCGCCACAAACTGAAATATGTGCCGCATGAATATATCGAGCTGA
TT GAAATT GC ACGT AATCCGACCC AGGATCGT ATT CT GGAAAT GAAAGTG AT GG
AATTTTTTATGAAAGTGTACGGCTATCGCGGTGAACATCTGGGTGGTAGCCGTAA
ACCGGATGGTGCAATTTATACCGTTGGTAGCCCGATTGATTATGGTGTTATTGTT
G AT AC C AAAGC CT AT AGC GGT GGTT AT AAT CT GCC G ATT GGT C AGGC AG AT G AA
AT GC AGCGTT AT GT G AAAG AAAAT C AG AC CC GC AAC AAAC AT ATT AAC CC G AAT
G AAT GGT GG AAAGTTT ATCC G AGC AGC GTT ACC G AGTTT AAATTCCT GTTTGTT A
GCGGTCACTTCAAAGGCAACTATAAAGCACAGCTGACCCGTCTGAATCGTAAAA
CC AATT GT AAT GGTGC AGTTCTG AGC GTT G AAGAACT GCT G ATT GGT GGT G AAAT
GATTAAAGCAGGCACCCTGACCCTGGAAGAAGTTCGTCGCAAATTTAACAATGG
CG AAAT C AACTTTGC GG ATC C C AC C AAC C GC GC GAAAGGC C TGGA AGC GGTG
AGCGTGGCGAGCatgaatttgcttattgataactggattcctgtacgcccgcgaaacggggggaaagtccaaatcataaat
ctgcaatcgctatactgcagtagagatcagtggcgattaagtttgccccgtgacgatatggaactggccgctttagcactgctggtttgc
attgggcaaattatcgccccggcaaaagatgacgttgaatttcgacatcgcataatgaatccgctcactgaagatgagtttcaacaactc
atcgcgccgtggatagatatgttctaccttaatcacgcagaacatccctttatgcagaccaaaggtgtcaaagcaaatgatgtgactcca
atggaaaaactgttggctggggtaagcggcgcgacgaattgtgcatttgtcaatcaaccggggcagggtgaagcattatgtggtggat
gcactgcgattgcgttattcaaccaggcgaatcaggcaccaggttttggtggtggttttaaaagcggtttacgtggaggaacacctgtaa
caacgttcgtacgtgggatcgatcttcgttcaacggtgttactcaatgtcctcacattacctcgtcttcaaaaacaatttcctaatgaatcac
atacggaaaaccaacctacctggattaaacctatcaagtccaatgagtctatacctgcttcgtcaattgggtttgtccgtggtctattctgg
caaccagcgcatattgaattatgcgatcccattgggattggtaaatgttcttgctgtggacaggaaagcaatttgcgttataccggttttctt
aaggaaaaatttacctttacagttaatgggctatggccccatccgcattccccttgtctggtaacagtcaagaaaggggaggttgaggaa
aaatttcttgctttcaccacctccgcaccatcatggacacaaatcagccgagttgtggtagataagattattcaaaatgaaaatggaaatc
gcgtggcggcggttgtgaatcaattcagaaatattgcgccgcaaagtcctcttgaattgattatggggggatatcgtaataatcaagcat
ctattcttgaacggcgtcatgatgtgttgatgtttaatcaggggtggcaacaatacggcaatgtgataaacgaaatagtgactgttggtttg
ggatataaaacagccttacgcaaggcgttatatacctttgcagaagggtttaaaaataaagacttcaaaggggccggagtctctgttcat
gagactgcagaaaggcatttctatcgacagagtgaattattaattcccgatgtactggcgaatgttaatttttcccaggctgatgaggtaat
agctgatttacgagacaaacttcatcaattgtgtgaaatgctatttaatcaatctgtagctccctatgcacatcatcctaaattaataagcaca
ttagcgcttgcccgcgccacgctatacaaacatttacgggagttaaaaccgcaaggagggccatcaaatggctga [SEQ ID
NO: 22]
>secuencia proteica de HÍS6-SLN monopartita dual SV40-FokI-(Sharkey-KKR)-Cse1
MHHHHHHPKKKRKYDPKKKRKVEDPKDMAQLYKSELEEKKSELRHKLKYVPHEYI
ELIEIARNPTQDRILEMKVMEFFMKVY GYRGEHLGGSRKPDGAIYTVGSPIDY GVIVD
TKAYSGGYNLPIGQADEMQRYVKENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGH
FKGN YKAQLTRLNRKTN CN G AVLS VEELLIGGEMIKAGTLTLEE VRRKFNN GEINF A
DPTNRAKGLEAVSVASMNLLIDNWIPVRPRNGGKVQIINLQSLYCSRDQWRLSLPRD
DMELAALALLV CIGQIIAP AKDD VEFRFtRIMNPLTEDEFQQLIAP WIDMFYLNHAEFÍP
FMQTKG VKAND VTPMEKLL AG V S G ATN C AF VN QPGQGE ALC GGCT AI ALFN Q AN Q
APGFGGGFKSGLRGGTPVTTFVRGIDLRSTVLLNVLTLPRLQKQFPNESHTENQPTWI
KPIKSNESIPASSIGFVRGLFWQPAHIELCDPIGIGKCSCCGQESNLRYTGFLKEKFTFT
VNGLWPHPHSPCLVTVKKGEVEEKFLAFTTSAPSWTQISRVVVDKIIQNENGNRVAA
VVNQFRNIAPQSPLELIMGGYRNNQASILERRHDVLMFNQGWQQYGNVINEIVTVGL
GYKTALRKALYTFAEGFKNKDFKGAGVSVHETAERHFYRQSELLIPDVLANVNFSQ
ADEVIADLRDKLHQLCEMLFNQSVAPYAHHPKLISTLALARATLYKHLRELKPQGGP
SNG* [SEQ ID NO: 23]
>secuencia de nucleótidos de His6-SLN monopartita dual SV40-FokI (Sharkey-ELD)-Csel
ATGcatcaccatcatcaccac CCGAAAAAAAA GCGCAAA GTGGA TCCGAA GAAAAAACGTAAA G TTGAA GA TCCGAAA GA CATGGCTC AACTGGTT AAAAGCGAACTGG AAGAGAAAAA
AAGTGAACTGCGCCACAAACTGAAATATGTGCCGCATGAATATATCGAGCTGAT TG AAATTGC ACGT AATCC GACCC AGGATCGT ATT CT GGAAAT G AAAGTGATGGA ATTTTTTATGAAAGTGTACGGCTATCGCGGTGAACATCTGGGTGGTAGCCGTAAA CC GG AT GGT GC AATTT AT AC C GTT GGT AGCC CG ATT G ATT AT GGT GTT ATT GTT G AT AC C AAAGC CT AT AGCGGTGGTT AT AAT CT GCC G ATT GGT C AGGC AG AT G AAA TGGAAC GTT AT GT GG AAG AAA AT C AG ACC C GT GAT AAAC AT CT GAAT C C G AAT G AAT GGT GGAAAGTTT AT C C G AGC AGCGTT ACC G AGTTT AAATT C CT GTTT GTT AG CGGTCACTTCAAAGGCAACTATAAAGCACAGCTGACCCGTCTGAATCATATTACC AATT GT AAT GGT GC AGTTCTG AGC GTT G AAG AACT GCTG ATTGGT GGT G AAAT G A TTAAAGCAGGCACCCTGACCCTGGAAGAAGTTCGTCGCAAATTTAACAATGGCG AAAT C AACTTT GC GGAT C CC AC C A AC C GC GC G AAAGGC C T GG AAGC GGT G AG CGTGGCGAGCatgaatttgcttattgataactggattcctgtacgcccgcgaaacggggggaaagtccaaatcataaatctg caatcgctatactgcagtagagatcagtggcgattaagtttgccccgtgacgatatggaactggccgctttagcactgctggtttgcattg ggcaaattatcgccccggcaaaagatgacgttgaatttcgacatcgcataatgaatccgctcactgaagatgagtttcaacaactcatcg
cgccgtggatagatatgttctaccttaatcacgcagaacatccctttatgcagaccaaaggtgtcaaagcaaatgatgtgactccaatgg aaaaactgttggctggggtaagcggcgcgacgaattgtgcatttgtcaatcaaccggggcagggtgaagcattatgtggtggatgcac tgcgattgcgttattcaaccaggcgaatcaggcaccaggttttggtggtggttttaaaagcggtttacgtggaggaacacctgtaacaac gttcgtacgtgggatcgatcttcgttcaacggtgttactcaatgtcctcacattacctcgtcttcaaaaacaatttcctaatgaatcacatacg gaaaaccaacctacctggattaaacctatcaagtccaatgagtctatacctgcttcgtcaattgggtttgtccgtggtctattctggcaacc agcgcatattgaattatgcgatcccattgggattggtaaatgttcttgctgtggacaggaaagcaatttgcgttataccggttttcttaagga aaaatttacctttacagttaatgggctatggccccatccgcattccccttgtctggtaacagtcaagaaaggggaggttgaggaaaaattt cttgctttcaccacctccgcaccatcatggacacaaatcagccgagttgtggtagataagattattcaaaatgaaaatggaaatcgcgtg gcggcggttgtgaatcaattcagaaatattgcgccgcaaagtcctcttgaattgattatggggggatatcgtaataatcaagcatctattct tgaacggcgtcatgatgtgttgatgtttaatcaggggtggcaacaatacggcaatgtgataaacgaaatagtgactgttggtttgggatat aaaacagccttacgcaaggcgttatatacctttgcagaagggtttaaaaataaagacttcaaaggggccggagtctctgttcatgagact gcagaaaggcatttctatcgacagagtgaattattaattcccgatgtactggcgaatgttaatttttcccaggctgatgaggtaatagctga tttacgagacaaacttcatcaattgtgtgaaatgctatttaatcaatctgtagctccctatgcacatcatcctaaattaataagcacattagcg cttgcccgcgccacgctatacaaacatttacgggagttaaaaccgcaaggagggccatcaaatggctga [SEQ ID NO: 24] >secuencia proteica de His6-SLN monopartita dual SV40-FokI-(Sharkey-ELD)-Cse1 MHHHHHHPKKKRKVDPKKKRKYEDPKDMAQLYKSELEEKKSELRHKLKYVPHEYI ELIEIARNPTQDRILEMKVMEFFMKVY GYRGEHLGGSRKPDGAIYTVGSPIDY GVIVD TK AY S GGYNLPIGQ ADEMERY VEEN QTRDKHLNPNE WWKV YPS S VTEFKF LF V S GEt FKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFA DPTNRAKGLEAVSVASMNLLIDNWIPVRPRNGGKVQIINLQSLYCSRDQWRLSLPRD DMELAALALLV CIGQIIAP AKDD VEFRHRIMNPLTEDEFQQLIAP WIDMFYLNHAEHP FMQTKG VKAND VTPMEKLL AG V S G ATN C AF VN QP GQGE ALC GGCT AI ALFN Q AN Q APGFGGGFKSGLRGGTPVTTFVRGIDLRSTVLLNVLTLPRLQKQFPNESHTENQPTWI KPIKSNESIPASSIGFVRGLFWQPAHIELCDPIGIGKCSCCGQESNLRYTGFLKEKFTFT VNGLWPHPHSPCLVTVKKGEVEEKFLAFTTSAPSWTQISRVVVDKIIQNENGNRVAA VVNQFRNIAPQSPLELIMGGYRNNQASILERRHDVLMFNQGWQQYGNVINEIVTVGL G YKT ALRK AL YTF AEGFKNKDFKG AG V S VFIET AERHF YRQ SELLIPD VL AN VNF S Q ADEVIADLRDKLHQLCEMLFNQSVAPYAHHPKLISTLALARATLYKHLRELKPQGGP SNG* [SEQ ID NO: 25]
Ensayo de escisión de ADN
5 La especificidad y la actividad de los complejos se ensayaron utilizando un plásmido objetivo artificialmente construido como sustrato. Este plásmido contiene sitios de unión M13 y P7 en cadenas opuestas de manera que ambos dominios FokI se enfrentan entre sí (véase la Figura 11). La distancia entre los sitios de unión de Cascada varía entre 25 y 50 pares de bases con incrementos de 5 pb. Como los sitios de unión de Cascada necesitan estar flanqueados por cualquiera de las cuatro secuencias de MAP conocidas (5'-protoespaciador-CTT/CAT/CTC/CCT-3' 10 este intervalo de distancia proporciona suficiente flexibilidad para diseñar dicho par para casi cualquier secuencia dada.
10
15
Las secuencias de los plásmidos objetivo utilizadas son las siguientes. El número indicó la distancia entre los sitios objetivo M13 y P7. Los protoespaciadores se muestran en negrita, MAPs están subrayados:
Las secuencias de los plásmidos objetivo. El número indica la distancia entre los sitios objetivo M13 y P7. (Protoespaciadores en negrita, MAPs subrayados).
>50 pb
gaattcACAACGGTGAGCAAGTCACTGTTGGCAAGCCAGGATCTGAACAATACCG
TCTTGCTTTCGAGCGCTAGCTCTAGAACTAGTCCTCAGCCTAGGCCTCGTTCCGA AGCTGTCTTTCGCTGCTGAGGGTGACGATCCCGCATAGGCGGCCTTTAACTCg gatee [SEQ ID NO: 26]
>45 pb
gaatte AC AAC GGT G AGC AAGT C AC TGTTGGC AAGC C AGG ATC TG AAC AAT AC C G TCTTTTCGAGCGCTAGCTCTAGAACTAGTCCTCAGCCTAGGCCTCGTTCAAGCTG TCTTTCGCTGCTGAGGGTGACGATCCCGCATAGGCGGCCTTTAACTCggatcc [SEQ ID NO: 27]
>40 pb
gaatte AC AAC GGT G AGC AAGT C AC TGTTGGC AAGC C AGG ATC TG AAC AAT AC C G
TCTTCGAGCGCTAGCTCTAGAACTAGTCCTCAGCCTAGGCCTCGAAGCTGTCTTT CGCTGCTGAGGGTGACGATCCCGCATAGGCGGCCTTTAACTCggatcc [SEQ ID NO: 28]
>35 pb
gaatte AC AAC GGT G AGC AAGT C AC TGTTGGC AAGC C AGG ATC TG AAC AAT AC C G TCTTGCGCTAGCTCTAGAACTAGTCCTCAGCCTAGGCCTAAGCTGTCTTTCGCT GCTGAGGGTGACGATCCCGCATAGGCGGCCTTTAACTCggatcc [SEQ ID NO: 29]
>30 pb
gaatte AC AAC GGT G AGC AAGT C AC TGTT GGC AAGC C AGG ATC TG AAC AAT AC C G TCTTGCTAGCTCTAGAACTAGTCCTCAGCCTAGGAAGCTGTCTTTCGCTGCTGA GGGTGACGATCCCGCATAGGCGGCCTTTAACTCggatcc [SEQ ID NO: 30]
>25 pb
gaatte AC AAC GGT G AGC AAGT C AC TGTTGGC AAGC C AGG ATC TG AAC AAT AC C G TCTTCTCTAGAACTAGTCCTCAGCCTAGGAAGCTGTCTTTCGCTGCTGAGGGTG ACGATCCCGCATAGGCGGCCTTTAACTCggatcc [SEQ ID NO: 31]
La escisión de los plásmidos objetivo se analizó en geles de agarosa, cuando el plásmido negativamente superenrollado (nSE) se puede distinguir del plásmido linealizado o escotado. El sitio de escisión del par de CascadaKKR/ELD en un vector objetivo se determinó aislando los productos de escisión lineal de un gel de agarosa y rellenando los extremos 3' rebajados dejados por la escisión de FokI con el fragmento Klenow de ADN polimerasa de E. coli para crear extremos romos. El vector lineal se autoligó, transformó, amplificó, aisló y secuenció. El relleno de los extremos 3' rebajados y el religamiento conducirán a nucleótidos adicionales en la secuencia que representa el saliente dejado por la escisión de FokI. Al alinear las lecturas de secuencia con la secuencia original, los sitios de escisión pueden encontrarse en un nivel clonal y mapearse. A continuación, las bases adicionales incorporadas en
la secuencia después del relleno en los extremos 3' rebajados dejados por la escisión con Fokl están subrayadas: Escisión plegada
5
5' CTTGCGCTAGCTCTAGAA
imagen1
CTAGTCCTCAGCCTAGGCCTAAG 3'
3' GAACGCGATCGAGATCTTGATC AGGAGTCGGATCCGGATTC 5'
3' relleno en ligamiento
5' CTTGCGCTAGCTCTAGAACTAG - CTAGTCCTCAGCCTAGGCCTAAG 3'
3' GAACGCGATCGAGATCTTGATC - GATCAGGAGTCGGATCCGGATTC 5'
Leyendo de arriba a abajo, las secuencias 5'- 3' anteriores son SEQ ID NOs: 32-35, respectivamente.
Escisión de un locus objetivo en células humanas
10 El gen CCR5 humano codifica la proteína del receptor 5 de quimiocina C-C, que sirve como el receptor para el virus de la inmunodeficiencia humana (VIH) en la superficie de los glóbulos blancos. El gen CCR5 se dirige utilizando un par de nucleasas CascadaKKR/ELD además de un locus artificial de PVF. Un par de sitios de unión adecuados se selecciona en la región de codificación de CCR5. Dos matrices CRISPR distintas que contienen espaciadores uniformes dirigidos a cada uno de los sitios de unión se construyen utilizando síntesis de ADN (Geneart).
15 La selección del gen objetivo CCR5 humano y los diseños CRISPR utilizados son los siguientes:
>Parte de la secuencia genómica humana CCR5, que contiene MLA completo (posición 347-1446).
GGT GG AAC AAG AT GG ATT AT C AAGT GT C AAGT C C AAT CT AT G AC AT C AATT ATT A TACATCGGAGCCCTGCCAAAAAATCAATGTGAAGCAAATCGCAGCCCGCCTCCT GCCTCCGCTCTACTCACTGGTGTTCATCTTTGGTTTTGTGGGCAACATGCTGGTCA TC CT C ATCCTG AT AAACT GC AAAAGGCT G AAG AGC AT G ACTG AC AT CT AC CTGCT CAACCTGGCCATCTCTGACCTGTTTTTCCTTCTTACTGTCCCCTTCTGGGCTCACT AT GCTGCCGCCC AGT GGGACTTT GGAAAT AC AAT GT GT C AACTCTT GAC AGGGCT
CTATTTTATAGGCTTCTTCTCTGGAATCTTCTTCATCATCCTCCTGACAATCGATA GGTACCTGGCTGTCGTCCATGCTGTGTTTGCTTTAAAAGCCAGGACGGTCACCTT TGGGGTGGTGACAAGTGTGATCACTTGGGTGGTGGCTGTGTTTGCGTCTCTCCCA GG AAT C ATCTTT AC C AGAT CT C AAAA AGA AGGT CTT C ATT AC AC CT GC AGCT CTC ATTTT C C AT AC AGT C AGT AT C AATT CT GG A AGA ATTTCC AG AC ATT AAAGAT AGT CATCTTGGGGCTGGTCCTGCCGCTGCTTGTCATGGTCATCTGCTACTCGGGAATC CT AAAAACT CTGCTTC GGT GT C G AA AT G AG AAG AAG AGGC AC AGGGCTGT G AGG CTT AT CTT C ACC AT C AT GATT GTTT ATTTT CTCTTCTGGGCTCCCT AC A AC ATT GT C CTTCTCCTGAACACCTTCCAGGAATTCTTTGGCCTGAATAATTGCAGTAGCTCTA AC AGGTT GG AC C AAGCT AT GC AGGT G AC AG AG ACTCTT GGG AT G ACGC ACT GCT GC AT C AAC CC C AT C AT CT AT GC CTTT GTCGGGG AG A AGTT C AG A AACT ACCTCTT AGTCTTCTTCCAAAAGCACATTGCCAAACGCTTCTGCAAATGCTGTTCTATTTTCC AGCAAGAGGCTCCCGAGCGAGCAAGCTCAGTTTACACCCGATCCACTGGGGAGC AGGAAAT ATCTGT GGGCTTGT GAC ACGGACT C AAGT GGGCT GGT GACCC AGT C [SEQ ID NO: 36]
Red1/2: sitios objetivo elegidos (distancia: 34 pb, MAP 5-CTT-3'). "Red 1 aparece primero en la secuencia
subrayada en el cuadro anterior. Red2 es la segunda secuencia subrayada.
>Matriz CRISPR red1 (cursiva = espaciadores, negrita = repeticiones)
ccatggT AAT AC G ACT C ACT AT AGGG AG AATT AGCT G ATCTTT AAT AAT A AGG AAAT GTT AC ATT AAGGTT GGT GGGTT GTTTTT AT GGGAAA AAAT GCTTT AAG AAC AAAT GTATACTTTTAGAGAGTTCCCCGCGCCAGCGGGGATAAACCGG4A4C4G4GC4 TGGACGACAGCCAGGTACCTAGAGTTCCCCGCGCCAGCGGGGATAAACCGCAAA CACA GCA TGGACGACA GCCA GGTACCTAGAGTTCCCCGCGCCAGCGGGGATAAA CCGCAAACACAGCATGGACGACAGCCAGGTACCTAGAGTTCCCCGCGCCAGCGG GGATAAACCGAAAACAAAAGGCTCAGTCGGAAGACTGGGCCTTTTGTTTTAACC 5 CCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGggtacc [SEQ ID NO: 37]
>Matriz CRISPR red2 (cursiva: espaciadores, negrita: repeticiones) ccatggT AAT AC G ACT C ACT AT AGGG AG AATT AGCT G ATCTTT AAT AAT A AGG AAAT GTT AC ATT AAGGTT GGT GGGTT GTTTTT AT GGG AAA AAAT GCTTT AAG AAC AAAT GTATACTTTTAGAGAGTTCCCCGCGCCAGCGGGGATAAACCGrGTGATOCTTG GGTGGTGGCTGTGTTTGCGTGAGTTCCCCGCGCCAGCGGGGATAAACCGTGTGA TCACTTGGGTGGTGGCTGTGTTTGCGTGAGTTCCCCGCGCCAGCGGGGATAAAC CGTGTGATCACTTGGGTGGTGGCTGTGTTTGCGTGAGTTCCCCGCGCCAGCGGGG ATAAACCGAAAACAAAAGGCTCAGTCGGAAGACTGGGCCTTTTGTTTTAACCCC TTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGggtacc [SEQ ID NO: 38]
5
10
15
20
25
30
35
40
45
50
55
Administración de CascadaKKR,ELD en el núcleo de las células humanas
Cascada es muy estable como complejo proteína-ARN de múltiples subunidades y se produce fácilmente en cantidades de mg en E. coli. La transfección o microinyección del complejo en su forma intacta como purificado a partir de E. coli se utiliza como procedimientos de administración (véase la Figura 12). Como se muestra en la figura 12, las nucleasas Cascada-FokI se purifican a partir de E. coli y se encapsulan en vesículas de transfección de proteínas. Estas se fusionan luego con la membrana celular de células HepG2 humanas liberando las nucleasas en el citoplasma (etapa 2). Las secuencias de SLN luego se reconocen por las proteínas importinas, que facilitan el paso de los nucleoporos (etapa 3). CascadaKKR (rectángulo abierto) y CascadaELD (rectángulo lleno) encontrarán y escindirán su sitio objetivo (etapa 4), induciendo vías de reparación del ADN que alterarán el sitio objetivo y llevarán a los cambios deseados. Las nucleasas CascadaKKR/ELD necesitan actuar solo una vez y no requieren presencia permanente en la célula codificada en el ADN.
Para administrar Cascada en células humanas, los reactivos de transfección de proteínas se utilizan de varias fuentes, incluyendo Pierce, NEB, Fermentas y Clontech. Estos reactivos se han desarrollado recientemente para la administración de anticuerpos, y son útiles para transfectar un amplio intervalo de estirpes celulares humanas con eficiencias de hasta el 90 %. Las células HepG2 humanas se transfectan. Además, se transfectan otras estirpes celulares que incluyen CHO-K1, COS-7, HeLa y células madre no embrionarias.
Para importar el par de nucleasas Cascada en el núcleo, se fusiona una señal de localización nuclear (SLN) monopartita en tándem del gran antígeno T del virus simio 40 (SV40) al extremo N-terminal de FokI. Esto garantiza la importación de CascadaELD/KKR solo intacta en el núcleo. (El complejo de poro nuclear transloca las ARN polimerasas (550 kDa) y otros complejos proteicos grandes). Como comprobación previa a las transformaciones, la actividad de nucleasa del par de nucleasas CascadaKKR/ELD se comprueba in vitro utilizando complejos purificados y amplicones por PCR de cCR5 para excluir la transfección de pares de nucleasas CascadaKKR/ELD no productivas.
Ensayo Surveyor
Las células transfectadas se cultivan y se someten a pases durante varios días. La eficacia de la escisión del ADN objetivo in vivo se evalúa a continuación utilizando el ensayo Surveyor de Guschin, D.Y., y col. (2010) Methods Mol. Biol., 649: 247-256. Brevemente, los amplicones de pCr del locus de ADN objetivo se mezclarán 1:1 con amplicones de PCR de células no tratadas. Estos se calientan y se les permite recocer, dando lugar a desapareamientos en los sitios objetivo que han sido reparados erróneamente por NHEJ. A continuación, se utiliza una nucleasa de desapareamiento erróneo para escindir solo moléculas de ADN desapareadas, dando un máximo de 50% de escisión cuando se completa la escisión de ADN objetivo por Cascada . Este procedimiento fue luego seguido por la secuenciación de los amplicones de ADN objetivo de las células tratadas. El ensayo permite una evaluación y optimización rápidas del procedimiento de administración.
Producción de pares de Cascada-nucleasa
Los complejos Cascada-nucleasa se construyeron como se ha explicado anteriormente. La purificación por afinidad de E. coli utilizando la subunidad Cse2 marcada con StrepII produce un complejo con la estequiometría esperada cuando se compara con Cascada nativa. Con referencia a la figura 13, esto muestra la estequiometría de la Cascada nativa (1), Cascada con P7 ARNcr y Cascada con M13 ARNcr 24 h después de la purificación
utilizando solo estreptactina. Las bandas en Cascada nativa (1) son de arriba a abajo: Cse1, Cas7, Cas5, Cas6e, Cse2. Cascada muestra la banda de fusión Fokl-Cse1 y una banda adicional que representa Cse1 con una pequeña parte de FokI como resultado de la degradación proteolítica.
Además de una proteína de fusión FokI-Cse1 intacta, se observó que una fracción de la proteína de fusión FokI- Cse1 se escinde proteolíticamente, dando como resultado una proteína Cse1 con solo el enlazador y una pequeña parte de FokI unida a ella (según lo confirmado por espectrometría de masas, datos no mostrados). En la mayoría de los aislamientos de proteínas, la fracción de proteína de fusión degradada es aproximadamente del 40 %. La proteína aislada se almacena de forma estable en el tampón de elución (HEPES 20 mM, pH 7,5, NaCl 75 mM, DTT 1 mM, destiobiotina 4 mM) con Tween 20 al 0,1 % adicional y glicerol al 50 % a -20 °C. En estas condiciones de almacenamiento, se ha descubierto que la integridad y la actividad del complejo son estables durante al menos tres semanas (datos no mostrados).
Introducción de un etiqueta Hs y SLN en la Cascada-nucleasa
El diseño de fusión Cascada nucleasa se modificó para incorporar una señal de localización nucleolar (SLN) para permitir el transporte al núcleo células eucariotas. Para esto, una SLN monopartita en tándem del gran antígeno T del virus de simio SV40 (secuencia: PKKKRKVDPKKKRKV) se fusionó por traducción al extremo N terminal de la proteína de fusión FokI-Cse1, directamente precedido por una etiqueta His6 en el extremo N-terminal. La etiqueta His6 (secuencia: MHHHHHH) permite una etapa de purificación de afinidad de resina adicional de Ni2+ después de la purificación de StrepII. Esta etapa adicional asegura el aislamiento del complejo de fusión de Cascada-nucleasa de longitud completa, y aumenta la eficacia de la escisión al eliminar la unión de complejos Cascada no intactos al sitio objetivo formando un par de nucleasas improductivo.
5
10
15
20
25
30
35
40
45
50
55
60
Ensayo de escisión in vitro
La actividad y especificidad de Cascada se ensayó in vitro como se ha descrito anteriormente. La Figura 14A muestra plásmidos con distancias entre protoespaciadores de 25-50 pb (incrementos de 5 pb, carriles 1-6) incubados con CascadaKKR/ELD durante 30 minutos a 37 °C. El carril 10 contiene el plásmido objetivo en sus tres topologías posibles: la banda más baja representa la forma inicial, negativamente superenrollada (nSE) del plásmido, la banda media representa la forma linealizada (escindida por Xbal), mientras que la banda superior representa la forma circular abierta (CA) (después de escotamiento con Nt.BbrCI). El carril 7 muestra la incubación de un plásmido con ambos sitios de unión eliminados (control negativo). Por lo tanto, la figura 14A muestra un ensayo de escisión típico utilizando varios plásmidos objetivo en los que los sitios de unión están separados por 25 a 50 pares de bases en incrementos de 5 pb (carriles 1 a 6). Estos plásmidos con distancias de 25-50 pb se incubaron con Cascada que llevaba anti P7 y M13 ARNcr, respectivamente. Un plásmido que no contiene sitios de unión sirvió como control (carril 7). El plásmido original existe en forma negativamente superenrollada (nSE, carril de control 8), y los productos escotados o linealizados son claramente distinguibles. Tras la incubación, se forma un producto de escisión lineal cuando los sitios de unión se separaron en 30, 35 y 40 pares de bases (carriles 2, 3, 4). A una distancia de 25, 45 y 50 pares de bases (carriles 1, 5, 6), el plásmido objetivo parecía estar escindido de manera incompleta conduciendo a la forma fragmentada (CA). Estos resultados muestran la mejor escisión en plásmidos con distancias entre 30 y 40 pb, lo que proporciona suficiente flexibilidad al diseñar un par de ARNcr para cualquier locus dado. Las distancias más cortas y más largas dan como resultado una mayor actividad de escotamiento al crear menos RBCs. Hay muy poca actividad en un plásmido en el que se han eliminado dos protoespaciadores, mostrando la especificidad del objetivo (carril 7).
Condiciones de escisión
Para evaluar las condiciones de tampón óptimas para los ensayos de escisión, y para estimar si se espera actividad del complejo en condiciones fisiológicas, se seleccionaron los siguientes dos tampones: (1) NEB4 (New England Biolabs, acetato de potasio 50 mM, Tris-acetato 20 mM, acetato de magnesio 10 mM, ditiotreitol 1 mM, pH 7,9) y (2) tampón O (Fermentas, Tris-HCl 50 mM, MgCh 10 mM, NaCl 100 mM, 0,1 mg/ml de ASB, pH 7,5). De los dos, se recomienda NEB4 para la actividad óptima de la enzima Fokl intacta comercial. Tampón O fue seleccionado de un muestreo rápido para dar buena actividad y especificidad (datos no mostrados). La Figura 14B muestra la incubación con diferentes tampones y diferentes tiempos de incubación. Los carriles 1-4 se incubaron con tampón O Fermentas (carril 1, 2 durante 15 minutos, carril 3, 4 durante 30 minutos), los carriles 5, 6 se incubaron con nEB4 (30 minutos). Los carriles 1, 3, 5 utilizaban el plásmido objetivo con espaciamiento de 35 pb, los carriles 2, 4 6 utilizaban el plásmido no objetivo (sin sitios de unión). Los carriles 7, 8 se han incubado solo con CascadaKKR o CascadaELD respectivamente (tampón O). El carril 9 es el marcador de topología como en (A). Los carriles 10 y 11 muestran el plásmido objetivo y el no objetivo incubados sin adición de Cascada. Por lo tanto, en la Figura 14b, se ensayó la actividad en el plásmido objetivo con una distancia de 35 pares de bases (carril 1, 3, 5) y un plásmido de control no objetivo (carril 2, 4, 6). Hubo una gran cantidad de escotamiento inespecífico y menos escisión en NEB4 (carril 5, 6), mientras que el tampón O solo muestra actividad en el plásmido objetivo con una gran cantidad de escisión específica y poco escotamiento (carril 1-4). La diferencia es probablemente causada por la concentración de NaCl en tampón O, la mayor fuerza iónica debilita las interacciones proteína-proteína, lo que lleva a una actividad menos inespecífica. La incubación de 15 o 30 minutos muestra poca diferencia en el plásmido objetivo y el no objetivo (carril 1, 2 o 3, 4 respectivamente). La adición de un solo tipo de Cascada (P7kKr o M13EL ) no da como resultado la actividad de escisión (carril 7, 8) como se esperaba. Este experimento muestra que la actividad nucleasa Cascada específica por un par diseñado se produce cuando la concentración de NaCl es al menos 100 mM, que está cerca de la concentración salina fisiológica dentro de las células (NaCl 137 mM). Se espera que el par de nucleasas Cascada sea totalmente activo in vivo, en células eucariotas, mientras que muestra una actividad de escisión fuera de objetivo insignificante.
Sitio de escisión
Se determinó el sitio de escisión en el plásmido objetivo con un espaciamiento de 35 pb (pObjetivot35). La Figura 15 muestra cómo la secuenciación revela sitios de escisión corriente arriba y corriente abajo por CascadaKKR/E D en el plásmido objetivo con espaciado de 35 pares de bases. En la Figura 15A) se muestra la región objetivo dentro de pObjetivo35 con sitios de escisión potenciales anotados. Las partes de los protoespaciadores están indicadas en rojo y azul. B) El diagrama de barras muestra cuatro patrones de escisión diferentes y su abundancia relativa dentro de clones secuenciados. Las barras azules representan el saliente generado, mientras que el borde izquierdo y derecho de cada barra representa el sitio de escisión izquierdo y derecho (véase B para la anotación).
La Figura 15A muestra la secuencia original de pObjetivo35, con sitios de escisión numerados de -7 a +7, en el que 0 se encuentra en el medio entre los dos protoespaciadores (indicados en rojo y azul). Se secuenciaron diecisiete clones y estos muestran escisión alrededor de la posición 0, creando salientes variables entre 3 y 5 pb (véase la Figura 15B). Los salientes de 4 son los más abundantes (acumulativamente 88 %), mientras que los salientes de 3 y 5 ocurren solo una vez (6 % cada uno). La escisión se produjo exactamente como se esperaba sin que los clones muestren escisión fuera del objetivo.
Escisión de un locus objetivo en células humanas.
5
10
15
20
25
30
35
KKR/ELD
Las nucleasas Cascada se modificaron con éxito para contener una etiqueta His6 N-terminal seguida de una señal de localización nucleolar monopartita dual. Estas proteínas de fusión de Cascada nucleasa modificadas se coexpresaron con cualquiera de las dos matrices CRISPR sintéticamente construidas, cada una dirigida a un sitio de unión en el gen CCR5 humano. En primer lugar, la actividad de este nuevo par de nucleasas se valida in vitro mediante el ensayo de la actividad en un plásmido que contiene esta región del gen CCR5. El par nucleasa se transfecta a una estirpe celular humana, p. ej., estirpe celular HeLa. La eficiencia de la escisión del objetivo se evalúa utilizando el ensayo Surveyor como se ha descrito anteriormente.
LISTADO DE SECUENCIAS
<110> CARIBOU BIOSCIENCES, INC.
<120> RIBONUCLEOPROTEÍNAS CASCADA MODIFICADAS Y USOS DE LAS MISMAS
<130> SMW/FP7203417
<140> EP <141>
<150> EP 12812999.6 <151>
<150> PCT/EP2012/076674 <151>
<150> GB 1122458.1 <151>
<160> 47
<170> PatentIn versión 3.5
<210> 1
<211> 502
<212> PRT
<213> Escherichia coli
<400> 1

Claims (11)

  1. REIVINDICACIONES
    1. Una proteína de fusión artificial de una subunidad proteica Cse1 asociada a repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR) de tipo I y una endonucleasa FokI.
  2. 2. La proteína de fusión según la reivindicación 1, en la que la proteína de fusión comprende además una señal de 5 localización nuclear.
  3. 3. Una molécula de ácido nucleico que codifica una proteína de fusión según la reivindicación 1 o 2.
  4. 4. Un vector de expresión que comprende una molécula de ácido nucleico según la reivindicación 3.
  5. 5. Un complejo proteico Cascada que comprende una proteína de fusión según la reivindicación 1 o 2.
  6. 6. Un complejo ribonucleoproteico que comprende la proteína de fusión según la reivindicación 1 o 2 y una molécula
    10 de ARN CRISPR (ARNcr).
  7. 7. El complejo ribonucleoproteico según la reivindicación 6, que comprende además una subunidad proteica Cas6, una subunidad proteica Cas5, una subunidad proteica Cse2 y una subunidad proteica Cas7.
  8. 8. Una célula eucariota que comprende un complejo ribonucleoproteico según la reivindicación 6 o la reivindicación 7, en la que la célula es distinta de una célula germinal humana y en la que la célula no forma parte del cuerpo
    15 humano o animal.
  9. 9. Un procedimiento de modificación, visualización, activación de la transcripción o represión de la transcripción de un ácido nucleico objetivo in vitro que comprende poner en contacto el ácido nucleico objetivo con un complejo ribonucleoproteico según la reivindicación 6 o la reivindicación 7.
  10. 10. Un procedimiento según la reivindicación 9, en el que el procedimiento de modificación es la unión y/o la escisión
    20 del ácido nucleico objetivo.
  11. 11. Un procedimiento según la reivindicación 9 o la reivindicación 10, en el que el ácido nucleico objetivo es un ADN bicatenario (ADNbc).
    imagen1
    Relación molar pUC-X:Cascada
    J3-Cascada
    (Dirigido)
    Lineal
    J3-Cascada
    (Dirigido)
    Figura 1
    Concentración de Cascada
    B
    ADN
    nSE
    con
    Cascada
    R44
    Cascada
    (No
    dirigido)
    ADN
    me
    J3
    Cascada
    (Dirigido)
    ADN
    CA
    ADN
    lin
    imagen2
    imagen3
    imagen4
    imagen5
    Sonda ADNmc
    ADN (
    ADN lin con Cascada
    ADN li
    ADN n
    EcoRI
    - + +
    EcoRI
    - + +
    Cascada R44 Cascada J3
    (No dirigido) (Dirigido)
    imagen6
    imagen7
    Figura 3
    Sin infectar
    CRISPR 7Tm
    (anti-X)
    CRISPR R44 (No dirigido)
    Casca daACsel
    Cse1-N155Venus
    Cas3-C85Venus
    CRÍSPR 7Tm (anti-;„)
    Fago X infectado
    Fago X infectado
    Venus
    Campo claro
    Superposición
    imagen8
    imagen9
    Fracción de células que contienen pUC-^
    imagen10
    imagen11
    imagen12
    imagen13
    Relación molar
    plásmido
    Concentración
    de J3-Cascada-Cas3
    Cascada
    Cas3
    ADN
    Cascada
    Cas3
    con
    pUC
    ADN
    me
    ADN
    D
    con
    pUC
    P7
    ADN
    me
    imagen14
    Tiempo
    Tiempo
    de reacción
    de reacción
    Tiempo de reacción
    (mi
    MgCI
    MgC!
    ATP
    pUC-p7
    pUC-?
    Cascada-Cas3 TS
    imagen15
    Tiempo
    de reacción
    Tiempo de reacción
    (min)
    0
    30
    60
    5
    MgCI
    +
    MgCI
    ATP
    +
    pUC-A,
    Cascada-Cas3 K320N
    imagen16
    ■v. - Tin
    £?iiiüEnn»ti
    1' Barrido del protoespaciador
    2: Unión del protoespaciador
    4: Escotamiento por dominio Cas HD
    3: Formación del complejo Cas-Cascada3
    5b:
    5a: Actividad de la exo nucleasa
    Disociación de Cascada
    dependiente de ATP de Cas3
    6: Degradación completa del plásmido por Cas3
    imagen17
    imagen18
    Union a ADN objetivo
    ADN objetivo
    Escisión objetivo
    imagen19
    Adhesión en el extremo no homólogo Recombinación homologa
    Bloqueo de genes Modificación génica, integración génica
    o reparación por mutación
    Cascada \Cse1
    Cse1-N155Venus Superposición
    Cas3-C85Venus
    imagen20
    imagen21
    imagen22
    'ifl íl"0 W ni
    O. ■- 1 J U ui CTfn
    JZ u i > / ^ {¡r *
    +/: vro «fl
    imagen23
    imagen24
    imagen25
    imagen26
    Fokt-Cse1
    Figura 13
    Variante FoKI
    . KKR ELD
    cargada con ARNcr
    J3 P7 M13
    M
    1 2 3
    imagen27
    imagen28
    corriente arriba
    corriente abajo
    Figura 15
    76543210
    CTAAGCTGI
    NMI
    1234567
    Patrones de escisión
    Posición de escisión
ES16169431.0T 2011-12-30 2012-12-21 Ribonucleoproteínas Cascada modificadas y usos de las mismas Active ES2689256T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB201122458A GB201122458D0 (en) 2011-12-30 2011-12-30 Modified cascade ribonucleoproteins and uses thereof
GB201122458 2011-12-30

Publications (1)

Publication Number Publication Date
ES2689256T3 true ES2689256T3 (es) 2018-11-12

Family

ID=45695084

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16169431.0T Active ES2689256T3 (es) 2011-12-30 2012-12-21 Ribonucleoproteínas Cascada modificadas y usos de las mismas

Country Status (26)

Country Link
US (9) US20140294773A1 (es)
EP (2) EP3091072B1 (es)
JP (1) JP6408914B2 (es)
KR (1) KR101889589B1 (es)
CN (2) CN105732816B (es)
AU (1) AU2012360975B2 (es)
BR (1) BR112014016228B1 (es)
CA (1) CA2862018C (es)
CY (1) CY1120538T1 (es)
DE (1) DE212012000234U1 (es)
DK (1) DK3091072T3 (es)
ES (1) ES2689256T3 (es)
GB (3) GB201122458D0 (es)
HR (1) HRP20181150T1 (es)
HU (1) HUE039617T2 (es)
IL (1) IL233399A0 (es)
IN (1) IN2014DN05937A (es)
LT (1) LT3091072T (es)
MX (1) MX364830B (es)
PL (1) PL3091072T3 (es)
PT (1) PT3091072T (es)
RS (1) RS57604B1 (es)
RU (1) RU2014127702A (es)
SG (1) SG11201403713QA (es)
SI (1) SI3091072T1 (es)
WO (1) WO2013098244A1 (es)

Families Citing this family (206)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7790756B2 (en) 2006-10-11 2010-09-07 Deciphera Pharmaceuticals, Llc Kinase inhibitors useful for the treatment of myleoproliferative diseases and other proliferative diseases
EP3078753B1 (en) 2010-05-10 2018-04-18 The Regents of The University of California Methods using endoribonuclease compositions
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
IN2014MN00974A (es) 2011-12-16 2015-04-24 Targetgene Biotechnologies Ltd
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
CN116064533A (zh) 2012-10-23 2023-05-05 基因工具股份有限公司 用于切割靶dna的组合物及其用途
KR101844123B1 (ko) 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
ES2553782T3 (es) 2012-12-12 2015-12-11 The Broad Institute, Inc. Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
ES2786193T3 (es) 2012-12-12 2020-10-09 Broad Inst Inc Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3252160B1 (en) 2012-12-12 2020-10-28 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
RU2699523C2 (ru) 2012-12-17 2019-09-05 Президент Энд Фэллоуз Оф Харвард Коллидж Рнк-направляемая инженерия генома человека
EP3578666A1 (en) 2013-03-12 2019-12-11 President and Fellows of Harvard College Method of generating a three-dimensional nucleic acid containing matrix
ES2901396T3 (es) 2013-03-14 2022-03-22 Caribou Biosciences Inc Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CN113563476A (zh) 2013-03-15 2021-10-29 通用医疗公司 遗传和表观遗传调节蛋白至特定基因组基因座的rna引导的靶向
US9902973B2 (en) 2013-04-11 2018-02-27 Caribou Biosciences, Inc. Methods of modifying a target nucleic acid with an argonaute
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
EP3603679B1 (en) 2013-06-04 2022-08-10 President and Fellows of Harvard College Rna-guided transcriptional regulation
DK3011031T3 (da) 2013-06-17 2020-12-21 Broad Inst Inc Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
SG11201510286QA (en) 2013-06-17 2016-01-28 Broad Inst Inc Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
ES2777217T3 (es) 2013-06-17 2020-08-04 Broad Inst Inc Suministro, modificación y optimización de sistemas de guía en tándem, métodos y composiciones para la manipulación de secuencias
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
US10011850B2 (en) 2013-06-21 2018-07-03 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
BR112016000571B1 (pt) * 2013-07-10 2023-12-26 President And Fellows Of Harvard College Métodos in vitro para modular a expressão e para alterar um ou mais ácidos nucleicos alvo em uma célula simultaneamente com a regulação da expressão de um ou mais ácidos nucleicos alvo em uma célula, bem como célula de levedura ou bactéria compreendendo ácidos nucleicos
US9663782B2 (en) 2013-07-19 2017-05-30 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
US11060083B2 (en) 2013-07-19 2021-07-13 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
CN103388006B (zh) * 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
WO2015021426A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. A crispr/cas system-based novel fusion protein and its application in genome editing
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
LT3036327T (lt) 2013-08-22 2019-06-25 Pioneer Hi-Bred International, Inc. Genomo modifikacijos, panaudojant nukreipiančias polinukleotido/cas endonukleazės sistemas, ir panaudojimo būdai
KR20160060659A (ko) * 2013-08-29 2016-05-30 템플 유니버시티-오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 Hiv 감염증의 rna-유도 치료를 위한 방법 및 조성물
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
CN105637087A (zh) 2013-09-18 2016-06-01 科马布有限公司 方法、细胞与生物体
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
WO2015066119A1 (en) 2013-10-30 2015-05-07 North Carolina State University Compositions and methods related to a type-ii crispr-cas system in lactobacillus buchneri
CN106459995B (zh) 2013-11-07 2020-02-21 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
WO2015089486A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
AU2014361834B2 (en) 2013-12-12 2020-10-22 Massachusetts Institute Of Technology CRISPR-Cas systems and methods for altering expression of gene products, structural information and inducible modular Cas enzymes
JP6625055B2 (ja) 2013-12-12 2020-01-08 ザ・ブロード・インスティテュート・インコーポレイテッド 組成物、及びヌクレオチドリピート障害におけるcrispr−cas系の使用方法
DK3079725T3 (da) 2013-12-12 2020-01-20 Broad Inst Inc Administration, brug og terapeutiske anvendelser af crispr-cas-systemerne og sammensætninger til genomredigering
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
MX2016007797A (es) 2013-12-19 2016-09-07 Amyris Inc Metodos para integracion genomica.
US10787654B2 (en) 2014-01-24 2020-09-29 North Carolina State University Methods and compositions for sequence guiding Cas9 targeting
CN111500569A (zh) 2014-03-05 2020-08-07 国立大学法人神户大学 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体
EP3957735A1 (en) 2014-03-05 2022-02-23 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
DK3116997T3 (da) 2014-03-10 2019-08-19 Editas Medicine Inc Crispr/cas-relaterede fremgangsmåder og sammensætninger til behandling af lebers kongenitale amaurose 10 (lca10)
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
EP3122880B1 (en) 2014-03-26 2021-05-05 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
EP3125946B1 (en) * 2014-03-28 2022-12-07 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
US11318206B2 (en) 2014-03-28 2022-05-03 Aposense Ltd Compounds and methods for trans-membrane delivery of molecules
CN106460003A (zh) * 2014-04-08 2017-02-22 北卡罗来纳州立大学 用于使用crispr相关基因rna引导阻遏转录的方法和组合物
CN106604994B (zh) 2014-06-23 2021-12-14 通用医疗公司 通过测序评估的DSBs的全基因组无偏鉴定(GUIDE-Seq)
WO2016007347A1 (en) 2014-07-11 2016-01-14 E. I. Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
SG11201701245QA (en) 2014-08-27 2017-03-30 Caribou Biosciences Inc Methods for increasing cas9-mediated engineering efficiency
EP3633032A3 (en) 2014-08-28 2020-07-29 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
EP3191595B1 (en) 2014-09-12 2019-12-25 E. I. du Pont de Nemours and Company Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
CA2969619A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
JP6830437B2 (ja) 2014-12-10 2021-02-17 リージェンツ オブ ザ ユニバーシティ オブ ミネソタ 疾患を処置するための遺伝子改変された細胞、組織および臓器
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
BR112017016080B1 (pt) 2015-01-28 2024-02-20 Caribou Biosciences, Inc Polinucleotídeo crispr da classe 2 único, sistema crispr da classe 2 e método in vitro de modificação de uma molécula de ácido nucleico alvo em um organismo não-humano, ou em uma célula
CN107532161A (zh) 2015-03-03 2018-01-02 通用医疗公司 具有改变的PAM特异性的工程化CRISPR‑Cas9核酸酶
WO2016153305A1 (ko) * 2015-03-26 2016-09-29 한국생명공학연구원 표적 유전자 특이적 핵산 프로브 및 Fok Ι 제한효소 이량체를 이용하여 세포 내에서 표적 유전자를 특이적으로 편집하기 위한 조성물 및 이의 용도
US10450576B2 (en) 2015-03-27 2019-10-22 E I Du Pont De Nemours And Company Soybean U6 small nuclear RNA gene promoters and their use in constitutive expression of small RNA genes in plants
EP3280803B1 (en) 2015-04-06 2021-05-26 The Board of Trustees of the Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
JP2018522249A (ja) 2015-04-24 2018-08-09 エディタス・メディシン、インコーポレイテッド Cas9分子/ガイドrna分子複合体の評価
WO2016182959A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
EP3303607A4 (en) 2015-05-29 2018-10-10 North Carolina State University Methods for screening bacteria, archaea, algae, and yeast using crispr nucleic acids
US10883103B2 (en) 2015-06-02 2021-01-05 Monsanto Technology Llc Compositions and methods for delivery of a polynucleotide into a plant
CN108368502B (zh) 2015-06-03 2022-03-18 内布拉斯加大学董事委员会 使用单链dna的dna编辑
CN108026526B (zh) 2015-06-09 2023-05-12 爱迪塔斯医药公司 用于改善移植的crispr/cas相关方法和组合物
CA2983874C (en) * 2015-06-15 2022-06-21 North Carolina State University Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
WO2016205613A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
US20190024073A1 (en) * 2015-07-23 2019-01-24 Mayo Foundation For Medical Education And Research Editing mitochondrial dna
CN108472314A (zh) 2015-07-31 2018-08-31 明尼苏达大学董事会 修饰的细胞和治疗方法
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
EP3341477B1 (en) 2015-08-28 2022-03-23 The General Hospital Corporation Engineered crispr-cas9 nucleases
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
CA2998087A1 (en) * 2015-09-09 2017-03-16 National University Corporation Kobe University Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method
CN108271384B (zh) 2015-09-09 2022-04-15 国立大学法人神户大学 用于特异性转变靶向dna序列的核酸碱基的革兰氏阳性菌的基因组序列的转变方法、及其使用的分子复合体
JP2018530536A (ja) 2015-09-11 2018-10-18 ザ ジェネラル ホスピタル コーポレイション ヌクレアーゼDSBの完全照合およびシーケンシング(FIND−seq)
EP3786294A1 (en) 2015-09-24 2021-03-03 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP3356533A1 (en) 2015-09-28 2018-08-08 North Carolina State University Methods and compositions for sequence specific antimicrobials
CN105331627B (zh) * 2015-09-30 2019-04-02 华中农业大学 一种利用内源CRISPR-Cas系统进行原核生物基因组编辑的方法
US9850484B2 (en) 2015-09-30 2017-12-26 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (Circle-seq)
EP4089175A1 (en) * 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
US9677090B2 (en) 2015-10-23 2017-06-13 Caribou Biosciences, Inc. Engineered nucleic-acid targeting nucleic acids
IL258821B (en) 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
WO2017079406A1 (en) 2015-11-03 2017-05-11 President And Fellows Of Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
US11220693B2 (en) 2015-11-27 2022-01-11 National University Corporation Kobe University Method for converting monocot plant genome sequence in which nucleic acid base in targeted DNA sequence is specifically converted, and molecular complex used therein
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
SG10202112024PA (en) 2016-01-11 2021-12-30 Univ Leland Stanford Junior Chimeric proteins and methods of immunotherapy
IL260532B2 (en) 2016-01-11 2023-12-01 Univ Leland Stanford Junior Systems containing chaperone proteins and their uses for controlling gene expression
RU2749050C2 (ru) 2016-01-27 2021-06-03 Онкорус, Инк. Онколитические вирусные векторы и их применение
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11512311B2 (en) 2016-03-25 2022-11-29 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency
EP3443086B1 (en) 2016-04-13 2021-11-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
CA3210120C (en) 2016-04-25 2024-04-09 President And Fellows Of Harvard College Hybridization chain reaction methods for in situ molecular detection
JP7093310B2 (ja) 2016-05-18 2022-06-29 アミリス, インコーポレイテッド 外因性ランディングパッドへの核酸のゲノム組込みのための組成物および方法
AU2017274145B2 (en) 2016-06-02 2020-07-23 Sigma-Aldrich Co Llc Using programmable DNA binding proteins to enhance targeted genome modification
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
US20190323038A1 (en) * 2016-06-17 2019-10-24 Montana State Univesity Bidirectional targeting for genome editing
EP3494220A1 (en) 2016-08-02 2019-06-12 Editas Medicine, Inc. Compositions and methods for treating cep290 associated disease
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
GB2573062A (en) 2016-10-14 2019-10-23 Harvard College AAV delivery of nucleobase editors
AU2017341926B2 (en) 2016-10-14 2022-06-30 The General Hospital Corporation Epigenetically regulated site-specific nucleases
EP4338799A3 (en) 2016-10-18 2024-06-05 Regents of the University of Minnesota Tumor infiltrating lymphocytes and methods of therapy
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
KR20190104392A (ko) 2017-01-09 2019-09-09 아포센스 엘티디. 분자의 막투과 전달을 위한 화합물 및 방법
WO2018148647A2 (en) * 2017-02-10 2018-08-16 Lajoie Marc Joseph Genome editing reagents and their use
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
WO2018170184A1 (en) 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
WO2018170436A1 (en) 2017-03-16 2018-09-20 Jacobs Farm Del Cabo Basil with high tolerance to downy mildew
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
CA3084252A1 (en) 2017-03-28 2018-10-04 Caribou Biosciences, Inc. Crispr-associated (cas) protein
BR112019021719A2 (pt) 2017-04-21 2020-06-16 The General Hospital Corporation Variantes de cpf1 (cas12a) com especificidade para pam alterada
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018209158A2 (en) 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
EP3630198A4 (en) 2017-05-25 2021-04-21 The General Hospital Corporation USE OF CLIVED DESAMINASES TO LIMIT UNWANTED OUT-OF-TARGET DESAMINATION FROM BASE EDITING
US11807869B2 (en) * 2017-06-08 2023-11-07 Osaka University Method for producing DNA-edited eukaryotic cell, and kit used in the same
EP3635104A1 (en) 2017-06-09 2020-04-15 Editas Medicine, Inc. Engineered cas9 nucleases
JP7275054B2 (ja) 2017-06-15 2023-05-17 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 標的化された非ウイルスdna挿入
CA3064807A1 (en) 2017-06-20 2018-12-27 Jiangsu Hengrui Medicine Co., Ltd. Method for knocking out target gene in t cell in vitro and crrna used in the method
WO2019006418A2 (en) 2017-06-30 2019-01-03 Intima Bioscience, Inc. ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
EP3658165A4 (en) 2017-07-26 2021-09-01 Oncorus, Inc. ONCOLYTIC VIRUS VECTORS AND USES THEREOF
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
AU2018321021B2 (en) 2017-08-21 2022-10-06 Tokushima University Target sequence specific alteration technology using nucleotide target recognition
WO2019040650A1 (en) 2017-08-23 2019-02-28 The General Hospital Corporation GENETICALLY MODIFIED CRISPR-CAS9 NUCLEASES HAVING MODIFIED PAM SPECIFICITY
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11252928B2 (en) 2017-09-21 2022-02-22 The Condard-Pyle Company Miniature rose plant named ‘Meibenbino’
US11917978B2 (en) 2017-09-21 2024-03-05 The Conard Pyle Company Miniature rose plant named ‘meibenbino’
US11725228B2 (en) 2017-10-11 2023-08-15 The General Hospital Corporation Methods for detecting site-specific and spurious genomic deamination induced by base editing technologies
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
KR102503130B1 (ko) 2017-10-27 2023-02-24 더 리전트 오브 더 유니버시티 오브 캘리포니아 내인성 t 세포 수용체의 표적화된 대체
CN111566121A (zh) 2018-01-12 2020-08-21 巴斯夫欧洲公司 小麦7a染色体上决定每穗小穗数QTL的基因
WO2019152941A1 (en) 2018-02-05 2019-08-08 Caribou Biosciences, Inc. Engineered gut microbes for reduction of reactivation of detoxified drugs
US11865164B2 (en) * 2018-03-27 2024-01-09 G+Flas Life Sciences Pharmaceutical composition for treating cancer, containing guide RNA and endonuclease as active ingredients
EP3781196B1 (en) 2018-03-27 2024-03-06 G+Flas Life Sciences Sequence-specific in vivo cell targeting
JP7422128B2 (ja) * 2018-04-03 2024-01-25 ジーフラス ライフ サイエンシズ,インク. 配列特異的なインビボ細胞標的化
AU2019256287A1 (en) 2018-04-17 2020-11-12 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
JP2021523745A (ja) 2018-05-16 2021-09-09 シンテゴ コーポレイション ガイドrna設計および使用のための方法およびシステム
FR3082208A1 (fr) * 2018-06-11 2019-12-13 Fondation Mediterranee Infection Methode de modification d'une sequence cible d'acide nucleique d'une cellule hote
US10227576B1 (en) 2018-06-13 2019-03-12 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes
KR102516697B1 (ko) * 2018-06-13 2023-03-31 카리부 바이오사이언시스 인코포레이티드 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
US20210102183A1 (en) * 2018-06-13 2021-04-08 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes
WO2019246555A1 (en) * 2018-06-21 2019-12-26 Cornell University Type i crispr system as a tool for genome editing
CN113195715A (zh) 2018-08-29 2021-07-30 阿迈瑞斯公司 基于选择的测定法的细胞和方法
GB201815820D0 (en) 2018-09-28 2018-11-14 Univ Wageningen Off-target activity inhibitors for guided endonucleases
US20220177943A1 (en) * 2018-10-01 2022-06-09 Rodolphe Barrangou Recombinant type i crispr-cas system and uses thereof for screening for variant cells
WO2020072248A1 (en) 2018-10-01 2020-04-09 North Carolina State University Recombinant type i crispr-cas system
WO2020092725A1 (en) * 2018-11-01 2020-05-07 Montana State University Gene modulation with crispr system type i
EP3877517A4 (en) * 2018-11-09 2022-09-07 Inari Agriculture, Inc. RNA-DRIVEN NUCLEASES AND DNA-BINDING PROTEINS
US20220073890A1 (en) 2018-12-14 2022-03-10 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
WO2020163396A1 (en) 2019-02-04 2020-08-13 The General Hospital Corporation Adenine dna base editor variants with reduced off-target rna editing
US20220290120A1 (en) 2019-02-25 2022-09-15 Novome Biotechnologies, Inc. Plasmids for gene editing
WO2020191153A2 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN113646429A (zh) 2019-04-05 2021-11-12 国立大学法人大阪大学 敲入细胞的制作方法
CN110438142A (zh) * 2019-05-13 2019-11-12 安徽大学 一种基于I-B-Svi型CRISPR-Cas系统中SviCas5-6-7的转录调控方法
CN114981418A (zh) * 2019-11-06 2022-08-30 洛可斯生物科学公司 包含crispr-cas系统的噬菌体组合物及其使用方法
US20230022635A1 (en) * 2019-12-31 2023-01-26 Inari Agriculture Technology, Inc. Delivery of biological molecules to plant cells
CN115003825A (zh) * 2020-01-24 2022-09-02 C4U株式会社 检测试样中的特定dna的方法
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
CN111979240B (zh) * 2020-06-11 2022-04-15 中山大学 一种基于Type I-F CRISPR/Cas的基因表达调控方法和调控系统
CN111849978B (zh) * 2020-06-11 2022-04-15 中山大学 一种基于Type I-F CRISPR/Cas的染色质成像方法和染色质成像系统
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
CA3191387A1 (en) 2020-09-30 2022-04-07 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
US11944063B2 (en) 2020-09-30 2024-04-02 Spring Meadow Nursery, Inc. Hydrangea ‘SMNHPH’
US11155884B1 (en) 2020-10-16 2021-10-26 Klemm & Sohn Gmbh & Co. Kg Double-flowering dwarf Calibrachoa
EP4321015A3 (en) 2020-10-16 2024-04-17 Klemm & Sohn GmbH & Co. KG Double-flowering dwarf calibrachoa
WO2022093977A1 (en) 2020-10-30 2022-05-05 Fortiphyte, Inc. Pathogen resistance in plants
US20230407350A1 (en) 2020-11-10 2023-12-21 Industrial Microbes, Inc. Microorganisms capable of producing poly(hiba) from feedstock
CA3222023A1 (en) 2021-06-01 2022-12-08 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
CA3231249A1 (en) * 2021-09-09 2023-03-16 Hedia MAAMAR Coronavirus rapid diagnostics
US11884915B2 (en) 2021-09-10 2024-01-30 Agilent Technologies, Inc. Guide RNAs with chemical modification for prime editing
US20230279442A1 (en) 2021-12-15 2023-09-07 Versitech Limited Engineered cas9-nucleases and method of use thereof
CN115851664B (zh) * 2022-09-19 2023-08-25 中国药科大学 一种I-B型CRISPR-Cascade-Cas3基因编辑系统及应用

Family Cites Families (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
WO1988008450A1 (en) 1987-05-01 1988-11-03 Birdwell Finlayson Gene therapy for metabolite disorders
US5350689A (en) 1987-05-20 1994-09-27 Ciba-Geigy Corporation Zea mays plants and transgenic Zea mays plants regenerated from protoplasts or protoplast-derived cells
US5767367A (en) 1990-06-23 1998-06-16 Hoechst Aktiengesellschaft Zea mays (L.) with capability of long term, highly efficient plant regeneration including fertile transgenic maize plants having a heterologous gene, and their preparation
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
FR2688514A1 (fr) 1992-03-16 1993-09-17 Centre Nat Rech Scient Adenovirus recombinants defectifs exprimant des cytokines et medicaments antitumoraux les contenant.
US5625048A (en) 1994-11-10 1997-04-29 The Regents Of The University Of California Modified green fluorescent proteins
US5968738A (en) 1995-12-06 1999-10-19 The Board Of Trustees Of The Leland Stanford Junior University Two-reporter FACS analysis of mammalian cells using green fluorescent proteins
US20020182673A1 (en) 1998-05-15 2002-12-05 Genentech, Inc. IL-17 homologous polypedies and therapeutic uses thereof
US6306610B1 (en) 1998-09-18 2001-10-23 Massachusetts Institute Of Technology Biological applications of quantum dots
WO2000046386A2 (en) 1999-02-03 2000-08-10 The Children's Medical Center Corporation Gene repair involving the induction of double-stranded dna cleavage at a chromosomal target site
CA2396058C (en) 1999-12-28 2009-09-15 Ribonomics, Inc. Methods for isolating and characterizing endogenous mrna-protein (mrnp) complexes
WO2002026967A2 (en) 2000-09-25 2002-04-04 Thomas Jefferson University Targeted gene correction by single-stranded oligodeoxynucleotides
NZ560966A (en) 2000-10-27 2010-06-25 Novartis Vaccines & Diagnostic Nucleic acids and proteins from streptococcus groups A & B
US20060253913A1 (en) 2001-12-21 2006-11-09 Yue-Jin Huang Production of hSA-linked butyrylcholinesterases in transgenic mammals
CN100575485C (zh) 2002-01-23 2009-12-30 犹他大学研究基金会 使用锌指核酸酶的定向染色体诱变
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
AU2003224897A1 (en) 2002-04-09 2003-10-27 Kenneth L. Beattie Oligonucleotide probes for genosensor chips
US9447434B2 (en) 2002-09-05 2016-09-20 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US20120196370A1 (en) 2010-12-03 2012-08-02 Fyodor Urnov Methods and compositions for targeted genomic deletion
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
CN101426931A (zh) * 2004-04-07 2009-05-06 安克塞斯生物公司 核酸检测系统
US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
US7892224B2 (en) 2005-06-01 2011-02-22 Brainlab Ag Inverse catheter planning
EP1913149A4 (en) 2005-07-26 2009-08-05 Sangamo Biosciences Inc TARGETED INTEGRATION AND EXPRESSION OF EXOGENOUS NUCLEIC ACID SEQUENCES
DK2341149T3 (en) 2005-08-26 2017-02-27 Dupont Nutrition Biosci Aps Use of CRISPR-associated genes (Cas)
EP2016183B1 (en) 2006-05-10 2011-06-15 Deinove Process for chromosomal engineering using a novel dna repair system
DK2018441T3 (da) 2006-05-19 2012-01-02 Danisco Mærkede mikroorganismer og fremgangsmåde til mærkning
EP2206782A1 (en) 2006-05-25 2010-07-14 Sangamo BioSciences, Inc. Methods and compositions for gene inactivation
WO2007144770A2 (en) 2006-06-16 2007-12-21 Danisco A/S Bacterium
EP2054514A4 (en) 2006-08-04 2009-11-04 Univ Georgia State Res Found ENZYME SENSORS, METHODS OF PREPARATION AND USE OF SUCH SENSORS, AND METHODS OF DETECTING PROTEASE ACTIVITY
TR201905633T4 (tr) 2007-03-02 2019-05-21 Dupont Nutrition Biosci Aps İyileştirilmiş faj direnci olan kültürler.
AU2008235256B2 (en) * 2007-04-05 2014-05-15 Speedx Pty Ltd Nucleic acid enzymes and complexes and methods for their use
FR2925918A1 (fr) 2007-12-28 2009-07-03 Pasteur Institut Typage et sous-typage moleculaire de salmonella par identification des sequences nucleotidiques variables des loci crispr
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
EP2313515B1 (en) 2008-08-22 2015-03-04 Sangamo BioSciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration
DK2334794T3 (en) 2008-09-15 2017-02-20 Children's Medical Center Corp MODULATION OF BCL11A FOR TREATMENT OF HEMOGLOBINOPATHIES
US20100076057A1 (en) * 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
EP2362915B1 (en) 2008-11-07 2016-12-21 DuPont Nutrition Biosciences ApS Bifidobacteria crispr sequences
WO2010066907A1 (en) 2008-12-12 2010-06-17 Danisco A/S Genetic cluster of strains of streptococcus thermophilus having unique rheological properties for dairy fermentation
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
EP2419511B1 (en) 2009-04-09 2018-01-17 Sangamo Therapeutics, Inc. Targeted integration into stem cells
CN102596255B (zh) 2009-04-30 2017-10-13 圣拉法埃莱医院有限公司 基因载体
US20120149115A1 (en) 2009-06-11 2012-06-14 Snu R&Db Foundation Targeted genomic rearrangements using site-specific nucleases
CA2767377A1 (en) 2009-07-24 2011-01-27 Sigma-Aldrich Co. Llc Method for genome editing
US20120192298A1 (en) 2009-07-24 2012-07-26 Sigma Aldrich Co. Llc Method for genome editing
EP2461819A4 (en) 2009-07-28 2013-07-31 Sangamo Biosciences Inc METHODS AND COMPOSITIONS FOR TREATING TRI-NUCLEOTIDE REPEAT DISORDERS
CA2770312A1 (en) 2009-08-11 2011-02-17 Sangamo Biosciences, Inc. Organisms homozygous for targeted modification
DK2292731T3 (en) 2009-08-13 2018-07-23 Dupont Nutrition Biosci Aps Process for producing complex cultures
EA201290168A1 (ru) 2009-09-25 2013-10-30 Басф Плант Сайенс Компани Гмбх Растения, обладающие повышенными урожайностными свойствами, и способ создания таких растений
GB2487341A (en) 2009-11-02 2012-07-18 Nugen Technologies Inc Compositions and methods for targeted nucleic acid sequence selection and amplification
CA2781835A1 (en) 2009-11-27 2011-06-03 Basf Plant Science Company Gmbh Chimeric endonucleases and uses thereof
US20110294114A1 (en) 2009-12-04 2011-12-01 Cincinnati Children's Hospital Medical Center Optimization of determinants for successful genetic correction of diseases, mediated by hematopoietic stem cells
EP2510096B2 (en) 2009-12-10 2018-02-07 Regents of the University of Minnesota Tal effector-mediated dna modification
US20110203012A1 (en) 2010-01-21 2011-08-18 Dotson Stanton B Methods and compositions for use of directed recombination in plant breeding
JP6137596B2 (ja) * 2010-02-08 2017-05-31 サンガモ セラピューティクス, インコーポレイテッド 遺伝子操作された切断ハーフドメイン
WO2011100058A1 (en) 2010-02-09 2011-08-18 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
US20130059388A1 (en) 2010-04-13 2013-03-07 Sigma-Aldrich Co., Llc Methods for generating endogenously tagged proteins
EP3078753B1 (en) 2010-05-10 2018-04-18 The Regents of The University of California Methods using endoribonuclease compositions
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
EP2392208B1 (en) * 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
WO2011156430A2 (en) 2010-06-07 2011-12-15 Fred Hutchinson Cancer Research Center Generation and expression of engineered i-onui endonuclease and its homologues and uses thereof
EP3489359A1 (en) 2010-07-23 2019-05-29 Sigma Aldrich Co. LLC Genome editing using targeting endonucleases and single-stranded nucleic acids
US9081737B2 (en) 2010-08-02 2015-07-14 Integrated Dna Technologies, Inc. Methods for predicting stability and melting temperatures of nucleic acid duplexes
WO2012054726A1 (en) 2010-10-20 2012-04-26 Danisco A/S Lactococcus crispr-cas sequences
KR20120096395A (ko) 2011-02-22 2012-08-30 주식회사 툴젠 뉴클레아제에 의해 유전자 변형된 세포를 농축시키는 방법
MX351043B (es) 2011-04-27 2017-09-29 Amyris Inc Metodos para modificacion genomica.
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
US8927218B2 (en) 2011-06-27 2015-01-06 Flir Systems, Inc. Methods and compositions for segregating target nucleic acid from mixed nucleic acid samples
EP3498833B1 (en) 2011-09-21 2023-08-16 Sangamo Therapeutics, Inc. Methods and compositions for regulation of transgene expression
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
IN2014MN00974A (es) 2011-12-16 2015-04-24 Targetgene Biotechnologies Ltd
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
ES2641840T3 (es) 2012-02-24 2017-11-14 Fred Hutchinson Cancer Research Center Composiciones y métodos para el tratamiento de hemoglobinopatías
MX359327B (es) 2012-02-29 2018-09-25 Sangamo Biosciences Inc Composiciones y sus usos para tratar y prevenir la enfermedad de huntington.
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
AU2013204327B2 (en) 2012-04-20 2016-09-01 Aviagen Cell transfection method
CA2871008C (en) 2012-04-23 2022-11-22 Bayer Cropscience Nv Targeted genome engineering in plants
US9523098B2 (en) 2012-05-02 2016-12-20 Dow Agrosciences Llc Targeted modification of malate dehydrogenase
WO2013169802A1 (en) 2012-05-07 2013-11-14 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration of transgenes
US11120889B2 (en) 2012-05-09 2021-09-14 Georgia Tech Research Corporation Method for synthesizing a nuclease with reduced off-site cleavage
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
IN2014DN10996A (es) 2012-05-30 2015-09-25 Baylor College Medicine
US9102936B2 (en) 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
KR20150023670A (ko) 2012-06-12 2015-03-05 제넨테크, 인크. 조건적 녹아웃 대립유전자의 생성 방법 및 이를 위한 조성물
EP2674501A1 (en) 2012-06-14 2013-12-18 Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail Method for detecting and identifying enterohemorrhagic Escherichia coli
US9688971B2 (en) 2012-06-15 2017-06-27 The Regents Of The University Of California Endoribonuclease and methods of use thereof
US20150225734A1 (en) 2012-06-19 2015-08-13 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
WO2014011901A2 (en) 2012-07-11 2014-01-16 Sangamo Biosciences, Inc. Methods and compositions for delivery of biologics
AU2013289206B2 (en) 2012-07-11 2018-08-09 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of lysosomal storage diseases
EP3808844A1 (en) 2012-07-25 2021-04-21 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
MX367081B (es) 2012-08-29 2019-08-05 Sangamo Biosciences Inc Modificación genética mediada por nucleasas para usarse en el tratamiento de una condición genética.
CN105264067B (zh) 2012-09-07 2020-11-10 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
EP2906602B1 (en) 2012-10-12 2019-01-16 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
CN116064533A (zh) 2012-10-23 2023-05-05 基因工具股份有限公司 用于切割靶dna的组合物及其用途
KR20150100651A (ko) 2012-10-30 2015-09-02 리컴비네틱스 인코포레이티드 동물의 성적 성숙 조절
US20150291967A1 (en) 2012-10-31 2015-10-15 Luc Mathis Coupling herbicide resistance with targeted insertion of transgenes in plants
US20140127752A1 (en) 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
KR101844123B1 (ko) * 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
ES2786193T3 (es) 2012-12-12 2020-10-09 Broad Inst Inc Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
EP2848690B1 (en) 2012-12-12 2020-08-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
ES2553782T3 (es) 2012-12-12 2015-12-11 The Broad Institute, Inc. Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
EP3252160B1 (en) 2012-12-12 2020-10-28 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
RU2699523C2 (ru) 2012-12-17 2019-09-05 Президент Энд Фэллоуз Оф Харвард Коллидж Рнк-направляемая инженерия генома человека
ES2705033T3 (es) 2012-12-27 2019-03-21 Keygene Nv Método para eliminar un ligamiento genético en una planta
AU2014207618A1 (en) 2013-01-16 2015-08-06 Emory University Cas9-nucleic acid complexes and uses related thereto
CN103233028B (zh) 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列
CN113563476A (zh) * 2013-03-15 2021-10-29 通用医疗公司 遗传和表观遗传调节蛋白至特定基因组基因座的rna引导的靶向
CN103224947B (zh) 2013-04-28 2015-06-10 陕西师范大学 一种基因打靶系统
EP3004370A4 (en) * 2013-06-05 2017-01-11 Duke University Rna-guided gene editing and gene regulation
CN103343120B (zh) 2013-07-04 2015-03-04 中国科学院遗传与发育生物学研究所 一种小麦基因组定点改造方法
US10227576B1 (en) * 2018-06-13 2019-03-12 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes

Also Published As

Publication number Publication date
LT3091072T (lt) 2018-08-27
EP3091072B1 (en) 2018-07-04
EP3091072A1 (en) 2016-11-09
CN105732816B (zh) 2020-12-25
EP2798060A1 (en) 2014-11-05
AU2012360975B2 (en) 2017-10-05
RU2014127702A (ru) 2016-02-20
IL233399A0 (en) 2014-08-31
PT3091072T (pt) 2018-07-25
CA2862018C (en) 2019-12-03
GB201122458D0 (en) 2012-02-08
US9885026B2 (en) 2018-02-06
US20160186152A1 (en) 2016-06-30
GB2512246B (en) 2016-07-20
MX2014007910A (es) 2015-02-12
JP2015503535A (ja) 2015-02-02
CN104321429A (zh) 2015-01-28
SI3091072T1 (sl) 2018-09-28
DE212012000234U1 (de) 2014-08-07
DK3091072T3 (en) 2018-08-06
US20240174998A1 (en) 2024-05-30
KR101889589B1 (ko) 2018-08-17
HUE039617T2 (hu) 2019-01-28
US20210171926A1 (en) 2021-06-10
GB201411878D0 (en) 2014-08-20
CY1120538T1 (el) 2019-07-10
BR112014016228A2 (pt) 2018-09-25
JP6408914B2 (ja) 2018-10-17
US20200040318A1 (en) 2020-02-06
GB201605069D0 (en) 2016-05-11
GB2512246A (en) 2014-09-24
US10435678B2 (en) 2019-10-08
US20180119121A1 (en) 2018-05-03
US20140294773A1 (en) 2014-10-02
CA2862018A1 (en) 2013-07-04
CN105732816A (zh) 2016-07-06
PL3091072T3 (pl) 2019-01-31
KR20140115335A (ko) 2014-09-30
BR112014016228B1 (pt) 2022-05-03
WO2013098244A1 (en) 2013-07-04
US11939604B2 (en) 2024-03-26
AU2012360975A1 (en) 2014-07-24
MX364830B (es) 2019-05-08
IN2014DN05937A (es) 2015-06-12
US20160186214A1 (en) 2016-06-30
GB2534074A (en) 2016-07-13
RS57604B1 (sr) 2018-11-30
US10954498B2 (en) 2021-03-23
SG11201403713QA (en) 2014-07-30
HRP20181150T1 (hr) 2019-10-04
US10711257B2 (en) 2020-07-14
US20200325462A1 (en) 2020-10-15
US20150024499A1 (en) 2015-01-22

Similar Documents

Publication Publication Date Title
ES2689256T3 (es) Ribonucleoproteínas Cascada modificadas y usos de las mismas
ES2749108T3 (es) Escisión de ADN dirigida por ARN mediante el complejo Cas9-ARNcr
AU2016316845B2 (en) Engineered CRISPR-Cas9 nucleases
KR102647766B1 (ko) 클래스 ii, 타입 v crispr 시스템
ES2705756T3 (es) Secuencias de reconocimiento para meganucleasas derivadas de I-Crel y sus usos
CN110402287A (zh) CRISPR/Cpf1系统和方法
KR20180015731A (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
JP6284181B2 (ja) 環状rna及びタンパク質の製造方法
CN106834252A (zh) 一种高稳定型MazF突变体及其应用
KR20230054457A (ko) 카고 뉴클레오타이드 서열을 전위시키는 시스템 및 방법
Hoeller et al. Random tag insertions by Transposon Integration mediated Mutagenesis (TIM)
EP4347808A2 (en) Synthetic cas proteins
Waltl Generation and characterization of transcription activator-like effector nucleases
Pan Structure and mechanism of the exonuclease enzymes of viral SynExo recombination systems
Sali Identification and characterization of Drosophila melanogaster DNA topoisomerase IIIβ