ES2969026T3 - Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau - Google Patents

Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau Download PDF

Info

Publication number
ES2969026T3
ES2969026T3 ES20718947T ES20718947T ES2969026T3 ES 2969026 T3 ES2969026 T3 ES 2969026T3 ES 20718947 T ES20718947 T ES 20718947T ES 20718947 T ES20718947 T ES 20718947T ES 2969026 T3 ES2969026 T3 ES 2969026T3
Authority
ES
Spain
Prior art keywords
tau
protein
cells
aggregation
repeat domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20718947T
Other languages
English (en)
Inventor
Marine Prissette
Matthew Koss
Yu Bai
Brian Zambrowicz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Application granted granted Critical
Publication of ES2969026T3 publication Critical patent/ES2969026T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0684Cells of the urinary tract or kidneys
    • C12N5/0686Kidney cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • G01N2021/6441Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks with two or more labels

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Hematology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Virology (AREA)
  • Food Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Se proporcionan células biosensoras de tau preparadas para la proteína Cas, células biosensoras de tau preparadas para el mediador de activación sinérgica (SAM) CRISPR/Cas y métodos para fabricar y utilizar dichas células para detectar la vulnerabilidad genética asociada con la agregación de tau. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau
Antecedentes
La agregación anormal o fibrilación de proteínas es una característica definitoria de muchas enfermedades, en particular, una serie de enfermedades neurodegenerativas tales como enfermedad de Alzheimer (EA), enfermedad de Parkinson (EP), demencia frontotemporal (DFT; en inglés, FTD), esclerosis lateral amiotrófica (ELA), encefalopatía traumática crónica (ETC; en inglés, CTE), enfermedad de Creutzfeldt-Jakob (ECJ) y otras. En muchas de estas enfermedades, la fibrilación de ciertas proteínas en agregados insolubles no es sólo una característica de la enfermedad, sino que también se ha implicado como factor causante de neurotoxicidad. Asimismo, estas enfermedades se caracterizan por la propagación de patología agregada a través del sistema nervioso central siguiendo patrones estereotipados, un proceso que se correlaciona con la progresión de la enfermedad. La identificación de genes y vías genéticas que modifican los procesos de agregación anormal de proteínas o propagación de agregados de célula a célula, es, por tanto, de gran valor para comprender mejor la etiología de las enfermedades neurodegenerativas, así como para diseñar estrategias de intervención terapéutica.
Nathanielet al.(Elucidating Cellular Trafficking Pathways Controlling Prion-like Spread of Tau Aggregation Using CRISPR interference Screens, Molecular Biology of the Cell 27(25): 3947 (Resumen P887)) describen una plataforma basada en interferencia CRISPR (CRISPRi) para identificar genes relacionados con la agregación de tau. CRISPRi utiliza una proteína Cas9 inactivada fusionada con un represor transcripcional para desactivar los genes diana.
De manera análoga, Chenet al.(CRISPR-based genome-wide screen identifies protein homeostasis factors that control Tau aggregation and propagation in human cells, Molecular Biology of the Cell 27(25): 3947 (Resumen M264)) divulgan una detección de todo el genoma basada en CRISPR que identificó genes que desempeñan un papel en la agregación de tau.
Konermannet al.(Nature 517: 583-588, 2015) describe CRISPR activation (CRISPRa), que utiliza una proteína Cas9 inactivada y un ARNgu para dirigir un activador transcripcional a un gen diana y así activar su expresión. El activador transcripcional puede fusionarse con el Cas9 inactivado o reclutarse mediante un ARNgu modificado.
Kampmann (ACS Chem. Biol. 13(2): 406-416, 2018) revisa las pruebas genéticas CRISPRi y CRISPRa para células de mamífero. Se puede transducir una biblioteca de ARNgu en células diana utilizando una biblioteca lentiviral con baja multiplicidad de infección, principalmente dando como resultado una integración estable de una única construcción de expresión de ARNgu por célula.
El informe de investigación anual del año fiscal 2016 para el proyecto de investigación de la Universidad de Tokio titulado "Identificación de reguladores genéticos para la agregación intracelular mediante detección CRISPR de todo el genoma" describe un método de detección por FACS para agregados de tau intracelulares. La formación de agregados intracelulares detectables se logró aplicando fibras de tau recombinantes marcadas con fluorescencia a líneas celulares que expresan constitutivamente tau. Los agregados se detectaron perforando las membranas celulares para liberar tau monomérica, luego realizando FACS en las células perforadas.
Holmeset al.(Proc. Natl. Acad. Sci. U.S.A. 111(41): E4376-E4385, 2014) describen un ensayo biosensor de citometría de flujo basado en FRET para la siembra de tau. Se desarrolló una línea celular biosensora que expresa de manera estable un dominio de repetición de tau fusionado con una proteína fluorescente c (CFP) o una proteína fluorescente amarilla (YFP). La exposición de la línea celular biosensora a semillas de tau provocó la agregación de tau, generando una señal FRET.
Sumario
En el presente documento se proporcionan métodos de detección de vulnerabilidades genéticas asociadas con la agregación de tau.
En un primer aspecto, se proporciona en el presente documento un método de detección de vulnerabilidades genéticas asociadas con la agregación de tau, que comprende: (a) proporcionar una población de células de agregación positiva y una población de células de agregación negativa, en donde cada población de células comprende una proteína Cas, un primer dominio de repetición de tau unido a un primer indicador, y un segundo dominio de repetición de tau unido a un segundo indicador, en donde las células son células de mamífero, en donde el primer indicador y el segundo indicador son proteínas fluorescentes y en donde el primer indicador y el segundo indicador son un par de transferencia de energía por resonancia de fluorescencia (FRET), en donde la población de células de agregación positiva comprende agregados del primer dominio de repetición de tau unido al primer indicador y del segundo dominio de repetición de tau unido al segundo indicador, y en donde la población de células de agregación negativa no comprende agregados de el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador; (b) introducir en cada población de células una biblioteca que comprende una pluralidad de ARN de guía única que se dirigen a una pluralidad de genes, en donde la pluralidad de ARN de guía única forman complejos con la proteína Cas y la proteína Cas escinde la pluralidad de genes dando como resultado la desactivación de la función del gen; y (c) determinar la abundancia de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células, en donde la pluralidad de puntos de tiempo comprende al menos tres puntos de tiempo, en donde hay más de 1 día entre cada punto temporal, en donde la depleción de un ARN guía en la población de células con agregación positiva pero no en la población de células con agregación negativa o una tasa más rápida de depleción de un ARN guía a lo largo del tiempo en la población de células con agregación positiva en relación con la población con agregación negativa indica que el gen al que se dirige el ARN guía exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau. Los ARN guía que se dirigen a dichos genes provocan la muerte celular selectiva en las células Ag.[+] pero no en las células Ag.[-].
En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau es un dominio de repetición de tau humano. En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden una mutación proagregación. Opcionalmente, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden una mutación tau P301S. En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden un dominio de cuatro repeticiones tau. En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden la SEQ ID NO: 11. En algunos de estos métodos, el primer dominio de repetición de tau y el segundo dominio de repetición de tau son iguales. En algunos de estos métodos, el primer dominio de repetición de tau y el segundo dominio de repetición de tau son iguales y cada uno comprende un dominio tau de cuatro repeticiones que comprende una mutación tau P301S.
En algunos de estos métodos, el primer indicador es la proteína fluorescente cian (CFP) y el segundo indicador es la proteína fluorescente amarilla (YFP).
En algunos de estos métodos, la proteína Cas es una proteína Cas9. Opcionalmente, la proteína Cas es Cas9 deStreptococcus pyogenes.Opcionalmente, la proteína Cas comprende la SEQ ID NO: 21. Opcionalmente, la proteína Cas está codificada por una secuencia de codificación que comprende la secuencia expuesta en la SEQ ID NO: 22.
En algunos de estos métodos, la proteína Cas, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador se expresan de manera estable en las poblaciones de células. En algunos de estos métodos, los ácidos nucleicos que codifican la proteína Cas, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador están integrados genómicamente en las poblaciones de células.
En algunos de estos métodos, las células son células humanas. Opcionalmente, las células son células HEK293T.
En algunos de estos métodos, la pluralidad de ARN de guía única se introducen en una concentración seleccionada de modo que la mayoría de las células reciban sólo uno de los ARN de guía única. En algunos de estos métodos, la pluralidad de ARN de guía única se dirige a 100 o más genes, 1000 o más genes o 10000 o más genes. En algunos de estos métodos, la biblioteca es una biblioteca de todo el genoma. En algunos de estos métodos, una pluralidad de secuencias diana se dirigen en promedio en cada uno de la pluralidad de genes diana. Opcionalmente, al menos tres secuencias diana están dirigidas en promedio en cada uno de la pluralidad de genes diana. Opcionalmente, de aproximadamente tres a aproximadamente seis secuencias diana (por ejemplo, aproximadamente tres, aproximadamente cuatro o aproximadamente seis) son diana en promedio en cada uno de la pluralidad de genes diana.
En algunos de estos métodos, cada ARN guía se dirige a un exón constitutivo. Opcionalmente, cada ARN guía se dirige a un exón constitutivo en 5'. En algunos de estos métodos, cada ARN guía se dirige a un primer exón, un segundo exón o un tercer exón.
En algunos de estos métodos, la pluralidad de ARN de guía única se introducen en las poblaciones de células mediante transducción viral. Opcionalmente, cada uno de la pluralidad de ARN de guía única está en un vector viral separado. En algunos de estos métodos, la pluralidad de ARN de guía única se introduce en las poblaciones de células mediante transducción lentiviral. En algunos de estos métodos, las poblaciones de células se infectan con una multiplicidad de infección inferior a aproximadamente 0,3.
En algunos de estos métodos, la pluralidad de ARN de guía única se introduce en las poblaciones de células junto con un marcador de selección y la etapa (b) comprende además seleccionar células que comprenden el marcador de selección. Opcionalmente, el marcador de selección confiere resistencia a un fármaco. Opcionalmente, el marcador de selección imparte resistencia a puromicina o zeocina. Opcionalmente, el marcador de selección se selecciona entre neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa y blasticidina S desaminasa. Opcionalmente, el marcador de selección se selecciona entre neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa, blasticidina S desaminasa y proteína resistente a bleomicina.
En algunos de estos métodos, las poblaciones de células en las que se introduce la pluralidad de ARN de guía única en la etapa (b) comprenden cada una más de aproximadamente 500 células por ARN guía único.
En algunos de estos métodos, el transcurso de tiempo en la etapa (c) es de más de aproximadamente 1 semana. Opcionalmente, el transcurso de tiempo en la etapa (c) es de más de aproximadamente 2 semanas. En algunos de estos métodos, el transcurso del tiempo en la etapa (c) comprende de aproximadamente de 10 a aproximadamente 15 duplicaciones de células. En algunos de estos métodos, la pluralidad de puntos de tiempo en la etapa (c) comprende aproximadamente cuatro puntos de tiempo o aproximadamente seis puntos de tiempo. En algunos de estos métodos, hay más de aproximadamente 2 días entre cada momento en la etapa (c). Opcionalmente, hay entre aproximadamente 3 y aproximadamente 4 días entre cada punto temporal en la etapa (c).
En algunos de estos métodos, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si un ARN guía dirigido al gen se agota en la población de células con agregación positiva pero no en la población de células con agregación negativa. De manera alternativa, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si un ARN guía dirigido al gen tiene un patrón de depleción más dramático a lo largo del tiempo en la población de células con agregación positiva en relación con la población de células con agregación negativa.
En algunos de estos métodos, un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto temporal es menor o igual a la abundancia del ARN guía en el punto temporal anterior. En algunos de estos métodos, un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores.
En algunos de estos métodos, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si más de aproximadamente el 30 % de los ARN guía en la biblioteca que se dirigen al gen se agotan en la población de células con agregación positiva, pero no en la población de células con agregación negativa. Opcionalmente, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) en cualquiera de las siguientes situaciones: (1) hay un ARN guía en la biblioteca que se dirige al gen y ese ARN guía se agota en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (2) hay dos ARN guía en la biblioteca que se dirigen al gen y al menos uno de los dos ARN guía está agotado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (3) hay tres ARN guía en la biblioteca que se dirigen al gen y al menos uno de los tres ARN guía está agotado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (4) hay cuatro ARN guía en la biblioteca que se dirigen al gen y al menos dos de los cuatro ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (5) hay cinco ARN guía en la biblioteca que se dirigen al gen y al menos dos de los cinco ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; y (6) hay seis ARN guía en la biblioteca que se dirigen al gen y al menos tres de los seis ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
En algunos de estos métodos, el método se repite al menos tres veces en al menos tres experimentos diferentes y se considera que un gen exhibe letalidad sintética con agregados de proteína tau si se considera que exhibe letalidad sintética con agregados de proteína tau en más de aproximadamente el 50 % de al menos tres experimentos diferentes.
En algunos de estos métodos, el transcurso de tiempo en la etapa (c) es de más de aproximadamente 2 semanas, en donde la pluralidad de puntos de tiempo en la etapa (c) comprende aproximadamente seis puntos de tiempo, en donde hay entre aproximadamente 3 y aproximadamente 4 días entre cada punto temporal en la etapa (c), en donde un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores y en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si más de aproximadamente el 30 % de los ARN guía de la biblioteca que se dirigen al gen se agotan en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
En un segundo aspecto, en el presente documento se proporcionan métodos que utilizan bibliotecas de ARN guía de activación CRISPR (mediador de activación sinérgica CRISPR/Cas (SAM)). En particular, se proporciona en el presente documento un método de detección de vulnerabilidades genéticas asociadas con la agregación de tau, que comprende: (a) proporcionar una población de células de agregación positiva y una población de células de agregación negativa, en donde cada población de células comprende una proteína Cas quimérica que comprende una proteína Cas inactiva de nucleasa (es decir, proteína Cas catalíticamente inactiva) fusionada a uno o más dominios de activación transcripcional, una proteína adaptadora quimérica que comprende una proteína adaptadora fusionada a uno o más dominios de activación transcripcional, un primer dominio de repetición de tau unido a un primer indicador, y un segundo dominio de repetición de tau unido a un segundo indicador, en donde las células son células de mamífero, en donde el primer indicador y el segundo indicador son proteínas fluorescentes y en donde el primer indicador y el segundo indicador son un par de transferencia de energía por resonancia de fluorescencia (FRET), en donde la población de células de agregación positiva comprende agregados del primer dominio de repetición de tau unido al primer indicador y del segundo dominio de repetición de tau unido al segundo indicador, y en donde la población de células de agregación negativa no comprende agregados de el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador; (b) introducir en cada población de células una biblioteca que comprende una pluralidad de ARN de guía única que se dirigen a una pluralidad de genes, en donde la pluralidad de ARN de guía única forman complejos con la proteína Cas quimérica y la proteína adaptadora quimérica y los complejos activan la transcripción de la pluralidad de genes dando como resultado una mayor expresión génica; y (c) determinar la abundancia de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células, en donde la pluralidad de puntos de tiempo comprende al menos tres puntos de tiempo, en donde hay más de 1 día entre cada punto temporal, en donde la depleción de un ARN guía en la población de células con agregación positiva pero no en la población de células con agregación negativa o una tasa más rápida de depleción de un ARN guía a lo largo del tiempo en la población de células con agregación positiva en relación con la población con agregación negativa indica que la activación del gen al que se dirige el ARN guía exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau.
En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau es un dominio de repetición de tau humano. En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden una mutación proagregación. Opcionalmente, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden una mutación tau P301S. En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden un dominio de cuatro repeticiones tau. En algunos de estos métodos, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden la SEQ ID NO: 11. En algunos de estos métodos, el primer dominio de repetición de tau y el segundo dominio de repetición de tau son iguales. En algunos de estos métodos, el primer dominio de repetición de tau y el segundo dominio de repetición de tau son iguales y cada uno comprende un dominio tau de cuatro repeticiones que comprende una mutación tau P301S.
En algunos de estos métodos, el primer indicador es la proteína fluorescente cian (CFP) y el segundo indicador es la proteína fluorescente amarilla (YFP).
En algunos de estos métodos, la proteína Cas es una proteína Cas9. Opcionalmente, la proteína Cas es Cas9 deStreptococcus pyogenes.En algunos de estos métodos, la proteína Cas quimérica comprende la proteína Cas inactiva de nucleasa fusionada a un dominio de activación transcripcional VP64, opcionalmente en donde la proteína Cas quimérica comprende desde el extremo N al extremo C: la proteína Cas inactiva para nucleasas; una señal de localización nuclear; y el dominio activador transcripcional VP64. En algunos de estos métodos, la proteína adaptadora es una proteína de cubierta MS2 y uno o más dominios de activación transcripcional en la proteína adaptadora quimérica comprenden un dominio de activación transcripcional p65 y un dominio de activación transcripcional HSF1, opcionalmente en donde la proteína adaptadora quimérica comprende desde el extremo N al extremo C: la proteína de la cubierta MS2; una señal de localización nuclear; el dominio de activación transcripcional p65; y el dominio de activación transcripcional HSF1. En algunos de estos métodos, la proteína Cas quimérica comprende la SEQ ID NO: 36, opcionalmente en donde la proteína Cas quimérica está codificada por una secuencia de codificación que comprende la secuencia expuesta en la SEQ ID NO: 38. En algunos de estos métodos, la proteína adaptadora quimérica comprende la SEQ ID NO: 37, opcionalmente en donde la proteína adaptadora quimérica está codificada por una secuencia de codificación que comprende la secuencia expuesta en la SEQ ID NO: 39.
En algunos de estos métodos, la proteína quimérica Cas, la proteína adaptadora quimérica, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador se expresan de manera estable en la población de células. En algunos de estos métodos, los ácidos nucleicos que codifican la proteína Cas quimérica, la proteína adaptadora quimérica, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador están integrados genómicamente en las poblaciones de células.
En algunos de estos métodos, las células son células humanas. Opcionalmente, las células son células HEK293T.
En algunos de estos métodos, la pluralidad de ARN de guía única se introducen en una concentración seleccionada de modo que la mayoría de las células reciban sólo uno de los ARN de guía única. En algunos de estos métodos, la pluralidad de ARN de guía única se dirige a 100 o más genes, 1000 o más genes o 10000 o más genes. En algunos de estos métodos, la biblioteca es una biblioteca de todo el genoma. En algunos de estos métodos, una pluralidad de secuencias diana se dirigen en promedio en cada uno de la pluralidad de genes diana. Opcionalmente, al menos tres secuencias diana están dirigidas en promedio en cada uno de la pluralidad de genes diana. Opcionalmente, de aproximadamente tres a aproximadamente seis secuencias diana (por ejemplo, aproximadamente tres, aproximadamente cuatro o aproximadamente seis) son diana en promedio en cada uno de la pluralidad de genes diana. Opcionalmente, aproximadamente tres secuencias diana están dirigidas en promedio en cada una de la pluralidad de genes diana
En algunos de estos métodos, cada ARN guía se dirige a una secuencia diana del ARN guía en 200 pb aguas arriba de un sitio de iniciación de la transcripción. En algunos de estos métodos, cada ARN guía comprende uno o más elementos de unión al adaptador a los que la proteína adaptadora quimérica puede unirse específicamente. Opcionalmente, cada ARN guía comprende dos elementos de unión al adaptador a los que la proteína adaptadora quimérica puede unirse específicamente. Opcionalmente, un primer elemento de unión al adaptador está dentro de un primer bucle de cada uno de uno o más<a>R<n>guía y un segundo elemento de unión al adaptador está dentro de un segundo bucle de cada uno de uno o más ARN guía. Opcionalmente, el elemento de unión al adaptador comprende la secuencia expuesta en la SEQ ID NO: 33. Opcionalmente, cada uno de uno o más ARN guía es un ARN guía único que comprende un fragmento de ARN de CRISPR (ARNcr) fusionado con un fragmento de ARN de CRISPR (ARNtracr) transactivante y el primer bucle es el tetrabucle correspondiente a los restos 13-16 de las SEQ ID NO: 17, 19, 30 o 31 y el segundo bucle es el bucle 2 del tallo correspondiente a los restos 53-56 de las SEQ ID NO: 17, 19, 30 o 31.
En algunos de estos métodos, la pluralidad de ARN de guía única se introducen en las poblaciones de células mediante transducción viral. Opcionalmente, cada uno de la pluralidad de ARN de guía única está en un vector viral separado. En algunos de estos métodos, la pluralidad de ARN de guía única se introduce en las poblaciones de células mediante transducción lentiviral. En algunos de estos métodos, las poblaciones de células se infectan con una multiplicidad de infección inferior a aproximadamente 0,3.
En algunos de estos métodos, la pluralidad de ARN de guía única se introduce en las poblaciones de células junto con un marcador de selección y la etapa (b) comprende además seleccionar células que comprenden el marcador de selección. Opcionalmente, el marcador de selección confiere resistencia a un fármaco. Opcionalmente, el marcador de selección imparte resistencia a puromicina o zeocina. Opcionalmente, el marcador de selección se selecciona entre neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa y blasticidina S desaminasa. Opcionalmente, el marcador de selección se selecciona entre neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa, blasticidina S desaminasa y proteína resistente a bleomicina.
En algunos de estos métodos, las poblaciones de células en las que se introduce la pluralidad de ARN de guía única en la etapa (b) comprenden cada una más de aproximadamente 500 células por ARN guía único.
En algunos de estos métodos, el transcurso de tiempo en la etapa (c) es de más de aproximadamente 1 semana. Opcionalmente, el transcurso de tiempo en la etapa (c) es de más de aproximadamente 2 semanas. En algunos de estos métodos, el transcurso del tiempo en la etapa (c) comprende de aproximadamente de 10 a aproximadamente 15 duplicaciones de células. En algunos de estos métodos, la pluralidad de puntos de tiempo en la etapa (c) comprende aproximadamente cuatro puntos de tiempo o aproximadamente seis puntos de tiempo. En algunos de estos métodos, hay más de aproximadamente 2 días entre cada momento en la etapa (c). Opcionalmente, hay entre aproximadamente 3 y aproximadamente 4 días entre cada punto temporal en la etapa (c).
En algunos de estos métodos, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si un ARN guía dirigido al gen se agota en la población de células con agregación positiva pero no en la población de células con agregación negativa. De manera alternativa, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si un ARN guía dirigido al gen tiene un patrón de depleción más dramático a lo largo del tiempo en la población de células con agregación positiva en relación con la población de células con agregación negativa.
En algunos de estos métodos, un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto temporal es menor o igual a la abundancia del ARN guía en el punto temporal anterior. En algunos de estos métodos, un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores.
En algunos de estos métodos, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si más de aproximadamente el 30 % de los ARN guía en la biblioteca que se dirigen al gen se agotan en la población de células con agregación positiva, pero no en la población de células con agregación negativa. Opcionalmente, se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) en cualquiera de las siguientes situaciones: (1) hay un ARN guía en la biblioteca que se dirige al gen y ese ARN guía se agota en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (2) hay dos ARN guía en la biblioteca que se dirigen al gen y al menos uno de los dos ARN guía está agotado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (3) hay tres ARN guía en la biblioteca que se dirigen al gen y al menos uno de los tres ARN guía está agotado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (4) hay cuatro ARN guía en la biblioteca que se dirigen al gen y al menos dos de los cuatro ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (5) hay cinco ARN guía en la biblioteca que se dirigen al gen y al menos dos de los cinco ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; y (6) hay seis ARN guía en la biblioteca que se dirigen al gen y al menos tres de los seis ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
En algunos de estos métodos, el método se repite al menos tres veces en al menos tres experimentos diferentes y se considera que un gen exhibe letalidad sintética con agregados de proteína tau si se considera que exhibe letalidad sintética con agregados de proteína tau en más de aproximadamente el 50 % de al menos tres experimentos diferentes.
En algunos de estos métodos, el transcurso de tiempo en la etapa (c) es de más de aproximadamente 2 semanas, en donde la pluralidad de puntos de tiempo en la etapa (c) comprende aproximadamente seis puntos de tiempo, en donde hay entre aproximadamente 3 y aproximadamente 4 días entre cada punto temporal en la etapa (c), en donde un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores y en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si más de aproximadamente el 30 % de los ARN guía de la biblioteca que se dirigen al gen se agotan en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
Breve descripción de las figuras
Lafigura 1(no a escala) muestra un esquema de la isoforma tau 2N4R. Las líneas de biosensores tau incluyen solo tau4RD-YFP y tau4RD-CFP como transgenes, no el 2N4R completo.
Lafigura2 muestra un esquema de cómo se monitoriza la formación de agregados mediante transferencia de energía por resonancia de fluorescencia (FRET) en líneas celulares de biosensores Tau. La proteína Tau4RD-CFP se excita con la luz violeta y emite luz azul. La proteína de fusión el Tau4RD-YFP se excita con la luz azul y emite luz amarilla. Si no hay agregación, la excitación por luz violeta no conducirá a FRET. Si hay agregación Tau, la excitación por luz violeta conducirá a FRET y emisión de luz amarilla.
LaFigura 3Amuestra la expresión relativa del ARNm de Cas9 en clones de células biosensoras Tau4RD-CFP/Tau4RD-YFP (TCY) transducidas con construcciones de expresión lentivirales de Cas9 en relación con el clon Cas9H1, que es un clon TCY de control con expresión de Cas9 de bajo rendimiento que se aisló previamente. LaFigura 3Bmuestra eficiencia de corte en el locusPERKy el locusSNCAen los clones Cas9 TCY tres y siete días después de la transducción con ARNgu dirigidosa PERKySNC4respectivamente.
LaFigura 4muestra un esquema de la estrategia para la alteración de genes diana en células biosensoras Cas9 TCY utilizando una biblioteca de ARNgu CRISPR/Cas9 de todo el genoma.
La Figura 5es un esquema que muestra la derivación de los subclones Tau4RD-CFP/Tau4RD-YFP/Cas9 Ag.[+] que contienen agregados de Tau que se propagan de forma estable. También se muestra una imagen de microscopia FRET que muestra el subclon con agregados de Tau.
LaFigura 6es un esquema de un experimento para evaluar genes alterados por la agregación de Tau.
LaFigura 7muestra los resultados de agrupación no supervisada que indican que las muestras de clones de Ag.[+] y las muestras de clones de Ag.[-] son distintas según el estado de agregación (procedimiento de agrupación: transformación logarítmica de lecturas por millón de kilobases (RPKM); métrica de distancia: 1 - valor absoluto del coeficiente de correlación de Pearson; agrupamiento jerárquico).
LaFigura 8muestra genes significativamente alterados por la agregación en células Tau Ag.[+] (genes significativamente alterados definidos como un factor de cambio > 1,5 (ya sea hacia arriba o hacia abajo) y un valor de p < 0,01.
LaFigura 9muestra un esquema general del cribado de CRISPR nucleasa de todo el genoma (CRISPRn) agrupado para revelar vulnerabilidades genéticas asociadas con la agregación de Tau.
LaFigura 10Amuestra un esquema general de la identificación de genes esenciales (ARNgu dirigidos a aquellos genes que están deplecionados tanto en Ag.[+] como en Ag.[-]).
LaFigura 10Bmuestra un esquema general de la identificación de genes letales sintéticos (ARNgu dirigidos a aquellos genes que están deplecionados en Ag.[+] pero no en Ag.[-]).
LaFigura 11muestra un esquema del transcurso del tiempo completo para identificar genes para los cuales existe un patrón de depleción de ARNgu a lo largo del tiempo.
LaFigura 12muestra el número de genes para los cuales se deplecionaron los ARNgu en muestras de Ag.[+] y Ag.[-].
LaFigura 13es un gráfico que muestra la superposición de genes esenciales identificados en el cribado del biosensor Tau en comparación con otros informes publicados.
LaFigura 14es un gráfico que muestra la identificación de 71 genes con ARNgu deplecionados de forma única a lo largo del tiempo en comparación con el día 3 en muestras de Ag.[+] en comparación con muestras de Ag.[-] en tres experimentos repetidos.
LasFiguras 15Ay15Bmuestra el factor de cambio a lo largo del tiempo (depleción de ARNgu) en relación con el día 3 en células Ag.[+] y Ag.[-] para los ARNgu dirigidos a tres genes esenciales candidatos (genes esenciales 6, 8 y 9 (EG6, EG8 y EG9);Figura 15A) y tres genes letales sintéticos candidatos (genes diana 1, 5 y 6 (TG1, TG5 y Tg 6);Figura 15b).
LaFigura 16muestra la distribución del recuento de lecturas de la biblioteca de ARNgu personalizada que consiste en 462 ARNgu dirigidos únicos a 71 supuestos genes letales sintéticos (para los cuales los ARNgu se deplecionaron de forma selectiva en las células Ag.[+] en el cribado primario) y 10 supuestos genes esenciales (para los cuales los ARNgu se deplecionaron en ambas células Ag.[+] y Ag.[-] en el cribado primario).
LaFigura 17muestra la distribución del recuento de lectura de una biblioteca de ARNgu que consiste en 500 ARNgu de control no específicos únicos (ARNgu no específicos que no se alteraron con el tiempo en el cribado primario).
LaFigura 18muestra un esquema general del cribado secundario para validar los 71 supuestos genes letales sintéticos y los 10 supuestos genes esenciales utilizando las bibliotecas de ARNgu personalizadas.
LasFiguras 19A-19Cmuestra el factor de cambio a lo largo del tiempo (depleción de ARNgu) en relación con el día 3 en células Ag.[+] y Ag.[-] para ARNgu dirigidos a diez genes esenciales candidatos (EG1-EG10) en el cribado secundario.
LaFigura 20muestra un ejemplo de un gráfico que muestra un patrón de depleción distinguible para un ARNgu entre células Ag.[+] y células Ag.[-] (es decir, una depleción o más dramática en células Ag.[+]).
LaFigura 21muestra un esquema general para la identificación de genes letales sintéticos en el cribado secundario mediante la identificación de ARNgu que demuestran tanto un valor p significativo en el transcurso del tiempo como un patrón de depleción en cada experimento (Día 10 < Día 3, Día 14 < Día 7 y Día 17 < Día 10). LaFigura 22Amuestra el factor de cambio en el tiempo (depleción de ARNgu) en células Ag.[+] y Ag.[-] para seis ARNgu dirigidos al gen diana 1 (TG1) y seis ARNgu dirigidos al gen diana 2 (TG2).
LaFigura 22Bmuestra el factor de cambio en el tiempo (depleción de ARNgu) en células Ag.[+] y Ag.[-] para seis ARNgu dirigidos al gen diana 3 (TG3) y seis ARNgu dirigidos al gen diana 4 (TG4).
LaFigura 23muestra un esquema general para la identificación de genes letales sintéticos en el cribado secundario mediante la identificación de ARNgu de CRISPRa que demuestran tanto un valor p significativo en el transcurso del tiempo como un patrón de depleción en cada experimento (Día 10 < Día 3, Día 14 < Día 7 y Día 17 < Día 10).
LasFiguras 24Ay24Bmuestra el factor de cambio a lo largo del tiempo (depleción de ARNgu) en células Ag.[+] y Ag.[-] para ARNgu dirigidos a los genes diana 7-15 (TG7-TG15).
LaFigura 25muestra un esquema para validar aún más los genes diana 1, 2 y 4, utilizando citometría de flujo para cuantificar la viabilidad celular y la muerte celular en células Ag.[+] y células Ag.[-] después de la transducción con vectores lentivirales que liberan ARNgu dirigidos a los genes diana 1, 2 y 4.
LaFigura 26muestra la viabilidad celular y la muerte celular en células Ag.[+] y células Ag.[-] después de la transducción con vectores lentivirales que liberan ARNgu dirigidos a los genes diana 1, 2 y 4.
Definiciones
Los términos "proteína", "polipéptido", y "péptido", utilizados indistintamente en el presente documento, incluyen formas poliméricas de aminoácidos de cualquier longitud, incluidos aminoácidos codificados y no codificados y aminoácidos derivatizados o modificados química o bioquímicamente. Los términos también incluyen polímeros que se han modificado, tales como polipéptidos que tienen cadenas principales peptídicas modificadas. El término "dominio" se refiere a cualquier parte de una proteína o polipéptido que tiene una función o estructura particular.
Se dice que las proteínas tienen un "extremo N" y un "extremo C". La expresión "extremo N" se refiere al inicio de una proteína o polipéptido, terminado por un aminoácido con un grupo amino libre (-NH2). La expresión "extremo C" se refiere al final de una cadena de aminoácidos (proteína o polipéptido), terminado por un grupo carboxilo libre (-COOH).
Las expresiones "ácido nucleico" y "polinucleótido", utilizados indistintamente en el presente documento, incluyen formas poliméricas de nucleótidos de cualquier longitud, incluidos ribonucleótidos, desoxirribonucleótidos, o análogos o versiones modificadas de los mismos. Incluyen ADN o ARN monocatenario, bicatenario y multicatenario, ADN genómico, ADNc, híbridos de ADN-ARN y polímeros que comprenden bases purínicas, bases de pirimidina u otras bases nucleotídicas naturales, modificadas químicamente, modificadas bioquímicamente, no naturales o derivadas.
Se dice que los ácidos nucleicos tienen "extremos 5'" y "extremos 3'" porque los mononucleótidos se hacen reaccionar para formar polinucleótidos de tal manera que el fosfato 5' de un anillo de pentosa mononucleotídico esté unido al oxígeno 3' de su vecino en una dirección a través de un enlace fosfodiéster. Un extremo de un oligonucleótido se denomina "extremo 5'" cuando su fosfato 5' no está unido al oxígeno 3' de un anillo de pentosa mononucleotídico. Un extremo de un oligonucleótido se denomina "extremo 3'" cuando su oxígeno 3' no está unido a un fosfato 5' de otro anillo de pentosa mononucleotídico. Una secuencia de un ácido nucleico, incluso si es interno a un oligonucleótido más grande, también se puede decir que tiene extremos 5' y 3'. En una molécula de ADN, ya sea lineal o circular, los elementos discretos se denominan "cadena arriba" o 5' de los elementos "cadena abajo" o 3'.
La expresión "integrado genómicamente" se refiere a un ácido nucleico que se ha introducido en una célula de manera que la secuencia de nucleótidos se integra en el genoma de la célula. Puede usarse cualquier protocolo para la incorporación estable de un ácido nucleico en el genoma de una célula.
La expresión "vector de direccionamiento" se refiere a un ácido nucleico recombinante que puede introducirse mediante recombinación homóloga, ligadura mediada por unión de extremos no homólogos o cualquier otro medio de recombinación a una posición diana en el genoma de una célula.
La expresión "vector viral" se refiere a un ácido nucleico recombinante que incluye al menos un elemento de origen viral e incluye elementos suficientes para o que permiten el empaquetamiento en una partícula de vector viral. El vector y/o partícula se puede utilizar con el fin de transferir ADN, ARN u otros ácidos nucleicos al interior de las célulasex vivooin vivo.Se conocen numerosas formas de vectores virales.
La expresión "de tipo silvestre" incluye entidades que tienen una estructura y/o actividad como la que se encuentra en un estado o contexto normal (en contraste con mutante, enfermo, alterado, etc.). Los genes y polipéptidos de tipo silvestre a menudo existen en múltiples formas diferentes (por ejemplo, alelos).
La expresión "secuencia endógena" se refiere a una secuencia de ácido nucleico que se produce de forma natural dentro de una célula u organismo. Por ejemplo, una secuenciaMAPTendógena de una célula u organismo se refiere a una secuenciaMAPTnativa de origen natural en el locus deMAPTen la célula u organismo.
Las moléculas o secuencias "exógenas" incluyen moléculas o secuencias que normalmente no están presentes en una célula en esa forma. La presencia normal incluye la presencia con respecto a la etapa de desarrollo particular y las condiciones ambientales de la célula. Una molécula o secuencia exógena, por ejemplo, puede incluir una versión mutada de una secuencia endógena correspondiente dentro de la célula, tal como una versión humanizada de la secuencia endógena, o puede incluir una secuencia correspondiente a una secuencia endógena dentro de la célula pero en una forma diferente (es decir, no dentro de un cromosoma). En contraste, las moléculas o secuencias endógenas incluyen moléculas o secuencias que normalmente están presentes en esa forma en una célula particular en una etapa de desarrollo particular en condiciones ambientales particulares.
El término "heterólogo", cuando se usa en el contexto de un ácido nucleico o una proteína indica que el ácido nucleico o la proteína comprende al menos dos segmentos que no se encuentran juntos de forma natural en la misma molécula. Por ejemplo, el término "heterólogo", cuando se usa con referencia a segmentos de un ácido nucleico o segmentos de una proteína, indica que el ácido nucleico o la proteína comprende dos o más subsecuencias que no se encuentran en la misma relación entre sí (por ejemplo, unidas entre sí) en la naturaleza. Como ejemplo, una región "heteróloga" de un vector de ácido nucleico es un segmento de ácido nucleico dentro o unido a otra molécula de ácido nucleico que no se encuentra asociado con la otra molécula en la naturaleza. Por ejemplo, una región heteróloga de un vector de ácido nucleico podría incluir una secuencia de codificación flanqueada por secuencias que no se encuentran asociadas con la secuencia de codificación en la naturaleza. Igualmente, una región "heteróloga" de una proteína es un segmento de aminoácidos dentro o unido a otra molécula peptídica que no se encuentra asociado con la otra molécula peptídica en la naturaleza (por ejemplo, una proteína de fusión o una proteína con una etiqueta). De manera análoga, un ácido nucleico o proteína puede comprender un marcador heterólogo o una secuencia de secreción o localización heteróloga.
El término "locus" se refiere a una ubicación específica de un gen (o secuencia significativa), secuencia de ADN, secuencia que codifica un polipéptido, o posición en un cromosoma del genoma de un organismo. Por ejemplo, un "locus deMAPT'puede hacer referencia a la ubicación específica de un genMAPT,secuencia de ADN deMAPT,secuencia de codificación de proteína Tau asociada a los microtúbulos o posición deMAPTen un cromosoma del genoma de un organismo en el que se ha identificado dónde reside dicha secuencia. Un "locus deMAPT' puede comprender un elemento regulador de un genMAPT,incluyendo, por ejemplo, un potenciador, un promotor, una región no traducida (UTR) 5' y/o 3' o una combinación de los mismos.
El término "gen" se refiere a una secuencia de ADN en un cromosoma que codifica un producto (por ejemplo, un producto de ARN y/o un producto polipeptídico) e incluye la región de codificación interrumpida con intrones no codificantes y la secuencia ubicada adyacente a la región de codificación en los extremos tanto 5' como 3' de modo que el gen corresponda al ARNm de longitud completa (incluidas las secuencias no traducidas 5' y 3'). El término "gen" también incluye otras secuencias no codificantes que incluyen secuencias reguladoras (por ejemplo, promotores, potenciadores y sitios de unión de factores de transcripción), señales de poliadenilación, sitios internos de entrada al ribosoma, silenciadores, secuencia aislante y regiones de unión a la matriz. Estas secuencias pueden estar cerca de la región de codificación del gen (por ejemplo, dentro de 10 kb) o en sitios distantes, e influyen en el nivel o velocidad de transcripción y traducción del gen.
El término "alelo" se refiere a una forma variante de un gen. Algunos genes tienen una diversidad de formas diferentes, que se encuentran en la misma posición, o locus genético, en un cromosoma. Un organismo diploide tiene dos alelos en cada locus genético. Cada par de alelos representa el genotipo de un locus genético específico. Los genotipos se describen como homocigotos si hay dos alelos idénticos en un locus particular y como heterocigotos si los dos alelos difieren.
Un "promotor" es una región reguladora de ADN que normalmente comprende una caja TATA capaz de dirigir la ARN polimerasa II para iniciar la síntesis de ARN en el sitio de inicio de la transcripción apropiado para una secuencia polinucleotídica particular. Un promotor puede comprender adicionalmente otras regiones que influyen en la velocidad de inicio de la transcripción. Las secuencias promotoras divulgadas en el presente documento modulan la transcripción de un polinucleótido unido operativamente. Un promotor puede ser activo en uno o más de los tipos de células divulgados en el presente documento (por ejemplo, una célula humana, una célula pluripotencial, un embrión en fase unicelular, una célula diferenciada, o una combinación de las mismas. Un promotor puede ser, por ejemplo, un promotor constitutivamente activo, un promotor condicional, un promotor inducible, un promotor temporalmente restringido (por ejemplo, un promotor regulado por el desarrollo), o un promotor espacialmente restringido (por ejemplo, un promotor específico de célula o de tejido). Se pueden encontrar ejemplos de promotores, por ejemplo, en el documento WO 2013/176772.
"Unión operativa" o estar "unido operativamente" incluye la yuxtaposición de dos o más componentes (por ejemplo, un promotor y otro elemento de secuencia) de manera que ambos componentes funcionen normalmente y permitan la posibilidad de que al menos uno de los componentes pueda mediar una función que es ejercida sobre al menos uno de los otros componentes. Por ejemplo, un promotor puede estar unido operativamente a una secuencia de codificación si el promotor controla el nivel de transcripción de la secuencia de codificación en respuesta a la presencia o ausencia de uno o más factores reguladores de la transcripción. La unión operativa puede incluir secuencias que sean contiguas entre sí o que actúen en trans (por ejemplo, una secuencia reguladora puede actuar a distancia para controlar la transcripción de la secuencia de codificación).
El término "variante" se refiere a una secuencia de nucleótidos que difiere de la secuencia más prevalente en una población (por ejemplo, en un nucleótido) o una secuencia de proteínas diferente de la secuencia más prevalente en una población (por ejemplo, en un aminoácido).
El término "fragmento", cuando se refiere a una proteína, significa una proteína que es más corta o tiene menos aminoácidos que la proteína de longitud completa. El término "fragmento", cuando se refiere a un ácido nucleico significa un ácido nucleico que es más corto o tiene menos nucleótidos que el ácido nucleico de longitud completa. Un fragmento puede ser, por ejemplo, un fragmento N-terminal (es decir, eliminación de un fragmento del extremo C-terminal de la proteína), un fragmento C-terminal (es decir, eliminación de un fragmento del extremo N-terminal de la proteína), o un fragmento interno.
"Identidad de secuencia" o "identidad" en el contexto de dos secuencias polinucleotídicas o polipeptídicas hace referencia a los restos en las dos secuencias que son iguales cuando se alinean para una máxima correspondencia a lo largo de una ventana de comparación específica. Cuando se usa el porcentaje de identidad de secuencia en referencia a proteínas, las posiciones de los restos que no son idénticas a menudo difieren en sustituciones de aminoácidos conservativas, donde se sustituyen restos de aminoácido por otros restos de aminoácido con propiedades químicas similares (por ejemplo, carga o hidrofobia) y, por lo tanto, no cambian las propiedades funcionales de la molécula. Cuando las secuencias difieren en sustituciones conservativas, puede ajustarse por exceso el porcentaje de identidad de secuencia para corregir la naturaleza conservativa de la sustitución. Se dice que las secuencias que difieren por dichas sustituciones conservativas tienen "similitud de secuencia" o "similitud". Los medios para realizar este ajuste son bien conocidos. Normalmente, esto implica puntuar una sustitución conservativa como un emparejamiento erróneo parcial en lugar de completo, aumentando de este modo el porcentaje de identidad de secuencia. Por lo tanto, por ejemplo, cuando se asigna a un aminoácido idéntico una puntuación de 1 y se asigna a una sustitución no conservativa una puntuación de cero, se asigna a una sustitución conservativa una puntuación entre cero y 1. La puntuación de sustituciones conservadoras se calcula, por ejemplo, como se implementa en el programa PC/GENE (Intelligenetics, Mountain View, California).
"Porcentaje de identidad de secuencia" incluye el valor determinado comparando dos secuencias óptimamente alineadas (el mayor número de restos perfectamente coincidentes) en una ventana de comparación, en donde la porción de la secuencia polinucleotídica en la ventana de comparación puede comprender adiciones o eliminaciones (es decir, huecos) en comparación con la secuencia de referencia (que no comprende adiciones o eliminaciones) para la alineación óptima de las dos secuencias. El porcentaje se calcula determinando el número de posiciones en las cuales se encuentran la base de ácido nucleico o el resto de aminoácido idénticos en ambas secuencias para producir el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia. Salvo que se indique lo contrario (por ejemplo, la secuencia más corta incluye una secuencia heteróloga unida), la ventana de comparación es la longitud total de la más corta de las dos secuencias que se comparan.
A menos que se indique lo contrario, los valores de identidad/similitud de secuencia incluyen el valor obtenido utilizando GAP versión 10 utilizando los siguientes parámetros: % de identidad y % de similitud para una secuencia de nucleótidos utilizando una ponderación de GAP de 50 y una ponderación de la longitud de 3 y la matriz de puntuación nwsgapdna.cmp; % de identidad y % de similitud de una secuencia de aminoácidos utilizando una ponderación de GAP de 8 y una ponderación de la longitud de 2 y la matriz de puntuación BLOSUM62; o cualquier programa equivalente de los mismos. "Programa equivalente" incluye cualquier programa de comparación de secuencias que, para dos secuencias cualquiera en cuestión, genera una alineación que tiene emparejamientos de restos de nucleótidos o aminoácidos idénticos y un porcentaje de identidad de secuencia idéntico en comparación con la alineación correspondiente generada por GAP Versión 10.
La expresión "sustitución de aminoácidos conservadora" se refiere a la sustitución de un aminoácido que normalmente está presente en la secuencia por un aminoácido diferente de tamaño, carga o polaridad similar. Los ejemplos de sustituciones conservativas incluyen la sustitución de un resto no polar (hidrófobo) tal como isoleucina, valina o leucina por otro resto no polar. Igualmente, los ejemplos de sustituciones conservativas incluyen la sustitución de un resto polar (hidrófilo) por otro, tal como entre arginina y lisina, entre glutamina y asparagina, o entre glicina y serina. Además, la sustitución de un resto básico tal como la lisina, arginina o histidina por otro, o la sustitución de un resto ácido tal como ácido aspártico o ácido glutámico por otro resto ácido son ejemplos adicionales de sustituciones conservativas. Los ejemplos de sustituciones no conservativas incluyen la sustitución de un resto de aminoácido no polar (hidrófobo) tal como isoleucina, valina, leucina, alanina o metionina para un resto polar (hidrófilo) tal como cisteína, glutamina, ácido glutámico o lisina y/o un resto polar para un resto no polar. Las categorizaciones habituales de aminoácidos se resumen a continuación.
Tabla 1. Clasificaciones de aminoácidos.
Alanina Ala A No polar Neutro 1,8
Arginina Arg R Polar Positivo -4,5
Asparagina Asn N Polar Neutro -3,5
Ácido aspártico Asp D Polar Negativo -3,5
Cisteína Cys C No polar Neutro 2,5
Ácido glutámico Glu E Polar Negativo -3,5
Glutamina Gln Q Polar Neutro -3,5
Glicina Gly G No polar Neutro -0,4
Histidina His H Polar Positivo -3,2
Isoleucina Ile I No polar Neutro 4,5
Leucina Leu L No polar Neutro 3,8
Lisina Lys K Polar Positivo -3,9
Metionina Met M No polar Neutro 1,9
Fenilalanina Phe F No polar Neutro 2,8
Prolina Pro P No polar Neutro -1,6
Serina Ser S Polar Neutro -0,8
Treonina Thr T Polar Neutro -0,7
Triptófano Tip W No polar Neutro -0,9
Tirosina Tyr Y Polar Neutro -1,3
Valina Val V No polar Neutro 4,2
Una secuencia "homóloga" (por ejemplo, secuencia de ácido nucleico) incluye una secuencia que es idéntica o sustancialmente similar a una secuencia de referencia conocida, de tal forma que es, por ejemplo, al menos un 50 %, al menos un 55 %, al menos un 60 %, al menos un 65 %, al menos un 70 %, al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 96 %, al menos un 97 %, al menos un 98 %, al menos un 99 % o 100 % idéntica a la secuencia de referencia conocida. Las secuencias homólogas pueden incluir, por ejemplo, secuencias ortólogas y secuencias parálogas. Los genes homólogos, por ejemplo, normalmente descienden de una secuencia de ADN ancestral común, ya sea a través de un evento de especiación (genes ortólogos) o un evento de duplicación genética (genes parálogos). Los genes "ortólogos" incluyen genes de diferentes especies que evolucionaron a partir de un gen ancestral común mediante especiación. Los ortólogos suelen conservar la misma función en el curso de la evolución. Los genes "parálogos" incluyen genes relacionados por duplicación dentro de un genoma. Los parálogos pueden desarrollar nuevas funciones en el curso de la evolución.
El término"in vitro"incluye ambientes artificiales y procesos o reacciones que se producen dentro de un ambiente artificial (por ejemplo, un tubo de ensayo o una célula o línea celular aislada). La expresión"in vivo"incluye entornos naturales (por ejemplo, una célula, organismo o cuerpo) y procesos o reacciones que ocurren dentro de un entorno natural. La expresión"ex-vivo"incluye células que se han extraído del cuerpo de un individuo y procesos o reacciones que tienen lugar dentro de dichas células.
La expresión "gen indicador" se refiere a un ácido nucleico que tiene una secuencia que codifica un producto génico (típicamente una enzima) que se analiza de manera fácil y cuantificable cuando una construcción que comprende la secuencia del gen indicador unida operativamente a un elemento promotor y/o potenciador heterólogo se introduce en células que contienen (o que pueden hacerse que contengan) los factores necesarios para la activación de los elementos promotores y/o potenciadores. Los ejemplos de genes indicadores incluyen, pero sin limitación, genes que codifican la beta-galactosidasa (lacZ), los genes bacterianos de cloranfenicol acetiltransferasa (cat), genes de luciferasa de luciérnaga, genes que codifican beta-glucuronidasa (GUS) y genes que codifican proteínas fluorescentes. Una "proteína indicadora" se refiere a una proteína codificada por un gen indicador.
La expresión "proteína indicadora fluorescente", tal como se utiliza en el presente documento, significa una proteína indicadora que es detectable basándose en la fluorescencia, en donde la fluorescencia puede proceder directamente de la proteína indicadora, la actividad de la proteína indicadora sobre un sustrato fluorogénico o una proteína con afinidad por la unión a un compuesto con etiqueta fluorescente. Los ejemplos de proteínas fluorescentes incluyen proteínas verdes fluorescentes (por ejemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami verde, Azami verde monomérico, CopGFP, AceGFP y ZsGreenl), proteínas fluorescentes amarillas (por ejemplo, YFP, eYFP, Citrina, Venus, YPet, PhiYFP y ZsYellowl), proteínas fluorescentes azules (por ejemplo, b Fp , eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire y T-sapphire), proteínas fluorescentes cian (por ejemplo, CFP, eCFP, Cerulean, CyPet, AmCyanl y Midoriishi-Cyan), proteínas fluorescentes rojas (por ejemplo, RFP, mKate, mKate2, mPlum, monómero de DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, monómero de DsRed, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry y Jred), proteínas fluorescentes naranjas (por ejemplo, mOrange, mKO, Kusabira-Naranja, Kusabira-naranja monomérico, mTangerine y tdTomato) y cualquier otra proteína fluorescente adecuada cuya presencia en las células pueda detectarse mediante métodos de citometría de flujo.
La reparación en respuesta a roturas de doble cadena (DSB) se produce principalmente a través de dos vías de reparación del ADN conservadas: recombinación homóloga (HR) y unión de extremos no homólogos (NHEJ). Véase Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897. Igualmente, la reparación de un ácido nucleico diana mediada por un ácido nucleico donador exógeno puede incluir cualquier proceso de intercambio de información genética entre los dos polinucleótidos.
El término "recombinación" incluye cualquier proceso de intercambio de información genética entre dos polinucleótidos y puede producirse por cualquier mecanismo. La recombinación puede producirse mediante reparación dirigida por homología (HDR) o recombinación homóloga (HR). La HDR o HR incluye una forma de reparación de ácidos nucleicos que puede requerir homología de secuencia de nucleótidos, utiliza una molécula "donador" como molde para la reparación de una molécula "diana" (es decir, la que experimentó la rotura de la doble cadena) y conduce a la transferencia de información genética del donador a la diana. Sin desear quedar ligado a teoría alguna, dicha transferencia puede implicar la corrección de desajustes del ADN heterodúplex que se forma entre la diana rota y el donador, y/o hibridación de cadena dependiente de síntesis, en la que el donador se utiliza para resintetizar la información genética que se convertirá en parte de la diana y/o procesos relacionados. En algunos casos, el polinucleótido donador, un fragmento del polinucleótido donador, una copia del polinucleótido donador o un fragmento de una copia del polinucleótido donador se integra en el ADN diana. Véase Wanget al.(2013) Cell 153:910-918; Mandaloset al.(2012) PLOS ONE 7:e45768:1-9; y Wanget al.(2013) Nat Biotechnol. 31:530-532.
NHEJ incluye la reparación de roturas de doble cadena en un ácido nucleico mediante la ligadura directa de los extremos de la rotura entre sí o con una secuencia exógena sin la necesidad de un molde homólogo. La ligadura de secuencias no contiguas por NHEJ a menudo puede dar como resultado eliminaciones, inserciones o translocaciones cerca del sitio de la rotura bicatenaria. Por ejemplo, NHEJ también puede dar como resultado la integración dirigida de un ácido nucleico donador exógeno mediante la ligadura directa de los extremos rotos con los extremos del ácido nucleico donador exógeno (es decir, captura basada en NHEJ). Dicha integración dirigida mediada por NHEJ puede preferirse para la inserción de un ácido nucleico donador exógeno cuando las vías de reparación dirigida por homología (HDR) no son fácilmente utilizables (por ejemplo, en células que no se dividen, células primarias y células que realizan mal la reparación del ADN basada en homología). Adicionalmente, a diferencia de la reparación dirigida por homología, no se necesita conocimiento sobre grandes regiones de identidad de secuencia que flanquean el sitio de escisión, lo que puede resultar beneficioso cuando se intenta la inserción dirigida en organismos que tienen genomas cuya secuencia genómica no se conoce completamente. La integración puede proceder mediante la ligadura de extremos romos entre el ácido nucleico donador exógeno y la secuencia genómica escindida, o mediante la ligadura de extremos adhesivos (es decir, que tienen salientes 5' o 3') usando un ácido nucleico donador exógeno que está flanqueado por salientes que son compatibles con los generados por un agente nucleasa en la secuencia genómica escindida. Véase, por ejemplo, el documento US 2011/020722, el documento WO 2014/033644, WO 2014/089290 y Marescaet al.(2013) Genoma Res. 23(3):539-546. Si se ligan extremos romos, puede ser necesaria la resección de la diana y/o del donador para generar regiones de microhomología necesarias para la unión de fragmentos, lo que puede crear alteraciones no deseadas en la secuencia diana.
Las composiciones o métodos "que comprenden" o "que incluyen" uno o más elementos enumerados pueden incluir otros elementos no enumerados específicamente. Por ejemplo, una composición que "comprende" o "incluye" una proteína puede contener la proteína sola o en combinación con otros ingredientes. La expresión de transición "que consiste esencialmente en" significa que debe interpretarse que el alcance de una reivindicación abarca los elementos especificados enumerados en la reivindicación y los que no afectan materialmente a las características básicas y novedosas de la invención reivindicada. Por lo tanto, no está previsto que la expresión "que consiste esencialmente en", cuando se usa en una reivindicación de esta invención, se interprete como equivalente a "que comprende".
"Opcional" u "opcionalmente" significa que el suceso o circunstancia descrito a continuación puede suceder o no y que la descripción incluye casos en los que el suceso o circunstancia ocurre y casos en los que no.
La designación de un intervalo de valores incluye todos los números enteros dentro del intervalo o que lo definen, y todos los subintervalos definidos por números enteros dentro del intervalo.
A menos que resulte evidente de otro modo por el contexto, el término "aproximadamente" abarca valores dentro de un margen estándar de error de medición (por ejemplo, SEM) de un valor establecido.
El término "y/o" se refiere y abarca todas y todas y cada una de las combinaciones posibles de uno o más de los elementos enumerados asociados, así como la ausencia de combinaciones cuando se interpreta en la alternativa ("o").
El término "o" se refiere a un miembro cualquiera de una lista particular y también incluye cualquier combinación de miembros de esa lista.
Las formas singulares de los artículos "un", "una", y "el/la" incluyen las referencias en plural a menos que el contexto indique claramente lo contrario. Por ejemplo, la expresión "una proteína" o "al menos una proteína" puede incluir una pluralidad de proteínas, incluyendo mezclas de las mismas.
Estadísticamente significativo significa p <0,05.
Descripción detallada
I. Descripción general
Se proporcionan células biosensoras de tau listas para la proteína Cas y métodos para fabricar y utilizar dichas células para detectar la vulnerabilidad genética asociada con la agregación de tau. También se proporcionan células biosensoras de tau listas (SAM) mediadoras de la activación sinérgica de CRISPR/Cas y métodos para fabricar y utilizar dichas células para detectar la vulnerabilidad genética asociada con la agregación de tau.
Para identificar genes y vías que exhiben letalidad sintética con agregados de proteínas asociados a enfermedades, se desarrolló una plataforma para realizar análisis de todo el genoma con bibliotecas de ARNgu de nucleasa CRISPR (CRISPRn). La plataforma identifica genes que, cuando se interrumpen, causan la muerte celular específicamente en el contexto de una agregación anormal de proteínas. Para identificar más genes y vías que exhiben letalidad sintética con agregados de proteínas asociados a enfermedades, se desarrolló una plataforma para realizar análisis de todo el genoma con bibliotecas de ARNgu de activación de CRISPR (CRISPRa). La plataforma identifica genes que, cuando se activan, causan la muerte celular específicamente en el contexto de una agregación anormal de proteínas. La identificación de dichos genes puede dilucidar los mecanismos de neurotoxicidad asociada a agregados y las vías genéticas que promueven la muerte de neuronas en el contexto de enfermedades neurodegenerativas.
Los cribados emplean una línea celular de mamífero biosensor tau (por ejemplo, línea celular humana o HEK293T) que consiste en células que expresan de manera estable el dominio de repetición de tau (por ejemplo, dominio de cuatro repeticiones tau, tau_4RD) con una mutación patogénica (por ejemplo, la mutación patogénica P301S), unidos a indicadores de proteínas fluorescentes únicas que pueden actuar juntos como un biosensor intracelular que produce una señal detectable cuando se agrega. En un ejemplo no limitante, las líneas celulares contienen dos transgenes que expresan de manera estable variantes de proteínas asociadas a enfermedades fusionadas con la proteína fluorescente CFP (por ejemplo, eCFP) o la proteína fluorescente YFP (por ejemplo, eYFP): tau4RD-CFP/tau4RD-YFP (TCY), en donde el dominio de repetición de tau (4RD) comprende la mutación patogénica P301S. En estas líneas de biosensores, la agregación de proteínas tau-CFP/tau-YFP produce una señal de transferencia de energía por resonancia de fluorescencia (FRET), el resultado de una transferencia de energía fluorescente de la CFP donadora a la YFP aceptora. El término CFP (proteína fluorescente cian) cuando se usa en el presente documento incluye eCFP (proteína fluorescente cian mejorada) y el término YFP (proteína fluorescente amarilla) cuando se usa en el presente documento incluye eYFP (proteína fluorescente amarilla mejorada). Las células positivas en FRET, que contienen agregados de tau, se pueden clasificar y aislar mediante citometría de flujo. En el punto de partida, las células no estimuladas expresan los indicadores en un estado estable y soluble con señal FRE<t>mínima. Tras la estimulación (por ejemplo, transfección en liposomas de partículas de semillas), las proteínas indicadoras forman agregados, produciendo una señal FRET. Las células que contienen agregados se pueden aislar mediante FACS. La propagación estable de líneas celulares que contienen agregados, Ag.[+], se puede aislar mediante dilución clonal en serie de las líneas celulares Ag.[-].
Se realizaron varias modificaciones a esta línea celular biosensora de tau para que sea útil para el cribado genético utilizando bibliotecas CRISPRn. En primer lugar, estas células biosensoras de tau se modificaron mediante la introducción de un transgén que expresa Cas (por ejemplo, Cas9 o SpCas9) para su uso en los cribados CRISPRn. En segundo lugar, se obtuvieron subclones de estas líneas de biosensores de tau que expresan Cas en las que la proteína tau está presente de manera estable en un estado no agregado (el estado predeterminado) (Ag.[-]) o agregado (Ag.[+]).
Estas líneas celulares se utilizaron para desarrollar un método de detección en el que las células biosensoras tau que expresan Cas, ya sea con agregados (Ag.[+]) o sin agregados (Ag.[-]), se transdujeron con una biblioteca de ARN guía CRISPR para introducir mutaciones de inactivación en cada gen diana. A continuación, se realizaron exámenes para identificar no sólo genes esenciales, que consiste en los genes cuyos ARNgu dirigidos se deplecionan con el tiempo en las líneas celulares tanto Ag.[+] como Ag.[-], sino también genes letales sintéticos, que consisten en genes cuyos ARNgu dirigidos se deplecionan con el tiempo preferentemente en las líneas celulares Ag.[+] en comparación con las líneas celulares Ag.[-]. Los perfiles de depleción se evaluaron mediante un análisis de evolución temporal recién definido, en el que se consideró que los<a>R<n>guía con un patrón consistente de lecturas decrecientes desde el punto de tiempo más temprano hasta el punto de tiempo final estaban deplecionados. Este es un enfoque analítico novedoso para evaluar la depleción del ARN guía, en comparación con el enfoque más convencional de simplemente comparar las lecturas de la colección de células del punto final con el primer pase.
Igualmente, se realizaron varias modificaciones a esta línea celular biosensora de tau para que sea útil para el cribado genético utilizando bibliotecas CRISPRa (por ejemplo, para su uso con un sistema mediador de activación sinérgica (SAM) CRISPR/Cas). En un sistema SAM de ejemplo, varios dominios de activación interactúan para provocar una activación transcripcional mayor que la que podría inducir cualquier factor por sí solo. Por ejemplo, un sistema SAM de ejemplo comprende una proteína Cas quimérica que comprende una proteína Cas inactiva para la nucleasa fusionada a uno o más dominios de activación transcripcional (por ejemplo, VP64) y una proteína adaptadora quimérica que comprende una proteína adaptadora (por ejemplo, proteína de la cubierta MS2 (MCP)) fusionada a uno o más dominios de activación transcripcional (por ejemplo, fusionados a p65 y HSF1). La MCP se une de forma natural a los bucles del tallo MS2. En un sistema SAM de ejemplo, la MCP interactúa con los bucles del tallo de MS2 diseñados en el ARNgu asociado a CRISPR y, por lo tanto, transporta los factores de transcripción unidos a la ubicación genómica adecuada.
En primer lugar, estas células biosensoras de tau se modificaron mediante la introducción de uno o más transgenes que expresan la proteína Cas quimérica que comprende la proteína Cas inactiva para la nucleasa fusionada a uno o más dominios de activación transcripcional (por ejemplo, VP64) y la proteína adaptadora quimérica que comprende la proteína adaptadora (por ejemplo, proteína de la cubierta MS2 (MCP)) fusionada a uno o más dominios de activación transcripcional (por ejemplo, fusionada a p65 y HSF1). Aunque los sistemas SAM se describen en el presente documento, también se pueden usar otros sistemas CRISPRa, tal como una proteína Cas inactiva para nucleasa fusionada a uno o más dominios de activación transcripcional, en donde tales sistemas no incluyen también una proteína adaptadora quimérica. En dichos casos, las células biosensoras tau se modificarían mediante la introducción de un transgén que exprese la proteína Cas quimérica.
En segundo lugar, se obtuvieron subclones de estas líneas de biosensores de tau que expresan SAM (es decir, que expresan Cas quimérica y que expresan adaptadora quimérica) en las que la proteína tau está presente de manera estable en un estado tanto no agregado (el estado predeterminado) (Ag.[-]) como agregado (Ag.[+]).
Estas líneas celulares se utilizaron para desarrollar un método de cribado en el que las células biosensoras tau que expresan SAM, ya sea con agregados (Ag.[+]) o sin agregados (Ag.[-]), se transdujeron con una biblioteca de ARN guía de CRISPRa para activar transcripcionalmente cada gen diana. Luego se realizaron pruebas para identificar genes que, cuando se activan, tienen un efecto letal sintético. De manera específica, los ARNgu que se deplecionan específicamente en la línea celular Ag.[+], aunque la depleción sea nula o inferior en la línea celular Ag.[-], pueden indicar un efecto letal sintético, en el que la activación de un gen diana específico se combina con la presencia de agregados de Tau en la célula para inducir la muerte celular. Los perfiles de depleción se evaluaron mediante un análisis de evolución temporal recién definido, en el que se consideró que los ARN guía con un patrón consistente de lecturas decrecientes desde el punto de tiempo más temprano hasta el punto de tiempo final estaban deplecionados. Este es un enfoque analítico novedoso para evaluar la depleción del a Rn guía, en comparación con el enfoque más convencional de simplemente comparar las lecturas de la colección de células del punto final con el primer pase. Estos genes letales sintéticos son de interés como posibles modificadores de la toxicidad de las células asociadas a tau.
II. Líneas celulares biosensoras Cas/Tau y biosensoras SAM/Tau y métodos de generación de células biosensoras A. Cas/Tau y células biosensoras SAM/Tau
En el presente documento se divulgan células que no solo expresan un primer dominio de repetición de tau (por ejemplo, que comprende el dominio de unión a microtúbulos (MBD) de tau) unido a un primer indicador y un segundo dominio de repetición de tau unido a un segundo indicador, sino que también expresan una proteína Cas, tal como Cas9. En el presente documento también se divulgan células que no solo expresan un primer dominio de repetición de tau (por ejemplo, que comprende el dominio de unión a microtúbulos (MBD) de tau) unido a un primer indicador y un segundo dominio de repetición de tau unido a un segundo indicador, sino que también expresando una proteína Cas quimérica que comprende una proteína Cas inactiva a la nucleasa fusionada a uno o más dominios de activación transcripcional y una proteína adaptadora quimérica que comprende una proteína adaptadora fusionada a uno o más dominios de activación transcripcional. El primer dominio de repetición de tau unido al primer indicador se puede expresar de manera estable y el segundo dominio de repetición de tau unido al segundo indicador se puede expresar de manera estable. Por ejemplo, el ADN que codifica el primer dominio de repetición de tau unido al primer indicador se puede integrar genómicamente y el a Dn que codifica el segundo dominio de repetición de tau unido al segundo indicador se puede integrar genómicamente. De manera análoga, la proteína Cas se puede expresar de forma estable en las células biosensoras Cas/tau. Por ejemplo, el ADN que codifica la proteína Cas se puede integrar genómicamente. Igualmente, la proteína Cas quimérica y/o la proteína adaptadora quimérica se pueden expresar de manera estable en las células biosensoras SAM/tau. Por ejemplo, el ADN que codifica la proteína Cas quimérica se puede integrar genómicamente y/o el ADN que codifica la proteína adaptadora quimérica se puede integrar genómicamente.
1. Tau y dominios de repetición de Tau unidos a indicadores
La proteína tau asociada a microtúbulos es una proteína que estimula el ensamblaje y la estabilidad de los microtúbulos y se expresa predominantemente en las neuronas. Tau tiene un papel en la estabilización de los microtúbulos neuronales y, por tanto, en la promoción del crecimiento axonal. En la enfermedad de Alzheimer (EA) y una familia de enfermedades neurodegenerativas relacionadas llamadas tauopatías, la proteína tau está anormalmente hiperfosforilada y agregada en haces de filamentos (filamentos helicoidales pares), que se manifiestan como ovillos neurofibrilares. Las tauopatías son un grupo de enfermedades neurodegenerativas heterogéneas caracterizadas por el depósito de tau anormal en el cerebro.
El dominio de repetición de tau puede ser de una proteína tau de cualquier animal o mamífero, tal como un ser humano, ratón o rata. En un ejemplo específico, el dominio de repetición de tau proviene de una proteína tau humana. A una proteína tau humana de ejemplo se le asigna el número de registro UniProt P10636. Las proteínas tau son los productos de corte y empalme alternativos de un solo gen que en los seres humanos se denominaMAPT(proteína tau asociada a los microtúbulos). El dominio de repetición de tau porta los motivos de secuencia responsables de la agregación (es decir, es el dominio propenso a la agregación de tau). Dependiendo del corte y empalme, el dominio repetido de la proteína tau tiene tres o cuatro regiones repetidas que constituyen el núcleo de la proteína propenso a la agregación, que a menudo se denomina dominio repetido (DR). De manera específica, el dominio repetido de tau representa el núcleo de la región de unión a los microtúbulos y alberga motivos hexapeptídicos en R2 y R3 que son responsables de la agregación de Tau. En el cerebro humano, hay seis isoformas de tau que varían de 352 a 441 aminoácidos de longitud. Estas isoformas varían en el extremo carboxilo según la presencia de tres o cuatro dominios repetidos (R1-R4), además de la presencia o ausencia de uno o dos dominios de inserción en el extremo amino. Los dominios repetidos, localizados en la mitad carboxilo terminal de tau, se cree que son importantes para la unión a los microtúbulos, así como para la agregación patológica de tau en filamentos helicoidales pares (PHF), que son los constituyentes centrales de los ovillos neurofibrilares que se encuentran en las tauopatías. Se proporcionan secuencias de ejemplo para los cuatro dominios repetidos (R1-R4) en las SEQ ID NO: 1-4, respectivamente. Se proporcionan secuencias de codificación de ejemplo para los cuatro dominios repetidos (R1-R4) en las SEQ ID NO: 5-8. En la SEQ ID NO: 9 se proporciona una secuencia de ejemplo para el dominio de cuatro repeticiones de Tau. En la SEQ ID NO: 10 se proporciona una secuencia de codificación de ejemplo para el dominio de cuatro repeticiones de Tau. En la SEQ ID NO: 11 se proporciona una secuencia de ejemplo para el dominio de cuatro repeticiones de Tau con la mutación P301S. En la SEQ ID NO: 12 se proporciona una secuencia de codificación de ejemplo para el dominio de cuatro repeticiones de Tau con la mutación P301S.
El dominio de repetición de tau usado en las células biosensoras Cas/tau o las células biosensoras SAM/tau puede comprender el dominio de unión a los microtúbulos de tau (MBD). El dominio de repetición de tau usado en las células biosensoras Cas/tau o las células biosensoras SAM/tau puede comprender uno o más o los cuatro dominios repetidos (R1-R4). Por ejemplo, el dominio de repetición de tau puede comprender, consistir esencialmente en o consistir en una o más o todas las SEQ ID NO: 1,2, 3 y 4, o secuencias al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idénticas a las SEQ ID NOS: 1, 2, 3 y 4. En un ejemplo específico, el dominio de repetición de tau es el dominio de cuatro repeticiones de tau (R1-R4) que se encuentra en varias isoformas de tau. Por ejemplo, el dominio de repetición de tau puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 9 o la SEQ ID NO: 11 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 9 o la SEQ ID NO: 11. En un ejemplo específico, el ácido nucleico que codifica el dominio de repetición de tau puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 12 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 12, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 11. En otro ejemplo específico, el ácido nucleico que codifica el segundo dominio de repetición de tau unido al segundo indicador puede comprender, consistir esencialmente en o consistir en la SEQ ID<n>O: 10 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 10, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 9. El primer y segundo dominio de repetición de tau en las células divulgadas en el presente documento pueden ser los mismos, similares o diferentes.
Uno o ambos del primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador pueden expresarse de manera estable en las células. Por ejemplo, los ácidos nucleicos que codifican uno o ambos del primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador pueden integrarse genómicamente en la población de células y unirse operativamente a promotores activos en la célula.
Los dominios de repetición de tau usados en las células divulgadas en el presente documento también pueden comprender una mutación patógena de tau, tal como una mutación proagregación. Tal mutación puede ser, por ejemplo, una mutación que está asociada con (por ejemplo, se segrega con) o causa una tauopatía. Como ejemplo, la mutación puede ser una mutación sensibilizadora de agregación que sensibiliza a tau a la siembra pero no da como resultado que tau se agregue fácilmente por sí solo. Por ejemplo, la mutación puede ser la mutación P301S asociada a la enfermedad. Por mutación P301S se entiende la mutación tau P301S humana o una mutación correspondiente en otra proteína tau cuando está alineada de manera óptima con la proteína tau humana. La mutación P301S en tau muestra una alta sensibilidad a la siembra, pero no se agrega fácilmente por sí solo. Por lo tanto, aunque al inicio las proteínas indicadoras tau que comprenden la mutación P301S existen en un estado estable y soluble dentro de la célula, la exposición a semillas de tau exógenas conduce a la agregación de proteínas indicadoras de tau. Otras mutaciones de tau incluyen, por ejemplo, K280del, P301L, V337M, P301L/V337M y K280del/I227P/I308P.
El primer dominio de repetición de tau puede unirse al primer indicador y el segundo dominio de repetición de tau puede unirse al segundo indicador por cualquier medio. Por ejemplo, el indicador puede fusionarse con el dominio de repetición de tau (por ejemplo, como parte de una proteína de fusión).
El primer indicador y el segundo indicador son un par de indicadores únicos que pueden actuar juntos como un biosensor intracelular que produce una señal detectable cuando se agregan la primera y la segunda proteína. De manera específica, los indicadores son proteínas fluorescentes. Los indicadores primero y segundo son un par de transferencia de energía por resonancia de fluorescencia (FRET), de modo que FRET puede usarse para medir la agregación de proteínas. Son bien conocidos ejemplos de pares FRET (fluoróforos donador y aceptor). Véase, por ejemplo, Bajaret al.(2016) Sensors (Basel) 16(9): 1488. Las técnicas típicas de microscopia de fluorescencia se basan en la absorción por un fluoróforo de luz en una longitud de onda (excitación), seguido de la posterior emisión de fluorescencia secundaria a una longitud de onda más larga. El mecanismo de transferencia de energía por resonancia de fluorescencia implica un fluoróforo donador en un estado electrónico excitado, que puede transferir su energía de excitación a un cromóforo aceptor cercano de forma no radiactiva a través de interacciones dipolo-dipolo de largo alcance. Por ejemplo, el donador de energía FRET puede ser el primer indicador y el aceptor de energía FRET puede ser el segundo indicador. De manera alternativa, el donador de energía FRET puede ser el segundo indicador y el aceptor de energía FRET puede ser el primer indicador. En un ejemplo específico, los indicadores primero y segundo son CFP y YFP. Se proporcionan proteínas de ejemplo y secuencias de codificación para CFP, por ejemplo, en las SEQ ID NO: 13 y 14, respectivamente. Se proporcionan proteínas de ejemplo y secuencias de codificación para YFP, por ejemplo, en las SEQ ID NO: 15 y 16, respectivamente. Como ejemplo específico, la CFP puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 13 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 13. Como otro ejemplo específico, la YFP puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 15 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 15.
En un ejemplo no limitante, las células biosensoras divulgadas en el presente documento contienen dos transgenes que expresan de manera estable variantes de la proteína tau asociadas a enfermedades fusionadas con la proteína fluorescente CFP o a la proteína fluorescente YFP, respectivamente (tau4RD-PPC/tau4RD-YFP (TCY)), en el que el dominio tau de cuatro repeticiones (4RD) comprende la mutación patogénica P301S. En estas líneas de biosensores, la agregación de proteína tau-CFP/tau-YFP produce una señal FRET, el resultado de una transferencia de energía fluorescente de la CFP donadora a la YFP aceptora. Las células positivas en FRET, que contienen agregados de tau, se pueden clasificar y aislar mediante citometría de flujo. En el punto de partida, las células no estimuladas expresan los indicadores en un estado estable y soluble con señal FRET mínima. Tras la estimulación (por ejemplo, transfección en liposomas de partículas de semillas), las proteínas indicadoras forman agregados, produciendo una señal FRET.
Las células biosensoras Cas/tau divulgadas en el presente documento pueden ser células de agregación positiva (Ag.[+]) en las que el dominio de repetición de tau se presenta de manera estable en un estado agregado, lo que significa que los agregados del dominio de repetición de tau persisten de manera estable en todas las células con crecimiento y múltiples pases a lo largo del tiempo. De manera alternativa, las células biosensoras Cas/tau divulgadas en el presente documento pueden ser de agregación negativa (Ag.[-]).
2. Proteínas Cas y proteínas Cas quiméricas
Las células biosensoras Cas/tau divulgadas en el presente documento también comprenden ácidos nucleicos (ADN o ARN) que codifican proteínas Cas. Opcionalmente, la proteína Cas se expresa de forma estable. Opcionalmente, las células comprenden una secuencia de codificación de Cas genómicamente integrada. Igualmente, las células biosensoras SAM/tau divulgadas en el presente documento también comprenden ácidos nucleicos (ADN o ARN) que codifican proteínas Cas quiméricas que comprenden una proteína Cas inactiva a nucleasa fusionada a uno o más dominios de activación transcripcional (por ejemplo, VP64). Opcionalmente, la proteína Cas quimérica se expresa de forma estable. Opcionalmente, las células comprenden una secuencia de codificación de Cas quimérica integrada genómicamente.
Las proteínas Cas son parte de los sistemas de repeticiones palindrómicas cortas agrupadas regularmente intercaladas (CRISPR)/asociadas a CRISPR (Cas). Los sistemas CRISPR/Cas incluyen transcritos y otros elementos involucrados en la expresión o dirección de la actividad de genes Cas. Un sistema CRISPR/Cas puede ser, por ejemplo, un sistema de tipo I, tipo II, tipo III o un sistema de tipo V (por ejemplo, subtipo V-A o subtipo V-B). Los métodos y composiciones divulgados en el presente documento pueden emplear sistemas CRISPR/Cas mediante la utilización de complejos CRISPR (que comprenden un ARN guía (ARNg) en complejo con una proteína Cas) para la unión o escisión de ácidos nucleicos dirigida al sitio.
Los sistemas CRISPR/Cas utilizados en las composiciones y métodos divulgados en el presente documento pueden ser de origen no natural. Un sistema "que no es de origen natural" incluye cualquier cosa que indique la participación de la mano del hombre, tal como que uno o más componentes del sistema se hayan alterado o mutado de su estado natural, estando al menos sustancialmente libres de al menos otro componente con el que están asociados naturalmente en la naturaleza, o estando asociados con al menos otro componente con el que no están asociados de manera natural. Por ejemplo, algunos sistemas CRISPR/Cas emplean complejos de CRISPR de forma no natural que comprenden un ARNg y una proteína Cas que no se encuentran juntos de forma natural, emplean una proteína Cas que no se produce de forma natural o un ARNg que no se produce de forma natural.
Las proteínas Cas generalmente comprenden al menos un dominio de unión o reconocimiento de ARN que puede interactuar con los ARN guía. Las proteínas Cas también pueden comprender dominios de nucleasa (por ejemplo, dominios DNasa o RNasa), dominios de unión al ADN, dominios helicasa, dominios de interacción proteína-proteína, dominios de dimerización y otros dominios. Algunos de estos dominios (por ejemplo, dominios DNasa) pueden provenir de una proteína Cas nativa. Se pueden agregar otros dominios similares para producir una proteína Cas modificada. Un dominio nucleasa posee actividad catalítica para la escisión de ácidos nucleicos, que incluye la rotura de los enlaces covalentes de una molécula de ácido nucleico. La escisión puede producir extremos romos o escalonados, y puede ser monocatenaria o bicatenaria. Por ejemplo, una proteína Cas9 de tipo silvestre normalmente creará un producto de escisión romo. De manera alternativa, una proteína Cpfl de tipo silvestre (por ejemplo, FnCpfI) puede dar como resultado un producto de escisión con un saliente en 5' de 5 nucleótidos, produciéndose la escisión después del par de bases 18 de la secuencia PAM en la cadena no diana y después de la base 23 en la cadena diana. Una proteína Cas puede tener actividad de escisión completa para crear una rotura bicatenaria en un locus genómico diana (por ejemplo, una rotura bicatenaria con extremos romos), o puede ser una nickasa que crea una rotura monocatenaria en un locus genómico diana.
Los ejemplos de proteínas Cas incluyen Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8al, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 o Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csxl7, Csxl4, Csx10, Csxl6, CsaX, Csx3, Csx1, Csxl5, Csf1, Csf2, Csf3, Csf4 y Cu1966, y homólogos o versiones modificadas de las mismas.
Una proteína Cas de ejemplo es una proteína Cas9 o una proteína derivada de la proteína Cas9. Las proteínas Cas9 provienen de un sistema CRISPR/Cas de tipo II y normalmente comparten cuatro motivos clave con una arquitectura conservada. Los motivos 1, 2 y 4 son motivos similares a RuvC y el motivo 3 es un motivo HNH. Las proteínas Cas9 ilustrativas son deStreptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, Acaryochloris marina, Neisseria meningitidisoCampylobacter jejuni.En el documento WO 2014/131833 se describen ejemplos adicionales de los miembros de la familia Cas9. Una proteína Cas9 ilustrativa es Cas9 de S.pyogenes(SpCas9) (a la que se le ha asignado el número de registro de SwissProt Q99ZW2). La proteína SpCas9 de ejemplo y la secuencia de codificación se exponen en las SEQ ID NO: 21 y 22, respectivamente. Otra proteína Cas9 ilustrativa es Cas9 de S.aureus(SaCas9) (a la que se le ha asignado el número de acceso de UniProt J7RUA5). Otra proteína Cas9 ilustrativa es Cas9 deCampylobacter jejuni(CjCas9) (a la que se le ha asignado el número de acceso de UniProt Q0P897). Véase, por ejemplo, Kimet al.(2017) Nat. Comm. 8:14500. SaCas9 es más pequeña que SpCas9 y CjCas9 es más pequeña que SaCas9 y SpCas9. Cas9 deNeisseria meningitidis(Nme2Cas9) es otra proteína Cas9 de ejemplo. Véase, por ejemplo, Edrakiet al.(2019) Mol. Cell 73(4):714-726. Las proteínas Cas9 deStreptococcus thermophilus(por ejemplo,Streptococcus thermophilusLMD-9 Cas9 codificado por el locus CRISPR1 (St1Cas9) oStreptococcus thermophilusCas9 del locus CRISPR3 (St3Cas9)) son otras proteínas Cas9 de ejemplo. Cas9 defFrancisella novicida (FnCas9)o la variante de Cas9 RHAFrancisella novicidaque reconoce una PAM alternativa (sustituciones E1369R/E1449H/R1556A) son otras proteínas Cas9 de ejemplo. Estas y otras proteínas Cas9 de ejemplo se revisan, por ejemplo, en Cebrian-Serrano y Davies (2017) Mamm. Genome 28(7):247-261.
Como ejemplo, la proteína Cas puede ser una proteína Cas9. Por ejemplo, la proteína Cas9 puede ser una proteína Cas9 deStreptococcus pyogenes.Como ejemplo específico, la proteína Cas puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 21 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 21. Como otro ejemplo específico, una proteína Cas quimérica que comprende una proteína Cas inactiva a nucleasa y uno o más dominios de activación transcripcional puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 36 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 36.
Otro ejemplo de proteína Cas es una proteína Cpfl (CRISPR dePrevotellayFrancisella1). Cpfl es una proteína grande (de aproximadamente 1300 aminoácidos) que contiene un dominio nucleasa similar a RuvC homólogo al dominio correspondiente de Cas9 junto con un homólogo al grupo rico en arginina característico de Cas9. Sin embargo, Cpfl carece del dominio nucleasa HNH que está presente en las proteínas Cas9, y el dominio similar a RuvC es contiguo en la secuencia de Cpfl, a diferencia de Cas9, donde contiene insertos largos que incluyen el dominio HNH. Véase, por ejemplo, Zetscheet al.(2015) Cell 163(3):759-771. Las proteínas Cpfl de ejemplo son deFrancisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC20171,Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011 GWA233 10, Parcubacteria bacterium GW2011 GWC244 17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiensyPorphyromonas macacae.La Cpfl deFrancisella novicidaU112 (FnCpf1; a la que se le ha asignado el número de acceso UniProt A0Q7Q2) es una proteína Cpfl ilustrativa.
Las proteínas Cas pueden ser proteínas de tipo silvestre (es decir, aquellas que se encuentran en la naturaleza), proteínas Cas modificadas (es decir, variantes de la proteína Cas) o fragmentos de proteínas Cas de tipo silvestre o modificadas. Las proteínas Cas también pueden ser variantes o fragmentos activos con respecto a la actividad catalítica de proteínas Cas de tipo silvestre o modificadas. Las variantes o fragmentos activos con respecto a la actividad catalítica pueden comprender al menos el 80 %, un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, 99 % o más de identidad de secuencia con la proteína Cas de tipo silvestre o modificada o un fragmento de la misma, en donde las variantes activas conservan la capacidad de cortar en un sitio de escisión deseado y, por tanto, conservan la actividad inductora de rotura bicatenaria. Se conocen ensayos de actividad para inducir roturas de doble cadena y generalmente miden la actividad y especificidad general de la proteína Cas en sustratos de ADN que contienen el sitio de escisión.
Un ejemplo de una proteína Cas modificada es la proteína SpCas9-HF1 modificada, que es una variante de alta fidelidad de Cas9 deStreptococcus pyogenesque alberga alteraciones (N497A/R661A/Q695A/Q926A) diseñadas para reducir los contactos de ADN no específicos. Véase, por ejemplo, Kleinstiveret al.(2016) Nature 529(7587):490-495. Otro ejemplo de proteína Cas modificada es la variante eSpCas9 modificada (K848A/K1003A/R1060A) diseñada para reducir los efectos fuera de la diana. Véase, por ejemplo, Slaymakeret al.(2016) Science 351(6268):84-88. Otras variantes de SpCas9 incluyen K855A y K810A/K1003A/R1060A. Estas y otras proteínas Cas modificadas se revisan, por ejemplo, en Cebrian-Serrano y Davies (2017) Mamm. Genome 28(7):247-261. Otro ejemplo de una proteína Cas9 modificada es xCas9, que es una variante SpCas9 que puede reconocer una gama ampliada de secuencias PAM. Véase, por ejemplo, Huet al.(2018) Nature 556:57-63.
Las proteínas Cas se pueden modificar para aumentar o disminuir una o más afinidades de unión a ácidos nucleicos, especificidades de unión a ácidos nucleicos y/o la actividad enzimática. Las proteínas Cas también se pueden modificar para cambiar cualquier otra actividad o propiedad de la proteína, tal como la estabilidad. Por ejemplo, una proteína Cas se puede truncar para eliminar dominios que no son esenciales para la función de la proteína o para optimizar (por ejemplo, mejorar o reducir) la actividad o una propiedad de la proteína Cas. Como ejemplo adicional, uno o más dominios de nucleasa de la proteína Cas se pueden modificar, eliminar o inactivar (por ejemplo, para su uso en las células biosensoras SAM/tau que comprenden una proteína Cas inactiva para nucleasa).
Las proteínas cas pueden comprender al menos un dominio nucleasa, tal como un dominio DNasa. Por ejemplo, una proteína Cpf1 de tipo silvestre comprende generalmente un dominio similar a RuvC que escinde ambas cadenas de ADN diana, quizás en una configuración dimérica. Las proteínas Cas también pueden comprender al menos dos dominios nucleasa, tales como dominios DNasa. Por ejemplo, una proteína Cas9 de tipo silvestre generalmente comprende un dominio nucleasa similar a RuvC y un dominio nucleasa similar a HNH. Los dominios RuvC y HNH pueden cortar cada uno una cadena diferente de ADN bicatenario para hacer una rotura de doble cadena en el ADN. Véase, por ejemplo, Jineket al.(2012) Science 337:816-821.
Uno o más o todos los dominios nucleasa pueden eliminarse o mutarse de modo que ya no sean funcionales o tengan una actividad nucleasa reducida. Por ejemplo, si uno de los dominios nucleasa se elimina o muta en una proteína Cas9, la proteína Cas9 resultante puede denominarse nickasa y puede generar una rotura monocatenaria dentro de un ADN diana bicatenario, pero no una rotura bicatenaria (es decir, puede escindir la cadena complementaria o la cadena no complementaria, pero no ambas). Si ambos dominios nucleasa se han eliminado o mutado, la proteína Cas resultante (por ejemplo, Cas9) tendrá una capacidad reducida para escindir ambas cadenas de un ADN bicatenario (por ejemplo, una proteína Cas nula o inactiva para nucleasa, o una proteína Cas catalíticamente muerta (dCas)). Un ejemplo de una mutación que convierte Cas9 en una nickasa es una mutación D10A (aspartato a alanina en la posición 10 de Cas9) en el dominio RuvC de Cas9 de S. pyogenes. Igualmente, H939A (histidina a alanina en la posición del aminoácido 839), H840A (histidina a alanina en la posición del aminoácido 840) o N863A (asparagina a alanina en la posición del aminoácido N863) en el dominio HNH de Cas9 de S.pyogenespuede convertir la Cas9 en una nickasa. Otros ejemplos de mutaciones que convierten Cas9 en una nickasa incluyen las mutaciones correspondientes a Cas9 de S.thermophilus.Véase, por ejemplo, Sapranauskaset al.(2011) Nucleic Acids Res. 39(21):9275-9282 y el documento WO 2013/141680. Estas mutaciones pueden generarse utilizando métodos tales como la mutagénesis dirigida, mutagénesis mediada por PCR o síntesis de genes totales. Se pueden encontrar ejemplos de otras mutaciones que crean nickasas, por ejemplo, en los documentos WO 2013/176772 y WO 2013/142578. Si todos los dominios de nucleasa se eliminan o mutan en una proteína Cas (por ejemplo, ambos dominios nucleasa se eliminan o mutan en una proteína Cas9), la proteína Cas resultante (por ejemplo, Cas9) tendrá una capacidad reducida para escindir las dos cadenas de un ADN bicatenario (por ejemplo, una proteína Cas nula o inactiva para nucleasas). Un ejemplo específico es un doble mutante de Cas9 D10A/H840A de S.pyogeneso un doble mutante correspondiente en una Cas9 de otra especie cuando se alinea óptimamente con Cas9 de S.pyogenes.Otro ejemplo específico es un doble mutante de Cas9 D10A/N863A de S.pyogeneso un doble mutante correspondiente en una Cas9 de otra especie cuando se alinea óptimamente con Cas9 de S.pyogenes.
Los ejemplos de mutaciones inactivadoras en los dominios catalíticos de xCas9 son los mismos que los descritos anteriormente para SpCas9. También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de proteínas Cas9 deStaphylococcus aureus.Por ejemplo, la enzima Cas9 deStaphylococcus aureus(SaCas9) puede comprender una sustitución en la posición n 580 (por ejemplo, sustitución N580A) y una sustitución en la posición D10 (por ejemplo, sustitución D10A) para generar una proteína Cas inactiva para nucleasas. Véase, por ejemplo, el documento Wo 2016/106236. También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de Nme2Cas9 (por ejemplo, combinación de D16A y H588A). También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de St1Cas9 (por ejemplo, combinación de D9A, D598A, H599A y N622A). También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de St3Cas9 (por ejemplo, combinación de D10A y N870A). También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de CjCas9 (por ejemplo, combinación de D8A y H559A). También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de FnCas9 y RHA FnCas9 (por ejemplo, N995A).
También se conocen ejemplos de mutaciones inactivadoras en los dominios catalíticos de proteínas CpfI. Con referencia a las proteínas Cpfl deFrancisella novicidaU112 (FnCpfI),Acidaminococcussp. BV3L6 (AsCpfl),Lachnospiraceae bacteriumND2006 (LbCpf1) yMoraxella bovoculi237 (MbCpfl Cpfl), dichas mutaciones pueden incluir mutaciones en las posiciones 908, 993 o 1263 de AsCpfl o las posiciones correspondientes en los ortólogos de Cpfl, o en las posiciones 832, 925, 947 o 1180 de LbCpfl o las posiciones correspondientes en ortólogos de Cpfl. Tales mutaciones pueden incluir, por ejemplo, una o más de las mutaciones D908A, E993A y D1263A de AsCpfl o mutaciones correspondientes en ortólogos de Cpfl, o D832A, E925A, D947A y D1180A de LbCpf1 o mutaciones correspondientes en ortólogos de Cpfl. Véase,por ejemplo, el documento US 2016/0208243.
Las proteínas Cas también pueden unirse operativamente a polipéptidos heterólogos como proteínas de fusión. Por ejemplo, una proteína Cas puede fusionarse a un dominio de escisión, un dominio de modificación epigenética, un dominio de activación transcripcional o un dominio represor transcripcional. Véase el documento WO 2014/089290. Por ejemplo, las proteínas Cas pueden unirse o fusionarse operativamente a un dominio de activación transcripcional para su uso en las células biosensoras SAM/tau. Los ejemplos de dominios de activación transcripcional incluyen un dominio de activación VP16 del virus del herpes simple, VP64 (que es un derivado tetramérico de VP16), un dominio de activación de NFkB p65, dominios de activación de p53 1 y 2, un dominio de activación CREB (proteína de unión al elemento de respuesta a AMPc), un dominio de activación E2A y un dominio de activación NFAT (factor nuclear de células T activadas). Otros ejemplos incluyen dominios de activación de Oct1, Oct-2A, SP1, AP-2, CTF1, P300, CBP, PCAF, SRC1, PvALF, ERF-2, OsGAl, HALF-1, C1, AP1, ARF-5, ARF-6, ARF-7, ARF-8, CPRF1, CPRF4, MYC-RP/GP, TRAB1PC4 y HSF1. Véanse, por ejemplo, los documento US 2016/0237456, EP3045537 y WO 2011/146121. En algunos casos, se puede utilizar un sistema de activación transcripcional que comprende una proteína de fusión dCas9-VP64 emparejada con MS2-p65-HSF1. Los ARN guía en tales sistemas se pueden diseñar con secuencias de aptámeros unidas al tetrabucle y al bucle del tallo 2 de ARNgu diseñados para unirse a las proteínas de la cubierta del bacteriófago MS2 dimerizadas. Véase, por ejemplo, Konermannet al.(2015) Nature 517(7536):583-588. Los ejemplos de dominios represores transcripcionales incluyen dominios represores tempranos de AMPc inducible (ICEr ), dominios represores de la caja A asociados a Kruppel (KRAB-A), dominios represores ricos en glicina YY1, represores de tipo Sp1, represores E(spl), represores IkB y MeCP2. Otros ejemplos incluyen dominios represores transcripcionales de A/B, K<o>X, gen temprano inducible por TGF-beta (T<i>E<g>), v-erbA, SID, SID4X, MBD2, MBD3, DNMT1, DNMG3A, DNMT3B, Rb, ROM2, Véase, por ejemplo, EP3045537 y WO 2011/146121. Las proteínas Cas también se pueden fusionar a un polipéptido heterólogo proporcionando una estabilidad aumentada o disminuida. El dominio o polipéptido heterólogo fusionados se pueden ubicar en el extremo N, el extremo C o internamente dentro de la proteína Cas.
Las proteínas Cas también pueden unirse operativamente a polipéptidos heterólogos como proteínas de fusión. Como ejemplo, una proteína Cas puede fusionarse con uno o más polipéptidos heterólogos que proporcionan la localización subcelular. Dichos polipéptidos heterólogos pueden incluir, por ejemplo, una o más señales de localización nuclear (NLS) tales como la NLS de SV40 monopartita y/o una NLS bipartita de alfa-importina para dirigirse al núcleo, una señal de localización mitocondrial para dirigirse a las mitocondrias, una señal de retención en el ER (retículo endoplasmático) y similares. Véase, por ejemplo, Langeet al.(2007) J. Biol. Chem. 282:5101-5105. Dichas señales de localización subcelular pueden ubicarse en el extremo N, el extremo C o en cualquier lugar dentro de la proteína Cas. Una NLS puede comprender un tramo de aminoácidos básicos y puede ser una secuencia monopartita o una secuencia bipartita. Opcionalmente, una proteína Cas puede comprender dos o más NLS, incluyendo un NLS (por ejemplo, un NLS de alfa-importina o un<n>L<s>monopartito) en el extremo N y un NLS (por ejemplo, un NLS de SV40 o un NLS bipartito) en el extremo C. Una proteína Cas también puede comprender dos o más NLS en el extremo N y/o dos o más NLS en el extremo C.
Las proteínas Cas también pueden estar unidas operativamente a un dominio de penetración celular o a un dominio de transducción de proteínas. Por ejemplo, el dominio de penetración celular puede derivar de la proteína TAT de VIH-1, el motivo de penetración de células TLM del virus de la hepatitis B humana, MPG, Pep-1, VP22, un péptido que penetra en las células del virus del herpes simple o una secuencia peptídica de poliarginina. Véanse, por ejemplo, los documentos WO 2014/089290 y WO 2013/176772. El dominio de penetración celular puede ubicarse en el extremo N, el extremo C o en cualquier lugar dentro de la proteína Cas.
Las proteínas cas también pueden unirse operativamente a un polipéptido heterólogo para facilitar el seguimiento o la purificación, tal como una proteína fluorescente, una etiqueta de purificación o una etiqueta de epítopo. Los ejemplos de proteínas fluorescentes incluyen proteínas verdes fluorescentes (por ejemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami verde, Azami verde monomérico, CopGFP, AceGFP, ZsGreenl), proteínas fluorescentes amarillas (por ejemplo, YFP, eYFP, Citrina, Venus, YPet, PhiYFP, ZsYellowl), proteínas fluorescentes azules (por ejemplo, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), proteínas fluorescentes cian (por ejemplo, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes rojas (por ejemplo, mKate, mKate2, mPlum, monómero de DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, monómero de DsRed, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), proteínas fluorescentes naranjas (por ejemplo, mOrange, mKO, Kusabira-Naranja, Kusabira-naranja monomérico, mTangerine, tdTomato) y cualquier otra proteína fluorescente adecuada. Los ejemplos de etiquetas incluyen glutatión-S-transferasa (GST), proteína de unión a quitina (CBP), proteína de unión a maltosa, tiorredoxina (TRX), poli(NANP), etiqueta de purificación por afinidad en tándem (TAP, por sus siglas en inglés), myc, AcV5, AU1, AU5, E, ECS, E2, FL<a>G, hemaglutinina (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, histidina (His), proteína transportadora de biotina carboxilo (BCCP) y calmodulina.
Las proteínas Cas se pueden proporcionar en cualquier forma. Por ejemplo, una proteína Cas se puede proporcionar en forma de una proteína. Por ejemplo, se puede proporcionar una proteína Cas como una proteína Cas en complejo con un ARNg. De manera alternativa, una proteína Cas se puede proporcionar en forma de un ácido nucleico que codifica la proteína Cas, tal como un ARN (por ejemplo, ARN mensajero (ARNm)) o ADN. Opcionalmente, el ácido nucleico que codifica la proteína Cas puede tener codones optimizados para una traducción eficaz en proteína en una célula u organismo particular. Por ejemplo, el ácido nucleico que codifica la proteína Cas puede modificarse para sustituir codones que tengan una mayor frecuencia de uso en una célula bacteriana, una célula de levadura, una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata o cualquier otra célula hospedadora de interés, en comparación con la secuencia polinucleotídica de origen natural. Por ejemplo, el ácido nucleico que codifica la proteína Cas puede optimizarse mediante codones para su expresión en una célula humana. Cuando se introduce en la célula un ácido nucleico que codifica la proteína Cas, la proteína Cas puede expresarse de forma transitoria, condicional o constitutiva en la célula.
Las proteínas Cas proporcionadas como ARNm pueden modificarse para mejorar la estabilidad y/o las propiedades de inmunogenicidad. Las modificaciones pueden realizarse en uno o más nucleósidos dentro del ARNm. Los ejemplos de modificaciones químicas de las nucleobases de ARNm incluyen pseudouridina, 1-metil-pseudouridina y 5-metilcitidina. Por ejemplo, se puede utilizar ARNm de Cas poliadenilado y protegido que contiene N1-metil pseudouridina. Igualmente, los ARNm de Cas pueden modificarse mediante empobrecimiento en uridina utilizando codones sinónimos.
Los ácidos nucleicos que codifican proteínas Cas pueden integrarse de manera estable en el genoma de la célula y unirse operativamente a un promotor activo en la célula. En un ejemplo específico, el ácido nucleico que codifica la proteína Cas puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 22 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 22, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 21. En otro ejemplo específico, el ácido nucleico que codifica una proteína Cas quimérica que comprende una proteína Cas inactiva para nucleasa y uno o más dominios de activación transcripcional puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 38 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 38, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 36. De manera alternativa, los ácidos nucleicos que codifican las proteínas Cas pueden estar unidos operativamente a un promotor en una construcción de expresión. Las construcciones de expresión incluyen cualquier construcción de ácido nucleico capaz de dirigir la expresión de un gen u otra secuencia de un ácido nucleico de interés (por ejemplo, un gen Cas) y que puede transferir dicha secuencia de un ácido nucleico de interés a una célula diana. Los promotores que pueden usarse en una construcción de expresión incluyen promotores activos, por ejemplo, en una o más de una célula eucariota, una célula humana, una célula no humana, una célula de mamífero, una célula de mamífero no humano, una célula de roedor, una célula de ratón, una célula de rata, una célula pluripotencial, una célula madre embrionaria (ME), una célula madre adulta, una célula progenitora de desarrollo restringido, una célula madre pluripotencial inducida (MPi) o un embrión en fase de una sola célula. Dichos promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos o promotores específicos de tejido.
3. Proteínas adaptadoras quiméricas
Las células biosensoras SAM/tau divulgadas en el presente documento pueden comprender no solo ácidos nucleicos (ADN o ARN) que codifican una proteína Cas quimérica que comprende una proteína Cas inactiva de nucleasa fusionada a uno o más dominios de activación transcripcional (por ejemplo, VP64), sino opcionalmente también ácidos nucleicos (ADN o ARN) que codifica una proteína adaptadora quimérica que comprende una proteína adaptadora (por ejemplo, proteína de la cubierta MS2 (MCP)) fusionada a uno o más dominios de activación transcripcional (por ejemplo, fusionada a p65 y HSF1). Opcionalmente, la proteína Cas quimérica y/o la proteína adaptadora quimérica se expresan de manera estable. Opcionalmente, las células comprenden una secuencia de codificación de proteína Cas quimérica integrada genómicamente y/o una secuencia de codificación de proteína adaptadora quimérica integrada genómicamente.
Dichas proteínas adaptadoras quiméricas comprenden: (a) un adaptador (es decir, dominio adaptador o proteína adaptadora) que se une específicamente a un elemento de unión al adaptador dentro de un ARN guía; y (b) uno o más dominios de activación transcripcional heterólogos. Por ejemplo, dichas proteínas de fusión pueden comprender 1,2, 3, 4, 5 o más dominios de activación transcripcional (por ejemplo, dos o más dominios de activación transcripcional heterólogos o tres o más dominios de activación transcripcional heterólogos). En un ejemplo, dichas proteínas adaptadoras quiméricas pueden comprender: (a) un adaptador (es decir, un dominio adaptador o proteína adaptadora) que se une específicamente a un elemento de unión al adaptador en un ARN guía; y (b) dos o más dominios de activación transcripcional. Por ejemplo, la proteína adaptadora quimérica puede comprender: (a) un adaptador de la proteína de la cubierta de MS2 que se une específicamente a uno o más aptámeros de MS2 en un ARN guía (por ejemplo, dos aptámeros de MS2 en ubicaciones separadas en un ARN guía); y (b) uno o más (por ejemplo, dos o más dominios de activación transcripcional). Por ejemplo, los dos dominios de activación transcripcional pueden ser dominios de activación transcripcional p65 y HSF1 o fragmentos funcionales o variantes de los mismos. Sin embargo, también se proporcionan proteínas adaptadoras quiméricas en las que los dominios de activación transcripcional comprenden otros dominios de activación transcripcional o fragmentos funcionales o variantes de los mismos.
Los uno o más dominios de activación transcripcional pueden fusionarse directamente al adaptador. De manera alternativa, el uno o más dominios de activación transcripcional pueden unirse al adaptador mediante un conector o una combinación de conectores o mediante uno o más dominios adicionales. Igualmente, si dos o más dominios de activación transcripcional están presentes, se pueden fusionar directamente entre sí o se pueden unir entre sí mediante un conector o una combinación de conectores o mediante uno o más dominios adicionales. Los conectores que pueden usarse en estas proteínas de fusión pueden incluir cualquier secuencia que no interfiera con la función de las proteínas de fusión. Los conectores de ejemplo son cortos (por ejemplo, de 2-20 aminoácidos) y típicamente son flexibles (por ejemplo, comprenden aminoácidos con un alto grado de libertad tales como glicina, alanina y serina.
El uno o más dominios de activación transcripcional y el adaptador pueden estar en cualquier orden dentro de la proteína adaptadora quimérica. Como opción, el uno o más dominios de activación transcripcional pueden estar en el extremo C con respecto al adaptador y el adaptador puede estar en el extremo N con respecto a uno o más dominios de activación transcripcional. Por ejemplo, el uno o más dominios de activación transcripcional pueden estar en el extremo C de la proteína adaptadora quimérica y el adaptador puede estar en el extremo N de la proteína adaptadora quimérica. Sin embargo, el uno o más dominios de activación transcripcional pueden estar en el extremo C con respecto al adaptador sin estar en el extremo C de la proteína adaptadora quimérica (por ejemplo, si una señal de localización nuclear está en el extremo C de la proteína adaptadora quimérica). Igualmente, el adaptador puede estar en el extremo N con respecto al uno o más dominios de activación transcripcional sin estar en el extremo N de la proteína adaptadora quimérica (por ejemplo, si una señal de localización nuclear está en el extremo N de la proteína adaptadora quimérica). Como otra opción, el uno o más dominios de activación transcripcional pueden estar en el extremo N con respecto al adaptador y el adaptador puede estar en el extremo C con respecto al uno o más dominios de activación transcripcional. Por ejemplo, el uno o más dominios de activación transcripcional pueden estar en el extremo N de la proteína adaptadora quimérica y el adaptador puede estar en el extremo C de la proteína adaptadora quimérica. Como otra opción más, si la proteína adaptadora quimérica comprende dos o más dominios de activación transcripcional, los dos o más dominios de activación transcripcional pueden flanquear al adaptador.
Las proteínas adaptadoras quiméricas también pueden unirse o fusionarse operativamente a polipéptidos heterólogos adicionales. El polipéptido heterólogo fusionado o unido se puede localizar en el extremo N, el extremo C o en cualquier lugar interno dentro de la proteína adaptadora quimérica. Por ejemplo, una proteína adaptadora quimérica puede comprender además una señal de localización nuclear. Un ejemplo específico de dicha proteína comprende una proteína de la cubierta MS2 (adaptador) unida (ya sea directamente o mediante un NLS) a un dominio de activación transcripcional p65 en el extremo C a la proteína de la cubierta MS2 (MCP), y un dominio de activación transcripcional en el extremo C HSF1 al dominio de activación transcripcional p65. Una proteína de este tipo puede comprender desde el extremo N hasta el extremo C: una MCP; una señal de localización nuclear; un dominio de activación transcripcional de p65; y un dominio de activación transcripcional HSF1. Por ejemplo, una proteína adaptadora quimérica puede comprender, consistir esencialmente en o consistir en una secuencia de aminoácidos que es al menos un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % idéntica a la secuencia de al proteína adaptadora quimérica MCP-p65-HSF1 expuesta en la SEQ ID NO: 37. Igualmente, un ácido nucleico que codifica una proteína adaptadora quimérica puede comprender, consistir esencialmente en o consistir en una secuencia al menos un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98%, un 99% o un 100% idéntica a la secuencia de codificación de la proteína adaptadora quimérica MCP-p65-HSF1 expuesta en la SEQ ID NO: 39
Los adaptadores (es decir, dominios adaptadores o proteínas adaptadoras) son dominios de unión a ácidos nucleicos (por ejemplo, dominios de unión a ADN y/o dominios de unión a ARN) que reconocen y se unen específicamente a secuencias distintas (por ejemplo, se unen a distintas secuencias de ADN y/o ARN tales como aptámeros de manera específica de secuencia). Los aptámeros incluyen ácidos nucleicos que, a través de su capacidad para adoptar una conformación tridimensional específica, pueden unirse a una molécula diana con alta afinidad y especificidad. Estos adaptadores pueden unirse, por ejemplo, a una secuencia de ARN específica y a una estructura secundaria. Estas secuencias (es decir, elementos de unión al adaptador) se pueden diseñar en un ARN guía. Por ejemplo, se puede diseñar un aptámero de MS2 en un ARN guía para unirse específicamente a una proteína de la cubierta de MS2 (MCP). Por ejemplo, el adaptador puede comprender, consistir esencialmente en o consistir en una secuencia de aminoácidos que es al menos un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % idéntica a la secuencia de MCP expuesta en la SEQ ID NO: 40. Igualmente, un ácido nucleico que codifica el adaptador puede comprender, consistir esencialmente en o consistir en una secuencia de aminoácidos que es al menos un 85 %, un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 %, un 99 % o un 100 % idéntica a la secuencia de codificación de MCP expuesta en la SEQ ID NO: 41. Los ejemplos específicos de adaptadores y dianas incluyen, por ejemplo, combinaciones de proteína de unión a ARN/aptámero que existen dentro de la diversidad de proteínas de la cubierta de bacteriófagos. Véanse, por ejemplo, los documentos US 2019/0284572 y WO 2019/183123.
Las proteínas adaptadoras quiméricas divulgadas en el presente documento comprenden uno o más dominios de activación transcripcional. Dichos dominios de activación transcripcional pueden ser dominios de activación transcripcional de origen natural, pueden ser fragmentos funcionales o variantes funcionales de dominios de activación transcripcional de origen natural o pueden ser dominios de activación transcripcional sintéticos o diseñados. Los dominios de activación transcripcional que pueden usarse incluyen los descritos, por ejemplo, en los documentos US 2019/0284572 y WO 2019/183123.
4. Tipos de células
Las células biosensoras Cas/tau divulgadas en el presente documento pueden ser cualquier tipo de célula de mamífero y pueden serin vitro, ex vivooin vivo.Una línea celular o población de células biosensora Cas/tau puede ser una línea celular o población de células monoclonales. Igualmente, las células biosensoras SAM/tau divulgadas en el presente documento pueden ser cualquier tipo de célula de mamífero y pueden serin vitro, ex vivooin vivo.Una línea celular o población de células biosensoras SAM/tau puede ser una línea celular o población de células monoclonales. La celda puede ser de cualquier fuente. Por ejemplo, dichas células pueden ser células humanas, células de mamífero no humano, células de roedores, células de ratón o células de rata. Los mamíferos incluyen, por ejemplo, seres humanos, primates no humanos, monos, simios, gatos, perros, caballos, toros, ciervos, bisontes, oveja, roedores (por ejemplo, ratones, ratas, hámsteres, cobayas), ganado (por ejemplo, especies bovinas como vacas y novillos; especies ovinas tales como ovejas y cabras; y especies porcinas tales como cerdos y jabalíes). También se incluyen animales domesticados y animales agrícolas. La expresión "animal no humano" excluye a los humanos. En un ejemplo específico, las células biosensoras Cas/tau son células humanas (por ejemplo, células HEK293T). Igualmente, en un ejemplo específico, las células biosensoras SAM/tau son células humanas (por ejemplo, células HEK293T).
La célula puede ser, por ejemplo, una célula totipotencial no humana o una célula pluripotencial (por ejemplo, una célula madre embrionaria (ME) tal como una célula ME de roedor, una célula ME de ratón es una célula ME de rata. Las células totipotenciales no humanas incluyen células indiferenciadas que pueden dar lugar a cualquier tipo de célula, y las células pluripotentes incluyen células indiferenciadas que poseen la capacidad de desarrollarse en más de un tipo de célula diferenciada. Tales células pluripotenciales y/o totipotenciales pueden ser, por ejemplo, células ME o células similares a ME, tales como células madre pluripotenciales inducidas (MPi). Las células ME incluyen células totipotenciales o pluripotenciales derivadas de embriones que son capaces de contribuir a cualquier tejido del embrión en desarrollo tras su introducción en un embrión. Solo como referencia, las células ME pueden proceder de la masa celular interna de un blastocisto y son capaces de diferenciarse en células de cualquiera de las tres capas germinales de los vertebrados (endodermo, ectodermo y mesodermo).
Las células también pueden ser células somáticas primarias o células que no son una célula somática primaria. Las células somáticas pueden incluir cualquier célula que no sea un gameto, célula germinal, gametocito o célula madre indiferenciada. La célula también puede ser una célula primaria. Las células primarias incluyen células o cultivos de células que se han aislado directamente de un organismo, órgano o tejido. Las células primarias incluyen células que no están transformadas ni son inmortales. Incluyen cualquier célula obtenida de un organismo, órgano o tejido que no se ha sometido a pases previos en cultivo tisular o que se ha sometido a pases previos en cultivo tisular pero no puede someterse a pases previos de manera indefinida en cultivo tisular. Dichas células pueden aislarse mediante técnicas convencionales e incluyen, por ejemplo, células somáticas, células hematopoyéticas, células endoteliales, células epiteliales, fibroblastos, células mesenquimatosas, queratinocitos, melanocitos, monocitos, células mononucleares, adipocitos, preadipocitos, neuronas, células gliales, hepatocitos, mioblastos esqueléticos y células de músculo liso. Por ejemplo, las células primarias pueden derivarse de tejidos conjuntivos, tejidos musculares, tejidos del sistema nervioso o tejidos epiteliales.
Estas células también incluyen las que normalmente no proliferarían indefinidamente pero, debido a una mutación o alteración, han evadido la senescencia celular normal y pueden seguir experimentando división. Estas mutaciones o alteraciones pueden producirse de forma natural o ser inducidas de manera intencionada. Los ejemplos de células inmortalizadas incluyen células de ovario de hámster chino (CHO), células de riñón embrionario humano (por ejemplo, células HEK293T) y células de fibroblastos embrionarios de ratón (por ejemplo, células 3T3). Son bien conocidos numerosos tipos de células inmortalizadas. Las células inmortalizadas o primarias incluyen células que normalmente se usan para cultivar o para expresar genes o proteínas recombinantes.
La célula también puede ser una célula diferenciada, tal como una célula neuronal (por ejemplo, una célula neuronal humana).
B. Métodos para generar células biosensoras Cas/Tau y células biosensoras SAM/Tau
Las células biosensoras Cas/tau descritas en el presente documento pueden generarse mediante cualquier medio conocido. El primer dominio de repetición de tau unido al primer indicador, el segundo dominio de repetición de tau unido al segundo indicador y la proteína Cas pueden introducirse en la célula de cualquier forma (por ejemplo, ADN, ARN o proteína) por cualquier medio conocido. Igualmente, las células biosensoras SAM/tau divulgadas en el presente documento pueden generarse mediante cualquier medio conocido. El primer dominio de repetición de tau unido al primer indicador, el segundo dominio de repetición de tau unido al segundo indicador, la proteína Cas quimérica y la proteína adaptadora quimérica se pueden introducir en la célula en cualquier forma (por ejemplo, ADN, ARN o proteína) por cualquier medio conocido. "Introducir" significa presentar a la célula el ácido nucleico o proteína de tal manera que la secuencia acceda al interior de la célula. Los métodos proporcionados en el presente documento no dependen de un método particular para introducir un ácido nucleico o una proteína en la célula, sólo que el ácido nucleico o la proteína accedan al interior de al menos una célula. Se conocen métodos para introducir ácidos nucleicos y proteínas en diversos tipos de células e incluyen, por ejemplo, métodos de transfección estable, métodos de transfección transitoria y métodos mediados por virus. Opcionalmente, se pueden utilizar vectores dirigidos.
Los protocolos de transfección así como los protocolos para introducir ácidos nucleicos o proteínas en las células pueden variar. Los métodos de transfección no limitativos incluyen métodos de transfección basados en química que utilizan liposomas; nanopartículas; fosfato cálcico (Graham et al. (1973) Virology 52 (2): 456-67, Bacchettiet al.(1977) Proc. Natl. Acad. Sci. u Sa 74 (4): 1590-4 y Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. Nueva York: W. H. Freeman and Company, págs. 96-97); dendrímeros; o polímeros catiónicos tales como DEAE dextrano o polietilenimina. Los métodos no químicos incluyen electroporación, sonoporación y transfección óptica. La transfección basada en partículas incluye el uso de una pistola genética o transfección asistida por imán (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). También se pueden usar métodos virales para la transfección.
La introducción de ácidos nucleicos o proteínas en una célula también puede estar mediada por electroporación, por inyección intracitoplasmática, por infección vírica, por adenovirus, por virus adenoasociado, por lentivirus, por retrovirus, por transfección, por transfección mediada por lípidos o por nucleofección. La nucleofección es una tecnología de electroporación mejorada que permite que los sustratos de ácidos nucleicos se suministren no solo al citoplasma sino también a través de la membrana nuclear y al núcleo. Adicionalmente, el uso de nucleofección en los métodos divulgados en el presente documento normalmente requiere muchas menos células que la electroporación regular (por ejemplo, sólo aproximadamente 2 millones en comparación con 7 millones mediante electroporación regular). En un ejemplo, la nucleofección se realiza utilizando el sistema LONZA® NUCLEOFECTOR™.
La introducción de ácidos nucleicos o proteínas en una célula también se puede lograr mediante microinyección. La microinyección de un ARNm se realiza preferentemente en el citoplasma (por ejemplo, para suministrar el ARNm directamente en la maquinaria de traducción), mientras que la microinyección de una proteína o de un ADN que codifica una proteína se realiza, preferentemente, en el núcleo. De manera alternativa, la microinyección se puede realizar mediante inyección tanto en el núcleo como en el citoplasma: primero se puede introducir una aguja en el núcleo y se puede inyectar una primera cantidad, y mientras se retira la aguja de la célula se puede inyectar una segunda cantidad en el citoplasma. Los métodos para llevar a cabo la microinyección son bien conocidos. Véase, por ejemplo, Nagyet al.(Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press); Meyeret al.(2010) Proc. Natl. Acad. Sci. USA 107:15022-15026 y Meyeret al.(2012) Proc. Natl. Acad. Sci. USA 109:9354-9359.
Otros métodos para introducir ácido nucleico o proteínas en una célula pueden incluir, por ejemplo, liberación por vectores, liberación mediada por partículas, liberación mediada por exosomas, liberación mediada por nanopartículas lipídicas, liberación mediada por péptidos que penetran en las células o liberación mediada por dispositivo implantable. Métodos de administración de ácidos nucleicos o proteínas a un sujeto para modificar célulasin vivose divulgan en otra parte del presente documento.
En un ejemplo, el primer dominio de repetición de tau unido al primer indicador, el segundo dominio de repetición de tau está unido al segundo indicador y la proteína Cas puede introducirse mediante transducción viral, tal como transducción lentiviral.
El cribado de células que comprenden el primer dominio de repetición de tau unido al primer indicador, el segundo dominio de repetición de tau unido al segundo indicador y la proteína Cas se puede realizar por cualquier medio conocido.
Como ejemplo, los genes indicadores se pueden utilizar para cribar células que tienen la proteína Cas, el primer dominio de repetición de tau unido al primer indicador o el segundo dominio de repetición de tau unido al segundo indicador. Los genes indicadores fluorescentes de ejemplo incluyen aquellos que codifican proteína fluorescente verde (GFP), proteína fluorescente verde mejorada (EGFP), proteína fluorescente cian (CFP), proteína fluorescente amarilla (YFP), proteína fluorescente amarilla mejorada (EYFP), proteína fluorescente azul (BFP), proteína fluorescente azul mejorada (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Red, mOrange, mKO, mCitrina, Venus, YPet, Emerald, CyPet, Cerulean y T-Sapphire. Dado que el primer indicador y el segundo indicador son proteínas fluorescentes (por ejemplo, CFP e YFP), las células que comprenden estos indicadores se pueden seleccionar mediante citometría de flujo para seleccionar células doblemente positivas. Las células doblemente positivas se pueden combinar luego para generar una línea policlonal o se pueden generar líneas monoclonales a partir de células únicas doblemente positivas.
Como ejemplo adicional, los marcadores de selección se pueden utilizar para cribar células que tienen la proteína Cas, el primer dominio de repetición de tau unido al primer indicador o el segundo dominio de repetición de tau unido al segundo indicador. Dichos marcadores de selección de ejemplo incluyen neomicina fosfotransferasa (neor), higromicina B fosfotransferasa (hygr), puromicina-N-acetiltransferasa (purcf), blasticidina S desaminasa (bsrr), xantina/guanina fosforribosil transferasa (gpt) o timidina quinasa del virus del herpes simple (HSV-k). Otro marcador de selección de ejemplo es la proteína de resistencia a bleomicina, codificada por el genSh ble(gen de bleomicina deStreptoalloteichus hindustanus),que confiere resistencia a zeocina (fleomicina D1).
Se pueden generar células de agregación positiva (Ag.[+]) en las que el dominio de repetición de tau se presenta de manera estable en un estado agregado, lo que significa que los agregados del dominio de repetición de tau persisten de manera estable en todas las células con crecimiento y múltiples pases a lo largo del tiempo, por ejemplo, sembrando con agregados de tau. Por ejemplo, las células biosensoras Cas/tau con agregación negativa (Ag.[-]) ingenuas descritas en el presente documento se pueden tratar con tau fibrilada recombinante (por ejemplo, dominio de repetición de tau fibrilada recombinante) para sembrar la agregación de la proteína del dominio de repetición de tau expresada de manera estable por estas células. Igualmente, las células biosensoras SAM/tau con agregación negativa (Ag.[-]) ingenuas descritas en el presente documento se pueden tratar con tau fibrilada recombinante (por ejemplo, dominio de repetición de tau fibrilada recombinante) para sembrar la agregación de la proteína del dominio de repetición de tau expresada de manera estable por estas células. El dominio de repetición de tau fibrilado puede ser el mismo, similar o diferente del dominio de repetición de tau expresado establemente por las células. Opcionalmente, la tau fibrilada recombinante se puede mezclar con reactivo de lipofectamina. Luego, las células sembradas se pueden diluir en serie para obtener clones derivados de células individuales y para identificar líneas celulares clonales en las que los agregados del dominio de repetición de tau persisten de manera estable en todas las células con crecimiento y múltiples pases a lo largo del tiempo.
III. Bibliotecas defectivas de ARN guía
Los métodos de cribado CRISPRn divulgados en el presente documento utilizan bibliotecas defectivas en ARN guía (ARNg) CRISPR como bibliotecas defectivas en ARNg de todo el genoma. Las nucleasas Cas, tales como Cas9, se pueden programar para inducir roturas de doble cadena en loci genómicos específicos a través de ARNg diseñados para apuntar a secuencias diana específicas. Debido a que la especificidad de direccionamiento de las proteínas Cas la confieren los ARNg cortos, es posible realizar un cribado funcional combinado a escala del genoma. Estas bibliotecas tienen varias ventajas sobre bibliotecas como las bibliotecas de ARNhs, que reducen la expresión de proteínas al dirigirse al ARNm. En contraste, las bibliotecas de ARNg logran la eliminación mediante mutaciones de cambio de marco introducidas en regiones de codificación genómicas de los genes.
Los métodos de cribado CRISPRa divulgados en el presente documento utilizan bibliotecas de activación transcripcional de ARN guía CRISPR (ARNg), como bibliotecas de activación transcripcional de ARNg de todo el genoma. Los sistemas SAM se pueden programar para activar la transcripción de genes en loci genómicos específicos a través de ARNg diseñados para dirigirse a secuencias diana específicas. Debido a que la especificidad de direccionamiento de las proteínas Cas la confieren los ARNg cortos, es posible realizar un cribado funcional combinado a escala del genoma.
Los ARNg de una biblioteca pueden apuntar a cualquier número de genes. Por ejemplo, los ARNg pueden apuntar a aproximadamente 50 o más genes, aproximadamente 100 o más genes, aproximadamente 200 o más genes, aproximadamente 300 o más genes, aproximadamente 400 o más genes, aproximadamente 500 o más genes, aproximadamente 1000 o más genes, aproximadamente 2000 o más genes, aproximadamente 3000 o más genes, aproximadamente 4000 o más genes, aproximadamente 5000 o más genes, aproximadamente 10.000 o más genes o aproximadamente 20.000 o más genes. En algunas bibliotecas, los ARNg se pueden seleccionar para apuntar a genes en una vía de señalización particular. Algunas bibliotecas son bibliotecas de todo el genoma.
Las bibliotecas de todo el genoma incluyen uno o más ARNg (por ejemplo, ARNgu) dirigidos a cada gen del genoma. El genoma al que se dirige puede ser cualquier tipo de genoma. Por ejemplo, el genoma puede ser un genoma eucariota, un genoma de mamífero, un genoma de mamífero no humano, un genoma de roedor, un genoma de ratón, un genoma de rata o un genoma humano. En un ejemplo, el genoma objetivo es un genoma humano.
Los ARNg pueden apuntar a cualquier número de secuencias dentro de cada gen diana individual. En algunas bibliotecas, una pluralidad de secuencias diana se dirigen en promedio en cada uno de la pluralidad de genes diana. Por ejemplo, de aproximadamente 2 a aproximadamente 10, de aproximadamente 2 a aproximadamente 9, de aproximadamente 2 a aproximadamente 8, de aproximadamente 2 a aproximadamente 7, de aproximadamente 2 a aproximadamente 6, de aproximadamente 2 a aproximadamente 5, de aproximadamente 2 a aproximadamente 4 o de aproximadamente 2 a aproximadamente 3 secuencias diana únicas pueden dirigirse en promedio en cada uno de la pluralidad de genes diana. Por ejemplo, al menos aproximadamente 2, al menos aproximadamente 3, al menos aproximadamente 4, al menos aproximadamente 5 o al menos aproximadamente 6 secuencias diana únicas pueden dirigirse en promedio en cada uno de la pluralidad de genes diana. Como ejemplo específico, se pueden dirigir aproximadamente 6 secuencias diana en promedio en cada una de la pluralidad de genes diana. Como otro ejemplo específico, de aproximadamente 3 a aproximadamente 6 o de aproximadamente 4 a aproximadamente 6 secuencias diana están dirigidas en promedio en cada uno de la pluralidad de genes diana.
Por ejemplo, las bibliotecas pueden apuntar a genes con una cobertura promedio de aproximadamente 1, aproximadamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproximadamente 9 o aproximadamente 10 ARNg por gen. En un ejemplo específico, una biblioteca puede apuntar a genes con una cobertura promedio de aproximadamente 3-4 ARNg por gen o aproximadamente 6 ARNg por gen.
Los ARNg pueden apuntar a cualquier ubicación deseada en los genes diana. Los ARNg de CRISPRn se pueden diseñar para apuntar a regiones de codificación de genes de modo que la escisión por la proteína Cas correspondiente dé como resultado mutaciones de inserción/deleción (indel) de desplazamiento del marco de lectura que resultan en un alelo de pérdida de función. Más específicamente, las mutaciones de desplazamiento de marco se pueden lograr mediante roturas específicas de la doble cadena del ADN y la posterior reparación mutagénica a través de la vía de unión de extremos no homólogos (NHEJ), que produce indeles en el sitio de rotura. El indel que se introduce en el DSB es aleatorio, y algunos indeles conducen a mutaciones de desplazamiento de marco que provocan la terminación prematura del gen.
En algunas bibliotecas CRISPRn, cada ARNg se dirige a un exón constitutivo si es posible. En algunas bibliotecas CRISPRn, cada ARNg se dirige a un exón constitutivo en 5' si es posible. En algunos métodos, cada ARNg se dirige a un primer exón, un segundo exón o un tercer exón (desde el extremo 5' del gen), si es posible.
Como ejemplo, los ARNg de la biblioteca CRISPRn se pueden dirigir a exones constitutivos. Los exones constitutivos son exones que se conservan consistentemente después del corte y empalme. Los exones expresados en todos los tejidos pueden considerarse exones constitutivos para la orientación al ARNg. Los ARNg de la biblioteca pueden apuntar a exones constitutivos cerca del extremo 5' de cada gen. Opcionalmente, el primer y el último exón de cada gen pueden excluirse como dianas potenciales. Opcionalmente, cualquier exón que contenga un sitio de corte y empalme alternativo puede excluirse como diana potencial. Opcionalmente, los dos primeros exones que cumplen los criterios anteriores se seleccionan como dianas potenciales. Opcionalmente, los exones 2 y 3 se seleccionan como dianas potenciales (por ejemplo, si no se identifican exones constitutivos). Adicionalmente, los ARNg de la biblioteca se pueden seleccionar y diseñar para minimizar los efectos no deseados.
En un ejemplo específico, la biblioteca o bibliotecas de ARNg CRISPRn de todo el genoma comprenden ARNgu dirigidos a exones constitutivos en 5' de > 18.000 genes en el genoma humano con una cobertura promedio de ~6 ARNgu por gen, con cada sitio diana seleccionado para minimizar modificaciones fuera de la diana.
Los ARNg de CRISPRa se pueden diseñar para apuntar a secuencias adyacentes al sitio de iniciación de la transcripción de un gen. Por ejemplo, la secuencia diana puede estar dentro de 1000, 900, 800, 700, 600, 500, 400, 300, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5 o 1 par de bases del sitio de iniciación de la transcripción. Por ejemplo, cada ARNg de la biblioteca CRISPRa puede apuntar a una secuencia dentro de 200 pb aguas arriba de un sitio de iniciación de la transcripción. Opcionalmente, la secuencia diana está dentro de la región de 200 pares de bases aguas arriba del sitio de iniciación de la transcripción y 1 par de bases aguas abajo del sitio de iniciación de la transcripción (-200 a 1).
Los ARNg de la biblioteca de todo el genoma pueden tener cualquier forma. Por ejemplo, la biblioteca de ARNg se puede empaquetar en un vector viral, tal como vectores retrovirales, vectores lentivirales o vectores adenovirales. En un ejemplo específico, la biblioteca de ARNg está empaquetada en vectores lentivirales. Los vectores pueden comprender además genes indicadores o marcadores de selección para facilitar la selección de células que reciben los vectores. Los ejemplos de dichos genes indicadores y marcadores de selección se divulgan en otra parte del presente documento. Como ejemplo, el marcador de selección puede ser uno que imparta resistencia a un fármaco, tal como neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa y blasticidina S desaminasa. Otro marcador de selección de ejemplo es la proteína de resistencia a bleomicina, codificada por el genSh ble(gen de bleomicina deStreptoalloteichus hindustanus),que confiere resistencia a zeocina (fleomicina D1). Por ejemplo, las células se pueden seleccionar con un fármaco (por ejemplo, puromicina) de modo que sólo las células transducidas con una construcción de ARN guía se conserven para su uso en la realización del cribado.
A. ARN guía
Un "ARN guía" o "ARNg" es una molécula de ARN que se une a una proteína Cas (por ejemplo, proteína Cas9) y dirige la proteína Cas a una ubicación específica dentro de un ADN diana. Los ARN guía pueden comprender dos segmentos: un "segmento de direccionamiento al ADN" y un "segmento de unión a proteínas". "Segmento" incluye una sección o región de una molécula, tal como un tramo contiguo de nucleótidos en un ARN. Algunos ARNg, tales como los de Cas9, pueden comprender dos moléculas de ARN separadas: un "ARN activador" (por ejemplo, ARNtracr) y un "ARN direccionador" (por ejemplo, ARN CRISPR o ARNcr). Otros ARNg son una única molécula de ARN (polinucleótido de ARN único), y también se pueden denominar "ARNg de una sola molécula", "ARN de guía única", o "ARNgu". Véase, por ejemplo, el documento WO 2013/176772, el documento WO 2014/065596, el documento WO 2014/089290, el documento WO 2014/093622, el documento WO 2014/099750, WO 2013/142578 y WO 2014/131833. Para Cas9, por ejemplo, un ARN de guía único puede comprender un ARNcr fusionado a un ARNtracr (por ejemplo, a través de un conector). Para Cpfl, por ejemplo, sólo se necesita un ARNcr para lograr la unión a una secuencia diana. Los términos "ARN guía" y "ARNg" incluyen tanto ARNg de doble molécula (es decir, modulares) como ARNg de una sola molécula.
Un ARNg de dos moléculas ilustrativo comprende una molécula similar a ARNcr ("ARN CRISPR" o "ARN direccionador" o "ARNcr" o "repetición de ARNcr") y una molécula correspondiente similar a ARNtracr ("ARN CRISPR de acción trans" o "ARN activador") o "ARNtracr"). Un ARNcr comprende tanto el segmento dirigido al ADN (monocatenario) del ARNg como un tramo de nucleótidos que forma la mitad del dúplex de ARNbc del segmento de unión a proteínas del ARNg. Un ejemplo de una cola de ARNcr, ubicada cadena abajo (3') del segmento di direccionamiento al ADN, comprende, consiste esencialmente en o consiste en GUUUUAGAGCUAUGCU (SEQ ID NO: 23). Cualquiera de los segmentos de direccionamiento al ADN divulgados en el presente documento se puede unir al extremo 5' de SEQ ID NO: 23 para formar un ARNcr.
Un ARNtracr correspondiente (ARN activador) comprende un tramo de nucleótidos que forma la otra mitad del dúplex de ARNbc del segmento de unión a proteínas del ARNg. Un tramo de nucleótidos de un ARNcr es complementario e hibrida con un tramo de nucleótidos de un ARNtracr para formar el dúplex de ARNbc del dominio de unión a proteínas del ARNg. Como tal, se puede decir que cada ARNcr tiene un ARNtracr correspondiente. Un ejemplo de una secuencia de ARNtracr comprende, consiste esencialmente en o consiste en AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACC GAGUCGGUGCUUU (SEQ ID NO: 24). Otros ejemplos de secuencias de ARNtracr comprenden, consisten esencialmente en, o consisten en cualquiera de AAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGG CACCGAGUCGGUGCUUUU (SEQ ID NO: 28),
o
GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA ACUU GA A A A AGU GGC AC C GAGU C GGU GC (SEQ ID NO: 29).
En sistemas en los que se necesitan tanto un ARNcr como un ARNtracr, el ARNcr y el ARNtracr correspondiente hibridan para formar un ARNg. En sistemas en los que solo se necesita un ARNcr, el ARNcr puede ser el ARNg. El ARNcr proporciona además el segmento dirigido al ADN monocatenario que hibrida con la hebra complementaria de un ADN diana. Si se usa para modificación dentro de una célula, la secuencia exacta de una determinada molécula de ARNcr o ARNtracr puede diseñarse para que sea específica de las especies en las que se utilizarán las moléculas de ARN. Véase, por ejemplo, Maliet al.(2013) Science 339:823-826; Jineket al.(2012) Science 337:816-821; Hwanget al.(2013) Nat. Biotechnol. 31:227-229; Jianget al.(2013) Nat. Biotechnol. 31:233-239; y Conget al.(2013) Science 339:819-823.
El segmento dirigido al ADN (ARNcr) de un ARNg determinado comprende una secuencia de nucleótidos que es complementaria a una secuencia de la hebra complementaria del ADN diana, como se describe con más detalle a continuación. El segmento dirigido al ADN de un ARNg interactúa con un ADN diana de una manera específica de secuencia mediante hibridación (es decir, apareamiento de bases). Como tal, la secuencia de nucleótidos del segmento de direccionamiento al ADN puede variar y determina la localización dentro del ADN diana en la que el ARNg y el ADN diana interactuarán. El segmento de direccionamiento al ADN de un ARNg en cuestión se puede modificar para hibridar con cualquier secuencia deseada dentro de un ADN diana. Los ARNcr naturales difieren según el sistema CRISPR/Cas y el organismo, pero a menudo contienen un segmento de direccionamiento de entre 21 y 72 nucleótidos de longitud, flanqueado por dos repeticiones directas (RD) de una longitud de entre 21 y 46 nucleótidos (véase, por ejemplo, el documento WO 2014/131833). En el caso de S.pyogenes,los DR tienen 36 nucleótidos de longitud y el segmento de direccionamiento tiene 30 nucleótidos de longitud. El DR ubicado en 3' es complementario e hibrida con el ARNtracr correspondiente, que a su vez se une a la proteína Cas.
El segmento dirigido al ADN puede tener, por ejemplo, una longitud de al menos aproximadamente 12, 15, 17, 18, 19, 20, 25, 30, 35 o 40 nucleótidos. Estos segmentos dirigidos al ADN pueden tener, por ejemplo, una longitud de aproximadamente 12 a aproximadamente 100, de aproximadamente 12 a aproximadamente 80 , de aproximadamente 12 a aproximadamente 50, de aproximadamente 12 a aproximadamente 40, de aproximadamente 12 a aproximadamente 30, de aproximadamente 12 a aproximadamente 25 o de aproximadamente 12 a aproximadamente 20 nucleótidos. Por ejemplo, el segmento dirigido al ADN puede ser de aproximadamente 15 a aproximadamente 25 nucleótidos (por ejemplo, de aproximadamente 17 a aproximadamente 20 nucleótidos o de aproximadamente 17, 18, 19 o 20 nucleótidos). Véase, por ejemplo, el documento US 2016/0024523. Para Cas9 de S.pyogenes,un segmento de direccionamiento al ADN típico tiene entre 16 y 20 nucleótidos de longitud o entre 17 y 20 nucleótidos de longitud. Para Cas9 de S.aureus,un segmento de direccionamiento al ADN típico tiene entre 21 y 23 nucleótidos de longitud. Para Cpf1, un segmento de direccionamiento al ADN típico tiene al menos 16 nucleótidos de longitud o al menos 18 nucleótidos de longitud.
Los ARNtracr pueden estar en cualquier forma (por ejemplo, ARNtracr de longitud completa o ARNtracr parciales activos) y de longitudes variables. Pueden incluir transcritos primarios o formas procesadas. Por ejemplo, los ARNtracr (como parte de un ARN de guía única o como una molécula separada como parte de un ARNg de dos moléculas) pueden comprender, consistir esencialmente o consistir en la totalidad o un fragmento de una secuencia de ARNtracr de tipo silvestre (por ejemplo, aproximadamente o más de aproximadamente 20, 26, 32, 45, 48, 54, 63, 67, 85 o más nucleótidos de una secuencia de ARNtracr de tipo silvestre). Los ejemplos de secuencias de ARNtracr de tipo silvestre de S.pyogenesincluyen versiones de 171 nucleótidos, 89 nucleótidos, 75 nucleótidos y 65 nucleótidos. Véase, por ejemplo, Deltchevaet al.(2011) Nature 471:602-607; el documento WO 2014/093661. Los ejemplos de ARNtracr dentro de los ARN de guía únicos (ARNgu) incluyen los segmentos de ARNtracr que se encuentran dentro de las versiones de 48, 54, 67 y 85 de ARNgu, donde "+n" indica que hasta el nucleótido n de ARNtracr de tipo silvestre está incluido en el ARNgu. Véase el documento US 8697359.
El porcentaje de complementariedad entre el segmento dirigido al ADN del ARN guía y la cadena complementaria del ADN diana puede ser de al menos un 60 % (por ejemplo, al menos un 65 %, al menos un 70 %, al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, al menos un 95 %, al menos un 97 %, al menos un 98 %, al menos un 99% o un 100%). El porcentaje de complementariedad entre el segmento dirigido al ADN y la cadena complementaria del ADN diana puede ser de al menos un 60 % en aproximadamente 20 nucleótidos contiguos. Como un ejemplo, el porcentaje de complementariedad entre el segmento dirigido al ADN y la cadena complementaria del ADN diana puede ser del 100 % sobre los 14 nucleótidos contiguos en el extremo 5' de la cadena complementaria del ADN diana y tan bajo como el 0 % sobre el resto. En tal caso, se puede considerar que el segmento de direccionamiento al ADN tiene 14 nucleótidos de longitud. Como ejemplo adicional, el porcentaje de complementariedad entre el segmento dirigido al ADN y la cadena complementaria del ADN diana puede ser del 100 % sobre los siete nucleótidos contiguos en el extremo 5' de la cadena complementaria del ADN diana y tan bajo como el 0 % sobre el resto. En tal caso, se puede considerar que el segmento de direccionamiento al ADN tiene 7 nucleótidos de longitud. En algunos ARN guía, al menos 17 nucleótidos dentro del segmento dirigido al ADN son complementarios a la cadena complementaria del ADN diana. Por ejemplo, el segmento dirigido al ADN puede tener 20 nucleótidos de longitud y puede comprender 1, 2 o 3 desajustes con la cadena complementaria del ADN diana. En un ejemplo, los desajustes no son adyacentes a la región de la cadena complementaria correspondiente a la secuencia del motivo adyacente al protoespaciador (PAM) (es decir, el complemento inverso de la secuencia PAM) (por ejemplo, los desajustes están en el extremo 5' del segmento dirigido al ADN del ARN guía, o los desajustes están al menos a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 o 19 pares de bases de distancia de la región de la hebra complementaria correspondiente a la secuencia PAM).
El segmento de unión a proteínas de un ARNg puede comprender dos tramos de nucleótidos que son complementarios entre sí. Los nucleótidos complementarios del segmento de unión a proteínas hibridan para formar un dúplex de ARN bicatenario (ARNbc). El segmento de unión a proteínas de un ARNg en cuestión interactúa con una proteína Cas, y el ARNg dirige la proteína Cas unida a una secuencia de nucleótidos específica dentro del ADN diana a través del segmento de direccionamiento al ADN.
Los ARN de guía única tienen el segmento dirigido al ADN y una secuencia de armazón (es decir, la secuencia de unión a proteínas o de unión a Cas del ARN guía). Por ejemplo, dichos ARN guía pueden tener un segmento dirigido al ADN en 5' unido a una secuencia de armazón en 3'. Las secuencias de armazón ilustrativas comprenden, consisten esencialmente en o consisten en:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGA
A A A AGU GGC AC C GAGU C GGU GCU (versión 1; SEQ ID NO: 17);
GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA
ACUU GA A A A AGU GGC AC C GAGU C GGU GC (versión 2; SEQ ID NO: 18);
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGA
A A A AGU GGC AC C GAGU C GGU GC (versión 3; SEQ ID NO: 19);
y GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUU AUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (versión 4; SEQ ID NO: 20). Otras secuencias de armazón de ejemplo comprenden, consisten esencialmente en o consisten en:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGA
A A A AGU GGC AC C GAGU C GGU GCUUUUUUU (versión 5; SEQ ID NO: 30);
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGA
AAAAGUGGCACCGAGUCGGUGCUUUU (versión 6; SEQ ID NO: 31);
o
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUU
AU C A ACUU GA AA A AGU GGC AC CGAGU C GGU GCUUUUUU (versión 7; SEQ ID NO: 32).
Los ARN guía dirigidos a cualquiera de las secuencias diana de ARN guía divulgadas en el presente documento pueden incluir, por ejemplo, un segmento de direccionamiento al ADN en el extremo 5' del a Rn guía fusionado a cualquiera de las secuencias de armazón de ARN guía ilustrativas en el extremo 3' del ARN guía. Es decir, cualquiera de los segmentos dirigidos al ADN divulgados en el presente documento se puede unir al extremo 5' de cualquiera de las secuencias de armazón anteriores para formar un ARN de guía única (ARN guía quimérico).
Los ARN guía pueden incluir modificaciones o secuencias que proporcionen características deseables adicionales (por ejemplo, estabilidad modificada o regulada; direccionamiento subcelular; seguimiento con una etiqueta fluorescente; un sitio de unión para una proteína o complejo de proteínas; y similares). Los ejemplos de dichas modificaciones incluyen, por ejemplo, una caperuza en 5' (por ejemplo, una caperuza de 7-metilguanilato (m7G)); una cola 3' poliadenilada (es decir, una cola 3' poli(A)); una secuencia de ribointerruptor (por ejemplo, para permitir la estabilidad regulada y/o la accesibilidad regulada por proteínas y/o complejos de proteínas); una secuencia de control de la estabilidad; una secuencia que forma un dúplex de ARNbc (es decir, una horquilla); una modificación o secuencia que dirige el ARN a una localización subcelular (por ejemplo, núcleo, mitocondria, cloroplastos y similares); una modificación o secuencia que proporciona seguimiento (por ejemplo, conjugación directa con una molécula fluorescente, conjugación con una fracción que facilita la detección fluorescente, una secuencia que permite la detección fluorescente, etc.); una modificación o secuencia que proporciona un sitio de unión para proteínas (por ejemplo, proteínas que actúan sobre el ADN, incluyendo activadores transcripcionales, represores transcripcionales, ADN metiltransferasas, ADN desmetilasas, histona acetiltransferasas, histona desacetilasas y similares); y combinaciones de los mismos. Otros ejemplos de modificaciones incluyen estructuras dúplex de tallo-bucle diseñadas por ingeniería genética, regiones abultadas diseñadas por ingeniería genética, horquillas 3' diseñadas por ingeniería genética de la estructura dúplex de tallo-bucle, o cualquier combinación de las mismas. Véase, por ejemplo, el documento US 2015/0376586. Un abultamiento puede ser una región desapareada de nucleótidos dentro del dúplex formado por la región similar a ARNcr y la región mínima similar a ARNtracr. Un abultamiento puede comprender, en un lado del dúplex, un 5'-XXXY-3' desapareado donde X es cualquier purina e Y puede ser un nucleótido que puede formar un par oscilante con un nucleótido en la cadena opuesta y una región de nucleótidos no apareado en el otro lado del dúplex.
En algunos casos, se puede utilizar un sistema de activación transcripcional que comprende una proteína de fusión dCas9-VP64 emparejada con MS2-p65-HSF1. Los ARN guía en tales sistemas se pueden diseñar con secuencias de aptámeros unidas al tetrabucle y al bucle del tallo 2 de ARNgu diseñados para unirse a las proteínas de la cubierta del bacteriófago MS2 dimerizadas. Véase, por ejemplo, Konermannet al.(2015) Nature 517(7536):583-588.
Los ácidos nucleicos no modificados pueden ser propensos a la degradación. Los ácidos nucleicos exógenos también pueden inducir una respuesta inmunitaria innata. Las modificaciones pueden ayudar a introducir estabilidad y reducir la inmunogenicidad. Los ARN guía pueden comprender nucleósidos modificados y nucleótidos modificados que incluyen, por ejemplo, uno o más de los siguientes: (1) alteración o reemplazo de uno o ambos oxígenos de fosfato no enlazantes y/o de uno o más de los oxígenos de fosfato enlazantes en el enlace de la cadena principal de fosfodiéster; (2) alteración o reemplazo de un constituyente del azúcar ribosa tal como alteración o sustitución del 2' hidroxilo del azúcar ribosa; (3) reemplazo de la fracción fosfato con conectores defosfo; (4) modificación o reemplazo de una nucleobase de origen natural; (5) reemplazo o modificación de la cadena principal de ribosa-fosfato; (6) modificación del extremo 3' o del extremo 5' del oligonucleótido (por ejemplo, eliminación, modificación o reemplazo de un grupo fosfato terminal o conjugación de una fracción); y (7) modificación del azúcar. Otras posibles modificaciones del a Rn guía incluyen modificaciones o reemplazo de uracilos o tractos de poliuracilo. Véanse, por ejemplo, los documentos WO 2015/048577 y US 2016/0237455. Se pueden realizar modificaciones similares en ácidos nucleicos que codifican Cas, tales como ARNm de Cas. Por ejemplo, los ARNm de Cas pueden modificarse mediante empobrecimiento en uridina utilizando codones sinónimos.
Como ejemplo, los nucleótidos en el extremo 5' o 3' de un ARN guía pueden incluir enlaces fosforotioato (por ejemplo, las bases pueden tener un grupo fosfato modificado que es un grupo fosforotioato). Por ejemplo, un ARN guía puede incluir enlaces fosforotioato entre los 2, 3 o 4 nucleótidos terminales en el extremo 5' o 3' del ARN guía. Como ejemplo adicional, los nucleótidos en el extremo 5' y/o 3' de un ARN guía pueden tener modificaciones 2'-O-metilo. Por ejemplo, un ARN guía puede incluir modificaciones 2'-O-metilo en los nucleótidos 2, 3 o 4 terminales en el extremo 5' y/o 3' del ARN guía (por ejemplo, el extremo 5'). Véase, por ejemplo, el documento WO 2017/173054 A1 y Finnet al.(2018) Cell Rep. 22(9):2227-2235. Otras posibles modificaciones se describen con más detalle en otra parte del presente documento. En un ejemplo específico, el ARN guía comprende análogos de 2'-O-metilo y enlaces internucleotídicos de fosforotioato 3' en los primeros tres restos de ARN en los extremos 5' y 3'. Estas modificaciones químicas pueden, por ejemplo, proporcionar mayor estabilidad y protección frente a exonucleasas para guiar los ARN, permitiéndoles persistir dentro de las células durante más tiempo que los ARN guía no modificados. Estas modificaciones químicas también pueden, por ejemplo, proteger contra respuestas inmunitarias intracelulares innatas que pueden degradar activamente el ARN o desencadenar cascadas inmunitarias que conducen a la muerte celular.
En algunos ARN guía (por ejemplo, ARN de guía única), al menos un bucle (por ejemplo, dos bucles) del ARN guía se modifica mediante la inserción de una secuencia de ARN distinta que se une a uno o más adaptadores (es decir, proteínas o dominios adaptadores). Dichas proteínas adaptadoras se pueden usar para reclutar adicionalmente uno o más dominios funcionales heterólogos, tales como dominios de activación transcripcional (por ejemplo, para uso en la detección CRISPRa en las células biosensoras SAM/tau). En otra parte del presente documento se describen ejemplos de proteínas de fusión que comprenden dichas proteínas adaptadoras (es decir, proteínas adaptadoras quiméricas). Por ejemplo, un bucle de unión a MS2 ggccAACAUGAGGAUCACCCAUGUCUGCAGggcc (<s>E<q>ID NO: 33) puede reemplazar los nucleótidos 13 a 16 y los nucleótidos 53 a 56 del armazón de ARNgu (estructura principal) establecido en SEQ ID NO: 17 o SEQ iD NO: 19 (o SEQ ID NO: 30 o 31) o la estructura de ARNgu para el sistema CRISPR/Cas9 de S.pyogenesdescrito en el documento WO 2016/049258 y en Konermannet al.(2015) Nature 517(7536):583-588. Véanse también los documentos US 2019-0284572 y WO 2019/183123. La numeración del ARN guía utilizada en el presente documento se refiere a la numeración de nucleótidos en la secuencia del armazón del ARN guía (es decir, la secuencia aguas abajo del segmento del ARN guía dirigido al ADN). Por ejemplo, el primer nucleótido del armazón del ARN guía es 1, el segundo nucleótido del armazón es 2 y así sucesivamente. Los restos correspondientes a los nucleótidos 13 a 16 en la SEQ ID NO: 17 o la SEQ ID NO: 19 (o la SEQ ID NO: 30 o 31) son la secuencia de bucle en la región que abarca los nucleótidos 9 a 21 en la SEQ ID NO: 17 o la SEQ ID NO: 19 (o la SEQ ID NO: 30 o 31), una región denominada en el presente documento tetrabucle. Los restos correspondientes a los nucleótidos 53 a 56 en la SEQ ID NO: 17 o la SEQ ID NO: 19 (o la SEQ ID NO: 30 o 31) son la secuencia de bucle en la región que abarca los nucleótidos 48 a 61 en la SEQ ID NO: 17 o la SEQ ID NO: 19 (o la SEQ ID NO: 30 o 31), una región denominada en el presente documento bucle 2 del tallo. Otras secuencias de bucle de tallo en la SEQ ID NO: 17 o la SEQ ID NO: 19 (o SEQ ID NO: 30 o 31) comprenden el bucle 1 de tallo (nucleótidos 33 a 41) y el bucle 3 de tallo (nucleótidos 63 a 75). La estructura resultante es un armazón de ARNgu en el que cada una de las secuencias del tetrabucle y el bucle 2 del tallo ha sido reemplazada por un bucle de unión a MS2. El tetrabucle y el bucle 2 del tallo sobresalen de la proteína Cas9 de tal manera que agregar un bucle de unión a MS2 no debería interferir con ningún resto de Cas9. Además, la proximidad de los sitios del tetrabucle y del bucle 2 del al ADN indica que la localización en estos lugares podría dar como resultado un alto grado de interacción entre el ADN y cualquier proteína reclutada, tal como un activador transcripcional. Por lo tanto, en algunos ARNgu, los nucleótidos correspondientes a 13 a 16 y/o los nucleótidos correspondientes a 53 a 56 del armazón de ARN guía expuesto en la Se Q ID NO: 17 o la SEQ ID NO: 19 (o SEQ ID NO: 30 o 31) o restos correspondientes cuando están alineados de manera óptima con cualquiera de estos armazones/estructuras se reemplazan por secuencias de ARN distintas capaces de unirse a una o más proteínas o dominios adaptadores. Como alternativa o adicionalmente, se pueden añadir secuencias de unión al adaptador al extremo 5' o al extremo 3' de un ARN guía. Un armazón de ARN guía de ejemplo que comprende bucles de unión a MS2 en las regiones de tetrabucle y bucle 2 del tallo puede comprender, consistir esencialmente en o consistir en la secuencia expuesta en la SEQ ID NO: 34. Un ARN guía único genérico de ejemplo que comprende bucles de unión a MS2 en las regiones de tetrabucle y bucle 2 del tallo puede comprender, consistir esencialmente en o consistir en la secuencia expuesta en la SEQ ID NO: 35.
Los ARN guía se pueden proporcionar en cualquier forma. Por ejemplo, el ARNg puede proporcionarse en forma de ARN, ya sea como dos moléculas (ARNcr y ARNtracr separados) o como una molécula (ARNgu) y, opcionalmente, en forma de un complejo con una proteína Cas. El ARNg también se puede proporcionar en forma de ADN que codifica el ARNg. El ADN que codifica el ARNg puede codificar una sola molécula de ARN (ARNgu) o moléculas de ARN separadas (por ejemplo, ARNcr y ARNtracr separados). En el último caso, el ADN que codifica el ARNg se puede proporcionar como una molécula de ADN o como moléculas de ADN separadas que codifican el ARNcr y el ARNtracr, respectivamente.
Cuando un ARNg se proporciona en forma de ADN, el ARNg puede expresarse de forma transitoria, condicional o constitutiva en la célula. Los ADN que codifican ARNg pueden integrarse de manera estable en el genoma de la célula y unirse operativamente a un promotor activo en la célula. De manera alternativa, los ADN que codifican ARNg pueden unirse operativamente a un promotor en una construcción de expresión. Por ejemplo, el ADN que codifica el ARNg puede estar en un vector que comprende un ácido nucleico heterólogo, tal como un ácido nucleico que codifica una proteína Cas. De manera alternativa, puede ser en un vector o un plásmido que esté separado del vector que comprende el ácido nucleico que codifica la proteína Cas. Los promotores que pueden usarse en tales construcciones de expresión son promotores activos en células de mamífero, por ejemplo, en una o más de una célula humana, una célula de mamífero no humano, una célula de roedor, una célula de ratón, una célula de rata, una célula pluripotencial, una célula madre embrionaria (ME), una célula madre adulta, una célula progenitora de desarrollo restringido, una célula madre pluripotencial inducida (MPi) o un embrión en fase de una sola célula. Dichos promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos o promotores específicos de tejido. Dichos promotores también pueden ser, por ejemplo, promotores bidireccionales. Los ejemplos específicos de promotores adecuados incluyen un promotor de ARN polimerasa III, tal como un promotor de U6 humano, un promotor III de U6 polimerasa de rata, o un promotor de U6 polimerasa III de ratón.
De manera alternativa, los ARNg se pueden preparar mediante otros diversos métodos. Por ejemplo, los ARNg se pueden preparar mediante transcripciónin vitrousando, por ejemplo, ARN polimerasa de T7 (véanse, por ejemplo, los documentos WO 2014/089290 y WO 2014/065596). Los ARNg también pueden ser una molécula producida sintéticamente preparada mediante síntesis química. Por ejemplo, se puede sintetizar químicamente un ARN guía para incluir análogos de 2'-O-metilo y enlaces internucleotídicos de fosforotioato 3' en los primeros tres restos de ARN terminales 5' y 3'.
Los ARN guía (o ácidos nucleicos que codifican los ARN guía) pueden estar en composiciones que comprenden uno o más ARN guía (por ejemplo, 1, 2, 3, 4 o más ARN guía) y un portador que aumenta la estabilidad del ARN guía (por ejemplo, prolongando el período en determinadas condiciones de almacenamiento (por ejemplo, -20 °C, 4 °C o temperatura ambiente) para las cuales los productos de degradación permanecen por debajo de un umbral, tal como por debajo del 0,5 % en peso del ácido nucleico o proteína de partida; o que aumenta la estabilidadin vivo).Los ejemplos no limitantes de tales vehículos incluyen microesferas de poli(ácido láctico) (PLA), microesferas de poli(ácido D,L-láctico-coglicólico) (PLGA), liposomas, micelas, micelas inversas, cocleatos lipídicos y microtúbulos lipídicos. Tales composiciones pueden comprender además una proteína Cas, tal como una proteína Cas9 o un ácido nucleico que codifica una proteína Cas.
B. Secuencias diana de ARN guía
Los ADN diana para los ARN guía incluyen secuencias de ácido nucleico presentes en un ADN a las que se unirá un segmento de un ARNg dirigido al ADN, siempre que existan condiciones suficientes para la unión. Las condiciones de unión al ADN/ARN adecuadas incluyen condiciones fisiológicas normalmente presentes en una célula. En la técnica se conocen otras condiciones de unión al ADN/ARN adecuadas (por ejemplo, condiciones en un sistema libre de células) (véase, por ejemplo, Molecular Cloning: A Laboratory Manual, 3a ed. (Sambrook et al., Harbor Laboratory Press 2001)). La cadena del ADN diana que es complementaria e hibrida con la proteína Cas o ARNg puede denominarse "cadena complementaria", y la cadena del ADN diana que es complementaria a la "cadena complementaria" (y por lo tanto no es complementaria a la proteína Cas o al ARNg) puede denominarse "cadena no complementaria" o "cadena molde".
El ADN diana incluye tanto la secuencia de la cadena complementaria con la que se hibrida el ARN guía como la secuencia correspondiente de la cadena no complementaria (por ejemplo, adyacente al motivo adyacente al protoespaciador (PAM)). La expresión "secuencia diana de ARN guía" como se usa en el presente documento se refiere específicamente a la secuencia en la cadena no complementaria correspondiente (es decir, el complemento inverso de) la secuencia con la que se hibrida el ARN guía en la cadena complementaria. Es decir, la secuencia diana de ARN guía se refiere a la secuencia en la cadena no complementaria adyacente al PAM (por ejemplo, aguas arriba o 5' del PAM en el caso de Cas9). Una secuencia diana de ARN guía es equivalente al segmento de direccionamiento al ADN de un ARN guía, pero con timinas en lugar de uracilos. Como ejemplo, una secuencia diana de ARN guía para una enzima SpCas9 puede hacer referencia a la secuencia aguas arriba de 5'-NGG-3' PAM en la cadena no complementaria. Un ARN guía está diseñado para tener complementariedad con la cadena complementaria de un ADN diana, donde la hibridación entre el segmento del ARN guía dirigido al ADN y la cadena complementaria del ADN objetivo promueve la formación de un complejo CRISPR. No se requiere necesariamente una complementariedad total, siempre que haya suficiente complementariedad para provocar la hibridación y promover la formación de un complejo CRISPR. Si en el presente documento se hace referencia a un ARN guía como dirigido a una secuencia diana de ARN guía, lo que se quiere decir es que el ARN guía se hibrida con la secuencia de la cadena complementaria del ADN diana que es el complemento inverso de la secuencia diana del ARN guía en la cadena no complementaria.
Una secuencia diana de ADN diana o ARN guía puede comprender cualquier polinucleótido y puede localizarse, por ejemplo, en el núcleo o citoplasma de una célula o dentro de un orgánulo de una célula, tal como una mitocondria o un cloroplasto. La secuencia dirigida al ADN o dirigida al ARN guía puede ser cualquier secuencia de ácido nucleico endógena o exógena a una célula. La secuencia de reconocimiento de ARN guía o la secuencia diana de ARN guía puede ser una secuencia que codifica un producto génico (por ejemplo, una proteína) o una secuencia no de codificación (por ejemplo, una secuencia reguladora) o puede incluir ambas.
Para sistemas CRISPRa y SAM, puede ser preferible que la secuencia diana esté adyacente al sitio de inicio de la transcripción de un gen. Por ejemplo, la secuencia diana puede estar dentro de 1000, 900, 800, 700, 600, 500, 400, 300, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5 o 1 par de bases del sitio de iniciación de la transcripción. Opcionalmente, la secuencia diana está dentro de la región de 200 pares de bases aguas arriba del sitio de iniciación de la transcripción y 1 par de bases aguas abajo del sitio de iniciación de la transcripción (-200 a 1).
La unión y/o escisión específica de sitio de un ADN diana por una proteína Cas puede producirse en ubicaciones determinadas tanto por (i) la complementariedad del emparejamiento de bases entre el ARN guía y la cadena complementaria del ADN diana como por (ii) un motivo corto, llamado motivo adyacente protoespaciador (PAM), en la cadena no complementaria del ADN diana. El PAM puede flanquear la secuencia diana del ARN guía. Opcionalmente, la secuencia diana del ARN guía puede estar flanqueada en el extremo 3' por PAM (por ejemplo, para Cas9). De manera alternativa, la secuencia diana del ARN guía puede estar flanqueada en el extremo 5' por PAM (por ejemplo, para Cpf1). Por ejemplo, el sitio de escisión de las proteínas Cas puede ser de aproximadamente 1 a aproximadamente 10 o de aproximadamente 2 a aproximadamente 5 pares de bases (por ejemplo, 3 pares de bases) aguas arriba o aguas abajo de la secuencia PAM (por ejemplo, dentro de la secuencia diana del ARN guía). En el caso de SpCas9, la secuencia PAM (es decir, en la cadena no complementaria) puede ser 5'-NiGG-3', donde N1 es cualquier nucleótido de ADN y donde PAM está inmediatamente en 3' de la secuencia de reconocimiento del ARN guía de la cadena NO complementaria del ADN diana. Como tal, la secuencia correspondiente a la PAM en la cadena complementaria (es decir, el complemento inverso) sería 5'-CCN2-3', donde N2 es cualquier nucleótido de ADN y está inmediatamente en 5' de la secuencia con la que el segmento del ARN guía que se dirige al ADN se hibrida en la cadena complementaria del ADN diana. En algunos de estos casos, N1 y N2 pueden ser complementarios y el par de bases N1-N2 puede ser cualquier par de bases (por ejemplo, Ni=C y N2=G; Ni=G y N2=C; Nf A y N2=T; o Nf T y N2=A). En el caso de Cas9 de S.aureus,el PAM puede ser NNGRRT o NNGRR, donde N puede ser A, G, C o T, y R puede ser G o A. En el caso de Cas9 deC.jejuni, el PAM puede ser, por ejemplo, NNNNa Ca C o NNNNRYAC, donde N puede ser A, G, C o T y R puede ser G o A. En algunos casos (por ejemplo, para FnCpfl), la secuencia de PAM puede estar cadena arriba del extremo 5' y tener la secuencia 5'-TTN-3'.
Un ejemplo de una secuencia diana de ARN guía es una secuencia de ADN de 20 nucleótidos que precede inmediatamente a un motivo NGG reconocido por una proteína SpCas9. Por ejemplo, dos ejemplos de secuencias diana del ARN guía más PAM son PAM GNigNGG (SEQ ID NO: 25) o N20NGG (Se Q ID NO: 26). Véase, por ejemplo, el documento WO 2014/165825. La guanina en el extremo 5' puede facilitar la transcripción mediante la ARN polimerasa en las células. Otros ejemplos de secuencias diana del ARN guía más PAM pueden incluir dos nucleótidos de guanina en el extremo 5' (por ejemplo, GGN)20NGG; SEQ ID NO: 27) para facilitar la transcripción eficaz por la polimerasa de T7in vitro.Véase, por ejemplo, el documento WO 2014/065596. Otras secuencias diana del ARN guía más PAM pueden tener entre 4 y 22 nucleótidos de longitud de las SEQ ID NO: 25-27, incluyendo la G o GG 5' y la GG o NGG 3'. Otras secuencias diana de ARN guía más PAM adicionales pueden tener entre 14 y 20 nucleótidos de longitud de las SEQ ID NO: 25-27.
La formación de un complejo CRISPR hibridado con un ADN diana puede dar como resultado la escisión de una o ambas cadenas del ADN diana dentro o cerca de la región correspondiente a la secuencia diana del ARN guía (es decir, la secuencia diana del ARN guía en la cadena no complementaria del ADN diana y el complemento inverso en la cadena complementaria con la que se hibrida el ARN guía). Por ejemplo, el sitio de escisión puede estar dentro de la secuencia diana del ARN guía (por ejemplo, en una ubicación definida con respecto a la secuencia PAM). El "sitio de escisión" incluye la posición de un a Dn diana en el que una proteína Cas produce una rotura monocatenaria o una rotura bicatenaria. El sitio de escisión puede estar en una sola cadena (por ejemplo, cuando se usa una nickasa) o en ambas cadenas de un ADN bicatenario. Los sitios de escisión pueden estar en la misma posición en ambas cadenas (produciendo extremos romos; p.ej. Cas9)) o puede estar en diferentes sitios en cada cadena (produciendo extremos escalonados (es decir, salientes); por ejemplo, Cpfl). Se pueden producir extremos escalonados, por ejemplo, mediante el uso de dos proteínas Cas, cada uno de los cuales produce una rotura monocatenaria en un sitio de escisión diferente en una cadena diferente, produciendo así una rotura bicatenaria. Por ejemplo, una primera nickasa puede crear una rotura monocatenaria en la primera cadena de ADN bicatenario (ADNbc), y una segunda nickasa puede crear una rotura monocatenaria en la segunda cadena de ADNbc de manera que se crean secuencias salientes. En algunos casos, la secuencia diana del ARN guía o la secuencia diana de la nickasa en la primera cadena está separada de la secuencia diana del ARN guía o el sitio de escisión de la nickasa en la segunda cadena por al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 o 1.000 pares de bases.
IV. Métodos de detección de abandonos para revelar vulnerabilidades genéticas asociadas con la agregación de Tau
Las líneas celulares biosensoras Cas/tau divulgadas en el presente documento se pueden utilizar en métodos de detección de abandono para revelar vulnerabilidades genéticas asociadas con la agregación de tau. Dichos métodos comprenden proporcionar poblaciones de agregación positiva y agregación negativa de células biosensoras Cas/tau como se describe en otra parte del presente documento, introduciendo una biblioteca que comprende una pluralidad de ARN de guía única en cada población y determinando la abundancia (por ejemplo, recuentos de lecturas) de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células.
En particular, dichos métodos comprenden proporcionar una población de células de agregación positiva y una población de células de agregación negativa, en donde cada población de células comprende una proteína Cas, un primer dominio de repetición de tau unido a un primer indicador, y un segundo dominio de repetición de tau unido a un segundo indicador como se divulga en otra parte del presente documento. En la población de células con agregación positiva, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador están presentes de manera estable en un estado agregado, mientras que en la población de células con agregación positiva, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador no están presentes de manera estable en un estado agregado. A continuación, el método comprende introducir en cada población de células una biblioteca que comprende una pluralidad de ARN de guía única que se dirigen a una pluralidad de genes. La pluralidad de ARN de guía única forman complejos con la proteína Cas y la proteína Cas escinde la pluralidad de genes dando como resultado la desactivación de la función del gen. Finalmente, la abundancia de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células. La depleción de un ARN guía en la población de células con agregación positiva pero no en la población de células con agregación negativa indica que el gen al que se dirige el ARN guía exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau. De manera alternativa, un patrón de depleción más dramático de un ARN guía a lo largo del tiempo en la población de células con agregación positiva en relación con la población de células con agregación negativa puede indicar que el gen al que se dirige el a Rn guía exhibe letalidad sintética con agregados de proteína tau y es un vulnerabilidad genética asociada con la agregación tau. Un patrón de depleción más dramático significa que el ARN guía se agota a un ritmo más rápido a lo largo del tiempo (por ejemplo, un patrón de depleción distinguible usando una prueba diferencial sobre tasas de desintegración exponencial ajustadas).
De manera análoga, las líneas celulares biosensoras SAM/tau divulgadas en el presente documento se pueden utilizar en métodos de detección de abandono para revelar vulnerabilidades genéticas asociadas con la agregación de tau. Dichos métodos comprenden proporcionar poblaciones de agregación positiva y agregación negativa de células biosensoras SAM/tau como se divulga en otra parte del presente documento, introduciendo una biblioteca que comprende una pluralidad de ARN de guía única en cada población y determinando la abundancia (por ejemplo, recuentos de lecturas) de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células.
En particular, dichos métodos comprenden proporcionar una población de células de agregación positiva y una población de células de agregación negativa, en donde cada población de células comprende una proteína Cas quimérica que comprende una proteína Cas inactiva para nucleasa fusionada a uno o más dominios de activación transcripcional, una proteína adaptadora quimérica que comprende una proteína adaptadora fusionada a uno o más dominios de activación transcripcional, un primer dominio de repetición de tau unido a un primer indicador, y un segundo dominio de repetición de tau unido a un segundo indicador como se divulga en otra parte del presente documento. En la población de células con agregación positiva, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador están presentes de manera estable en un estado agregado, mientras que en la población de células con agregación positiva, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador no están presentes de manera estable en un estado agregado. A continuación, el método comprende introducir en cada población de células una biblioteca que comprende una pluralidad de ARN de guía única que se dirigen a una pluralidad de genes. en donde la pluralidad de ARN de guía única forman complejos con la proteína Cas quimérica y la proteína adaptadora quimérica y los complejos activan la transcripción de la pluralidad de genes dando como resultado una mayor expresión génica. Finalmente, la abundancia de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células. La depleción de un ARN guía en la población de células con agregación positiva, pero no en la población de células con agregación negativa, puede indicar que el gen al que se dirige el ARN guía, cuando se activa transcripcionalmente, exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau. De manera alternativa, un patrón de depleción más dramático de un ARN guía a lo largo del tiempo en la población de células con agregación positiva en relación con la población de células con agregación negativa puede indicar que el gen al que se dirige el ARN guía, cuando se activa transcripcionalmente, exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau. Un patrón de depleción más dramático significa que el ARN guía se agota a un ritmo más rápido a lo largo del tiempo (por ejemplo, un patrón de depleción distinguible usando una prueba diferencial sobre tasas de desintegración exponencial ajustadas).
Las células biosensoras Cas/tau utilizadas en el método pueden ser cualquiera de las células biosensoras Cas/tau divulgadas en otra parte del presente documento. Igualmente, las células biosensoras SAM/tau utilizadas en el método pueden ser cualquiera de las células biosensoras SAM/tau divulgadas en otra parte del presente documento. El primer dominio de repetición de tau y el segundo dominio de repetición de tau pueden ser diferentes o pueden ser similares o iguales. El dominio de repetición de tau puede ser cualquiera de los dominios de repetición tau divulgados en otra parte del presente documento. Por ejemplo, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau pueden ser un dominio de repetición de tau de tipo silvestre o pueden comprender una mutación proagregación, tal como una mutación tau P301S. El primer dominio de repetición de tau y/o el segundo dominio de repetición de tau pueden comprender un dominio de cuatro repeticiones de tau. Como ejemplo específico, el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau pueden comprender, consistir esencialmente en o consistir en la SEQ ID NO: 11 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 11. En un ejemplo específico, el ácido nucleico que codifica el dominio de repetición de tau puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 12 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 12, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 11.
El primer dominio de repetición de tau puede unirse al primer indicador y el segundo dominio de repetición de tau puede unirse al segundo indicador por cualquier medio. Por ejemplo, el indicador puede fusionarse con el dominio de repetición de tau (por ejemplo, como parte de una proteína de fusión). Las proteínas indicadoras son un par de proteínas indicadoras que producen una señal detectable cuando el primer dominio de repetición de tau unido al primer indicador se agrega con el segundo dominio de repetición de tau unido al segundo indicador. De manera específica, los indicadores son proteínas fluorescentes, que son un par de transferencia de energía por resonancia de fluorescencia (FRET). FRET es un fenómeno físico en el que un fluoróforo donador en su estado excitado transfiere de forma no radiactiva su energía de excitación a un fluoróforo aceptor vecino, provocando así que el aceptor emita su fluorescencia característica. Son bien conocidos ejemplos de pares FRET (fluoróforos donador y aceptor). Véase, por ejemplo, Bajaret al.(2016) Sensors (Basel) 16(9): 1488. Como ejemplo específico de un par FRET, el primer indicador puede ser la proteína fluorescente cian (CFP) y el segundo indicador puede ser la proteína fluorescente amarilla (YFP). Como ejemplo específico, la CFP puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 13 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 13. Como otro ejemplo específico, la YFP puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 15 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 15.
Para las células biosensoras Cas/tau, la proteína Cas puede ser cualquier proteína Cas divulgada en otro lugar del presente documento. Como ejemplo, la proteína Cas puede ser una proteína Cas9. Por ejemplo, la proteína Cas9 puede ser una proteína Cas9 deStreptococcus pyogenes.Como ejemplo específico, la proteína Cas puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 21 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 21.
Una o más o todas las proteínas Cas, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador se pueden expresar de manera estable en la población de células. Por ejemplo, los ácidos nucleicos que codifican una o más o todas las proteínas Cas, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador pueden estar integrados genómicamente en las poblaciones de células. En un ejemplo específico, el ácido nucleico que codifica la proteína Cas puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 22 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 22, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 21.
Para las células biosensoras SAM/tau, la proteína Cas puede ser cualquier proteína Cas divulgada en otro lugar del presente documento. Como ejemplo, la proteína Cas puede ser una proteína Cas9. Por ejemplo, la proteína Cas9 puede ser una proteína Cas9 deStreptococcus pyogenes.Como ejemplo específico, la proteína Cas quimérica puede comprender la proteína Cas inactiva para nucleasa fusionada a un dominio de activación transcripcional VP64. Por ejemplo, la proteína Cas quimérica puede comprender desde el extremo N al extremo C: la proteína Cas inactiva para nucleasas; una señal de localización nuclear; y el dominio activador transcripcional VP64. Como ejemplo específico, la proteína adaptadora puede ser una proteína de cubierta MS2 y uno o más dominios de activación transcripcional en la proteína adaptadora quimérica comprenden un dominio de activación transcripcional p65 y un dominio de activación transcripcional HSF1. Por ejemplo, la proteína adaptadora quimérica puede comprender desde el extremo N al extremo C: la proteína de la cubierta MS2; una señal de localización nuclear; el dominio de activación transcripcional p65; y el dominio de activación transcripcional HSF1. En un ejemplo específico, el ácido nucleico que codifica la proteína Cas quimérica puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 38 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 38, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 36. En un ejemplo específico, el ácido nucleico que codifica una proteína adaptadora quimérica puede comprender, consistir esencialmente en o consistir en la SEQ ID NO: 39 o una secuencia al menos aproximadamente un 90 %, un 91 %, un 92 %, un 93 %, un 94 %, un 95 %, un 96 %, un 97 %, un 98 % o un 99 % idéntica a la SEQ ID NO: 39, opcionalmente en donde el ácido nucleico codifica una proteína que comprende, consiste esencialmente en o consiste en la SEQ ID NO: 37.
Una o más o todas las proteínas Cas quiméricas, la proteína adaptadora quimérica, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador se pueden expresar de manera estable en la población de células. Por ejemplo, los ácidos nucleicos que codifican una o más o todas las proteínas Cas quiméricas, la proteína adaptadora quimérica, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador pueden estar integrados genómicamente en las poblaciones de células.
Como se divulga en otra parte del presente documento, las células pueden ser cualquier tipo de células de mamífero. Por ejemplo, las células pueden ser células humanas (por ejemplo, células HEK293T o células neuronales).
La pluralidad de ARN de guía única se puede introducir en las poblaciones de células mediante cualquier medio conocido. En algunos métodos, la pluralidad de ARN guía se introducen en las poblaciones de células mediante transducción viral, tal como transducción retroviral, adenoviral o lentiviral. En un ejemplo específico, los ARN guía pueden introducirse mediante transducción lentiviral. Cada uno de la pluralidad de ARN de guía única puede estar en un vector viral separado. Las poblaciones de células pueden infectarse con cualquier multiplicidad de infección. Por ejemplo, la multiplicidad de infección puede estar entre aproximadamente 0,1 y aproximadamente 1,0, entre aproximadamente 0,1 y aproximadamente 0,9, entre aproximadamente 0,1 y aproximadamente 0,8, entre aproximadamente 0,1 y aproximadamente 0,7, entre aproximadamente 0,1 y aproximadamente 0,6, entre aproximadamente 0,1 y aproximadamente 0,5, entre aproximadamente 0,1 y aproximadamente 0,4, o entre aproximadamente 0,1 y aproximadamente 0,3. De manera alternativa, la multiplicidad de infección puede ser inferior a aproximadamente 1,0, menos de aproximadamente 0,9, menos de aproximadamente 0,8, menos de aproximadamente 0,7, menos de aproximadamente 0,6, menos de aproximadamente 0,5, menos de aproximadamente 0,4, inferior a aproximadamente 0,3 o inferior a aproximadamente 0,2. En un ejemplo específico, la multiplicidad de infección puede ser inferior a aproximadamente 0,3.
Los ARN guía se pueden introducir en las poblaciones de células junto con un marcador de selección o gen indicador para seleccionar células que tienen los ARN guía, y el método puede comprender además seleccionar células que comprenden el marcador de selección o gen indicador. En otra parte del presente documento se proporcionan ejemplos de marcadores de selección y genes indicadores. Como ejemplo, el marcador de selección puede ser uno que imparta resistencia a un fármaco, tal como neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa y blasticidina S desaminasa. Otro marcador de selección de ejemplo es la proteína de resistencia a bleomicina, codificada por el genSh ble(gen de bleomicina deStreptoalloteichus hindustanus),que confiere resistencia a zeocina (fleomicina D1). Por ejemplo, las células se pueden seleccionar con un fármaco (por ejemplo, puromicina) de modo que sólo las células transducidas con una construcción de ARN guía se conserven para su uso en la realización del cribado. Por ejemplo, el fármaco puede ser puromicina o zeocina (fleomicina D1).
En algunos métodos, la pluralidad de ARN de guía única se introducen en una concentración seleccionada de modo que la mayoría de las células reciban sólo uno de los ARN de guía única. Por ejemplo, si los ARN guía se introducen mediante transducción viral, las células pueden infectarse con una multiplicidad de infección baja para garantizar que la mayoría de las células reciban sólo una construcción viral con alta probabilidad. Como ejemplo específico, la multiplicidad de infección puede ser inferior a aproximadamente 0,3.
Las poblaciones de células en las que se introduce la pluralidad de ARN de guía única pueden ser cualquier número adecuado de células. Por ejemplo, las poblaciones de células pueden comprender más de aproximadamente 50, más de aproximadamente 100, más de aproximadamente 200, más de aproximadamente 300, más de aproximadamente 400, más de aproximadamente 500, más de aproximadamente 600, más de aproximadamente 700, más de aproximadamente 800, más de aproximadamente 900 o más de aproximadamente 1.000 células por ARN de guía única. En un ejemplo específico, las poblaciones de células comprenden más de aproximadamente 300 células o más de aproximadamente 500 células por ARN de guía única.
La pluralidad de ARN de guía única puede apuntar a cualquier número de genes. Por ejemplo, la pluralidad de ARN de guía única puede apuntar a aproximadamente 50 o más genes, aproximadamente 100 o más genes, aproximadamente 200 o más genes, aproximadamente 300 o más genes, aproximadamente 400 o más genes, aproximadamente 500 o más genes, aproximadamente 1000 o más genes, aproximadamente 2000 o más genes, aproximadamente 3000 o más genes, aproximadamente 4000 o más genes, aproximadamente 5000 o más genes, aproximadamente 10.000 o más genes o aproximadamente 20.000 o más genes. En algunos métodos, los ARN guía se pueden seleccionar para apuntar a genes en una vía de señalización particular. En algunos métodos, la biblioteca de ARN de guía única es una biblioteca de todo el genoma.
La pluralidad de ARN de guía única puede apuntar a cualquier número de secuencias dentro de cada gen diana individual. En algunos métodos, una pluralidad de secuencias diana se dirigen en promedio en cada uno de la pluralidad de genes diana. Por ejemplo, de aproximadamente 2 a aproximadamente 10, de aproximadamente 2 a aproximadamente 9, de aproximadamente 2 a aproximadamente 8, de aproximadamente 2 a aproximadamente 7, de aproximadamente 2 a aproximadamente 6, de aproximadamente 2 a aproximadamente 5, de aproximadamente 2 a aproximadamente 4 o de aproximadamente 2 a aproximadamente 3 secuencias diana únicas pueden dirigirse en promedio en cada uno de la pluralidad de genes diana. Por ejemplo, al menos aproximadamente 2, al menos aproximadamente 3, al menos aproximadamente 4, al menos aproximadamente 5 o al menos aproximadamente 6 secuencias diana únicas pueden dirigirse en promedio en cada uno de la pluralidad de genes diana. Como ejemplo específico, se pueden dirigir aproximadamente 6 secuencias diana en promedio en cada una de la pluralidad de genes diana. Como otro ejemplo específico, de aproximadamente 3 a aproximadamente 6 o de aproximadamente 4 a aproximadamente 6 secuencias diana están dirigidas en promedio en cada uno de la pluralidad de genes diana.
Los ARN guía pueden apuntar a cualquier ubicación deseada en los genes diana. En algunos métodos CRISPRn que utilizan células biosensoras Cas/tau, cada ARN guía se dirige a un exón constitutivo si es posible. En algunos métodos, cada ARN guía se dirige a un exón constitutivo en 5', si es posible. En algunos métodos, cada ARN guía se dirige a un primer exón, un segundo exón o un tercer exón (desde el extremo 5' del gen), si es posible. En algunos métodos CRISPRa que utilizan células biosensoras SAM/tau, cada ARN guía se puede dirigir a una secuencia diana del ARN guía en 200 pb aguas arriba de un sitio de iniciación de la transcripción, en caso de que fuese posible. En algunos métodos CRISPRa que utilizan células biosensoras SAM/tau, en donde cada ARN guía comprende uno o más elementos de unión al adaptador a los que la proteína adaptadora quimérica puede unirse específicamente. En un ejemplo, cada ARN guía comprende dos elementos de unión al adaptador a los que la proteína adaptadora quimérica puede unirse específicamente, opcionalmente en donde un primer elemento de unión al adaptador está dentro de un primer bucle de cada uno de uno o más ARN guía y un segundo elemento de unión al adaptador está dentro de un segundo bucle de cada uno de uno o más ARN guía. Por ejemplo, el elemento de unión al adaptador puede comprender la secuencia expuesta en la SEQ ID NO: 33. En un ejemplo específico, cada uno de uno o más ARN guía es un ARN guía único que comprende un fragmento de ARN de CRISPR (ARNcr) fusionado con un fragmento de ARN de CRISPR (ARNtracr) transactivante y el primer bucle es el tetrabucle correspondiente a los restos 13-16 de las SEQ ID NO: 17, 19, 30 o 31 y el segundo bucle es el bucle 2 del tallo correspondiente a los restos 53-56 de las SEQ ID NO: 17, 19, 30 o 31.
La abundancia de ARN guía se puede determinar mediante cualquier medio adecuado. En un ejemplo específico, la abundancia está determinada por la secuenciación de última generación. La secuenciación de última generación se refiere a tecnologías de secuenciación de ADN de alto rendimiento no basadas en Sanger. Por ejemplo, determinar la abundancia de un ARN guía puede comprender medir los recuentos de lecturas del ARN guía.
El transcurso del tiempo en la etapa (c) puede ser cualquier período de tiempo adecuado. Por ejemplo, el período de tratamiento puede ser de al menos aproximadamente 1 semana, al menos aproximadamente 2 semanas, más de aproximadamente 1 semana o más de aproximadamente 2 semanas. Por ejemplo, el periodo de tiempo puede ser entre aproximadamente 6 días y aproximadamente 28 días, entre aproximadamente 9 días y aproximadamente 25 días, entre aproximadamente 12 días y aproximadamente 22 días, entre aproximadamente 15 días y aproximadamente 19 días o aproximadamente 17 días. De manera análoga, el periodo de tiempo en la etapa (c) puede comprender cualquier número adecuado de pases celulares o duplicaciones celulares. El periodo de tiempo puede comprender de aproximadamente 5 a aproximadamente 20, de aproximadamente 6 a aproximadamente 19, de aproximadamente 7 a aproximadamente 18, de aproximadamente 8 a aproximadamente 17, de aproximadamente 9 a aproximadamente 16, de aproximadamente 10 a aproximadamente 15, de aproximadamente 11 a aproximadamente 14, de aproximadamente 12 a aproximadamente 13 o de aproximadamente 12 duplicaciones de células. De manera alternativa, el periodo de tiempo puede comprender de aproximadamente 2 a aproximadamente 8, de aproximadamente 2 a aproximadamente 7, de aproximadamente 2 a aproximadamente 6, de aproximadamente 3 a aproximadamente 5, de aproximadamente 3 a aproximadamente 6, de aproximadamente 3 a aproximadamente 7, de aproximadamente 3 a aproximadamente 8 o de aproximadamente 4 pases celulares. Por ejemplo, puede haber entre aproximadamente 10 y aproximadamente 15 duplicaciones de células. En un ejemplo específico, puede haber aproximadamente 12 duplicaciones de células entre la primera recolección el día 3 y el día 17 (es decir, aproximadamente 4 pases de células). En algunos métodos, para mantener una buena representación de la biblioteca de ARNg de todo el genoma, las células no se diluyen demasiado en cada pase. Por ejemplo, las células se pueden pasar aproximadamente 1/10, aproximadamente 1/9, aproximadamente 1/8, aproximadamente 1/7, aproximadamente 1/6, aproximadamente 1/5, aproximadamente 1/4, aproximadamente 1/3 o aproximadamente 1/2. En un ejemplo específico, las células se pasan a aproximadamente 1/5 (por ejemplo, de modo que > 2 duplicaciones de células).
Las células biosensoras de tau descritas en el presente documento se deban para la agregación. Es decir, se encuentran en un punto de inflexión de agregación. Se ha descubierto que los agregados de tau provocan un cambio fuerte y consistente en el perfil transcripcional de las células biosensoras de tau. La hipótesis de los autores es que estas células con agregación positiva pueden ser selectivamente vulnerables a ciertas agresiones genéticas de una manera que las células con agregación negativa no lo son. También se planteó la hipótesis de que cualquier "mutación" en el cribado CRISPRn que desencadenaría la muerte celular "específica" en las células que contienen agregados también puede tener un efecto nocivo menor en las células que no contienen agregados. Igualmente, cualquier activación génica en el cribado CRISPRn que desencadenaría la muerte celular "específica" en las células que contienen agregados también puede tener un efecto nocivo menor en las células que no contienen agregados. La evaluación en una pluralidad de puntos de tiempo permite identificar este tipo de diana mediante la identificación de perfiles de depleción de ARN (tasa de depleción o intensidad de la depleción del ARNg) a lo largo del tiempo en lugar de solo en el último pase en comparación con el primer pase, en cuyo caso este tipo de diana no se alcanzaría. Por ejemplo, este tipo de perfil de depleción se observó con el gen diana 1. Se identificó este tipo de perfiles de depleción para la diana principal de los inventores, Gen diana 1.
La pluralidad de puntos de tiempo en la etapa (c) puede ser cualquier número adecuado de puntos de tiempo. De manera específica, la pluralidad de puntos de tiempo en la etapa (c) es al menos 3 puntos de tiempo y puede ser al menos aproximadamente 4 puntos de tiempo, al menos aproximadamente 5 puntos de tiempo, al menos aproximadamente 6 puntos de tiempo, más de aproximadamente 3 puntos de tiempo, más de aproximadamente 4 puntos de tiempo, más de aproximadamente 5 puntos de tiempo o más de aproximadamente 6 puntos de tiempo. Por ejemplo, puede haber entre aproximadamente 3 y aproximadamente 9 puntos de tiempo, entre aproximadamente 4 y aproximadamente 8 puntos de tiempo, entre aproximadamente 5 y aproximadamente 7 puntos de tiempo o aproximadamente 6 puntos de tiempo. Como ejemplo adicional, puede haber entre aproximadamente 3 y aproximadamente 5 puntos de tiempo o aproximadamente 4 puntos de tiempo.
Cada punto de tiempo puede corresponder al pase de células. El período de tiempo entre cada punto de tiempo sucesivo puede ser cualquier período de tiempo adecuado. De manera específica, hay más de 1 día entre cada punto de tiempo, por ejemplo, al menos aproximadamente 2 días, al menos aproximadamente 3 días, , más de aproximadamente 2 días o más de aproximadamente 3 días entre cada punto de tiempo. Por ejemplo, puede haber aproximadamente 6 días, de aproximadamente 2 días a aproximadamente 5 días o de aproximadamente 3 días a aproximadamente 4 días entre cada punto de tiempo sucesivo. Como ejemplo específico, puede haber al menos aproximadamente 2 días o de aproximadamente 3 días a aproximadamente 4 días entre cada punto de tiempo sucesivo (es decir, entre pases sucesivos de las células).
El primer punto de tiempo puede ser cualquier punto de tiempo adecuado después de que los ARN guía se introduzcan en las poblaciones de células. Por ejemplo, con métodos de cribado CRISPRn utilizando células biosensoras Cas/tau, el primer punto de tiempo puede ser después de una cantidad de tiempo suficiente para que los ARN guía formen complejos con la proteína Cas y para que la proteína Cas escinda la pluralidad de genes dando como resultado la desactivación de la función del gen. Igualmente, con métodos de cribado CRISPRa utilizando células biosensoras SAM/tau, el primer punto de tiempo puede ser después de una cantidad de tiempo suficiente para que los ARN guía formen complejos con la proteína Cas quimérica y la proteína adaptadora quimérica, y para que los complejos activen la transcripción de la pluralidad de genes dando como resultado una mayor expresión génica. Por ejemplo, el primer punto de tiempo puede ser al menos aproximadamente 1 día, al menos aproximadamente 2 días, al menos aproximadamente 3 días, más de aproximadamente 1 día, más de aproximadamente 2 días o más de aproximadamente 3 días después de la introducción de los ARN guía en las células. De manera alternativa, el primer punto de tiempo puede estar entre aproximadamente 0 días y aproximadamente 6 días, entre aproximadamente 1 día y aproximadamente 5 días, entre aproximadamente 2 días y aproximadamente 4 días o aproximadamente 3 días después de la introducción de los<a>R<n>guía en las células.
En un ejemplo específico, la abundancia de ARN guía se evalúa los días 3, 6 o 7, 10 u 11, 13 o 14 y 17 después de la introducción de los ARN guía el día 0. Por ejemplo, la abundancia de ARN guía se puede evaluar los días 3, 7, 10, 14 y 17 después de la introducción de los ARN guía el día 0.
Si un ARN guía se considera deplecionado a lo largo del tiempo puede implicar diferentes evaluaciones. Como ejemplo, un ARN guía se puede considerar deplecionado si la abundancia del ARN guía en cada punto de tiempo es menor o igual a la abundancia del ARN guía en el punto de tiempo anterior. Como ejemplo adicional, un ARN guía se puede considerar deplecionado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores (es decir, el punto de tiempo antes del punto de tiempo anterior, tal como el punto de tiempo 3 en comparación con el punto de tiempo 1, punto de tiempo 4 en comparación con el punto de tiempo 2, punto de tiempo 5 en comparación con el punto de tiempo 3, y así sucesivamente). En un ejemplo específico, la abundancia de<a>R<n>guía se evalúa los días 3, 6 o 7, 10 u 11, 13 o 14 y 17 después de la introducción de los ARN guía el día 0, y un ARN guía se considera agotado si su abundancia en el día 10 u 11 es menos que el día 3, su abundancia el día 13 o 14 es menor que la del día 6 o 7, y su abundancia el día 17 es menor que la del día 10 u 11.
La evaluación en los métodos divulgados en el presente documento también puede considerar la tendencia entre todos los ARN guía en la biblioteca que se dirigen a un gen particular. Por ejemplo, se puede considerar que un gen exhibe letalidad sintética con agregados de proteína tau si al menos aproximadamente el 30%, al menos aproximadamente el 33 %, al menos aproximadamente el 35 %, al menos aproximadamente el 40 %, al menos aproximadamente el 45 %, al menos aproximadamente el 50 %, al menos aproximadamente el 60 %, al menos aproximadamente el 65 %, al menos aproximadamente el 70 %, al menos aproximadamente el 75 %, superior a aproximadamente el 30 %, superior a aproximadamente el 33 %, superior a aproximadamente el 35 %, superior a aproximadamente el 40 %, superior a aproximadamente el 45 %, superior a aproximadamente el 50 %, superior a aproximadamente el 60 %, superior a aproximadamente el 65 %, más de aproximadamente el 70 % o más de aproximadamente el 75 % (por ejemplo, al menos aproximadamente el 30 % o más de aproximadamente el 30 %) de los ARN guía en la biblioteca que se dirigen al gen están deplecionados en la población de células con agregación positiva, pero no en la población de células de agregación negativa. Como algunos ejemplos específicos no limitantes, se puede considerar que un gen exhibe letalidad sintética con agregados de proteína tau en las siguientes situaciones:
(1) si hay un ARN guía en la biblioteca que se dirige al gen, el único ARN guía está deplecionado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (2) si hay dos ARN guía en la biblioteca que se dirigen al gen, al menos uno de los dos ARN guía está deplecionado en la población de células con agregación positiva pero no en la población de células con agregación negativa; (3) si hay tres ARN guía en la biblioteca que se dirigen al gen, al menos uno de los tres ARN guía está deplecionado en la población de células con agregación positiva pero no en la población de células con agregación negativa; (4) si hay cuatro ARN guía en la biblioteca que se dirigen al gen, al menos dos de los cuatro ARN guía están deplecionados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (5) si hay cinco ARN guía en la biblioteca que se dirigen al gen, al menos dos de los cinco ARN guía están deplecionados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; y (6) si hay seis ARN guía en la biblioteca que se dirigen al gen, al menos tres de los seis ARN guía están deplecionados en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
La evaluación en los métodos divulgados en el presente documento también puede considerar la tendencia de los
ARN guía en la biblioteca que se dirigen a un gen particular en múltiples experimentos. Por ejemplo, el método se puede repetir al menos aproximadamente 2 veces, al menos aproximadamente 3 veces, al menos aproximadamente
4 veces, al menos aproximadamente 5 veces, al menos aproximadamente 6 veces, más de aproximadamente 1 vez, más de aproximadamente 2 veces, más de aproximadamente 3 veces, más de aproximadamente 4 veces, más de aproximadamente 5 veces o más de aproximadamente 6 veces. Por ejemplo, se puede considerar que un gen exhibe letalidad sintética con agregados de proteína tau si se selecciona (es decir, si se considera que exhibe letalidad sintética con agregados de proteína tau) en al menos aproximadamente el 30 %, al menos aproximadamente el 35 %, al menos aproximadamente el 40 %, al menos aproximadamente el 45 %, al menos aproximadamente el 50 %, al menos aproximadamente el 55 %, al menos aproximadamente el 60 %, al menos aproximadamente el 65 %, al menos aproximadamente el 70 %, al menos aproximadamente el 75 %, superior a aproximadamente el 30 aproximadamente el 35 %, superior a aproximadamente el 40 %, superior a aproximadamente el 45 aproximadamente el 50 %, superior a aproximadamente el 55 %, superior a aproximadamente el 60 aproximadamente el 65 %, más de aproximadamente el 70 % o más de aproximadamente el 75 % de todos experimentos. Por ejemplo, se puede considerar que un gen exhibe letalidad sintética con agregados de proteína tau si se selecciona (es decir, si se considera que exhibe letalidad sintética con agregados de proteína tau) en más de aproximadamente el 50 % o más de aproximadamente el 60 % de todos los experimentos. Como ejemplo específico, los métodos se pueden repetir en tres experimentos y se puede considerar que el gen exhibe letalidad sintética con agregados de proteína tau si se selecciona (es decir, si se considera que exhibe letalidad sintética con agregados de proteína tau) en al menos dos de los tres experimentos.
Si diferentes versiones de una secuencia están asociadas con un número de referencia en diferentes momentos, se entiende la versión asociada con el número de referencia en la fecha de entrada en vigor de presentación de esta solicitud. La fecha de entrada en vigor de presentación significa la primera entre la fecha de presentación real o la fecha de presentación de una solicitud de prioridad que se refiere al número de referencia, si corresponde. Igualmente, si diferentes versiones de una publicación, sitio web o similares se publican en diferentes momentos, se entiende la versión publicada más recientemente en la fecha de entrada en vigor de presentación de la solicitud, a menos que se indique lo contrario. Cualquier característica, etapa, elemento, realización o aspecto de la invención se puede usar en combinación con cualquier otro a menos que se indique específicamente lo contrario. Aunque la presente invención se ha descrito con cierto nivel de detalle a modo de ilustración y ejemplo con fines de claridad de entendimiento, será evidente que pueden practicarse ciertos cambios y modificaciones dentro del alcance de las reivindicaciones adjuntas.
BREVE DESCRIPCIÓN DE LAS SECUENCIAS
Las secuencias de nucleótidos y aminoácidos enumeradas en el listado de secuencias adjunto se muestran usando abreviaturas de letras convencionales para bases nucleotídicas y el código de tres letras para aminoácidos. Las secuencias de nucleótidos siguen la convención estándar de comenzar en el extremo 5' de la secuencia y avanzar (es decir, de izquierda a derecha en cada línea) hasta el extremo 3'. Solo se muestra una cadena de cada secuencia de nucleótidos, pero se entiende que la cadena complementaria está incluida por cualquier referencia a la cadena que se muestra. Cuando se proporciona una secuencia de nucleótidos que codifica una secuencia de aminoácidos, se entiende que también se proporcionan variantes degeneradas de codones del mismo que codifican la misma secuencia de aminoácidos. Las secuencias de aminoácidos siguen la convención estándar de comenzar en el extremo
amino de la secuencia y avanzar (es decir, de izquierda a derecha en cada línea) hasta el extremo carboxi.
Tabla 2. Descri ción de Secuencias.
continuación
Ejemplos
Ejemplo 1. Desarrollo de una plataforma de cribado CRISPR/Cas9 de todo el genoma para identificar vulnerabilidades genéticas asociadas con la agregación de Tau
La agregación anormal o fibrilación de proteínas es una característica definitoria de muchas enfermedades, en particular, una serie de enfermedades neurodegenerativas tales como enfermedad de Alzheimer (EA), enfermedad de Parkinson (EP), demencia frontotemporal (DFT; en inglés, FTD), esclerosis lateral amiotrófica (ELA), encefalopatía traumática crónica (ETC; en inglés, CTE), enfermedad de Creutzfeldt-Jakob (ECJ) y otras. En muchas de estas enfermedades, la fibrilación de ciertas proteínas en agregados insolubles no es sólo una característica de la enfermedad, sino que también se ha implicado como factor causante de neurotoxicidad. Asimismo, estas enfermedades se caracterizan por la propagación de patología agregada a través del sistema nervioso central siguiendo patrones estereotipados, un proceso que se correlaciona con la progresión de la enfermedad. La identificación de genes y vías genéticas que modifican los procesos de agregación anormal de proteínas o propagación de agregados de célula a célula, es, por tanto, de gran valor para comprender mejor la etiología de las enfermedades neurodegenerativas, así como para diseñar estrategias de intervención terapéutica.
Para identificar genes y vías que exhiben letalidad sintética con agregados de proteínas asociados a enfermedades, se desarrolló una plataforma para realizar análisis de todo el genoma con bibliotecas de ARNgu de nucleasa CRISPR (CRISPRn). La plataforma identifica genes que, cuando se interrumpen, causan la muerte celular específicamente en el contexto de una agregación anormal de proteínas. La identificación de dichos genes puede dilucidar los mecanismos de neurotoxicidad asociada a agregados y las vías genéticas que promueven la muerte de neuronas en el contexto de enfermedades neurodegenerativas.
El cribado empleó una línea celular humana con biosensor Tau que consiste en células HEK293T que expresan de manera estable el dominio de cuatro repeticiones de Tau, Tau_4RD, que comprende el dominio de unión a los microtúbulos de Tau (MBD) con la mutación patogénica P301S, fusionado a CFP o YFP. Es decir, las células HEK293T contienen dos transgenes que expresan de manera estable variantes de la proteína asociadas a enfermedades fusionadas con la proteína fluorescente CFP o a la proteína fluorescente YFP: Tau4RD-CFP/Tau4RD-YFP (TCY), en donde el dominio de repetición de tau (4RD) comprende la mutación patogénica P301S. Véase lafigura 1.En estas líneas de biosensores, la agregación de proteína tau-CFP/tau-YFP produce una señal FRET, el resultado de una transferencia de energía fluorescente de la CFP donadora a la YFP aceptora. Véase lafigura2. Las células positivas en FRET, que contienen agregados de Tau, se pueden clasificar y aislar mediante citometría de flujo. En el punto de partida, las células no estimuladas expresan los indicadores en un estado estable y soluble con señal FRET mínima. Tras la estimulación (por ejemplo, transfección en liposomas de partículas de semillas), las proteínas indicadoras forman agregados, produciendo una señal FRET. Las células que contienen agregados se pueden aislar mediante FACS. La propagación estable de líneas celulares que contienen agregados, Ag.[+], se puede aislar mediante dilución clonal en serie de las líneas celulares Ag.[-].
Se realizaron varias modificaciones a esta línea celular biosensora de Tau para que sea útil para el cribado genético. En primer lugar, estas células biosensoras Tau se modificaron mediante la introducción de un transgén que expresa Cas9 a través de un vector lentiviral. Se seleccionaron líneas celulares transgénicas clonales que expresaban Cas9 con blasticidina y se aislaron mediante dilución clonal en serie para obtener clones derivados de células individuales. Se evaluó el nivel de expresión de Cas9 de los clones mediante qRT-PCR(Figura 3A)y para la actividad de escisión del ADN mediante PCR digital(Figura 3B).Los niveles relativos de expresión de Cas9 también se muestran en laTabla 3.
Tabla 3. Niveles relativos de expresión de Cas9.
De manera específica, La eficiencia de la mutación de Cas9 se evaluó mediante PCR digital 3 y 7 días después de la transducción de lentivirus que codifican ARNg contra dos genes diana seleccionados. La eficiencia de corte estuvo limitada por los niveles de Cas9 en clones de menor expresión. Se necesitaba un clon con un nivel adecuado de expresión de Cas9 para lograr la máxima actividad. Varios clones derivados con menor expresión de Cas9 no pudieron cortar secuencias objetivo de manera eficiente, mientras que los clones con mayor expresión (incluidos los utilizados para el cribado) pudieron generar mutaciones en secuencias diana de los genes PERK ySNCAcon aproximadamente UN 80 % de eficiencia después de tres días en cultivo. Ya se observó un corte eficiente 3 días después de la transducción de ARNg con una mejora solo marginal después de 7 días. Se seleccionó el clon 7B10-C3 como clon de alto rendimiento para utilizarlo en pantallas de biblioteca posteriores.
En segundo lugar, se obtuvieron subclones de estas líneas celulares biosensoras Tau-CFP/Tau-YFP (TCY) que expresan Cas9 en las que la proteína Tau está presente de forma estable en un estado no agregado (el estado predeterminado) (Ag.[-]) o agregado ( Ag.[+]). Para obtener líneas celulares en las que la proteína Tau está presente de manera estable y persistente en un estado agregado, las células que expresan Cas9 se trataron con Tau fibrilada recombinante mezclada con reactivo de lipofectamina para "sembrar" la agregación de la proteína Tau expresada transgénicamente por estas células. Véase lafigura 5.Luego, las células "sembradas" se diluyeron en serie para obtener clones derivados de células individuales y estos clones se expandieron después para identificar las líneas celulares clonales en las que los agregados de Tau persisten de manera estable en todas las células con crecimiento y múltiples pases a lo largo del tiempo.
Luego, se analizaron los subclones Ag.[+] y Ag.[-] para determinar si ciertos genes fueron alterados por la agregación de Tau. Véase lafigura 6.La agrupación no supervisada indicó que los subclones de Ag.[+] y los subclones de Ag.[-] eran distintos por el estado de agregación (procedimiento de agrupación: transformación logarítmica de lecturas por millón de kilobases (RPKM); métrica de distancia: 1 - valor absoluto del coeficiente de correlación de Pearson; agrupamiento jerárquico). Véase lafigura 7.La agrupación no supervisada se refiere a la agrupación de muestras sin ningún conocimiento previo sobre las muestras (por ejemplo, de qué línea celular proviene una muestra (Ag.[+] o Ag.[-])), de modo que la formación de agrupaciones entre las muestras está completamente impulsada por los datos mismos. El procedimiento fue el siguiente: (1) añadir 1 al nivel de expresión de todos los genes (la unidad es RPKM) en cada muestra; (2) transformar en log2 los valores de RPKM 1; (3) calcular el coeficiente de correlación de Pearson por pares entre todas las muestras; (4) calcular la similitud entre cada par de muestras como 1 valor absoluto del coeficiente de correlación de Pearson; y (5) aplicar el algoritmo de agrupamiento jerárquico estándar en los valores de (4). Los datos mostraron que las muestras de las líneas celulares Ag.[+] y Ag.[-] forman grupos claramente separados basándose únicamente en sus perfiles de expresión genética, lo que sugiere que las líneas celulares Ag.[+] y Ag.[-] son diferentes en el nivel de expresión génica.
La secuenciación de ARN de los subclones Ag.[+] y Ag.[-] del biosensor Tau reveló que > 1500 genes están alterados por la agregación de Tau. Véase lafigura 8.Los genes significativamente alterados se definieron como aquellos que tenían un cambio > 1,5 en cualquier dirección y un valor de p < 0,01. RNAseq de cinco subclones de Ag.[+] y cinco subclones de Ag.[-] demostró que la presencia de agregados de Tau provoca un cambio fuerte y consistente en el perfil transcripcional de los subclones de Ag.[+] en comparación con los subclones de Ag.[-]. Por lo tanto, los subclones de Ag.[+] pueden ser selectivamente vulnerables a ciertas agresiones genéticas de una manera que los subclones de Ag.[-] no lo son. Como se explica en el Ejemplo 2, se probaron estas vulnerabilidades utilizando bibliotecas CRISPR para realizar una detección de abandono e identificar ARNgu que causan letalidad sintética cuando se combinan con agregados de Tau.
Ejemplo 2. Detección CRISPR/Cas9 de todo el genoma para identificar vulnerabilidades genéticas asociadas con la agregación de Tau
Para probar las vulnerabilidades identificadas en el Ejemplo 1, se realizó una prueba de nucleasa CRISPR de todo el genoma (CRISPRn) para revelar vulnerabilidades genéticas asociadas con la agregación de Tau. De manera específica, las células biosensoras Tau-CFP/Tau-YFP que expresan Cas9, ya sea con agregados (Ag.[+]) o sin agregados (Ag.[-]), se transdujeron con dos bibliotecas de ARNgu CRISPR de todo el genoma humano utilizando un enfoque de administración lentiviral para introducir mutaciones defectivas en cada gen diana en una representación de 500X células por ARNgu. Véanse lasfiguras 4y9. Las bibliotecas de ARNgu de CRISPR se dirigen a los exones constitutivos 5' para una desactivación funcional con una cobertura promedio de 3-4 ARNgu por gen. Los ARNgu se diseñaron para evitar efectos fuera de la diana al evitar los ARNgu con dos o menos coincidencias con secuencias genómicas fuera de la diana. Las bibliotecas cubren 19.050 genes humanos y 1.864 miARN con 1.000 ARNgu de control no dirigidos. Las bibliotecas se transdujeron con una multiplicidad de infección (MOI) <0,3 con una cobertura de> 500 células por ARNgu. Se cultivaron células biosensoras de tau bajo selección con puromicina para seleccionar células con integración y expresión de un ARNgu único por célula. La selección de puromicina comenzó 24 horas después de la transducción a 1 pg/ml.
Se recolectaron muestras de células (Ag.[+][]) y (Ag.[-]) en cinco puntos de tiempo: Días 3, 6-7, 10-11, 13-14 y 17 postransducción. El aislamiento del ADN y la amplificación por PCR de las construcciones de ARNgu integradas permitieron una caracterización mediante secuenciación de próxima generación (NGS) del repertorio de ARNgu en cada línea celular en cada punto de tiempo. La selección consistió en 3 experimentos replicados. El análisis de los datos de NGS permitió la identificación de genes esenciales, que consiste en los genes cuyos ARNgu dirigidos se deplecionan con el tiempo en las líneas celulares tanto Ag.[+] como Ag.[-]. Véase lafigura 10A. Lo que es más importante, este método de cribado permitió la identificación de genes letales sintéticos, que consisten en genes cuyos ARNgu dirigidos se deplecionan con el tiempo preferentemente en las líneas celulares Ag.[+] en comparación con las líneas celulares Ag.[-]. Véase lafigura 10B.
Los perfiles de depleción se evaluaron mediante un análisis de curso del tiempo recién definido en el que los ARNgu con un patrón constante de lecturas de NGS decrecientes desde el punto de tiempo más temprano (día 3) hasta el punto de tiempo final (día 17) se consideraron deplecionados. Véase lafigura 11y laTabla 4.
Tabla 4. Estrate ia del curso de tiem o ara el cribado de abandono CRISPRn.
Este es un enfoque analítico novedoso para evaluar la depleción del ARNgu, en comparación con el enfoque más convencional de simplemente comparar las lecturas de NGS de la colección de células del punto final con el primer pase. En comparación, otras pruebas de depleción de CRISPRn de todo el genoma publicadas han comparado las puntuaciones de CRISPR como la proporción de recuentos de lectura entre la recolección final y el pase inicial. En contraste, el enfoque de los inventores fue examinar el curso de tiempo completo para identificar genes que exhiben un patrón de depleción de ARNgu a lo largo del tiempo. El análisis del curso del tiempo identificó más ARNgu génicos deplecionados en el subconjunto Ag.[+][] que en el subconjunto Ag.[-] en los tres experimentos repetidos.
Las primeras etapas del análisis incluyeron control de calidad (ARNgu no dirigidos), normalización (por lecturas totales por muestra) y marcaje de "presencia"/"ausencia" por ARNgu por muestra con un límite de detección de 30 lecturas. En primer lugar, se probaron los ARNgu no dirigidos. Se confirmó que no hubo ninguna perturbación o deleción fuerte o sistemático de los 1000 ARNgu de control no dirigidos. En segundo lugar, se realizaron experimentos para mostrar que la biblioteca de ARNgu de plásmido y las muestras del día 3 eran muy similares con respecto a los recuentos de lectura de los ARNgu (no se había producido una depleción significativa de ARNgu el día 3). Esta fue la validación para usar el Día 3 como punto de referencia para el análisis del curso temporal.
Luego se identificaron los genes deplecionados mediante un análisis del curso del tiempo. En cada repetición, se seleccionaron los ARNgu deplecionados con patrones de tiempo no crecientes (el recuento de lecturas el día 10 < el día 3; el recuento de lecturas el día 14 < el día 6; y el recuento de lecturas el día 17 < el día 10) en relación con el día 3. Los ARNgu ya deplecionados el Día 3 (es decir, por debajo del límite de detección de 30 el Día 3 y permaneciendo por debajo del límite de detección durante el resto de los puntos de tiempo) se mantuvieron. Se ignoró la fluctuación cercana al límite de detección (es decir, si el recuento de lecturas de un ARNgu fue menor o igual que el recuento medio de lecturas de los ARNgu que están por debajo del límite de detección 2*desviación estándar de los recuentos de lectura de ARNgu que están por debajo del límite de detección), el ARNgu se consideró no detectado). Los genes se seleccionaron si tenían una cantidad suficiente de ARNgu deplecionados (1 de 1 ARNgu total, 1 de 2 ARNgu total, 1 de 3 ARNgu totales, 2 de 4 ARNgu totales, 2 de 5 ARNgu totales o 3 de 6 ARNgu totales). Los genes se retuvieron si se seleccionaron en al menos 2 de 3 experimentos repetidos en el transcurso del tiempo. A continuación, los genes se identificaron como "esenciales" si los ARNgu dirigidos a esos genes se deplecionaron tanto en Ag.[+] como en Ag.[-]. Los genes se identificaron como "letales sintéticos" si los ARNgu dirigidos a esos genes se deplecionaron en Ag.[+][] pero no en Ag.[-] (sin depleción en Ag.[-] en comparación con Ag.[+]; refinamiento basado en múltiples repeticiones e inspección manual). Por refinamiento se entiende tomar los genes que se presentaron en los tres experimentos repetidos en el transcurso del tiempo en la línea celular Ag.[+][] y luego excluir cualquier gen que se presentó en al menos un experimento en la línea celular Ag.[-]. La inspección manual implicó revisar los ARN guía que se mostraron deplecionados en uno de los experimentos de Ag.[+], buscando ARN guía agotados en todos los experimentos de Ag.[+][] pero en ningún experimento de Ag.[-] o en solo un experimento de Ag.[-], y confirmando que no se perdieron las dianas.
No hubo ninguna alteración fuerte o sistemática con los 1.000 ARNgu de control no dirigidos (datos no mostrados). De manera específica, para cada uno de los días 6, 7, 10, 11, 13, 14 y 17 frente al día 3, todas las repeticiones experimentales se combinaron tanto de Ag.[+] como de Ag.[-]. Se calcularon los valores de P (ajustados para pruebas múltiples) de los cambios en los recuentos de lectura. Ningún ARNg en ningún momento tuvo un valor de p <0,05.
El análisis del curso del tiempo reveló 977 genes como genes "esenciales" con ARNgu que tenían patrones temporales de depleción en los subclones Ag.[+][] y Ag.[-] (datos no mostrados). Estos genes identificados como "esenciales" se superponen significativamente con genes identificados como esenciales en conjuntos de datos públicos (véase, por ejemplo, Tzelepiset al.(2016) Cell Reports 17: 1193-1205 and Wanget al.(2015) Science 350(6264):1096-1101). Véase lafigura 13y laTabla 5.
T l . r i i n n n i l n n n li .
Los genes a los que se dirigen múltiples ARNgu que exhiben un patrón de depleción en múltiples cribados replicados en Ag.[+][] pero no en Ag.[-] se seleccionaron para su posterior validación en un cribado secundario como genes "letales sintéticos". Se identificaron setenta y un genes agotados en todas las réplicas experimentales de Ag.[+] en comparación con el día 3, pero no en ninguna réplica experimental de Ag.[-]. Véase lafigura 14.Los datos de tres genes diana (Gen diana 1, gen diana 5 y gen diana 6) se muestran en lafigura 15B.
Estos 71 genes se identificaron mediante análisis de la depleción del ARNgu en tres réplicas, depleción ARNgu en múltiples puntos de tiempo e inspección visual de datos. Luego se generaron minibibliotecas GenScript personalizadas. La biblioteca 1 contenía 462 ARNgu de direccionamiento únicos (dirigidos a los 71 supuestos genes letales sintéticos con ARNgu identificados como agotados selectivamente en las células Ag.[+]y 10 supuestos genes esenciales con ARNgu identificados como agotados tanto en las células Ag.[+] como en las Ag.[-], cada uno dirigido por ~6 ARNgu únicos). La biblioteca 2 contenía 500 ARNgu de control no dirigidos únicos que no se alteraron durante el experimento en el transcurso del tiempo. La distribución del recuento de lecturas de las dos bibliotecas se muestra en lasfiguras 16y17,respectivamente. Esto muestra que la representación de las dos bibliotecas se mantiene después de la expansión. La r de Pearson describe la correlación estadística entre la biblioteca original y la posterior a la expansión.
Luego, las bibliotecas se utilizaron para un cribado secundario de las diana candidatas. Véase lafigura 18.La depleción de los ARNgu dirigidos en relación con los ARNgu de control no dirigidos se evaluó a lo largo de un enfoque de 17 días en clones (Ag.[+][]) y (Ag.[-]) con una alta representación de 10,000X células por ARNgu. La depleción de los ARNgu de los genes diana en relación con los ARNgu de control se evaluó a lo largo del tiempo en los clones Ag.[+] y Ag.[-]. En primer lugar, los recuentos de lectura se normalizaron mediante la suma de los ARNgu no dirigidos. La normalización implicó multiplicar un número escalar para cada muestra (diferentes muestras pueden tener diferentes números escalares) de modo que, después de la normalización, los recuentos totales de lectura de todos los ARNgu no dirigidos por muestra fueran los mismos. Después de tal normalización, los ARNgu no dirigidos no mostraron cambios como se esperaba, y muchos ARNgu dirigidos mostraron patrones de depleción en el tiempo. Usando la normalización por suma de los ARNgu no dirigidos, solo una pequeña cantidad de ARNgu no dirigidos mostraron alteración (criterios de alteración: valor de p < 0,01; factor de cambio > 1,2). El patrón era aleatorio y la magnitud era pequeña. Además de no mostrar visualmente (cualitativamente) perturbaciones en los ARNgu no dirigidos, esto se demostró mediante análisis estadístico (valor de p y factor de cambio) el día 7 frente al día 3, el día 10 y el día 3, el día 14 frente al día 3 y el día 17 frente al día 3 en que solo se alteró una pequeña cantidad de ARNgu no dirigidos. Adicionalmente, qué ARNgu en qué momento se alteraron (en relación con el día 3) fue bastante aleatorio porque el mapa de calor no mostró un patrón temporal para ninguno de estos ARNgu alterados (datos no mostrados). A continuación, los 10 supuestos genes "esenciales" se validaron mediante la evaluación de la depleción del ARNgu en muestras de Ag.[+]y Ag.[-]. Los datos del curso temporal de las réplicas de los ARNgu de los diez genes se muestran en lasfiguras 19A-19C.
A continuación, se evaluaron patrones de depleción para los genes letales sintéticos candidatos. Para cada ARNgu, se calculó la significancia (valor de p) del factor tiempo (se utilizaron dos experimentos como repeticiones por punto de tiempo). Se utilizó un modelo de regresión lineal general estándar (GLM): y ~ beta*t, donde y=recuento de lecturas y t=tiempo, se aplicó a los datos (dos experimentos repetidos en los cinco puntos temporales (del día 3 al día 17)). Resolver el GLM dio como resultado un valor p para beta que define qué tan significativamente beta es aparte de 0 (es decir, la importancia del factor tiempo). Adicionalmente, cada ARNgu se marcó si tenía un patrón de depleción en cada experimento (Día 10 <Día 3; Y Día 14 < Día 7, Y Día 17 < Día 10). Los ARNgu se seleccionaron si tenían un valor p de curso temporal significativo (< 1e-3) y un patrón de depleción en cada experimento. Luego se seleccionaron los ARNgu si tenían un patrón de depleción distinguible entre Ag.[+] y Ag.[-] (prueba diferencial sobre tasas de desintegración exponencial ajustadas). Para determinar si había un patrón de depleción distinguible, se usaron las siguientes etapas: (1) en las células Ag.[+] y Ag.[-], para cada ARNgu X, promediar sus recuentos de lectura en dos experimentos repetidos en cada punto de tiempo; (2) ajustar los datos de cinco puntos de tiempo de (1) a un modelo de decaimiento exponencial: Leer el recuento de lecturas=exp(-tasa* t) para estimar la tasa, dando como resultado un valor esperado de la tasa (por ejemplo, tasa 1) y su error estándar asociado (por ejemplo, error estándar 1); y (3) si [tasa 1]/[tasa 2] > 1,5 o < 1/1,5, y ([tasa 1]-[tasa 2])/sqrt([error estándar 1]2 [error estándar 2]2) > 1,96 o < -1,96, entonces tasa1 y tasa2 son estadísticamente diferentes. Un ejemplo de un patrón de depleción distinguible (es decir, un patrón de depleción más dramático o más agudo en las células Ag.[+]) se muestra en lafigura 20.Luego se seleccionaron genes en función del número de ARNgu seleccionados (2 de 4 ARNgu totales dirigidos a un gen, o 3 de 6 ARNgu totales dirigidos a un gen).
Se identificaron veintisiete ARNgu que tenían patrones de depleción más nítidos en Ag.[+][] en comparación con Ag.[-]. Véase lafigura 21.De estos, se seleccionaron cuatro genes diana para su posterior validación (gen diana 1, gen diana 2, gen diana 3 y gen diana 4) según la cantidad de ARNgu seleccionados (2 de 4 ARNgu totales dirigidos a un gen, o 3 de 6 ARNgu totales dirigidos a un gen). La validación de los genes diana 1 y 2 se muestra en lafigura 22A,y la validación para los genes diana 3 y 4 se muestra en lafigura 22B.Los 10 genes esenciales también fueron validados mediante un método de detección secundario (datos no mostrados).
Para una mayor validación, las células biosensoras Tau-CFP/Tau-YFP que expresan Cas9, ya sea con agregados (Ag.[+]) o sin agregados (Ag.[-]), fueron transducidos con ARNgu dirigidos al gen diana 1, el gen diana 2 y el gen diana 4 utilizan un enfoque de administración lentiviral para introducir mutaciones defectivas en cada gen diana(Figura 25).
Después de la expansión bajo selección durante 7 días, la viabilidad celular y la muerte celular se evaluaron y cuantificaron mediante citometría de flujo.(Figura 26)y se evaluaron y confirmaron las disminuciones en la expresión de los genes diana (datos no mostrados). Los ARNgu dirigidos al gen diana 1, el gen diana 2 y el gen diana 4 causaron la muerte celular selectiva en las células Ag.[+][] pero no en las células Ag.[-].
Ejemplo 3. Desarrollo de una plataforma de cribado CRISPR/Cas9 de todo el genoma para identificar modificadores genéticos de Tau que afectan a la viabilidad celular mediante una biblioteca CRISPR/Cas9 de activación transcripcional
Para identificar genes que cuando se activan transcripcionalmente exhiben letalidad sintética con agregados de proteínas asociados a enfermedades, se desarrolló una plataforma para realizar análisis de todo el genoma con bibliotecas de ARNgu de activación transcripcional de CRISPR (CRISPRa). La plataforma identifica genes que, tras la activación transcripcional, causan la muerte celular específicamente en el contexto de una agregación anormal de proteínas. La identificación de dichos genes puede dilucidar los mecanismos de neurotoxicidad asociada a agregados y las vías genéticas que promueven la muerte de neuronas en el contexto de enfermedades neurodegenerativas.
El cribado empleó una línea celular humana con biosensor Tau que consiste en células HEK293T que expresan de manera estable el dominio de cuatro repeticiones de Tau, Tau_4RD, que comprende el dominio de unión a los microtúbulos de Tau (MBD) con la mutación patogénica P301S, fusionado a CFP o YFP. Es decir, las células HEK293T contienen dos transgenes que expresan de manera estable variantes de la proteína asociadas a enfermedades fusionadas con la proteína fluorescente CFP o a la proteína fluorescente YFP: Tau4RD-CFP/Tau4RD-YFP (TCY), en donde el dominio de repetición de tau (4RD) comprende la mutación patogénica P301S. Véase lafigura 1.En estas líneas de biosensores, la agregación de proteína tau-CFP/tau-YFP produce una señal FRET, el resultado de una transferencia de energía fluorescente de la CFP donadora a la YFP aceptora. Véase lafigura 2.Las células positivas en FRET, que contienen agregados de Tau, se pueden clasificar y aislar mediante citometría de flujo. En el punto de partida, las células no estimuladas expresan los indicadores en un estado estable y soluble con señal FRET mínima. Tras la estimulación (por ejemplo, transfección en liposomas de partículas de semillas), las proteínas indicadoras forman agregados, produciendo una señal FRET. Las células que contienen agregados se pueden aislar mediante FACS. La propagación estable de líneas celulares que contienen agregados, Ag.[+], se puede aislar mediante dilución clonal en serie de las líneas celulares Ag.[-].
Se realizaron varias modificaciones a esta línea celular biosensora de Tau para que sea útil para el cribado genético. En primer lugar, esta línea celular biosensora se modificó transgénicamente para expresar los componentes del sistema de activación transcripcional CRISPR/Cas SAM: dCas9-VP64 y MS2-P65-HSF1. Las construcciones lentivirales dCas9-VP64 y MS2-P65-HSF1 se proporcionan en las SEQ ID NO: 42 y 43, respectivamente. Se seleccionó el clon DC11 como clon de alto rendimiento para utilizarlo en pantallas de biblioteca posteriores. Este clon fue validado por su eficacia en la activación de genes diana seleccionados.
En segundo lugar, se obtuvieron subclones de estas líneas celulares biosensoras Tau-CFP/Tau-YFP (TCY) que expresan SAM en las que la proteína Tau está presente de forma estable en un estado no agregado (el estado predeterminado) (Ag.[-]) o agregado ( Ag.[+]). Para obtener líneas celulares en las que la proteína Tau está presente de manera estable y persistente en un estado agregado, las células que expresan SAM se trataron con Tau fibrilada recombinante mezclada con reactivo de lipofectamina para "sembrar" la agregación de la proteína Tau expresada transgénicamente por estas células. Luego, las células "sembradas" se diluyeron en serie para obtener clones derivados de células individuales y estos clones se expandieron después para identificar las líneas celulares clonales en las que los agregados de Tau persisten de manera estable en todas las células con crecimiento y múltiples pases a lo largo del tiempo. Uno de estos clones estables con agregados positivos Ag.[+], DC11-B6, se seleccionaron para su expansión y uso en el cribado.
Ejemplo 4. Plataforma de detección CRISPR/Cas9 de todo el genoma para identificar modificadores genéticos de Tau que afectan la viabilidad celular mediante una biblioteca CRISPR/Cas9 de activación transcripcional
Se realizó una detección CRISPRa de activación transcripcional de todo el genoma (hSAM) combinada para revelar modificadores genéticos de Tau que afectan a la viabilidad celular utilizando las líneas celulares clonales desarrolladas en el Ejemplo 3. De manera específica, las células biosensoras Tau-CFP/Tau-YFP que expresan SAM (es decir, que expresan dCas9-VP64/MS2-P65-HSF1), ya sea con agregados (Ag.[+]) o sin agregados (Ag.[-]), se transdujeron con una biblioteca de ARNgu CRISPR hSAM de todo el genoma humano utilizando un enfoque de administración lentiviral para activar transcripcionalmente cada gen diana en una representación de 500X células por ARNgu. La biblioteca de ARNgu CRISPR hSAM se dirige a sitios dentro de 200 pb aguas arriba del sitio de inicio de la transcripción con una cobertura promedio de 3-4 ARNgu por gen. Los ARNgu se diseñaron para evitar efectos fuera de la diana al evitar los ARNgu con dos o menos coincidencias con secuencias genómicas fuera de la diana. La biblioteca cubre 18.946 genes humanos. La biblioteca se transdujo con una multiplicidad de infección (MOI) <0,3 con una cobertura de> 500 células por ARNgu. Se cultivaron células biosensoras de tau bajo selección con zeocina para seleccionar células con integración y expresión de un ARNgu único por célula.
Se recolectaron muestras de células (Ag.[+][]) y (Ag.[-]) en cinco puntos de tiempo: Días 3, 6, 7, 14 y 17 postransducción. El aislamiento del ADN y la amplificación por PCR de las construcciones de ARNgu integradas permitieron una caracterización mediante secuenciación de próxima generación (NGS) del repertorio de ARNgu en cada línea celular en cada punto de tiempo. La selección consistió en 4 experimentos replicados. El análisis de los datos de NGS permitió la identificación de genes que, tras la activación transcripcional, conducían a la muerte celular. Es probable que los ARNgu que se deplecionan en ambas líneas celulares estén interrumpiendo algún proceso celular esencial para la viabilidad celular, mientras que los ARNgu que se deplecionan específicamente en la línea celular Ag.[+], aunque la depleción sea nula o inferior en la línea celular Ag.[-], pueden indicar un efecto letal sintético, en el que la activación de un gen diana específico se combina con la presencia de agregados de Tau en la célula para inducir la muerte celular. Estos genes letales sintéticos son de interés como posibles modificadores de la toxicidad de las células asociadas a tau.
El análisis de datos reflejó el enfoque utilizado en el Ejemplo 2 e incluyó (1) perfiles de ARNgu en dos poblaciones de células Ag.[+] y Ag.[-] durante un período de 17 días y (2) perfiles de ARNgu en Ag.[+]en comparación con Ag.[-] en diferentes puntos de tiempo o en el punto de tiempo final en comparación con el día 3. Debido a que el análisis de datos reflejó el enfoque utilizado en el Ejemplo 2, no todos los detalles del Ejemplo 2 se repiten aquí.
Como se explica en el Ejemplo 2, este es un enfoque analítico novedoso para evaluar la depleción del ARNgu, en comparación con el enfoque más convencional de simplemente comparar las lecturas de NGS de la colección de células del punto final con el primer pase. En comparación, otras pruebas de cribado de depleción con CRISPR de todo el genoma publicadas han comparado las puntuaciones de CRISPR como la proporción de recuentos de lectura entre la recolección final y el pase inicial. En contraste, el enfoque de los inventores fue examinar el curso de tiempo completo para identificar genes que exhiben un patrón de depleción de ARNgu a lo largo del tiempo.
Luego se identificaron los genes deplecionados mediante un análisis del curso del tiempo. En cada repetición, los ARNgu deplecionados con patrones de tiempo no crecientes (recuento de lecturas el día 10 < el día 3; recuento de lecturas el día 14 < el día 7; y se seleccionaron el recuento de lectura el día 17 < el día 10) en relación con el día 3. Los ARNgu ya deplecionados el Día 3 (es decir, por debajo del límite de detección de 30 el Día 3 y permaneciendo por debajo del límite de detección durante el resto de los puntos de tiempo) se mantuvieron. Se ignoró la fluctuación cercana al límite de detección (es decir, si el recuento de lecturas de un ARNgu fue menor o igual que el recuento medio de lecturas de los ARNgu que están por debajo del límite de detección 2*desviación estándar de los recuentos de lectura de ARNgu que están por debajo del límite de detección), el ARNgu se consideró no detectado). Los genes se seleccionaron si tenían una cantidad suficiente de ARNgu deplecionados (1 de 1 ARNgu total, 1 de 2 ARNgu total, 1 de 3 ARNgu totales, 2 de 4 ARNgu totales, 2 de 5 ARNgu totales o 3 de 6 ARNgu totales). A continuación, los genes se identificaron como "esenciales" si los ARNgu dirigidos a esos genes se deplecionaron tanto en Ag.[+] como en Ag.[-]. Los genes se identificaron como "letales sintéticos" si los ARNgu dirigidos a esos genes se deplecionaron en Ag.[+][] pero no en Ag.[-] (sin depleción en Ag.[-] en comparación con Ag.[+]; refinamiento basado en múltiples repeticiones e inspección manual). Por refinamiento se entiende tomar los genes que se presentaron en los tres experimentos repetidos en el transcurso del tiempo en la línea celular Ag.[+][] y luego excluir cualquier gen que se presentó en al menos un experimento en la línea celular Ag.[-]. La inspección manual implicó revisar los ARN guía que se mostraron deplecionados en uno de los experimentos de Ag.[+], buscando ARN guía agotados en todos los experimentos de Ag.[+][] pero en ningún experimento de Ag.[-] o en solo un experimento de Ag.[-], y confirmando que no se perdieron las dianas.
Los genes a los que se dirigen múltiples ARNgu que exhiben un patrón de depleción en múltiples cribados replicados en Ag.[+] pero no en Ag.[-] se identificaron como genes candidatos "letales sintéticos". A continuación, se evaluaron patrones de depleción para los genes letales sintéticos candidatos. Para cada ARNgu, se calculó la significancia (valor de p) del factor tiempo (se utilizaron dos experimentos como repeticiones por punto de tiempo). Se utilizó un modelo de regresión lineal general estándar (GLM): y ~ beta*t, donde y=recuento de lecturas y t=tiempo, se aplicó a los datos (dos experimentos repetidos en los cinco puntos temporales (del día 3 al día 17)). Resolver el GLM dio como resultado un valor p para beta que define qué tan significativamente beta es aparte de 0 (es decir, la importancia del factor tiempo). Adicionalmente, cada ARNgu se marcó si tenía un patrón de depleción en cada experimento (Día 10 <Día 3; Y Día 14 < Día 7, Y Día 17 < Día 10). Los ARNgu se seleccionaron si tenían un valor p de curso temporal significativo (< 1e-3) y un patrón de depleción en cada experimento. Luego se seleccionaron los ARNgu si tenían un patrón de depleción distinguible entre Ag.[+] y Ag.[-] (prueba diferencial sobre tasas de desintegración exponencial ajustadas). Para determinar si había un patrón de depleción distinguible, se usaron las siguientes etapas: (1) en las células Ag.[+] y Ag.[-], para cada ARNgu X, promediar sus recuentos de lectura en dos experimentos repetidos en cada punto de tiempo; (2) ajustar los datos de cinco puntos de tiempo de (1) a un modelo de decaimiento exponencial: Leer el recuento de lecturas=exp(-tasa* t) para estimar la tasa, dando como resultado un valor esperado de la tasa (por ejemplo, tasa 1) y su error estándar asociado (por ejemplo, error estándar 1); y (3) si [tasa 1]/[tasa 2] > 1,5 o < 1/1,5, y ([tasa 1]-[tasa 2])/sqrt([error estándar 1]2 [error estándar 2]2) >1,96 o < -1,96, entonces tasa1 y tasa2 son estadísticamente diferentes. Un ejemplo de un patrón de depleción distinguible (es decir, un patrón de depleción más dramático o más agudo en las células Ag.[+]) se muestra en lafigura 20.
Se identificó que trece ARNgu que representan nueve genes diana (genes diana 7-15) tenían patrones de depleción más nítidos en Ag.[+] en comparación con Ag.[-]. Véase lafigura 23.La validación para los genes diana 7-15 se muestra en lasfiguras 24A-24B.

Claims (27)

REIVINDICACIONES
1. Un método de cribado de vulnerabilidades genéticas asociadas con la agregación de tau, que comprende:
(a) proporcionar una población de células de agregación positiva y una población de células de agregación negativa, en donde cada población de células comprende una proteína Cas, un primer dominio de repetición de tau unido a un primer indicador, y un segundo dominio de repetición de tau unido a un segundo indicador,
en donde las células son células de mamífero,
en donde el primer indicador y el segundo indicador son proteínas fluorescentes y en donde el primer indicador y el segundo indicador son un par de transferencia de energía por resonancia de fluorescencia (FRET), en donde la población de células con agregación positiva comprende agregados del primer dominio de repetición de tau unido al primer indicador y del segundo dominio de repetición de tau unido al segundo indicador, y
en donde la población de células con agregación negativa no comprende agregados del primer dominio de repetición de tau unido al primer indicador y del segundo dominio de repetición de tau unido al segundo indicador;
(b) introducir en cada población de células una biblioteca que comprende una pluralidad de ARN de guía única que se dirigen a una pluralidad de genes, en donde la pluralidad de ARN de guía única forman complejos con la proteína Cas y la proteína Cas escinde la pluralidad de genes dando como resultado la desactivación de la función del gen; y
(c) determinar la abundancia de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células,
en donde la pluralidad de puntos de tiempo comprende al menos tres puntos de tiempo, en donde hay más de 1 día entre cada punto temporal,
en donde la depleción de un ARN guía en la población de células con agregación positiva pero no en la población de células con agregación negativa o una tasa más rápida de depleción de un ARN guía a lo largo del tiempo en la población de células con agregación positiva en relación con la población con agregación negativa indica que el gen al que se dirige el ARN guía exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau.
2. El método de la reivindicación 1, en donde la proteína Cas es una proteína Cas9, opcionalmente en donde la proteína Cas es una proteína Cas9 deStreptococcus pyogenes,opcionalmente en donde la proteína Cas comprende la SEQ ID NO: 21 y opcionalmente en donde la proteína Cas está codificada por una secuencia de codificación que comprende la secuencia expuesta en la SEQ ID NO: 22.
3. El método de cualquier reivindicación anterior, en donde la proteína Cas, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador se expresan de manera estable en las poblaciones de células o
en donde los ácidos nucleicos que codifican la proteína Cas, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador están integrados genómicamente en las poblaciones de células.
4. El método de cualquier reivindicación anterior, en donde cada ARN guía se dirige a un exón constitutivo, opcionalmente en donde cada ARN guía se dirige a un exón constitutivo en 5' o
en donde cada ARN guía se dirige a un primer exón, un segundo exón o un tercer exón.
5. Un método de cribado de vulnerabilidades genéticas asociadas con la agregación de tau, que comprende:
(a) proporcionar una población de células de agregación positiva y una población de células de agregación negativa, en donde cada población de células comprende una proteína Cas quimérica que comprende una proteína Cas inactiva para nucleasa fusionada a uno o más dominios de activación transcripcional, una proteína adaptadora quimérica que comprende una proteína adaptadora fusionada a uno o más dominios de activación transcripcional, un primer dominio de repetición de tau unido a un primer indicador, y un segundo dominio de repetición de tau unido a un segundo indicador,
en donde las células son células de mamífero,
en donde el primer indicador y el segundo indicador son proteínas fluorescentes y en donde el primer indicador y el segundo indicador son un par de transferencia de energía por resonancia de fluorescencia (FRET), en donde la población de células con agregación positiva comprende agregados del primer dominio de repetición de tau unido al primer indicador y del segundo dominio de repetición de tau unido al segundo indicador, y
en donde la población de células con agregación negativa no comprende agregados del primer dominio de repetición de tau unido al primer indicador y del segundo dominio de repetición de tau unido al segundo indicador;
(b) introducir en cada población de células una biblioteca que comprende una pluralidad de ARN de guía única que se dirigen a una pluralidad de genes, en donde la pluralidad de ARN de guía única forman complejos con la proteína Cas quimérica y la proteína adaptadora quimérica y los complejos activan la transcripción de la pluralidad de genes dando como resultado una mayor expresión génica; y
(c) determinar la abundancia de cada uno de la pluralidad de ARN de guía única en una pluralidad de puntos de tiempo durante un transcurso de tiempo en cada población de células,
en donde la pluralidad de puntos de tiempo comprende al menos tres puntos de tiempo, en donde hay más de 1 día entre cada punto temporal,
en donde la depleción de un ARN guía en la población de células con agregación positiva pero no en la población de células con agregación negativa o una tasa más rápida de depleción de un ARN guía a lo largo del tiempo en la población de células con agregación positiva en relación con la población con agregación negativa indica que la activación del gen al que se dirige el ARN guía exhibe letalidad sintética con agregados de proteína tau y es una vulnerabilidad genética asociada con la agregación de tau.
6. El método de la reivindicación 5, en donde la proteína Cas es una proteína Cas9, opcionalmente en donde la proteína Cas es una proteína Cas9 deStreptococcus pyogenesy
en donde la proteína Cas quimérica comprende la proteína Cas inactiva a nucleasa fusionada a un dominio de activación transcripcional VP64, opcionalmente en donde la proteína Cas quimérica comprende desde el extremo N al extremo C: la proteína Cas inactiva para nucleasas; una señal de localización nuclear; y el dominio activador transcripcional VP64, opcionalmente en donde la proteína Cas quimérica comprende la SEQ ID NO: 36 y opcionalmente en donde la proteína Cas quimérica está codificada por una secuencia de codificación que comprende la secuencia expuesta en la SEQ ID NO: 38 y
en donde la proteína adaptadora es una proteína de la cubierta MS2 y en donde el uno o más dominios de activación transcripcional en la proteína adaptadora quimérica comprenden un dominio de activación transcripcional p65 y un dominio de activación transcripcional HSF1, opcionalmente en donde la proteína adaptadora quimérica comprende desde el extremo N al extremo C: la proteína de la cubierta MS2; una señal de localización nuclear; el dominio de activación transcripcional p65; y el dominio de activación transcripcional HSF1, opcionalmente en donde la proteína adaptadora quimérica comprende la SEQ ID NO: 37 y opcionalmente en donde la proteína adaptadora quimérica está codificada por una secuencia de codificación que comprende la secuencia expuesta en la SEQ ID NO: 39.
7. El método de la reivindicación 5 o 6, en donde la proteína Cas quimérica, la proteína adaptadora quimérica, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador se expresan de manera estable en las poblaciones de células o
en donde los ácidos nucleicos que codifican la proteína Cas quimérica, la proteína adaptadora quimérica, el primer dominio de repetición de tau unido al primer indicador y el segundo dominio de repetición de tau unido al segundo indicador están integrados genómicamente en la población de células.
8. El método de una cualquiera de las reivindicaciones 5-7, en donde cada ARN guía se dirige a una secuencia diana del ARN guía en 200 pb aguas arriba de un sitio de iniciación de la transcripción y
en donde cada ARN guía comprende uno o más elementos de unión al adaptador a los que la proteína adaptadora quimérica puede unirse específicamente, opcionalmente en donde cada ARN guía comprende dos elementos de unión al adaptador a los que la proteína adaptadora quimérica puede unirse específicamente, opcionalmente en donde un primer elemento de unión al adaptador está dentro de un primer bucle de cada uno de uno o más ARN guía y un segundo elemento de unión al adaptador está dentro de un segundo bucle de cada uno de uno o más ARN guía, opcionalmente en donde el elemento de unión al adaptador comprende la secuencia expuesta en la SEQ ID NO: 33, y
opcionalmente en donde cada uno de uno o más ARN guía es un ARN guía único que comprende un fragmento de ARN de CRISPR (ARNcr) fusionado con un fragmento de ARN de CRISPR (ARNtracr) transactivante y el primer bucle es el tetrabucle correspondiente a los restos 13-16 de la SEQ ID NO: 17, y el segundo bucle es el bucle 2 del tallo correspondiente a los restos 53-56 de la SEQ ID NO: 17.
9. El método de cualquier reivindicación anterior, en donde el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau es un dominio de repetición de tau humano y/o
en donde el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden una mutación proagregación, opcionalmente en donde el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden una mutación tau P301S y/o
en donde el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden un dominio de cuatro repeticiones tau y/o
en donde el primer dominio de repetición de tau y/o el segundo dominio de repetición de tau comprenden la SEQ ID NO: 11, y/o
en donde el primer dominio de repetición de tau y el segundo dominio de repetición de tau son iguales.
10. El método de cualquier reivindicación anterior, en donde el primer dominio de repetición de tau y el segundo dominio de repetición de tau son iguales y cada uno comprende un dominio de cuatro repeticiones de tau que comprende una mutación tau P301S.
11. El método de cualquier reivindicación anterior, en donde el primer indicador es la proteína fluorescente cian (CFP) y el segundo indicador es la proteína fluorescente amarilla (YFP).
12. El método de cualquier reivindicación anterior, en donde las células son células humanas, opcionalmente en donde las células son células HEK293T.
13. El método de cualquier reivindicación anterior, en donde la pluralidad de ARN de guía única se introducen en una concentración seleccionada de modo que la mayoría de las células reciban sólo uno de los ARN de guía única.
14. El método de cualquier reivindicación anterior, en donde la pluralidad de ARN de guía única se dirige a 100 o más genes, 1.000 o más genes o 10.000 o más genes o
en donde la biblioteca es una biblioteca de todo el genoma.
15. El método de cualquier reivindicación anterior, en donde una pluralidad de secuencias diana se dirigen en promedio en cada uno de la pluralidad dirigida de genes,
opcionalmente en donde al menos tres secuencias diana están dirigidas en promedio en cada uno de la pluralidad de genes diana y
opcionalmente en donde de aproximadamente tres a aproximadamente seis secuencias diana se dirigen en promedio en cada uno de la pluralidad dirigida de genes.
16. El método de cualquier reivindicación anterior, en donde la pluralidad de ARN de guía única se introducen en las poblaciones de células mediante transducción viral,
opcionalmente en donde cada uno de la pluralidad de ARN de guía única está en un vector viral separado, opcionalmente en donde la pluralidad de ARN de guía única se introduce en las poblaciones de células mediante transducción viral y
opcionalmente en donde las poblaciones de células se infectan con una multiplicidad de infección inferior a aproximadamente 0,3.
17. El método de cualquier reivindicación anterior, en donde la pluralidad de ARN de guía única se introduce en las poblaciones de células junto con un marcador de selección y la etapa (b) comprende además seleccionar células que comprenden el marcador de selección,
opcionalmente en donde el marcador de selección imparte resistencia a un fármaco, opcionalmente en donde el marcador de selección imparte resistencia a puromicina o zeocina, y
opcionalmente en donde el marcador de selección se selecciona de neomicina fosfotransferasa, higromicina B fosfotransferasa, puromicina-N-acetiltransferasa y blasticidina S desaminasa.
18. El método de cualquier reivindicación anterior, en donde las poblaciones de células en las que se introduce la pluralidad de ARN de guía única en la etapa (b) comprenden cada una más de aproximadamente 500 células por ARN de guía única.
19. El método de cualquier reivindicación anterior, en donde el transcurso de tiempo en la etapa (c) es de más de aproximadamente 1 semana, opcionalmente en donde el transcurso de tiempo en la etapa (c) es de más de aproximadamente 2 semanas.
20. El método de cualquier reivindicación anterior, en donde el transcurso de tiempo en la etapa (c) comprende de aproximadamente de 10 a aproximadamente 15 duplicaciones de células.
21. El método de cualquier reivindicación anterior, en donde la pluralidad de puntos de tiempo en la etapa (c) comprende aproximadamente cuatro puntos de tiempo o aproximadamente seis puntos de tiempo.
22. El método de cualquier reivindicación anterior, en donde hay más de aproximadamente 2 días entre cada punto de tiempo en la etapa (c), opcionalmente en donde hay entre aproximadamente 3 y aproximadamente 4 días entre cada punto de tiempo en la etapa (c).
23. El método de cualquier reivindicación anterior, en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si un ARN guía dirigido al gen se agota en la población de células con agregación positiva pero no en la población de células con agregación negativa,
opcionalmente en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si un ARN guía dirigido al gen tiene una tasa de depleción más rápida a lo largo del tiempo en la población de células con agregación positiva en relación con la población de células con agregación negativa.
24. El método de cualquier reivindicación anterior, en donde un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto temporal es menor o igual a la abundancia del ARN guía en el punto de tiempo anterior o
en donde un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores.
25. El método de cualquier reivindicación anterior, en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si más de aproximadamente el 30 % de los ARN guía en la biblioteca que se dirigen al gen se agotan en la población de células con agregación positiva, pero no en la población de células con agregación negativa,
opcionalmente en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) en una cualquiera de las siguientes situaciones:
(1) hay un ARN guía en la biblioteca que se dirige al gen y ese ARN guía se agota en la población de células con agregación positiva, pero no en la población de células con agregación negativa;
(2) hay dos ARN guía en la biblioteca que se dirigen al gen y al menos uno de los dos ARN guía está agotado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (3) hay tres ARN guía en la biblioteca que se dirigen al gen y al menos uno de los tres ARN guía está agotado en la población de células con agregación positiva, pero no en la población de células con agregación negativa; (4) hay cuatro ARN guía en la biblioteca que se dirigen al gen y al menos dos de los cuatro ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa;
(5) hay cinco ARN guía en la biblioteca que se dirigen al gen y al menos dos de los cinco ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa; y (6) hay seis ARN guía en la biblioteca que se dirigen al gen y al menos tres de los seis ARN guía están agotados en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
26. El método de cualquier reivindicación anterior, en donde el método se repite al menos tres veces en al menos tres experimentos diferentes y se considera que un gen exhibe letalidad sintética con agregados de proteína tau si se considera que exhibe letalidad sintética con agregados de proteína tau en más de aproximadamente el 50 % de al menos tres experimentos diferentes.
27. El método de cualquier reivindicación anterior, en donde el transcurso de tiempo en la etapa (c) es de más de aproximadamente 2 semanas,
en donde la pluralidad de puntos de tiempo en la etapa (c) comprende aproximadamente seis puntos de tiempo, en donde hay entre aproximadamente 3 y aproximadamente 4 días entre cada punto temporal en la etapa (c), en donde un ARN guía se considera agotado en la etapa (c) si la abundancia del ARN guía en cada punto de tiempo después del segundo punto de tiempo es menor o igual a la abundancia del punto de tiempo dos puntos de tiempo anteriores, y
en donde se considera que un gen exhibe letalidad sintética con agregados de proteína tau en la etapa (c) si más de aproximadamente el 30 % de los ARN guía en la biblioteca que se dirigen al gen se agotan en la población de células con agregación positiva, pero no en la población de células con agregación negativa.
ES20718947T 2019-03-18 2020-03-17 Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau Active ES2969026T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201962820101P 2019-03-18 2019-03-18
PCT/US2020/023121 WO2020190927A1 (en) 2019-03-18 2020-03-17 Crispr/cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation

Publications (1)

Publication Number Publication Date
ES2969026T3 true ES2969026T3 (es) 2024-05-16

Family

ID=70285886

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20718947T Active ES2969026T3 (es) 2019-03-18 2020-03-17 Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau

Country Status (10)

Country Link
US (2) US11781131B2 (es)
EP (1) EP3769090B1 (es)
JP (1) JP7389135B2 (es)
CN (1) CN113711046B (es)
AU (1) AU2020241856B2 (es)
CA (1) CA3127814C (es)
ES (1) ES2969026T3 (es)
IL (1) IL286359B2 (es)
SG (1) SG11202108090XA (es)
WO (1) WO2020190927A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2970541T3 (es) 2019-03-18 2024-05-29 Regeneron Pharma Plataforma de cribado CRISPR/CAS para identificar modificadores genéticos de la siembra o agregación de tau
AU2020241856B2 (en) 2019-03-18 2024-06-27 Regeneron Pharmaceuticals, Inc. CRISPR/Cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation
JP2022536606A (ja) 2019-06-14 2022-08-18 リジェネロン・ファーマシューティカルズ・インコーポレイテッド タウオパチーのモデル
CN114426982B (zh) * 2022-02-22 2024-03-22 上海交通大学 一种细胞代谢重编程的方法及其应用

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001271553A1 (en) * 2000-06-23 2002-01-08 Genetastix Corporation High throughput generation and screening of fully human antibody repertoire in yeast
CN101333555B (zh) * 2007-12-25 2012-03-21 浙江大学 新型的g蛋白偶联受体细胞水平筛选系统构建与应用
WO2009126161A1 (en) 2008-04-11 2009-10-15 Utc Fuel Cells, Llc Fuel cell and bipolar plate having manifold sump
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
WO2014008404A1 (en) 2012-07-03 2014-01-09 Washington University Antibodies to tau
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
WO2014089104A1 (en) 2012-12-03 2014-06-12 Washington University Method for detection of aggregates in biological samples
JP6620018B2 (ja) 2012-12-06 2019-12-11 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Crisprに基づくゲノム修飾および制御
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20140186843A1 (en) 2012-12-12 2014-07-03 Massachusetts Institute Of Technology Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
CN105658796B (zh) 2012-12-12 2021-10-26 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
EP3553174A1 (en) 2012-12-17 2019-10-16 President and Fellows of Harvard College Rna-guided human genome engineering
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
CA2907198C (en) 2013-03-15 2019-12-10 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
CN105518146B (zh) 2013-04-04 2022-07-15 哈佛学院校长同事会 利用CRISPR/Cas系统的基因组编辑的治疗性用途
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
JP2017512751A (ja) 2014-02-14 2017-05-25 アイピエリアン,インコーポレイティド タウペプチド、抗タウ抗体、およびそれらの使用方法
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
EP3169776A4 (en) 2014-07-14 2018-07-04 The Regents of The University of California Crispr/cas transcriptional modulation
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3325018A4 (en) 2015-07-22 2019-04-24 Duke University HIGH EFFICIENCY SCREENING OF REGULATORY ELEMENT FUNCTION USING EPIGENOUS EDITING TECHNOLOGIES
EP3386550B1 (en) 2015-12-07 2021-01-20 Arc Bio, LLC Methods for the making and using of guide nucleic acids
TWI773666B (zh) 2016-03-30 2022-08-11 美商英特利亞醫療公司 Crispr/cas 組分之脂質奈米粒子調配物
WO2017172764A1 (en) 2016-04-01 2017-10-05 The Regents Of The University Of California Modified cell line and method of determining tauopathies
WO2017174329A1 (en) * 2016-04-04 2017-10-12 Eth Zurich Mammalian cell line for protein production and library generation
US10995137B2 (en) 2017-01-04 2021-05-04 H. Lundbeck A/S Antibodies specific for hyperphosphorlated tau for the treatment of ocular diseases
GB201708998D0 (en) 2017-06-06 2017-07-19 Univ Leuven Kath Methods for identifying activators and suppressors
US20200202981A1 (en) 2017-07-07 2020-06-25 The Broad Institute, Inc. Methods for designing guide sequences for guided nucleases
SG11201912235PA (en) 2017-07-31 2020-01-30 Regeneron Pharma Cas-transgenic mouse embryonic stem cells and mice and uses thereof
MX2020001177A (es) * 2017-07-31 2020-09-25 Regeneron Pharma Animales no humanos reporteros de crispr y usos de los mismos.
CA3089331A1 (en) 2018-03-19 2019-09-26 Regeneron Pharmaceuticals, Inc. Transcription modulation in animals using crispr/cas systems
EP3942558A1 (en) 2019-03-18 2022-01-26 Regeneron Pharmaceuticals, Inc. Methods and systems for crispr selection
ES2970541T3 (es) 2019-03-18 2024-05-29 Regeneron Pharma Plataforma de cribado CRISPR/CAS para identificar modificadores genéticos de la siembra o agregación de tau
AU2020241856B2 (en) 2019-03-18 2024-06-27 Regeneron Pharmaceuticals, Inc. CRISPR/Cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation
JP2022536606A (ja) 2019-06-14 2022-08-18 リジェネロン・ファーマシューティカルズ・インコーポレイテッド タウオパチーのモデル

Also Published As

Publication number Publication date
IL286359B2 (en) 2024-06-01
EP3769090B1 (en) 2023-11-15
WO2020190927A1 (en) 2020-09-24
JP2022526297A (ja) 2022-05-24
AU2020241856B2 (en) 2024-06-27
KR20210141536A (ko) 2021-11-23
CA3127814A1 (en) 2020-09-24
CN113711046B (zh) 2023-08-29
IL286359B1 (en) 2024-02-01
US11781131B2 (en) 2023-10-10
US20200299681A1 (en) 2020-09-24
SG11202108090XA (en) 2021-08-30
CA3127814C (en) 2024-05-14
IL286359A (en) 2021-10-31
AU2020241856A1 (en) 2021-08-12
JP7389135B2 (ja) 2023-11-29
CN113711046A (zh) 2021-11-26
US20230416728A1 (en) 2023-12-28
EP3769090A1 (en) 2021-01-27
EP3769090C0 (en) 2023-11-15

Similar Documents

Publication Publication Date Title
ES2969026T3 (es) Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau
ES2760477T3 (es) Uso de proteínas de unión a ADN programables para potenciar la modificación dirigida del genoma
ES2970541T3 (es) Plataforma de cribado CRISPR/CAS para identificar modificadores genéticos de la siembra o agregación de tau
BR112019028146A2 (pt) rna guia sintético para sistemas ativadores de crispr/cas
US20240076613A1 (en) Models of tauopathy
CN110199020B (zh) 用于快速产生用于细胞系开发的同源重组载体的dna质粒
EP4349979A1 (en) Engineered cas12i nuclease, effector protein and use thereof
BR112021016019A2 (pt) Sistemas e proteínas de fusão crispr/cas
KR102683424B1 (ko) 타우 응집과 관련된 유전적 취약성을 식별하기 위한 CRISPR/Cas 드랍아웃 스크리닝 플랫폼
RU2808829C2 (ru) Платформа crispr/cas для исключающего скрининга для выявления генетических уязвимостей, связанных с агрегацией тау-белка
RU2819350C2 (ru) Скрининговая платформа crispr/cas для идентификации генетических модификаторов засева или агрегации тау-белка
WO2023104185A1 (en) Engineered cas12b effector proteins and methods of use thereof