ES2808651T3 - Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína - Google Patents

Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína Download PDF

Info

Publication number
ES2808651T3
ES2808651T3 ES15744035T ES15744035T ES2808651T3 ES 2808651 T3 ES2808651 T3 ES 2808651T3 ES 15744035 T ES15744035 T ES 15744035T ES 15744035 T ES15744035 T ES 15744035T ES 2808651 T3 ES2808651 T3 ES 2808651T3
Authority
ES
Spain
Prior art keywords
epitope
histone
pattern
amount
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15744035T
Other languages
English (en)
Inventor
Alexander Ruthenburg
Adrian Grzybowski
Zhonglei Chen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Chicago
Original Assignee
University of Chicago
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Chicago filed Critical University of Chicago
Application granted granted Critical
Publication of ES2808651T3 publication Critical patent/ES2808651T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6875Nucleoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2440/00Post-translational modifications [PTMs] in chemical analysis of biological material

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Peptides Or Proteins (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método de determinación de una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, comprendiendo el método: preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas que comprenden, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa del locus genómico y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo; añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende (i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y (ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón, forman una asociación estable de proteína-ADN; añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión, a la colección dopada, para capturar una cantidad de nucleosomas naturales y el patrón que comprende el primer epítopo; determinar una abundancia genómica relativa para el primer epítopo comparando la cantidad de una secuencia de nucleótidos dada asociada con los nucleosomas naturales capturados que comprenden el primer epítopo y la cantidad de una secuencia de nucleótidos dada asociada con el nucleosoma natural en una cantidad introducida de la colección dopada; determinar una eficacia de captura de patrón para el primer epítopo comparando la cantidad de una secuencia de código de barras asociada con el patrón capturado y la cantidad de una secuencia de nucleótidos dada asociada con el patrón en una cantidad introducida de la colección dopada; y determinar la densidad del primer epítopo de la histona central en el locus genómico comparando la abundancia genómica relativa respecto a la eficacia de captura de patrón; en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.

Description

DESCRIPCIÓN
Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína
Solicitudes relacionadas
La presente solicitud de patente reivindica el beneficio de la fecha de presentación de la solicitud de patente provisional de Estados Unidos n.° 61/935.129, presentada el 3 de febrero de 2014.
Investigación subvencionada federalmente
Esta invención se hizo con apoyo gubernamental de EE. UU. según los números de concesión NIH-1R21HG007426. El gobierno tiene determinados derechos en la invención.
Antecedentes
La cromatina, el ensamblaje de proteína y ADN que es la forma fisiológica del genoma, es un regulador crucial de la función del ADN subyacente, desempeñando funciones clave en todos los aspectos del metabolismo del ADN, el funcionamiento celular y del organismo al completo. La unidad repetitiva fundamental de la estructura de la cromatina es el nucleosoma: una combinación de unión a ADN de ocho proteínas histonas centrales (dos copias de H2A, H2B, H3 y H4), alrededor de las que se enrollan casi dos giros completos de ADN genómico. Los nucleosomas individuales pueden generarse, por ejemplo, por digestión con nucleasa microcócica. Las histonas incluyen las histonas H1, H2A, H2B, H3 y H4 y pueden modificarse para que incluyan una pluralidad de epítopos y modificaciones postraduccionales.
En la célula, las modificaciones postraduccionales (o la variación de la secuencia de aminoácidos) de la histona pueden regular cambios en los estados locales de la cromatina que gobierna la accesibilidad del ADN subyacente, regulando los procesos que varían desde activación transcripcional hasta silenciamiento génico. Estas modificaciones químicas se denominan "marcas epigenéticas" y añaden otra capa de información sin alterar la capacidad de emparejamiento de bases convencional del ADN y parecen actuar en concierto entre sí y con otras características distintivas de la cromatina para controlar el genoma. Los procesos celulares tan variados como la transcripción, la replicación, la pluripotencia de las células madre, el silenciamiento génico, la inactivación del cromosoma X, la reparación del ADN, la apoptosis, la herencia epigenética, la retención de la identidad celular, la hematopoyesis, los cánceres, numerosos trastornos del sistema nervioso central, enfermedad cardiovascular, la diabetes, la obesidad, las infecciones bacterianas y programas de expresión génica durante el desarrollo parecen implicar, todos ellos, modificaciones epigenéticas en su curso o causalidad.
La inmunoprecipitación de la cromatina (ChIP, cchromatin immunoprecipitation), es la metodología fundamental para consultar el lugar donde existen estas modificaciones epigenéticas en el genoma, así como para rastrear sus cambios como una función de la identidad celular en el desarrollo y transiciones patológicas (por ejemplo, célula madre hematopoyética a leucemia). La ChIP es bien conocida en la técnica. En resumen, la ChIP es un ensayo de extracción que se basa en la fragmentación del material genómico de los organismos vivos por corte mecánico, físico, químico o enzimático para generar una combinación de fragmentos de proteína-ADN (en gran medida nucleosomas) que entonces pueden sondearse con un reactivo de afinidad tal como un anticuerpo que se une a una proteína particular o modificación postraduccional de la misma para extraer fragmentos específicos de la cromatina. La ChIP usa captura de afinidad de una combinación de cromatina fragmentada "introducida" para enriquecer fragmentos que albergan el epítopo de interés. La identidad, abundancia relativa y posición del genoma de los fragmentos de a Dn capturados indirectamente pueden identificarse por numerosas técnicas incluyendo RT-PCR, secuenciación de última generación, ddPCR, qPCR, hibridación con sonda en micromatriz y otros métodos con capacidad de leer y cuantificar la secuencia de ADN, todos ellos conocidos en la técnica.
Esta información acerca de la posición del ADN asociado con proteína in situ puede usarse entonces para deducir la posición de la proteína unida al ADN en el genoma intacto, y proporcionar una evaluación de la cantidad de material unido que estaba presente en esos locus de ADN en comparación con la frecuencia de esa secuencia en la combinación inicial de fragmentos sometidos a captura de afinidad, es decir, "la aportación", o con respecto a algún otro locus genómico. En otras palabras, el material capturado se analiza por qPCR, secuenciación de última generación o similares y se compara con controles negativos para evaluar el enriquecimiento relativo producido por la inmunoprecipitación, también conocido como extracción. De forma notable, la presente tecnología responde a la pregunta "dónde en el genoma" en un sentido relativo, sin proporcionar información significativa acerca de la abundancia real del epítopo abordado en ese sitio. No obstante, la ChIP ha proporcionado ideas sobre la manera en que una combinación de colocación, marcas de histona y variantes de histona, pueden regular la expresión génica (Henikoff, 2008; Jiang y Pugh, 2009; Li y Carey, 2007) y la manera en que estos cambios pueden regular la diferenciación celular (Bernstein et al., 2007). Además, es una herramienta crucial en la comprensión de la función de la epigenética en cáncer y otras enfermedades, incluyendo el descubrimiento de marcadores de enfermedad (Dawson y Kouzarides, 2012; Feinberg, 2007).
A pesar de servir como técnica experimental central en investigación epigenética, la inmunoprecipitación de la cromatina acoplada a secuenciación profunda (ChIP-seq) u otro análisis tiene varios inconvenientes importantes. En primer lugar, cada medición de ChIP es relativa, no está normalizada a ninguna referencia, lo que impide la comparación directa de los datos que provienen de las diferentes repeticiones de la misma muestra, diferentes células y diferentes pacientes. En segundo lugar, la ChIP es muy dependiente de la calidad de los reactivos de anticuerpo que varían en especificidad y afinidad incluso con diferentes lotes del mismo anticuerpo, que puede tener afinidad significativa por epítopos inespecíficos dando lugar a menudo a detección de positivos falsos e interpretación incorrecta de los datos (Bock et al., 2011; Nady et al., 2008; Park, 2009; Fuchs et al., 2011; Landt et al., 2012; Egelhofer et al., 2011). La mayor fuente de error experimental en la ChIP es la calidad de los reactivos de afinidad de anticuerpo empleados para capturar los epítopos deseados (modificaciones de histona, variantes o factores de transcripción). La promiscuidad problemática de la unión de anticuerpo de "calidad ChIP" revelado usando ensayos inmovilizados de epítopos peptídicos relacionados (Bock et al., 2011; Egelhofer et al., 2011; Fuchs et al., 2011), está compuesto de medidas cada vez más sofisticadas de afinidad, especificidad y reproducibilidad; hasta un 80 % de varios cientos de anticuerpos comerciales no pasaron los rigurosos controles de calidad (Egelhofer et al., 2011; Landt et al., 2012). Incluso diferentes lotes del mismo anticuerpo comercial pueden variar en la afinidad aparente por la diana en hasta 20 veces (Hattori et al., 2013) y presentar diferencias de especificidad notables (Nishikori et al., 2012). Aún actualmente, no hay medidas disponibles de la especificidad del anticuerpo en experimentos de ChIP disponibles, dando lugar a una gran incertidumbre en la evaluación de los datos. En tercer lugar, incluso con afinidad y especificidad de anticuerpo equivalentes por dos epítopos diferentes, la amplia variabilidad de la abundancia del epítopo impediría la comparación significativa de los resultados de ChIP (Leroy et al., 2013; Young et al., 2009). Finalmente, las diferencias muy pequeñas en la preparación de ChIP pueden producir diferencias significativas en los datos producidos, dando lugar a inconsistencia de un experimento a otro. Las diferencias en la manipulación del experimentador (Marinov et al., 2014), así como las cantidades equivalentes de carga de la muestra en cada carril del secuenciador a pesar de la amplificación diferencial (Zhang y Pugh, 2011) hacen que las comparaciones basadas en ChIP no sesgadas sean problemáticas.
Como los datos de ChIP se expresan en una escala relativa que es muy dependiente de las condiciones experimentales precisas, la normalización en último lugar requiere suposiciones que no pueden garantizarse (Bin Liu et al., 2013; Liang y Keles, 2012) o la mayoría de datos experimentales debe sacrificarse en asignar picos para permitir comparaciones (Zhang et al., 2008). Más allá de la asignación de picos, hay pocos controles de calidad ChIP-seq ampliamente aplicados, aún en los peores casos, ChIP no es reproducible (Egelhofer et al., 2011; Landt et al., 2012; Marinov et al., 2014). Aún ninguno de estos factores se tiene en cuenta en las metodologías o tecnologías actuales. Con la presente tecnología ChIP, es imposible medir las densidades absolutas de modificaciones de histona de una manera específica de locus. Por consiguiente, los picos de diferentes modificaciones de histona que parecen solapar en determinados locus genómicos no pueden compararse significativamente. Además, la variación experimental y los escollos que están ocultos al experimentador anulan los ensayos ChIP para que sirvan como producto de diagnóstico del paciente fiable (a pesar de las claras conexiones entre las marcas epigenéticas que miden y numerosos estados patológicos), y también impiden la utilidad de ChIP en investigación científica básica.
Teytelman et al. (Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins, PNAS, 12 de noviembre de 2012, vol. 110, n.° 46, 18602-18607) describen un artefacto en ChIP que da lugar a enriquecimiento reproducible, pero biológicamente significativo de proteínas en genes muy expresados, causado por altos niveles de transcripción de polimerasa II y polimerasa III. El documento WO 2013/184930 divulga un método para identificar la especificidad de fármacos epigenéticos, que comprende combinar una molécula candidata con una colección de mononucleosomas sintéticos, en el que cada mononucleosoma en la colección tiene un patrón único de modificaciones de histona y/o un patrón único de modificaciones de ADN y uno o más códigos de barra únicos cuya secuencia y posición en el ADN nucleosómico es indicativo del patrón único de modificaciones del nucleosoma en el mononucleosoma.
Breve descripción de la invención
Un método de determinación de una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, comprendiendo el método:
preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas que comprenden, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa del locus genómico y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo;
añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende
(i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón, forman una asociación estable de proteína-ADN;
añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión, a la colección dopada, para capturar una cantidad de nucleosomas naturales y el patrón que comprende el primer epítopo;
determinar una abundancia genómica relativa para el primer epítopo comparando la cantidad de una secuencia de nucleótidos dada asociada con los nucleosomas naturales capturados que comprenden el primer epítopo y la cantidad de una secuencia de nucleótidos dada asociada con el nucleosoma natural en una cantidad introducida de la colección dopada; determinar una eficacia de captura de patrón para el primer epítopo comparando la cantidad de una secuencia de código de barras asociada con el patrón capturado y la cantidad de una secuencia de nucleótidos dada asociada con el patrón en una cantidad introducida de la colección dopada; y determinar la densidad del primer epítopo de la histona central en el locus genómico comparando la abundancia genómica relativa respecto a la eficacia de captura de patrón;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.
En una realización preferida, la determinación de la eficacia de captura de patrón comprende comparar la relación de una cantidad capturada de la molécula de código de barras respecto a una cantidad introducida de los nucleosomas reconstituidos.
En otra realización preferida, la determinación de la abundancia genómica relativa comprende comparar la relación de una cantidad capturada de la secuencia de nucleótidos del nucleosoma natural con una cantidad introducida de secuencia de nucleótidos del nucleosoma natural.
En realizaciones preferidas, el primer agente de afinidad es un anticuerpo dirigido al primer epítopo.
En una realización preferida, la pluralidad de patrones se añade a la colección, comprendiendo cada patrón un nucleosoma reconstituido que comprende
(i) la histona patrón que tiene el primer epítopo y
(ii) la molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a la molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la molécula de código de barras codifica un parámetro de concentración indicativo de la concentración del patrón añadido a la colección y en el que a la colección se añaden patrones que tienen al menos dos concentraciones diferentes.
En una realización preferida, la pluralidad de patrones comprende además patrones que comprenden nucleosomas reconstituidos que comprenden (i) uno o más epítopos inespecíficos y (ii) un código de barras de molécula patrón que codifica una identidad de epítopo inespecífico y parámetros de concentración indicativos del epítopo inespecífico. En una realización preferida, el método comprende además determinar una especificidad de captura inespecífica para el primer reactivo de afinidad basándose en una o más eficacias de captura para los epítopos inespecíficos y corregir la densidad del primer epítopo de la histona central en el locus genómico basándose en la especificidad de la captura inespecífica.
En realizaciones preferidas, la secuencia de código de barras es una secuencia ausente en el genoma de la célula. En realizaciones preferidas, se determina una abundancia de al menos una de las secuencias de nucleótidos del nucleosoma y la secuencia de nucleótidos patrón mediante un método seleccionado del grupo que consiste en PCR, qPCR, ddPCR, secuenciación de última generación, hibridación, autorradiografía, marcaje fluorescente, densidad óptica y el uso de sondas fluorescentes intercalantes.
En realizaciones preferidas, el primer epítopo de la histona central comprende al menos una modificación de aminoácido postraduccional seleccionada del grupo que consiste en N-acetilación de serina y alanina; fosforilación de serina, treonina y tirosina; N-crotonilación, N-acetilación de lisina; N6-metilación, N6,N6-dimetilación, N6,N6,N6-trimetilación de lisina; omega-N-metilación, dimetilación simétrica, dimetilación asimétrica de arginina; citrulinación de arginina; ubiquitinilación de lisina; sumoilación de lisina; O-metilación de serina y treonina y ADP-ribosilación de arginina, ácido aspártico y ácido glutámico.
En realizaciones preferidas, el polinucleótido bicatenario comprende una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO 1-115.
Se proporciona un método de diagnóstico de una enfermedad en un paciente, comprendiendo el método: determinar una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula del paciente, comprendiendo el método:
preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas que comprenden, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa del locus genómico y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo;
añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende
(i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón, forman una asociación estable de proteína-ADN; añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo,
un monocuerpo, un aptámero, un Fab y un péptido de unión, a la colección dopada, para capturar una cantidad de nucleosomas naturales y el patrón que comprende el primer epítopo;
determinar una abundancia genómica relativa para el primer epítopo comparando la cantidad de una secuencia de nucleótidos dada asociada con los nucleosomas naturales capturados que comprenden el primer epítopo y la cantidad de una secuencia de nucleótidos dada asociada con el nucleosoma natural en una cantidad introducida de la colección dopada;
determinar una eficacia de captura de patrón para el primer epítopo comparando la cantidad de una secuencia de código de barras asociada con el patrón capturado y la cantidad de una secuencia de nucleótidos dada asociada con el patrón en una cantidad introducida de la colección dopada; y
determinar la densidad del primer epítopo de la histona central en el locus genómico comparando la abundancia genómica relativa respecto a la eficacia de captura de patrón;
en el que la cantidad del primer epítopo en un locus dado es indicativa de una enfermedad asociada con cambios en modificaciones postraduccionales de la histona;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.
En una realización preferida, la enfermedad es leucemia mielógena aguda, el primer epítopo es N6,N6-dimetilación de lisina 79 de histona H3 y el locus es HOXA9 y MEIS1.
Se proporciona un método de determinación de una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, comprendiendo el método:
preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas, comprendiendo, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa de su locus genómico de origen, y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo; añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende
(i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la molécula patrón forman una asociación estable de proteína-ADN;
determinar una cantidad de la histona central en el locus genómico en la colección dopada añadiendo un segundo reactivo de afinidad a la colección dopada para recuperar una cantidad de nucleosomas que comprenden un segundo epítopo, en el que el segundo epítopo es un epítopo invariante presente en la histona central, y determinar una cantidad de secuencia de nucleótidos del nucleosoma en la cantidad de nucleosomas recuperados que comprenden el segundo epítopo, seleccionándose el segundo reactivo de afinidad del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión;
determinar una cantidad de patrón en la colección dopada recuperando una cantidad de nucleosoma reconstituido; en el que el nucleosoma reconstituido comprende el segundo epítopo, y determinar una cantidad de la molécula patrón en la cantidad de nucleosomas reconstituidos recuperados que comprenden el segundo epítopo; añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión a la colección dopada, para capturar una cantidad de nucleosomas naturales y nucleosomas reconstituidos que comprenden el primer epítopo; determinar una abundancia genómica relativa para el primer epítopo en un locus genómico basándose en la cantidad del patrón capturado que comprende el primer epítopo y la cantidad de la histona central en el locus genómico en la colección dopada;
determinar una eficacia de captura de patrón para el primer epítopo basándose en la cantidad de nucleosomas reconstituidos capturados y en la cantidad de patrón en la colección dopada; determinar la abundancia genómica relativa del primer epítopo de la histona central en el locus genómico basándose en la abundancia del primer epítopo para la histona central y la eficacia de captura de patrón;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.
En una realización preferida, el primer reactivo de afinidad es un anticuerpo dirigido al primer epítopo y en el que el segundo reactivo de afinidad es un anticuerpo dirigido al segundo epítopo.
Se proporciona un kit para realizar el método de la invención, que comprende:
un conjunto de patrones presentes, cada uno, en una diferente concentración,
en el que cada patrón comprende un nucleosoma reconstituido que comprende:
(i) una histona patrón o fragmento de histona patrón que tiene un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras que indica la concentración en que está presente el patrón, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, un ácido nucleico bloqueado y una secuencia de ADN, y siendo de al menos 10 pares de bases de longitud; en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica,
en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón forman una asociación estable de proteína-ADN.
En una realización preferida, el kit comprende al menos un reactivo de afinidad que reconoce el primer epítopo, en el que el reactivo de afinidad se selecciona del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, una Fab y un péptido de unión.
Breve descripción de las figuras
La figura 1 es un diagrama esquemático de ICe-ChIP-seq de H3K4me3, una de las realizaciones de experimentos de inmunoprecipitación de cromatina calibrada.
La figura 2 ilustra el diseño y preparación de nucleosomas semisintéticos con código de barras. Representación esquemática de la reconstitución de una escala de nucleosoma H3K4me3 semisintético: octámeros de histona, producidos por replegamiento de histonas centrales equimolares de fuentes recombinantes y semisintéticas, se purifican, después se mezclan con cantidades iguales de ADN de escala con código de barras. Representación esquemática de secuencias de ADN de colocación de nucleosoma con código de barras basadas en la secuencia de nucleosoma de colocación 601.
Figura 3: (A) La amplificación por ciclo de ADN de escala con código de barras se mide con qPCR utilizando una serie de dilución en serie 2 x ajustada por regresión lineal (R2 del ajuste presentado en cada barra). (B) Amplificación por ciclo de todos los miembros de escala de ADN con código de barras frente a los fragmentos de ADN genómico natural después de ligamiento de los adaptadores de secuenciación con cebadores que hibridan con estos adaptadores.
Figura 4: La ICe-ChIP-seq de H3K4me3 de la línea celular E14 de mESC muestra la densidad de modificación de histona dentro del intervalo esperado. El gráfico superior representa la densidad de modificación de histona H3K4me3 real para el grupo de genes HOXA en la línea celular E14 de mESC como una función de las coordenadas cromosómicas para el cromosoma 6. ICeChIP acoplada con secuenciación de extremos emparejados Illumina revela la densidad de modificación de H3K4me3 por par de bases (HMD, línea más oscura, intervalo de confianza del 95 %, línea más clara)) en el grupo de genes Hoxa en la línea E14 de mESC como una función de las coordenadas cromosómicas. Los genes codificantes y no codificantes están marcados con barras y flechas de dirección por debajo de cada gráfico. Los picos pequeños por debajo representan la señal de ChIP de H3K4me3 (parte superior) y la señal a aportación (parte inferior), expresada en recuentos de lectura sin procesar.
Figura 5. Un examen crítico de ICeChIP (A) La abundancia relativa de marcas de código de barras normalizada al miembro de escala más abundante medido en IP y aportación de ICeChIP-seq de H3K4me3 de HEK293. (B) ICeChIP-seq en comparación con ddPCR y qPCR: la línea central representa la densidad de modificación de histona (HMD) de H3K4me3 sin corregir ± IC del 95 % (líneas superiores e inferiores) en la línea celular E14 de mESC como una función de las ventanas cromosómicas. Las barras representan H3K4me3 medido por ddPCR y qPCR respectivamente en la misma escala de HMD (las barras de error son IC del 95 %), colocadas sobre el amplicón indicado.
Figura 6: La ICeChIP es muy reproducible y más robusta a las diferencias experimentales que ChIP convencional (A) Comparación de diagrama de dispersión de las dos muestras (S1 y S2) mediante representación de la media de HMD del nucleosoma (% H3K4me3) para picos asignados en los mismos locus. (B) Medición de HMD (% H3K4me3) frente al enriquecimiento (% IP/aportación, que representa la manera convencional de presentar los datos de ChIP) en el locus DNMT3a por ICeChIP-qPCR en mESCs como una función del conjugado de anticuerporesina con 10 |jg fijos de aportación de cromatina.
Figura 7: La reproducibilidad y robustez de ICeChIP. (A) Comparación de dos experimentos de ICeChIP dirigidos a H3K27me3 de células S2 de Drosophila, seriados de la misma aportación, pero con gran variación en IP y lavados. Se generaron datos de la muestra 1 usando nuestras condiciones de ICeChIP convencionales (15 minutos de incubación del conjugado de resina-Ab con aportación, seguido de cinco lavados durante 50 minutos) mientras que la IP de la muestra 2 se realizó con una incubación más corta y lavados por flujo de la resina con los mismos volúmenes aplicados sobre el tramo de un minuto. Cada dato puntual corresponde a la media de H3K27me3 promediada sobre una ventana no solapante de 3000 pb (N = 41158); las ventanas con insuficiente profundidad de aportación se excluyeron del análisis (límite > 5). Datos combinados de triplicados técnicos para cada protocolo (IP y mediciones independientes).
Figura 8: ICeChIP con múltiples patrones internos. Valoración de la cromatina introducida para un experimento de ICeChIP a pequeña escala presentado en la figura 9. El método funciona bien para la cromatina equivalente de 400 células.
Figura 9: ICeChIP con múltiples patrones internos revela la especificidad de la IP in situ. (A) Una comparación de captura de patrón interno (escalas de nucleosoma sin modificar, con código de barras de H3K4me3, H3K9me3, H3K27me3, H3K36me3, H3K79me2 simultáneamente dopadas en concentración equimolar) en cinco experimentos de ICeChIP-seq de múltiples patrones con anticuerpos contra cada una de las marcas de metilo. Los datos, presentados como eficiencia de IP relativa, normalizados a la escala específica, permiten una fácil comparación con los nucleosomas metilados inespecíficos potenciales, así como nucleosomas sin modificar. (B) Cálculo del enriquecimiento de IP en experimentos de ICeChIP de múltiples patrones de mESCs presentado como recuentos de lectura del miembro de escala sin procesar en la IP frente a la aportación para la marca específica, así como las escalas de fondo inespecíficas más altas para H3K4me3 (Active Motif AM39159), (C) H3K9me3 (M309M3-A (Hattori et al., 2013)), (D) H3K27me3 (Millipore 07-449)
Descripción detallada
Salvo que se defina de otro modo, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que el comprendido habitualmente por un experto en la materia a la que pertenece esta invención. En caso de conflicto, el presente documento, incluyendo las definiciones, prevalecerá. A continuación se describen métodos y materiales preferidos, aunque pueden usarse métodos y materiales similares o equivalentes a los descritos en este documento en la práctica o ensayo de la presente invención.
Los usos de los términos "un/o" y "una" y "el/la" y referencias similares en el contexto de la descripción de la invención (especialmente en el contexto de las siguientes reivindicaciones) deben interpretarse cubriendo tanto el singular como el plural, salvo que se indique lo contrario en este documento o se contradiga claramente por el contexto. La enumeración de intervalos de valores en este documento pretende servir simplemente como un método acortado de mencionar individualmente cada valor por separado que está dentro del intervalo, salvo que se indique de otro modo en este documento, y cada valor separado se incorpora en esta memoria descriptiva como si se indicara individualmente en este documento. Todos los métodos descritos en este documento pueden realizarse en cualquier orden adecuado salvo que se indique de otro modo en este documento o se contradiga claramente de otro modo por el contexto. El uso de todos los ejemplos, o expresiones ejemplares (por ejemplo, "tal como", "por ejemplo") proporcionadas en este documento, simplemente pretende ilustrar mejor la invención y no impone limitación al alcance de la invención salvo se reivindique de otro modo. Ninguna expresión en la memoria descriptiva debe interpretarse indicando algún elemento no reivindicado como esencial para la práctica de la invención.
I) Definiciones
El término "epítopo" se refiere a cualquier sitio en una biomolécula que pueda provocar la unión del reactivo de afinidad. El reactivo de afinidad podría reconocer una secuencia lineal de la biomolécula o fragmento de la biomolécula, forma de la biomolécula o fragmento de la biomolécula, propiedad quimicofísica de la biomolécula o su fragmento o combinación de estos.
Los "aminoácidos" pueden mencionarse en este documento por sus símbolos de tres letras habitualmente conocidos o por los símbolos de una letra recomendados por la Comisión de Nomenclatura Bioquímica IUPAC- IUB. Los residuos aminoacídicos en las proteínas o péptidos se abrevian de la siguiente manera: fenilalanina es Phe o F; leucina es Leu o L; isoleucina es Ile o I; metionina es Met o M; valina es Val o V; serina es Ser o S; prolina es Pro o P; treonina es Thr o T; alanina es Ala o A; tirosina es Tyr o Y; histidina es His o H; glutamina es Gln o Q; asparagina es Asn o N; lisina es Lys o K; ácido aspártico es Asp o D; ácido glutámico es Glu o E; cisteína es Cys o C; triptófano es Trp o W; arginina es Arg o R; y glicina es Gly o G.
El término "aminoácido" se refiere a aminoácidos de origen natural o no naturales, así como a análogos aminoacídicos y miméticos aminoacídicos que funcionan de una manera similar a los aminoácidos de origen natural. Los aminoácidos codificados naturales son los 20 aminoácidos comunes (alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptófano, tirosina y valina) y pirrolisina y selenocisteína. Los análogos aminoacídicos se refieren a compuestos que tienen la misma estructura química básica que un aminoácido de origen natural, es decir, un carbono que se une a un hidrógeno, un grupo carboxilo, un grupo amino y un grupo R, tal como, homoserina, norleucina, sulfóxido de metionina, metionina metil sulfonio. Dichos análogos tienen grupos R modificados (tales como, norleucina) o estructuras peptídicas modificadas, pero retienen la misma estructura química básica que un aminoácido de origen natural.
En cuanto a las secuencias de aminoácidos, un experto reconocerá que sustituciones, eliminaciones o adiciones a un ácido nucleico, péptido, polipéptido o secuencia proteínica que altere, añada o elimine un solo aminoácido o un pequeño porcentaje de aminoácidos en la secuencia codificada es una "variante modificada de manera conservativa" donde la alteración provoca la sustitución de un aminoácido con un aminoácido químicamente similar. Las tablas de sustitución conservativa que proporcionan aminoácidos funcionalmente similares son conocidas por los expertos en la materia. Dichas variantes modificadas de manera conservativa son además de y no excluyen las variantes polimórficas, homólogos/ortólogos entre especies y alelos de los agentes descritos en este documento.
Un "antígeno", como se usa en este documento, puede ser cualquier fragmento de aminoácidos (modificado o no modificado) de 5 aminoácidos o más que se reconocen por un anticuerpo o para el que se generan anticuerpos de reconocimiento. En determinadas realizaciones, los antígenos pueden comprender modificaciones de un aminoácido, tal como acetilación, metilación (por ejemplo, mono-, di-, tri-), fosforilación, ubiquitinación, por ejemplo, mono-, di-, tri-, poli-), sumoilación, ADP-ribosilación, citrulinación, biotinilación e isomerización cis-trans. En otras realizaciones, los antígenos pueden comprender mutaciones específicas, tales como mutaciones puntuales. En otras realizaciones más, los antígenos pueden comprender secuencia de aminoácidos de tipo silvestre.
Los términos "polipéptido", "péptido" y "proteína" se usan indistintamente en este documento para hacer referencia a un polímero de residuos aminoacídicos. Es decir, una descripción referida a un polipéptido se aplica de la misma manera a una descripción de un péptido y una descripción de una proteína, y viceversa. Los términos se aplican a polímeros de aminoácidos de origen natural, así como polímeros de aminoácidos en que uno o más residuos aminoacídicos son un aminoácido no natural. Como se usa en este documento, los términos abarcan cadenas de aminoácidos de cualquier longitud, incluyendo proteínas de longitud completa, donde los residuos aminoacídicos están unidos por enlaces peptídicos y/o pseudopeptídicos covalentes.
La expresión "modificación postraduccional" se refiere a cualquier modificación de un aminoácido natural o no natural que aparece o aparecería en dicho aminoácido después de haberlo incorporado en una cadena polipeptídica in vivo o in vitro. Dichas modificaciones incluyen, aunque sin limitación, acetilación, metilación (por ejemplo, mono-, di-, tri-), fosforilación, ubiquitinación (por ejemplo, mono-, di-, tri-, poli-), sumoilación, ADP-ribosilación, citrulinación, biotinilación e isomerización cis-trans. Dichas modificaciones pueden introducirse sintéticamente, por ejemplo, químicamente, durante la síntesis del polipéptido o enzimáticamente después de la síntesis del polipéptido o purificación del polipéptido.
La expresión "enriquecimiento por inmunoprecipitación (IP)" se refiere a las lecturas de patrón interno de la muestra inmunoprecipitada divididas por las lecturas del patrón interno de la muestra introducida.
El término "asimétrico" se refiere a un nucleosoma en que una histona dentro del dímero de histonas contiene una modificación postraduccional. Por ejemplo, la modificación trimetílica se encuentra en lisina 9 de una histona H3, pero está ausente en la segunda H3 dentro de un dímero.
El término "simétrico" se refiere a un nucleosoma en el que ambas histonas dentro de un dímero de histonas contienen una modificación postraduccional. Por ejemplo, la modificación trimetílica se encuentra en la lisina 9 de ambas histonas H3.
II) ChIP calibrada con patrón interno (ICeChIP)
Los ensayos de extracción realizados actualmente tienen unidades de medición arbitrarias, lo que hace que cualquier tipo de comparación entre cualquier tipo de experimento de extracción sea muy impreciso e impida el uso de los ensayos de extracción en diagnóstico médico e investigación. La precisión de la interpretación de los datos se mejora mediante una escala normalizada con unidades absolutas desacoplando los valores de resultado del ensayo y acoplándolos al fenómeno biológico real. Se proporcionan materiales y métodos que posibilitan el uso de ensayos de extracción en diagnóstico médico tal como en ensayos que identifican marcadores de enfermedad. En estos métodos, los datos resultantes del ensayo de extracción, tal como ChIP, se caracterizan no por valores arbitrarios específicos para un ensayo, sino por valores absolutos específicos para el propio marcador de enfermedad. Esto significa que los resultados de extracciones de diferentes muestras, diferentes extracciones de la misma muestra, extracciones de diferentes epítopos, extracciones realizadas en diferentes laboratorios pueden compararse fácil y directamente entre sí, lo que a menudo es imposible con los métodos y tecnologías disponibles actualmente.
Se describe un método de evaluación absoluta de proteínas unidas a ADN, isoformas proteínicas y densidades de modificación postraduccional de proteínas que denominamos ChIP calibrada con patrón interno (ICeChIP, Internal Standard Calibrated ChIP). Este método proporciona la primera medición local de modificaciones de histonas a una escala biológicamente significativa. Esta mejora de ChIP utiliza un patrón interno que no es de origen natural con el que puede compararse la lectura de ChIP. Como patrón interno, se desarrollaron complejos de proteína-ADN recombinantes y semisintéticos diseñados para que contuviesen epítopos con características afinidad, especificidad y avidez de tipo natural.
Estos complejos de proteína-ADN incluyen nucleosomas que albergan epítopos proteínicos con afinidad, especificidad y avidez de tipo natural por un reactivo de afinidad, y una secuencia de ADN que incluye una molécula de reconocimiento de patrón que comprende una secuencia de colocación y una secuencia única o código de barras. El "código de barras", que proporciona un medio único de reconocimiento específico del complejo de ADN-proteína, puede ser, por ejemplo, una secuencia de nucleótidos tal como ADN, un polipéptido, fluoróforo, cromóforo, secuencia de ARN, secuencia de ácido nucleico bloqueado, marcador de afinidad, etc., que identifica la identidad y/o concentración de un nucleosoma semisintético de patrón específico. Aquí, la expresión "de tipo natural" se refiere a cualquier epítopo proteínico que tenga propiedades de afinidad, especificidad y avidez similares a epítopos de origen natural.
La figura 1 muestra una realización de un ensayo de ICeChIP. En este esquema, una escala de nucleosoma semisintética de patrones con histona H3 modificada que porta N6,N6,N6-trimetilación de la lisina 4 en concentraciones definidas (codificada por cada código de barras de ADN único) se dopa en una colección de nucleosomas naturales aislados de núcleos humanos y liberados por digestión en el núcleo con nucleasa microcócica. Después, una muestra de la colección dopada con escala, se somete a inmunoprecipitación (IP), purificación de ADN y secuenciación de última generación. Otra muestra de la colección dopada con escala se retiene como muestra introducida y no se somete a inmunoprecipitación. Aquí, la inmunoprecipitación (IP) o "extracción" se refiere a un método o técnica para purificar la cromatina, los nucleosomas, los complejos de ADN-proteína, o proteínas que incluyen uno o más epítopos de interés donde el epítopo se pone en contacto con un reactivo de afinidad específico para un epítopo y separado de otros componentes de la colección.
La muestra inmunoprecipitada y la muestra introducida se someten a un método con capacidad de leer y cuantificar las secuencias de ADN. Los fragmentos de ADN recuperados se cartografían en la posición genómica relativa basándose en el genoma de referencia y la abundancia de estos fragmentos se mide por cada par de bases del genoma para el ADN recuperado de IP (la muestra producida a través de inmunoprecipitación usando un reactivo de afinidad) y aportación (la muestra no sometida a inmunoprecipitación). Se realiza el mismo recuento de lectura de los datos de secuenciación de las secuencias de nucleótidos únicas usadas para preparar los nucleosomas semisintéticos. La relación de abundancia de nucleosomas semisintéticos en IP y aportación se usa para medir la eficacia de IP y la relación de abundancia de fragmentos de ADN para cualquier locus genómico en IP y aportación se usa para medir el enriquecimiento relativo. Los recuentos de marca resultantes para los nucleosomas semisintéticos añadidos constituyen una curva de calibración para derivar la densidad de modificación de histona para nucleosomas naturales en todo el genoma. El promedio de relación de IP-enriquecimiento para la escala de nucleosoma semisintética que alberga un 100 % de la modificación se usa como corrección de escala para cromatina natural que alberga el mismo epítopo para calcular la cantidad de modificación sobre un intervalo genómico deseado como una relación de relaciones. Posteriormente, se aplica la eficacia de IP al enriquecimiento relativo para medir la densidad de modificación de histona de modificación postraduccional de la histona H3K4me3 con resolución de par de bases para el tramo del genoma completo.
En algunas realizaciones, los epítopos proteínicos que tienen afinidad, especificidad y avidez de tipo natural incluyen una isoforma proteínica y/o proteína que tiene una modificación postraduccional. Por ejemplo, el epítopo puede ser la modificación de histona para el que se mide la densidad en el ensayo o un epítopo que tiene características de unión similares. En una realización preferida, la parte proteínica de un complejo de ADN-proteína es un complejo octamérico de histona central que contiene las histonas centrales H2A, H2B, H3, h 4. Estas secuencias se describen en la solicitud de patente n.°: US2013/044537. Para reproducir la afinidad, especificidad y avidez de tipo natural del epítopo proteínico de cualquiera de las histonas centrales mencionadas anteriormente, pueden representarse por cualquier variante de histona incluyendo las enumeradas en la tabla 1a-f-. El epítopo proteínico puede ser un fragmento de una histona.
Los complejos de proteína-ADN comprenden una molécula de reconocimiento de patrón que comprende, aunque sin limitación, una secuencia de colocación y una secuencia única o código de barras. La inclusión de una secuencia de colocación proteínica permite la creación de un complejo de ADN-proteína a través de una interacción de tipo natural específica con la proteína. En una realización preferida, la secuencia de colocación proteínica es una secuencia de colocación de nucleosoma. En una realización, la secuencia de colocación comprende una secuencia de ADN bicatenaria natural o sintética de al menos 146 pares de bases. En una realización más preferida, la secuencia de colocación proteínica es una secuencia "601-Widom", una secuencia de unión a nucleosoma sintética preparada a través de una selección de secuencias que mostraban afinidad por el nucleosoma. Aunque se ha mencionado aquí una secuencia "601-Widom" como secuencia de colocación de nucleosoma, las presentes realizaciones abarcan el uso de otras de estas secuencias sintéticas y naturales que muestran afinidad por nucleosomas.
Una secuencia única permite la identificación específica de un complejo de ADN-proteína en una colección o combinación de complejos de ADN-proteína naturales, es decir, un código de barras. En algunas realizaciones, la secuencia única puede sustituirse por otro medio de reconocimiento específico, por ejemplo, un polipéptido, fluoróforo, cromóforo, secuencia de ARN, secuencia de ácido nucleico bloqueado, marca de afinidad, etc. En un aspecto, la secuencia única puede analizarse por análisis de nucleótidos conocidos, por ejemplo, secuenciación de última generación, qPCR. RT-PCR o ddPCR. Una secuencia única y una secuencia de colocación podrían ser la misma secuencia y tener doble función como molécula de reconocimiento. La secuencia única puede residir en el extremo 5' de la secuencia de colocación, el extremo 3' de la secuencia de colocación o en ambos extremos de la secuencia de colocación.
En una realización preferida, una secuencia única es una secuencia de ADN bicatenaria con longitud mínima para mantener una distancia de Hamming de al menos 1 desde la secuencia genómica del organismo que se está investigando y todas las demás secuencias que podrían encontrarse en la muestra. En una realización más preferida, para garantizar la discriminación robusta de los códigos de barras en el medio de secuencias genómicas naturales, cada código de barras está compuesto de dos secuencias de 11 pares de bases (pb) ausentes en el genoma humano y de ratones (Herold et al., 2008), donde las secuencias de 11 pb son las secuencias más cortas que garantizan la distancia de Hamming de al menos 1 para el genoma humano y de ratones. En otra realización, la secuencia de código de barras es una secuencia no presente en el genoma de la célula. En otra realización, la secuencia de código de barras es una secuencia no presente en la naturaleza. Aunque se mencionan 11 pb en esta ocasión como la secuencia más corta posible con distancia de Hamming de al menos 1 para ser humano y ratón, hay número ilimitado de secuencias más largas con distancia de Hamming de al menos 1 que pueden usarse satisfactoriamente para que sirvan como secuencias únicas mencionadas anteriormente. Además la secuencia más corta de secuencia única con distancia de Hamming de al menos 1 para genomas de otros organismos podría ser más corta de 11 pb y, por tanto, secuencias más cortas de 11 pb podrían usarse satisfactoriamente para estos organismos. El código de barras es una molécula, en una realización preferida es ADN, que puede analizarse por análisis de ADN conocido que comprende, aunque sin limitación, secuenciación de última generación y PCR. La secuencia de código de barras codifica una concentración y/o identidad de un nucleosoma de patrón interno dado.
En una realización preferida, una secuencia de nucleótidos única indica la concentración e identidad de un patrón interno dado. Una secuencia única comprende una longitud de al menos o como mucho 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 o 100 pares de bases de longitud. En otra realización más, la longitud total de la secuencia de colocación y la secuencia única tiene una longitud de al menos 100 pares de bases. En una realización preferida, una secuencia de colocación y una secuencia única se seleccionan de la tabla 7. En un aspecto, la secuencia única es resistente a nucleasa microcócica. La molécula patrón que comprende, aunque sin limitación, una secuencia de colocación y una secuencia única o código de barras incluye la SEQ ID NO:1; s Eq ID NO:2; SEQ ID NO:3; SEQ ID NO:4; SEQ ID NO:5; SEQ ID NO:6; SEQ ID NO:7; SEQ ID NO:8; SEQ ID NO:9; SEQ ID NO:10; SEQ ID NO:11; SEQ ID NO:12; SEQ ID NO:13; SEQ ID NO:14; o SEQ ID NO:15. En una realización preferida, la molécula patrón que comprende, aunque sin limitación, una secuencia de colocación y una secuencia única o código de barras incluye la SEQ ID NO:16; SEQ ID NO:17; SEQ ID NO:18; SEQ ID NO:19; SEQ ID NO:20; SEQ ID NO:21; SEQ ID NO:22; SEQ ID NO:23; SEQ ID NO:24; SEQ ID NO:25; SEQ ID NO:26; SEQ ID NO:27; SEQ ID NO:28; SEQ ID NO:29; SEQ ID NO:30; SEQ ID NO:31; SEQ ID NO:32; SEQ ID NO:33; SEQ ID NO:34; SEQ ID NO:35; SEQ ID NO:36; SEQ ID NO:37; SEQ ID NO:38; SEQ ID NO:39; SEQ ID NO:40; SEQ ID NO:41; SEQ ID NO:42; SEQ ID NO:43; SEQ ID NO:44; SEQ ID NO:45; SEQ ID NO:46; SEQ ID NO:47; SEQ ID NO:48; SEQ ID NO:49; SEQ ID NO:50; SEQ ID NO:51; SEQ ID NO:52; SEQ ID NO:53; SEQ ID NO:54; SEQ ID NO:55; SEQ ID NO:56; SEQ ID NO:57; SEQ ID NO:58; SEQ ID NO:59; SEQ ID NO:60; SEQ ID NO:61; SEQ ID NO:62; SEQ ID NO:63; SEQ ID NO:64; SEQ ID NO:65; SEQ ID NO:66; SEQ ID NO:67; SEQ ID NO:68; SEQ ID NO:69; SEQ ID NO:70; SEQ ID NO:71; SEQ ID NO:72; SEQ ID NO:73; SEQ ID NO:74; SEQ ID NO: SEQ ID NO:75; SEQ ID NO:76; SEQ ID NO:77; SEQ ID NO:78; SEQ ID NO:79; SEQ ID NO:80; SEQ ID NO:81; SEQ ID NO:82; SEQ ID NO:83; SEQ ID NO:84; SEQ ID NO:85; SEQ ID NO:86; SEQ ID NO:87; SEQ ID NO:88; SEQ ID NO:89; SEQ ID NO:90; SEQ ID NO:91; SEQ ID NO:92; SEQ ID NO:93; SEQ ID NO:94; SEQ ID NO:95; SEQ ID NO:96; SEQ ID NO:97; SEQ ID NO:98; SEQ ID NO:99; SEQ ID NO:100; SEQ ID NO:101; SEQ ID NO:102; SEQ ID NO:103; SEQ ID NO:104; SEQ ID NO:.105; SEQ ID NO:106 SEQ ID NO:107; SEQ ID NO:108; SEQ ID NO:109; SEQ ID NO:110; SEQ ID NO:111; SEQ ID NO:112; SEQ ID NO:113; SEQ ID NO:114; o SEQ ID NO:115.
En una realización del método de determinación de la densidad de epítopos como se describe en el que, un conjunto de los nucleosomas semisintéticos mencionados anteriormente con la molécula de reconocimiento de patrón se dopa en una colección de nucleosomas naturales. El conjunto puede comprender nucleosomas semisintéticos con la molécula de reconocimiento de patrón que alberga más de un epítopo, pero que comprende al menos un epítopo de interés. Por ejemplo, un conjunto de nucleosomas sintéticos puede albergar la modificación postraduccional, es decir, H3K9me3 y un epítopo conservado o invariante tal como la secuencia polipeptídica de la histona. Como alternativa, un conjunto de nucleosomas semisintéticos puede albergar más de una modificación postraduccional tal como H3K9me3 o insertar un segundo epítopo. En otro aspecto, el conjunto de patrones comprende al menos una proteína de unión a ADN semisintética, reconstituida o variante con afinidad, especificidad y avidez de tipo natural de un epítopo falso positivo que es diferente del epítopo de interés. En una realización preferida, un conjunto de nucleosomas semisintéticos o variantes que incluyen al menos un nucleosoma con afinidad, especificidad y avidez de tipo natural de un epítopo positivo verdadero y al menos un nucleosoma con afinidad, especificidad y avidez de tipo natural de un epítopo positivo falso.
Para purificar una población de nucleosomas naturales o semisintéticos de una combinación de complejos de proteína-ADN se puede usar una etapa de captura por afinidad donde un reactivo de afinidad reconoce un fragmento invariante del nucleosoma, por ejemplo, la histona. En un aspecto, el reactivo de afinidad que contiene el epítopo de interés comprende un anticuerpo, un monocuerpo, un aptámero, un Fab o un péptido de unión. El método de purificación de una población de nucleosomas puede aplicarse a nucleosomas semisintéticos en solitario, nucleosomas naturales en solitario o un nucleosoma natural dopado con nucleosomas sintéticos.
Análisis de datos de ICe-ChIP
En una realización, para realizar ICe-ChIP, un conjunto de los patrones internos mencionados anteriormente con los que puede compararse la lectura de ChIP, se dopa en una colección de complejos de ADN-proteína naturales. A continuación se describe la manera en que estos patrones se usan para calcular la eficacia de IP de patrón, que a su vez puede usarse para calcular lo que se llama densidad de proteína o epítopo (PD), densidad variante de proteína (PVD) o densidad de modificación de proteína (PMD), dependiendo de si el epítopo investigado es un fragmento proteínico invariante, isoforma proteínica o modificación postraduccional proteínica. Los patrones basados en nucleosomas semisintéticos o variantes con afinidad, especificidad y avidez de tipo natural, mejoran la inmunoprecipitación de la cromatina permitiendo realizar la cuantificación absoluta de la densidad de modificación de histona (HMD, Histone Modification Density) o densidad variante de histona (HVD, Histone Variant Density).
La densidad de modificación de histona es una escala normalizada y se define como el porcentaje aparente de nucleosomas que albergan un epítopo específico de todos los nucleosomas en una posición genómica dada. La densidad de modificación de histona se expresa en una escala análoga que varía entre un 0 %, que significa ausencia, y un 100 % que significa presencia saturante del epítopo. Por ejemplo, un 90 % de densidad de modificación de histona H3K4me3 para el nucleosoma 1 (el primer nucleosoma posterior al sitio de inicio de transcripción) del gen de GAPDH debe interpretarse que en la población de todas las moléculas de histona H3 que componen el nucleosoma 1 en el promotor del gen de GAPDH, un 90 % de ellas albergan la modificación postraduccional N6,N6,N6-trimetilación de lisina 4 de histona H3 (H3K4me3) y un 10 % debe estar libre de H3K4me3. Aunque este ejemplo se proporcionó para la región del genoma que abarca un solo nucleosoma, que es casi de 147 pb, lo mismo puede aplicarse a cualquier tramo del genoma que varía desde un solo par de bases al genoma completo.
Para calcular la densidad de proteína o epítopo se necesitan conocer cuatro cosas: el tamaño del locus genómico, la abundancia de epítopo, la abundancia de proteína general y la eficacia de inmunoprecipitación ("eficacia de IP"). El tamaño del locus genómico se define por el usuario y puede variar de un solo par de bases al genoma completo. La abundancia de epítopo se define como la abundancia del epítopo sobre el tramo del locus genómico. La abundancia se deduce habitualmente cuantificando la cantidad de ADN unido al complejo de ADN-proteína y es estequiométrica a la proteína y el ADN es fácil de cuantificar con numerosos métodos, por ejemplo, PCR, RT-PCR, ddPCR, secuenciación de última generación, hibridación, autorradiografía, marcaje fluorescente, densidad óptica, sondas fluorescentes intercalantes, etc. Sin embargo, la abundancia también puede medirse directamente midiendo la concentración de proteína a través de densidad óptica, fluorescencia, autorradiografía, espectrometría de masas, ensayo colorimétrico, descomposición total del polipéptido, etc.
La abundancia de epítopo se mide después de una etapa de captura por afinidad en que un reactivo de afinidad específico reconoce el epítopo, después de dicha etapa el complejo de epítopo-reactivo de afinidad se separa de la población no unida de complejos de ADN-proteína. Muy a menudo, el complejo de epítopo-reactivo de afinidad se separa de los nucleosomas no unidos por el complejo de epítopo-reactivo de afinidad inmovilizante en la superficie y lavado de la población unida de complejos de ADN-proteína. La abundancia de proteína general se define como la abundancia de todas las proteínas de un tipo dado que componen los complejos de ADN dentro del tramo del locus genómico dado. La abundancia de proteína general se mide con los mismos métodos que la abundancia de epítopo.
Para purificar una población de nucleosomas de otros complejos de proteína-ADN se puede usar una etapa de captura por afinidad donde un reactivo de afinidad reconoce un fragmento invariante del nucleosoma, por ejemplo, la histona. Sin embargo, si un fragmento invariante dado implicado en la generación del complejo de proteína-ADN es dominante sobre un tamaño de locus genómico considerado, entonces la etapa de captura por afinidad para la población de proteínas general puede saltarse suponiendo que la población de otros complejos de proteína-ADN es insignificante. La relación de abundancia de epítopo y abundancia de proteína general debe producir la densidad de epítopo por proteína. Sin embargo, es infrecuente el caso de que la etapa de captura de afinidad sea un 100 % eficaz y si se utilizan dos o más etapas de captura por afinidad sus eficacias de captura infrecuentemente serán iguales entre sí. Para resolver este problema se necesita conocer la eficacia de IP relativa entre la medición de abundancia de epítopo y abundancia de proteína general.
La "eficacia de IP" se refiere a la recuperación relativa del epítopo entre uno o más extracciones. El conocimiento de la eficacia de IP para el patrón permite realizar la cuantificación absoluta corrigiendo las diferencias en la recuperación entre una o más extracciones. En una realización, la eficacia de IP mencionada anteriormente se mide usando un conjunto de los patrones mencionados anteriormente que tienen la misma afinidad, especificidad y avidez que el epítopo natural y cuya abundancia es fácil de medir en una mezcla compleja. Estos patrones semisintéticos se dopan en una combinación de complejos de ADN-proteína naturales, cuya muestra se someterá a captura por afinidad. Después de esta etapa, las mediciones mencionadas anteriormente de abundancia de epítopo y densidad de proteína general se realizan para los patrones semisintéticos y la combinación de población de complejos de ADN-proteína naturales con uno de los métodos de medición de abundancia mencionados. En una realización, el conjunto de patrones incluye patrones que se añaden a diferentes concentraciones. Aquí, la concentración añadida se identifica de manera única por el código de barras.
En una realización, la abundancia de epítopo puede medirse a través de cuantificación de ADN unido a complejos de ADN-proteína para complejos de ADN-proteína de patrón y complejos de ADN-proteína naturales. En una realización preferida, la relación de epítopo de un código de barras de patrón dado en el material de IP frente a aportación para nucleosoma semisintético es igual a la eficacia de IP de patrón. Como alternativa, esta eficacia de IP de patrón puede calcularse como una relación de la abundancia de código de barras en la IP específica de epítopo frente a la abundancia de proteína general (para histona H3, por ejemplo, el código de barras cuenta en la IP general anti-H3). Una vez calculada la eficacia de IP, se puede aplicar esta eficacia de IP de patrón a las relaciones de ADN IP/introducido o IP-epítopo/IP-proteína general en cualquier locus genómico. Esto se calcula dividiendo la relación de eficacia de IP genómica de la abundancia de epítopo en la IP (cantidad de ADN para un intervalo genómico dado capturado en la etapa de afinidad) respecto a la cantidad de ADN que cubre el mismo intervalo presente en la aportación por la eficacia de IP de patrón. Como alternativa, esto puede calcularse como la relación de un fragmento de ADN genómico dado en la cantidad dividida de IP de la misma especie en la IP de abundancia de epítopo general para cualquier locus genómico como se describe anteriormente y después dividiendo por la eficacia de IP de patrón. El valor resultante es una densidad de proteína o epítopo (PD), también conocida como densidad variante de proteína (PVD) o densidad de modificación de proteína (PMD).
(— ,p .. YlOO %
PD (per/pb) = Ef vic°acriadce‘°n IP7- d--e- p-a--tr-ó-n-
Corrección de especificidad inespecífica
Otro problema que dificulta el análisis de los experimentos de extracción es la baja precisión de la predicción proveniente de la especificidad inespecífica de un reactivo de afinidad usado en un ensayo de extracción. Las expresiones "positivo falso" e "inespecífico" son sinónimos y se refieren a un epítopo que entra en contacto con un reactivo de afinidad de manera promiscuo y no específicamente o un resultado incorrecto. La expresión "positivo verdadero" y "específico" son sinónimos y se refieren a un epítopo de interés o resultado correcto.
La prevalencia de la señal positiva falsa de epítopo varía entre una extracción y otra y depende de la calidad del reactivo de afinidad (su afinidad de unión intrínseca por un epítopo deseado frente a su afinidad por otros epítopos relacionados), la abundancia de epítopo específico frente a inespecífico en la cromatina natural, la relación de capacidad del reactivo de afinidad y los niveles de carga de los complejos de ADN-proteína en una extracción, así como otras condiciones en que se realiza la extracción. Para diferentes reactivos de afinidad, la unión específica e inespecífica contribuyen ambas a la señal de ChIP aparente en diferentes grados, cuyo alcance en el que contribuye cada fuente dentro de un experimento dado con ChIP convencional es desconocido. En ausencia de conocimiento de la abundancia de unión inespecífica, no se puede tomar la decisión de si la abundancia de epítopo observada es significativa o no, lo que a su vez hace que el uso de extracción en diagnóstico médico e investigación sea impracticable. Los autores de la invención han descubierto un método para cuantificar la eficacia de IP de los epítopos positivos falsos y positivos verdaderos en un ensayo de extracción in situ, que mejora la precisión de la interpretación de los datos ya que el valor predictivo positivo (PPV) puede calcularse fácilmente. El PPV permite una estimación de la abundancia mínima de epítopo a un determinado nivel de confianza a considerar un positivo verdadero.
. Usando los métodos mencionados anteriormente de calcular la eficacia de IP y la eficacia de IP de patrón, el valor predictivo positivo (PPV) también denominado precisión puede calcularse. El conocimiento del PPV simplifica cualquier análisis de datos ya que permite la estimación de si alguna diferencia en la densidad de proteína es significativa o no, lo que puede conseguirse con métodos y técnicas actualmente disponibles.
£ a-yTp
Precisión = PPV = £ U 'tfpp £ f í t fp p
nTP es la eficacia de IP de epítopo positivo verdadero y a es un peso dado de epítopo positivo verdadero, r|FP es la eficacia de IP de epítopo positivo falso, también conocido como epítopo inespecífico y p es un peso de epítopo positivo falso. En ausencia de conocimiento previo de la distribución de pesos a = p = 1. Existen otras variantes de esta ecuación y el conocimiento de la prevalencia de epítopo positivo falso y positivo verdadero puede usarse en otras aplicaciones.
Hay dos maneras alternativas de calibrar ChIP: calibración de densidad de modificación de histona global usando un patrón externo y calibración de patrón interno directo. Como la estrategia de patrón interno relativo que se empleó predominantemente en este trabajo, estos dos pueden producir resultados expresados en unidades de "densidad de modificación de histona", que es igual a la relación aparente de epítopo sondeado respecto a todos los demás epítopos disponibles en el locus dado.
La calibración de densidad de modificación de histona global depende de una medición de la relación total de modificación con respecto a la cantidad de histona, por ejemplo, conociendo el porcentaje de toda la H3 que está trimetilada K4. Esta densidad de modificación de histona global, derivada de espectrometría de masas o mediciones de transferencia de Western cuantitativas entonces puede redistribuirse entre todos los picos de IP corregidos para la profundidad de la aportación en cualquier locus dado. El inconveniente de este método, aparte del error considerable en la generación de la medición de abundancia global (por ejemplo, precisión de EM más la ambigüedad de, quizás, no observar todas las formas posibles de la modificación), es que dichas mediciones externas por metodologías ortogonales tienen que hacerse de la misma muestra nucleosómica usada en la ChIP, y las pérdidas de manipulación de muestra en ambas técnicas son una fuente considerable de error. En particular, la eficacia de IP nunca es de un 100 % (en la práctica, esta puede ser considerablemente menor), de modo que el grado por el que se desvía la eficacia del máximo teórico se reflejará en valores proporcionalmente inflados para HMD aparente.
La calibración de patrón interno directo mide el recuento de marcas de un patrón de nucleosoma con código de barras añadido a través del proceso de ChIP, conociendo las concentraciones molares precisas de cada miembro de escala de patrón interno en la aportación para extrapolar la abundancia molar absoluta de epítopo sondeado en la muestra original. Este tipo de calibración está limitado por la precisión del recuento del número de núcleos sometidos a la digestión con nucleasa microcócica y las pérdidas sesgadas que se acumulan en el camino desde este número bien cuantificado respecto hasta el aislado de cromatina exhaustivamente fragmentada. Como se recupera poco más de un 80 % del ácido nucleico total de los núcleos digeridos en condiciones de digestión y aislamiento muy optimizadas, hay algún error sistemático debido a la recuperación sesgada de genoma (Henikoff et al., 2009).
Otra ventaja más de esta realización es la capacidad de deconvolucionar la señal de epítopo positivo verdadero de la señal de epítopo positivo falso, presentada en esta ocasión en el ejemplo de densidad de modificación de histona, resolviendo la siguiente ecuación de matriz: A*x = b. Para los conjuntos de datos indicados, los rastros de ICeChIP-seq se corrigieron para ausencia de especificidad resolviendo la siguiente ecuación de matriz: A*x = b,
Se describe un método para deconvolucionar la señal de epítopo positivo verdadero de la señal de epítopo positivo falso, presentado en esta ocasión en el ejemplo de densidad de modificación de histona, resolviendo la siguiente ecuación de matriz: A*x = b
Figure imgf000013_0001
donde, x es una matriz de puntuaciones de HMD corregidas, A es una matriz de factores de corrección y b es una matriz de puntuaciones de HMD no corregidas, donde, t es el factor de corrección para la especificidad hacia las marcas de histona del conjunto de marcas de histona "a" a "z" (subíndice), en la inmunoprecipitación usando anticuerpo contra una marca de histona del conjunto de marcas de histona "a" a "z" (superíndice); HMD es la densidad de modificación de histona para una marca de histona dada ("a" a "z") desde el 1.° al n-ésimo locus; HMD(Cor) es la densidad de modificación de histona corregida para una marca de histona dada del 1.° al n-ésimo locus,
E? IP?
a E? aportaciónz
= yN 1 n aa____
E? aportacióna
donde, t es el factor de corrección para la especificidad hacia las marcas de histona del conjunto de marcas de histona "a" a "z" (subíndice), en la inmunoprecipitación usando anticuerpo contra una marca de histona del conjunto de marcas de histona "a" a "z" (superíndice); HMD es la densidad de modificación de histona para una marca de histona dada ("a" a "z") desde el 1.° al n-ésimo locus; HMD(Cor) es la densidad de modificación de histona corregida para una marca de histona dada del 1.° al n-ésimo locus,
Z? IP?
a E? aportaciónz
= yN 1 p aa____
E? aportacióna
donde, El? IP y El? aportación se refieren a la abundancia del código de barras dado en la IP o en la aportación, el superíndice se refiere a la marca de histona contra la que se generó el anticuerpo, mientras que el subíndice se refiere a la marca en el nucleosoma semisintético que se extrajo.
Diagnóstico de enfermedad
Las razones principales por las que los ensayos de ChIP convencionales no se han adoptado en clínica son que a menudo son irreproducibles debido a sutiles diferencias de manipulación y especificidad variable de anticuerpo, haciendo que el % de enriquecimiento en la IP sea muy variante de un experimento a otro, y haciendo que las comparaciones sin sesgar sean problemáticas y no fiables. Como tiene un patrón interno que se somete a las etapas de ChIP que son sensibles a variación, ICe-ChIP es mucho más robusta en términos de replicación y fiabilidad de los resultados, como se demuestra en la figura 6A, 6B y 7A, y los números se comparan fácilmente ya que HMD es una escala universal, biológicamente relevante, realizada por comparación in situ directa con un patrón interno bien definido.
Las modificaciones de histona y otros mecanismos epigenéticos son cruciales para regular la actividad génica y los procesos celulares. Las diferentes modificaciones de histona regulan diferentes procesos, tales como transcripción, reparación de ADN y reparación de ADN. La desregulación de cualquiera de estas modificaciones puede desplazar el equilibrio de la expresión génica dando lugar a patrones epigenéticos aberrantes y anomalías celulares. Por ejemplo, cambios en las modificaciones postraduccionales y variantes de histona se han detectado en diversos cánceres, y se sabe que los patrones de modificación aberrantes son accionadores de enfermedad en algunos casos (Daigle et al., 2011; Chi et al., 2010).
Los presentes materiales y métodos pueden usarse en el diagnóstico, pronóstico, clasificación, predicción de riesgo de enfermedad, detección de recidiva, selección de tratamiento y evaluación de eficacia del tratamiento para cualquier enfermedad asociada con cambios en las modificaciones postraduccionales de histona, incluyendo cáncer en un paciente, por ejemplo, un paciente humano. Dichos análisis también podrían ser útiles junto con cultivo ex vivo de células del paciente o células madre con pluripotencia inducida para evaluar la idoneidad de un protocolo de diferenciación dado para producir células madre verdaderamente pluripotentes, o los protocolos para diferenciar células madre en tipos celulares específicos.
Cualquier estadio de progresión puede detectarse, tal como cáncer primario, metastásico y recidivante. Puede encontrarse información con respecto a numerosos tipos de cáncer, por ejemplo, en la American Cancer Society (disponible en la red mundial en cancer.org), o en, por ejemplo, Harrison's Principles of Internal Medicine, (2005).
Se describen métodos de pronóstico de enfermedad, tal como la estimación de la probabilidad de que un paciente desarrolle cáncer, clasificando los estadios de la enfermedad y controlando la eficacia del tratamiento en un paciente con cáncer. Dichos métodos se basan en el descubrimiento de que ICe-ChIP puede usarse para calibrar experimentos de ChIP para controlar las diferencias de manipulación y la variabilidad del anticuerpo. Por consiguiente, determinando el nivel de una PTM de histona particular (véase, por ejemplo, la tabla 1) dentro de una célula recogida del paciente, incluyendo histonas metiladas como se describe en este documento, es posible determinar si el paciente tiene riesgo o no de desarrollar una enfermedad particular o ya ha desarrollado una enfermedad particular. Por ejemplo, como se describe en este documento, la cuantificación de los niveles de PTM de histona en tejidos cancerosos puede usarse para el pronóstico o diagnóstico de cáncer.
Los materiales y métodos descritos en determinados aspectos de la descripción pueden usarse para detectar los niveles de PTM de histona o variantes en una muestra biológica en locus genómicos dados, detectando de ese modo la presencia o ausencia de células enfermas en la muestra biológica. En algunas realizaciones, la muestra biológica comprende una muestra de tejido de un tejido sospechoso de contener células enfermas, tal como células cancerosas. Pueden obtenerse muestras de ADN de cromatina humana por cualquier medio conocido en la técnica. En casos donde tiene que detectarse un fenotipo o enfermedad particular, las muestras que contienen histona deben prepararse a partir de un tejido de interés, células sanguíneas o, según lo apropiado, de líquido cefalorraquídeo. Por ejemplo, las muestras que contienen histona pueden prepararse de tejido de biopsia para detectar el estado de PTM de histona asociado con cáncer.
Según lo apropiado, el tejido o las células pueden obtenerse por cualquier método conocidos en la técnica incluyendo por cirugía. En otras realizaciones, una muestra de tejido que sabe que contiene células cancerosas, por ejemplo, de un tumor, se analizará para la presencia o cantidad de PTM de histona en uno o más de los sitios de PTM de histona, tal como los descritos en la tabla 1, para determinar información acerca de la enfermedad, por ejemplo, la eficacia de determinados tratamientos, la expectativa de supervivencia del individuo, la presencia de tipos específicos de enfermedad, etc. En algunas realizaciones, los métodos pueden usarse junto con métodos adicionales de pronóstico o diagnóstico, por ejemplo, detección de otros marcadores de enfermedad, etc.
Los materiales y métodos de determinados aspectos de la descripción pueden usarse para evaluar individuos que se sabe o se sospecha que tienen una enfermedad, incluyendo cáncer, o como un ensayo clínico rutinario, por ejemplo, en un individuo no necesariamente sospechoso de tener una enfermedad. Pueden realizarse ensayos de diagnóstico adicionales para confirmar el estado de la enfermedad en el individuo.
Además, los presentes métodos y materiales pueden usarse para evaluar la eficacia de un ciclo de tratamiento. La eficacia de un tratamiento puede evaluarse controlando las modificaciones postraduccionales de histona o depósito de variante usando los métodos y materiales descritos en este documento a lo largo del tiempo en un mamífero que tiene una enfermedad. Por ejemplo, una reducción o ausencia de metilación de histona en cualquiera de los biomarcadores de metilación como se describe en este documento en una muestra biológica recogida de un mamífero después de un tratamiento, en comparación con un nivel en una muestra recogida del mamífero antes, o previamente en, el tratamiento, indica tratamiento eficaz. La detección de una PTM de histona como se describe anteriormente puede usarse en solitario o en combinación con otros marcadores, PARA EL diagnóstico o pronóstico de enfermedad. Los materiales y métodos de determinadas realizaciones pueden usarse para determinar el ciclo óptimo de tratamiento en un mamífero con una enfermedad. Por ejemplo, la presencia de marcas de histona metiladas dentro de determinados biomarcadores de mutilación como se describe en este documento o una cantidad aumentada de mutilación dentro de determinados biomarcadores de mutilación puede indicar una expectativa de supervivencia reducida de un mamífero con cáncer, indicando de ese modo un tratamiento más agresivo para el mamífero. Además, puede establecerse fácilmente una correlación entre la presencia, ausencia o cantidad de metilación en un biomarcador de metilación, como se describe en este documento, y la eficacia relativa de uno u otro agente antineoplásico. Dichos análisis pueden realizarse, por ejemplo, de manera retrospectiva, es decir, detectando metilación usando los materiales y métodos descritos en este documento en uno o más de los biomarcadores de metilación en muestras recogidas previamente de mamíferos que han experimentado posteriormente uno o más tipos de tratamiento antineoplásico, y correlacionando la eficacia conocida del tratamiento con la presencia, ausencia o niveles de metilación de uno o más de los biomarcadores de metilación como se describe anteriormente.
En la elaboración de un diagnóstico, pronóstico, evaluación de riesgo, clasificación, detección de recidiva o selección de tratamiento basándose en la presencia, ausencia o HMD de una PTM de histona particular, la cantidad de la PTM o variante puede compararse con un valor umbral que distingue entre un diagnóstico, pronóstico, evaluación de riesgo, clasificación, etc., y otro. Por ejemplo, un valor umbral puede representar el grado de metilación de histona que distingue adecuadamente entre muestras de cáncer y muestras de biopsia normales con un nivel deseado de sensibilidad y especificidad. Con el uso de ICe-ChIP el valor umbral no variará dependiendo del anticuerpo usado o las condiciones de manipulación. El valor umbral o intervalo puede determinarse midiendo la PTM de histona particular de interés en muestras enfermas y normales usando ICe-ChIP y después determinando un valor que distingue al menos una mayoría de las muestras de cáncer de una mayoría de muestras no cancerosas.
En algunas realizaciones, los métodos comprenden registrar un diagnóstico, pronóstico, evaluación de riesgo o clasificación, basándose en el estado de PTM de histona determinado de un individuo. Se contempla cualquier tipo de registro, incluyendo registro electrónico, por ejemplo, mediante un ordenador.
Determinadas realizaciones de la presente descripción proporcionan la determinación del estado de modificación postraduccional de histona en el cáncer de un paciente. La información de modificación postraduccional de histona puede usarse para el pronóstico, evaluación, clasificación y/o tratamiento del cáncer. Los cánceres que pueden examinarse por un método descrito en este documento pueden incluir, aunque sin limitación, carcinoma de células renales, glioma, gliosarcoma, astrocitoma anaplásico, meduloblastoma, cáncer pulmonar, carcinoma pulmonar microcítico, carcinoma cervicouterino, cáncer de colon, cáncer rectal, cordoma, cáncer de garganta, sarcoma de Kaposi, linfangiosarcoma, linfangioendoteliosarcoma, cáncer colorrectal, cáncer de endometrio, cáncer de ovario, cáncer de mama, cáncer pancreático, cáncer de próstata, carcinoma de células renales, carcinoma hepático, carcinoma de las vías biliares, coriocarcinoma, seminoma, tumor testicular, tumor de Wilms, tumor de Ewing, carcinoma de vejiga, angiosarcoma, endoteliosarcoma, adenocarcinoma, carcinoma de glándulas sudoríparas, sarcoma de glándulas sebáceas, sarcoma papilar, adenosarcoma papilar, cistadenosarcoma, carcinoma broncogénico, carcinoma medular, mastocitoma, mesotelioma, sinovioma, melanoma, leiomiosarcoma, rabdomiosarcoma, neuroblastoma, retinoblastoma, oligodendroglioma, neuroma acústico, hemangioblastoma, meningioma, pinealoma, ependimoma, craneofaringioma, carcinoma epitelial, carcinoma embrionario, carcinoma escamocelular, carcinoma vasocelular, fibrosarcoma, mixoma, mixosarcoma, glioma o liposarcoma.
En determinadas realizaciones, las siguientes enfermedades pueden diagnosticarse usando los presente métodos y materiales: Infecciones bacterianas causadas por Heliocobacter pylori, Listeria monocytogenes, Shigella flexneri, Anaplasma phagocytophilum,
Chlamdophila, virus de Epstein-Barr, herpes, VIH, Schistosoma haematobium; obesidad, diabetes, cardiopatía, autismo, síndrome del X frágil, síndrome de ATR-X, síndrome de Angelman, síndrome de Prader-Willi, síndrome de Beckwith Wiedemann, síndrome de Rett, síndrome de Rubinstein-Taybi, síndrome de Coffin-Lowry, síndrome de inmunodeficiencia-inestabilidad centrométrica-anomalías faciales, a-talasemia, leucemia, enfermedad de Huntington, esquizofrenia, enfermedad bipolar, envejecimiento, demencia, enfermedad de Alzheimer, enfermedad de Parkinson, síndrome de Cornelia de Langue, síndrome de Kabuki, síndrome de Sjogren, vitíligo, esclerosis diseminada progresiva, psoriasis, cirrosis biliar primaria, enfermedad de Crohn y colitis ulcerosa, tiroiditis de Hashimoto, enfermedad de Graves, enfermedad inflamatoria intestinal, ateroesclerosis e hipertrofia cardiaca.
Reactivos y kits
Otro aspecto de la invención proporciona reactivos y kits que incluyen reactivos para realizar uno de los métodos descritos en este documento. Los reactivos pueden incluirse en envases o recipientes adecuados. El kit puede incluir uno o más reactivos que contienen patrones como se describe en este documento para la cuantificación absoluta de epítopos positivos verdaderos y positivos falsos, por ejemplo, en un ensayo de extracción o ensayo de inmunoprecipitación de la cromatina. El kit también puede incluir al menos un reactivo de afinidad como se describe en este documento, por ejemplo, un anticuerpo. Los patrones pueden tener afinidad, especificidad y avidez de tipo natural para un epítopo positivo verdadero. El kit también puede comprender al menos un patrón con afinidad, especificidad y avidez de tipo natural de epítopo para un epítopo positivo falso.
En otra realización preferida, los patrones mencionados anteriormente incluyen complejos de ADN-proteína que comprenden nucleosomas semisintéticos, hechos con histonas, isoformas de histona o modificaciones postraduccionales de histona con afinidad, especificidad y avidez de tipo natural y una molécula de código de barras. En diversas realizaciones, cualquier variante de secuencias de histona central, conocidas en la técnica, o modificación postraduccional, incluyendo las definidas en la tabla 1, puede instalarse en las histonas que comprenden el octámero de histona con la suposición de que la afinidad, especificidad y avidez de tipo natural del epítopo se mantienen. En una realización preferida, un conjunto de patrones está comprendido de al menos un solo patrón de complejos de ADN con afinidad, especificidad y avidez de tipo natural del epítopo para el epítopo positivo verdadero y múltiples patrones de complejos de ADN con afinidad, especificidad y avidez de tipo natural del epítopo que cubre un intervalo de posibles epítopos inespecíficos (epítopos positivos falsos) presentes en la combinación natural de complejos de ADN-proteína.
En otras realizaciones, el kit puede incluir uno o más tampones de lavado, (por ejemplo, solución salina tamponada con fosfato) y/u otros tampones en envases o recipientes. En otras realizaciones más, los kits pueden incluir reactivos necesarios para la separación de los agentes capturados, por ejemplo, un reactivo de captura en fase sólida que incluye, por ejemplo, partículas paramagnéticas ligadas a un segundo anticuerpo o proteína A. El kit también puede incluir reactivos necesarios para la medición de la cantidad de patrón o muestra capturada.
Cuando se suministra un kit, los diferentes componentes pueden envasarse en recipientes separados y mezclarse inmediatamente antes de su uso. Dicho envasado de los componentes por separado puede permitir almacenamiento a largo plazo sin perder las funciones de los componentes activos. Los kits también pueden suministrarse con materiales de instrucciones. Las instrucciones pueden imprimirse en papel u otro sustrato, y/o pueden suministrarse como un medio legible electrónicamente.
EJEMPLO 1: Ice-ChIP-seq de H3K4me3 de línea celular E14 de ESC de ratón
Para normalizar la inmunoprecipitación de la cromatina a una escala biológicamente significativa, se adaptó el concepto de química analítica de calibración por patrones internos definidos. Se introdujeron nucleosomas reconstituidos que llevaban una modificación postraduccional que se asemeja precisamente a su homólogo nucleosómico natural aislado por fragmentación con nucleasa microcócica en el ChIP natural convencional (Brand et al., 2008). La figura 4 muestra los datos para ICe-ChIP-seq de H3K4me3 para el grupo del gen HOXA de la línea celular E14 de ESC de ratón. Los valores de densidad de modificación de histona están dentro del intervalo esperado (0-100 %). Como se muestra previamente, H3K4me3 está predominantemente enriquecida en sitios de inicio de la transcripción y potenciadores.
En ICeChIP, dichos patrones internos nucleosómicos adoptan la forma de una "escala" o series de concentración del mismo nucleosoma modificado, distintos solamente en cortas secuencias con código de barras que codifican la concentración relativa de cada miembro de la escala de modo que pueda construirse una curva de calibración. Véase la figura 2.
El segundo componente del patrón interno nucleosómico es un conjunto de especies de ADN con código de barras que se asociará de manera estable con el octámero de histona tras la reconstitución y puede distinguirse fácilmente de secuencias genómicas. Se construyó una colección de ADN de nueve miembros compuesta de una secuencia de colocación de nucleosoma "601" constante (Lowary y Widom, 1998) y secuencias de código de barras flanqueantes variables seleccionadas para que fueran únicas y estuvieran desprovistas de artefactos de amplificación por PCR con respecto al ADN aleatorio (figura 2). Se diseñaron secuencias de código de barras para que fueran sustancialmente diferentes de los genomas humano, de ratón y de levadura de modo que la deconvolución de la escala de patrón interno de secuencias de ADN genómico sea robusta para cuatro o más errores de asignación de base en secuenciación de extremos emparejados. Los códigos de barras candidatos se adjuntaron en parejas flanqueando el núcleo 601 y se seleccionaron adicionalmente para la formación de un producto de PCR de una sola banda limpio con eficacia de amplificación alta e igual (figura 3A). Como nuestras lecturas analíticas de ICeChIP implican PCR, para preparar las colecciones para secuenciación o para generar directamente la medición (qPCR o ddPCR), se examinó si nuestro ADN de escala presenta algún sesgo de ampliación con respecto al ADN genómico y no se encontraron diferencias detectables (figura 3B). Se preparó la escala de nucleosoma de ICeChIP por diálisis en gradiente del octámero de histona con una serie de concentración de diferentes ADN con código de barras en un solo tubo (Luger et al., 1999; Ruthenburg et al., 2011) (figura 2).
Se realizó ICeChIP-seq dopando un patrón interno de nucleosoma que albergaba la marca H3K4me3 en cromatina genómica digerida antes de la inmunoprecipitación o extracción. En esta ocasión, se presentan los datos de ICeChIP-seq para células madre embrionarias de ratón E14 (figura 4). Se descubrió que sutiles mejoras en el protocolo de Dilworth para ChIP natural (Brand et al., 2008) maximizaba la recuperación de la cromatina (> 80 % por qPCR) produciendo nucleosomas al menos un 95 % puros, y minimizaba de ese modo el sesgo de la eucromatina. A esta población de nucleosoma natural entonces se le añadió escala de patrón interno y se sometió a purificación por cromatografía con hidroxiapatita antes de la inmunoprecipitación o extracción. Se cuantificó el número de núcleos antes de digestión con MNasa para seriar nuestro intervalo de escala de nucleosoma alrededor de las copias de genoma representadas de modo que nuestro intervalo de concentración de escala fuera representativo de un nucleosoma natural dado. Con cantidades minúsculas de escala añadida (típicamente un 0,0001-0,002 % de los nucleosomas totales en la aportación), no debilitó apreciablemente nuestra profundidad de secuenciación, ni se perturbó la captura de nucleosoma natural. Se sometió tanto el material inmunoprecipitado como la aportación dopada en secuenciación Illumina; las lecturas de la escala y los nucleosomas naturales se deconvolucionaron por alineación con el ensamblaje del genoma apropiado concatenado con las secuencias de ADN de patrón interno.
En oposición a ChIP convencional, donde las alturas de los picos carecen de significado biológico directo, ICeChIP puede calcular la densidad de modificación de histona (% HMD): el porcentaje real de un epítopo de marca presente en un intervalo cromosómico dado, con la resolución de pb apropiada para ChIP-seq. Con un buen anticuerpo, el % HMD típicamente abarca un 0-100 %, pero no está restringido a este intervalo (figura 4). En ICeChIP-seq, la relación de lecturas de patrón interno en la IP y aportación es una medida directa del enriquecimiento de IP, un valor aplicado a la relación de lecturas de IP natural/aportación alineadas por par de bases, en todo el genoma (figura 1).
Como región representativa de enriquecimiento de H3K4me3, se presentan los grupos del gen HOXA/Hoxa en células de ratón (Bernstein et al., 2006; Guenther et al., 2007; Mikkelsen et al., 2007) (figura 4). A esta profundidad de secuenciación, los picos significativamente enriquecidos varían en HMD entre tan poco como un 1 % a más de un 100 %. Las estimaciones de error repuntan asintóticamente cerca de la díada de nucleosomas de alta ocupación; ya que el número de lecturas de estas regiones es bajo, la estadística de números pequeños en un intervalo de pb son una gran fuente de error experimental. Una mayor profundidad de secuenciación de la aportación reduce la magnitud del error, discernible comparando la secuenciación más profunda en -4 veces (error ~ 1/Vprofundo). Como alternativa, la HMD puede expresarse sobre intervalos cromosómicos más grandes con inexactitud reducida. De forma importante, estos datos están dentro de un intervalo físicamente plausible, la densidad de modificación aparente infrecuentemente excede un 100 % dentro del error experimental. En particular, de 60530 picos asignados en el conjunto de datos de H3K4me3 de mESC (MACS2, p < 10-20), 18300 de estos tienen un valor de HMD/pb que excede un 100 % en cualquier punto dentro del pico, aunque solamente 1627 tienen un valor de HMD/pb donde el límite inferior del intervalo de confianza del 95 % es mayor del 100 %. No obstante, se emprendió una valoración más cuidadosa de esta validez del método en la medición de la densidad de modificación de histona.
El comportamiento de patrones internos en el transcurso de la realización de las mediciones de ICeChIP-seq en la figura 4 produce una evaluación directa de la precisión. La regresión lineal de las abundancias relativas observadas de cada miembro de escala en la IP frente a la aportación para nuestra ICeChIP de HEK293 dirigida contra H3K4me3 reveló una pronunciada correlación con una pendiente de 1,02 ± 0,02 y una R2 de 0,998 (figura 5A). Experimentos independientes adicionalmente revelaron una linealidad similar llamativa indicativa de precisión muy alta sin desviaciones sistemáticas aparentes que sugieren que cada miembro de escala presenta enriquecimiento de IP equivalente (figura 9B-D). Estos experimentos representan la primera demostración de que puede haber una relación lineal entre la cantidad de epítopo y la intensidad de la señal de ChIP correspondiente. Dicha linealidad es un requisito para usar corrección de factor de escala en ICeChIP y, por lo tanto, se examinó de manera rutinaria para la estricta linealidad antes de aplicar gradación de ICeChIP. En nuestros experimentos, esta linealidad existe a través de un intervalo de trabajo útil ya que hemos seriado la serie de concentración de patrones internos nucleosómicos en aproximadamente el mismo intervalo del número de núcleos en el experimento. Se buscaron maneras de comparar la HMD/pb calculada de secuenciación Illumina con otros métodos de recuento de ADN cuantitativos. La PCR de gota digital (ddPCR) y la PCR cuantitativa (qPCR) se basan en amplicones definidos por conjuntos de cebadores específicos, de modo que la HMD/pb derivada de ICeChIP-seq promediada sobre el intervalo cromosómico del amplicón puede compararse directamente. Para nuestra sorpresa, se descubrió un enriquecimiento de 5,7 veces de los fragmentos de ADN más largos de los nucleosomas en nuestra IP con respecto a la aportación por secuenciación de extremos emparejados, que da lugar a una inflación ~ 16 % del HMD aparente. Se menciona esta sobrerrepresentación como un "sesgo de avidez de oligonucleosoma", que se cree que proviene de una valencia mayor de epítopo por fragmento de ADN. Como corrección, típicamente se filtran los datos de secuenciación de extremos emparejados sin procesar para eliminar los fragmentos más grandes de ADN. Sin embargo, las mediciones hechas con qPCR y ddPCR no pueden distinguir entre señal de nucleosoma y derivada de oligonucleosoma sin una selección rigurosa del tamaño. Por tanto, con fines de comparación se presenta la señal de HMD sin corregir (figura 5B) y se proporciona la HMD corregida al mononucleosoma en la información complementaria. Con este análisis, los tres métodos de medición fueron idénticos con un error experimental en los locus HoxA5 en mESCs. (figura 5B). Además, se realizó ICeChIP con anticuerpos para las histonas H3 y H4 y se descubrió que la relación -2,2 esperada en los nucleosomas era indistinguible para las tres modalidades de medición. Esta congruencia sugiere que la ICeChIP es precisa o alberga error sistemático independiente del método de cuantificación de ADN.
Preparación de histona semisintética
La histona humana H3.2(C110A)K4me3 se preparó por semisíntesis (Ruthenburg et al., 2011; Shogren-Knaak y Peterson, 2003), pero distinta en un aspecto crucial, la unión por ligamiento es sin cicatriz después de una etapa de desulfuración (Wan y Danishefsky, 2007), la histona resultante es idéntica a la histona modificada natural salvo por la mutación C110A que se prepara frecuentemente para facilitar la manipulación en histona recombinante. La secuencia correspondiente a los residuos 1-20 de histona 3, que alberga la modificación K4me3 se sintetizó como un tioéster peptídico por SPPS con química de tipo Boc sobre resina de S-tritil-p-mercaptopronionil-p-metil-benzhidrilamina (Nova Biochem) (Alewood et al., 1997). La resina se hinchí durante 1 hora con DMF y posteriormente se desprotegió lavándola tres veces durante tres minutos con TFA al 95 %, triisopropilsilano al 2,5 % y H2O al 2,5 %. Todos los acoplamientos de aminoácido se realizaron con 4 equivalentes molares de aminoácido protegido con Boc, 3,9 equivalentes molares de HBTU y 6 equivalentes molares de DIPEA se incubaron con resina durante 10 minutos en agitación con nitrógeno. Después del acoplamiento, la resina se lavó tres veces con DMF (con la excepción de glutamina cuando se usaba DCM en su lugar), y la desprotección con Boc se logró con tres lavados de TFA, donde el primero es un lavado por flujo. Después de la desprotección del último aminoácido, la resina se lavó secuencialmente con DMF, DCM y metanol. Todos los péptidos se escindieron de la resina con HF/DMS/anisol (10:1:1), se precipitaron con éter dietílico frío y se liofilizaron.
La histona truncada H3.2A20 (C110A) se expresó de manera recombinante con marca de His6 en el extremo N y se insertó un sitio de escisión por proteasa TEV (ENLYFQAC) después de la posición H3.2L20, remplazando A21, de modo que tras la escisión con proteasa TEV, se libera una cisteína N terminal. El tioéster peptidílico C terminal descrito anteriormente se ligó al fragmento de histona recombinante H3.2A20-A21C mediante ligamiento químico natural (Dawson et al., 1994), usando el auxiliar de ligamiento MPAA (Johnson y Kent, 2006). En resumen, se mezclaron cantidades equimolares de tioéster de peptidil 3-mercaptopropionamida e histona truncada a concentración final 2 mM en tampón n Cl (cloruro de guanidinio 6 M, fosfato 200 mM pH 7,0) en presencia de MPAA 30 mM y TCEP 20 mM. Si se necesitaba, el pH se ajustaba hasta 7,0 y la reacción se incubó durante 12-16 horas a temperatura ambiente. Posteriormente, la finalización de la reacción se validó con EM MALDI y el producto se purificó por HPLC semipreparativa (columna YMC pack C8, 250 mm*10 mm, 5 pm, 30 nm). La alanina natural en la posición 21 se restauró por desulfuración mediada por radical de cisteína (Wan y Danishefsky, 2007). La finalización de la reacción se validó por EM IEN, se purificó por HPLC semipreparativa (YMC pack C8, 250 mm*10 mm, 5 pm, 30 nm) y posteriormente se liofilizó.
Los octámeros se prepararon a una escala de 250-500 pg como se describe previamente (Luger et al., 1999; Muthurajan et al., 2003), usando histonas humanas expresadas en E. coli (Ruthenburg et al., 2011). En resumen, se mezclaron histonas centrales equimolares en tampón de desplegamiento (Tris-HCl 50 mM pH 8, Guanidina-HCl 6,3 M, 2-mercaptoetanol 10 mM, EDTA 4 mM) hasta concentración final de histona total > 1 mg/ml, y se dializaron en dos cambios de 500 volúmenes de tampón de replegamiento (Tris-HCl 20 mM pH 7,8, NaCl 2 M, EDTA 1 mM, DTT 5 mM) durante 16 horas en tubos de diálisis SnakeSkin de 3500 MWCO (Pierce) a 4 °C. Después de la diálisis y la centrifugación para eliminar cualquier material precipitado, la fracción soluble de octámero en bruto se sometió a cromatografía de filtración en (Superdex 200 10/300 GL, GE Healthcare), se resolvió en tampón de replegamiento. Las fracciones que contenían octámero puro se combinaron y concentraron con filtros de centrifugación Amicon Ultra-4 (10 k MWCO, Millipore) hasta una concentración final de 5-15 pM (medida espectroscópicamente, £280nm = 44700 M' 1 cm-1, con blanco de flujo directo del concentrador).
El ADN para la reconstitución del nucleosoma se basa en secuencia de colocación de nucleosoma "601-Widom" (Lowary y Widom, 1998). A cada extremo de la secuencia 601 hemos adjuntado secuencias de código de barras de 22 pb, cada compuesto de dos secuencias de 11 pb concatenadas ausente en genoma humano y de ratón (Herold et al., 2008) flanqueado por 6 pb constantes de ADN conector.
Los nucleosomas se reconstituyeron mezclando octámero de histona equimolar y ADN hasta concentraciones finales de 1 pM, después dializando esta solución en botones de diálisis (Hampton Research) en un gradiente no lineal partiendo de NaCl 2 M y finalizando en NaCl 200 mM sobre el transcurso de 12-16 horas en tampón que contenía Tris-HCl 20 mM pH 7,5, EDTA 1 mM, 2-mercaptoetanol 10 mM (Ruthenburg et al., 2011). Posterior a la diálisis, los nucleosomas semisintéticos se diluyeron 1:1 con tampón de almacenamiento 2x (cacodilato de Na 20 mM pH 7,5, glicerol al 10 % v/v, EDTA 1 mM), cóctel inhibidor de proteasa RL 1X [PMSF 1 mM, ABESF 1 mM, aprotinina 0,8 pM, leupeptina 20 pM, pepstatina A 15 pM, bestatina 40 pM, E-64 15 pM], PMSF 200 pM y se mantuvieron a 4 °C. La concentración de nucleosomas se midió por triplicado separando de ADN con NaCl 2 M y midiendo la concentración de ADN por densitometría de geles de agarosa teñidos con bromuro de etidio calibrados in situ con la escala de ADN de bajo intervalo Thermo Scientific MassRuler. Las concentraciones de trabajo de los nucleosomas semisintéticos se prepararon por dilución hasta concentraciones deseadas en tampón de almacenamiento a largo plazo (cacodilato de Na 10 mM pH 7,5, NaCl 100 mM, glicerol al 50 %, EDTA 1 mM, cóctel inhibidor de proteasa RL 1X, PMSF 200 pM) y se almacenaron a -20 °C.
ICeChIP
El protocolo de ICeChIP es un protocolo de extracción como un protocolo de ChIP natural (Brand et al., 2008). Células adheridas a la placa (~107 células por IP) se lavaron dos veces con 10 ml de PBS, y se liberaron mediante 5 ml de Accutase (Millipore) durante 5 minutos en 37 °C, se inactivaron con 2 ml de medio completo, y se recogieron por centrifugación (500 x g, durante 5 minutos a 4 °C). Todas las etapas posteriores se realizaron en hielo con tampones enfriados en hielo. Las células se lavaron dos veces con 10 ml de PBS, y dos veces con 5 ml de tampón N (Tris 15 mM pH 7,5, NaCl 15 mM, KCl 60 mM, sacarosa al 8,5 % (p/v), MgCh 5 mM, CaCh 1 mM, DTT 1 mM, PMSF 200 pM, cóctel inhibidor de proteasa RL 1x). Las células se resuspendieron en 2 PCV (volúmenes de células compactadas) de tampón N y se lisaron añadiendo 2 PCV de tampón de lisis 2x (tampón N complementado con sustituto NP-40 al 0,6 % (Sigma)) durante 10 minutos a 4 °C. Los núcleos se recogieron por centrifugación (500 x g durante 5 minutos a 4 °C) y se resuspendieron en 6 PCV de tampón N. Para retirar los desechos celulares, los núcleos resuspendidos se superpusieron sobre la superficie de 7,5 ml de lecho de sacarosa (HEPES 10 mM pH 7,9, sacarosa al 30 %(p/v), MgCh 1,5 mM) en un tubo de centrifugación de 50 ml se centrifugaron (1300 x g, rotor de cubeta de balanceo Sorvall Legend XTR durante 12 minutos a 4 °C). La mayoría de los desechos celulares permanecieron en la capa superior mientras que los núcleos sedimentaron a través del lecho de sacarosa y sedimentaron en el fondo del tubo. El sobrenadante se descartó y los núcleos se resuspendieron en 2 PCV de tampón N. Para medir la concentración aparente de cromatina, se diluyeron 2 pl de núcleos resuspendidos en 98 pl de NaCl 2 M por triplicado, se midió la absorbancia total de ácido nucleico a 260 nm por Nanodrop (Thermo Scientific), y se empleó el factor de conversión suponiendo IA 260 = 50 ng/pl de cromatina. Basándose en estas mediciones, la concentración aparente de cromatina se ajustó a 1 pg/pl con tampón N. También se evaluaron la cantidad y calidad de los núcleos usando un hemocitómetro.
En esta fase, una escala de nucleosomas semisintéticos se dopó en la combinación de nucleosomas naturales. La cantidad de escala añadida fue comparable a la cantidad estimada de copias de genoma en la combinación basándose en el recuento de núcleos multiplicado por el promedio de contenido de ADN por célula (~2,5 copias de genoma por célula).
Para retirar los desechos que provienen de la lisis de los núcleos y la digestión con MNasa, así como separar los factores unidos a cromatina, la combinación de nucleosomas se sometió a purificación por cromatografía en hidroxiapatita (Brand et al., 2008). La cromatina fragmentada con escalas de patrón interno se dividió en fracciones de 100 pg de ácido nucleico total y cada fracción se mezcló con 66 mg de resina de hidroxiapatita (HAP) (hidroxiapatita cerámica Bio-Rad Macro-Prep® tipo I 20 pm) rehidratada con 200 pl de tampón HAP 1 (Na2HPO43,42 mM y NaH2PO4 1,58 mM pH final 7,2, NaCl 600 mM, Ed Ta 1 mM, PMSF 200 pM), se incubó durante 10 minutos a 4 °C en un rotador y posteriormente se aplicó a la unidad de filtro de centrifugación (filtro de centrifugación Millipore Ultrafree® MC-HV 0,45 pm). La resina cargada de cromatina en la columna se drenó y después se lavó cuatro veces con 200 pl de tampón HAP 1 y cuatro veces con 200 pl de tampón HAP 2 (Na2HPO43,42 mM y NaH2PO41,58 mM pH final 7,2, NaCl 100 mM, EDTA 1 mM, PMSF 200 pM) por centrifugación (600 x g, 1 minuto a 4 °C en rotor de ángulo fijo. Los nucleosomas se eluyeron de la columna HAP con tres lavados de 100 pl de tampón de elución HAP (Na2HPO4342 mM y NaH2PO4158 mM pH final 7,2, NaCl 100 mM, EDTA 1 mM, PMSF 200 pM). Para medir la concentración aparente de fragmentos de cromatina purificados en HAP, se diluyeron 10 pl de la elución en HAP en 40 pl de NaCl 2 M por triplicado, y se midió la absorbancia a 260 nm promediada y ajustada (1A260 = 50 ng/pl de cromatina). La concentración aparente de cromatina se ajustó a 20 pg/ml con tampón de ChIP 1 (Tris 25 mM pH 7,5, MgCh 5 mM, KCl 100 mM, glicerol al 10 % (v/v), sustituto NP-40 al 0,1 % (v/v)).
Se realizó ChIP de H3K4me3 con 10 pg de cromatina y 15 pl de anticuerpo AM39159, se realizó ChIP de H3 y H4 con 1 pg de cromatina y 15 pl de anticuerpo AM61277 y AM61299, respectivamente (Active Motif). Se reservó un 10 % de cromatina inicial para cada IP para que sirviera como aportación de ChIP. Cada experimento de IP usó 50 pl de Dynabeads de proteína A (Invitrogen) que se lavaron dos veces con 1 ml de tampón de ChIP 1 con 1 min de recogida en gradilla magnética después de cada lavado. Para preparar la resina, se añadieron 15 pl de anticuerpo y 85 pl de tampón de ChIP 1 a las Dynabeads de proteína A y se incubaron durante 10 minutos a temperatura ambiente en un rotador, después se lavaron dos veces con 1 ml de tampón de ChIP 1. Después se añadió cromatina (10 pg salvo que se indique otra cosa) en 500 pl de tampón de ChIP 1 a las microesferas magnéticas y se incubaron durante 15 minutos a temperatura ambiente en el rotador. Las microesferas se lavaron 3 veces con 1 ml de tampón de ChIP 2 (Tris mM pH 7,5, MgCl25 mM, KCl 300 mM, glicerol al 10 % (v/v), sustituto NP-40 al 0,1 % (v/v)), después dos veces con tampón de ChIP 3 (Tris 10 mM pH 7,5, LiCl 250 mM, EDTA 1 mM, desoxicolato de Na al 0,5 %, sustituto NP-40 al 0,5 %(v/v)), consistiendo cada lavado en una incubación de rotación de 10 minutos y recogida de 1 minuto en gradilla magnética a 4 °C. Durante el transcurso del lavado, al menos dos cambios de tubo redujeron el fondo no específico. Las microesferas entonces se aclararon con 1 ml de tampón de ChIP 1 y 1 ml de tampón TE, seguido de dos etapas con tampón de elución de ChIP de 200 pl (Tris 50 mM pH 7,5, EDTA 1 mM, SDS al 1 % p/v). Cada etapa de elución consistía en incubación de 10 minutos a 65 °C en un Thermoshaker (Eppendorf) a 900 rpm. Las eluciones se combinaron y se añadió tampón de elución de ChIP a las aportaciones para igualas el volumen de las eluciones de ChIP. Después de ajustar el tampón a NaCl 200 mM, se añadieron 100 ng de RNasa A a la mezcla y se incubó a 65 °C durante 45 minutos en Thermoshaker a 800 rpm, y se terminó con EDTA 10 mM. A continuación, la digestión de las proteínas se consiguió con 20 ug de proteinasa K (Roche) durante 2 horas a 42 °C en el Thermoshaker a 800 rpm. El ADN se recuperó y se purificó con columnas Qiaquick (Qiagen): se añadieron 6 volúmenes de tampón PB a la digestión y esta solución se aplicó a la columna (17900 x g, 30 s) seguido de lavados 3x de 750 pl de tampón PE (17900 x g, 30 s) con una centrifugación adicional de 1 minuto para retirar el etanol residual. El ADN se eluyó aplicando dos veces 25 pl de tampón TE a 50 °C y centrifugando (17900 x g, 1 min).
Preparación de colección Illumina
Para la preparación de la colección, se usaron 10 ng de ADN asilado de IP o aportación. En casos en que la cantidad total de ADN estaba por debajo de 10 ng, todo el ADN disponible se sometió a preparación de la colección. Los extremos de ADN se cortaron de forma roma usando el kit de reparación de extremos de ADN End-it™ (Epicentre) (7 pl de tampón End-It 10x, 7 pl de mezcla de dNTP 2,5 mM, 7 pl de ATP 10 mM, 1,4 pl de mezcla de enzima de reparación de extremos y 47,6 pl de ADN en tampón TE, se incubaron durante 45 minutos a temperatura ambiente. El a Dn se purificó con 126 pl (1,8 volúmenes) de microesferas Ampure XP (Beckman Coulter). Las microesferas se mezclaron con mezcla de reparación de extremos pipeteando 10 veces arriba y abajo seguido de 5 minutos de incubación a temperatura ambiente. Las microesferas magnéticas se recogieron en el lateral del tubo mediante un imán y se realizaron dos lavados de 30 segundos con 250 pl de EtOH al 80 % en el imán. Los tubos se retiraron de la gradilla magnética y se añadieron 34 |jl de tampón TE a las microesferas y se pipetearon 10 veces arriba y abajo. Las microesferas magnéticas no se retiraron de la elución y permanecieron en el tubo durante la adición de cola de A. La adición de una sola adenosina a los extremos 3' de ADN se consiguió añadiendo a 5 j l de tampón NEB 2, 10 j l de dATP 1 mM, 1 j l de fragmento Klenow (3 '^5 ' exo-, NEB) al ADN de extremos reparados, y con incubación a 37 °C durante 30 minutos. Para purificar el ADN, se añadieron 110 j l (2,2 volúmenes) de tampón SPRI (PEG6000 al 20 %, NaCl 2,5 M) a la reacción y se pipetearon 10 veces arriba y abajo seguido de 5 minutos de incubación a temperatura ambiente. Las microesferas magnéticas se recogieron en el lateral del tubo con un imán y se realizaron dos lavados de 30 segundos con 200 j l de EtOH al 80 % en el imán. Los tubos entonces se cogieron de la gradilla magnética y se añadieron 13 j l de tampón TE a las microesferas y se mezclaron mediante pipeta. Las microesferas magnéticas no se retiraron de la elución y permanecieron en el tubo durante el ligamiento de adaptador. Para ligar los adaptadores, se preparó la siguiente mezcla: tampón de ligasas de ADN Quick 2x, 2 j l de 2 jM de adaptador bicatenario, 1 j l de ligasa de ADN Quick (NEB) y se añadió a 13 j l de ADN con cola de A. La reacción se incubó durante 15 minutos a temperatura ambiente. Para purificar el ADN, se añadieron 21 j l (0,7 volúmenes) de tampón SPRI a la reacción y se pipetearon 10 veces arriba y abajo seguido de 5 minutos de incubación a temperatura ambiente. Las microesferas magnéticas se recogieron mediante un imán y se lavaron dos veces con incubaciones de 30 segundos de 200 j l de EtOH al 80 %, y se eluyeron con 46 j l de tampón TE. El sobrenadante se transfirió al nuevo tubo siliconizado.
Se ejecutó PCR cuantitativa para estimar el número mínimo de ciclos de PCR para amplificar la colección de ADN.
7,15 j l de H2O, 1 j l de tampón de PCR AccuPrime II 10x, 0,25 j l de tinte EvaGreen® 20 x (Biotum) hasta dilución final 0,5x, 1 j l de colección de ADN, 0,2 j l de cebador MP_PCR_Primer1 25 jM , 0,2 j l de cebador MP_PCR_Primer2 25 jM y 0,2 j l de ADN polimerasa Taq AccuPrime (Invitrogen n.° 12339-016). El programa de la máquina de qPCR Bio-Rad CFX384 se ajustó a: 1-95 °C durante 5 min, 2-95 °C durante 80 s, 365 °C durante 90 s - lectura en el extremo, 4 retornos a la etapa 2 durante 24 veces. Basándose en las lecturas, el número de ciclos para amplificar la colección se estableció en Ct 3 ciclos. Si el valor de Ct observado estaba por debajo de 7 ciclos, el molde se diluía 10 veces y se repetía el procedimiento.
La colección de ADN se amplificó mezclando: 40 j l de colección de ADN, 5 j l de tampón de PCR AccuPrime II 10x, 1 j l de cebador MP_PCR_Primer1 25 jM , 1 j l de cebador MP_PCR_Primer2_INDEX 25 jM , 1 j l de ADN polimerasa Taq AccuPrime y 2 j l de H2O, seguido de termociclado en un C1000 (Bio-Rad). La máquina se ajustó a: 1-95 °C durante 5 min, 2-95 °C durante 80 s, 3-65 °C durante 90 s, 4 retornos a la etapa 2 durante el número de ciclos determinado con qPCR (Ct+3 ciclos). El ADN amplificado se purificó con 90 j l (1,8 volúmenes) de microesferas Agencourt Ampure XP. Las microesferas se mezclaron con mezcla de PCR pipeteando 10 veces arriba y abajo, seguido de 5 minutos de incubación a temperatura ambiente. Las microesferas magnéticas se recogieron en el lateral del tubo mediante un imán y se realizaron dos lavados de 30 s con 250 j l de EtOH al 80 % en el imán. El tubo se retiró de la gradilla magnética y se añadieron 25 j l de tampón TE a las microesferas y se pipetearon 10 veces arriba y abajo. Las microesferas magnéticas se recogieron en el lateral del tubo y el sobrenadante se movió a un nuevo tubo siliconizado. La distribución de tamaños y la concentración de la colección amplificada se evaluaron con el bioanalizador Agilent Technologies 2100.
Secuenciación y análisis de datos
La generación de grupos y secuenciación se realizaron usando el protocolo Illumina convencional para Illumina HiSeq 2500 por la instalación central de Genómica Funcional de la Universidad de Chicago. El análisis de datos se realizó con Galaxy(Blankenberg et al., 2010; Giardine et al., 2005; Goecks et al., 2010). En primer lugar, las lecturas sin procesar en formato FastQ se sometieron a FastQ Groomer. Las lecturas se cartografiaron con Bowtie2 (Langmead et al., 2009) (opción de preajuste sensible, alineación extremo a extremo), dependiendo del organismo de origen, en genomas de referencia de ratón (MM10) con secuencias de códigos de barras concatenadas en el extremo (cada código de barras con su propia entrada). Los archivos SAM resultantes entonces se filtraron usando SAMtools (Li et al., 2009). Las lecturas que no se cartografiaron, no se emparejaron (distancia >1000 pb) y se emparejaron incorrectamente se eliminaron del conjunto mediante esta canalización de análisis de datos. Para eliminar el ruido proveniente de las lecturas de baja calidad y los contaminantes, así como enmascarar las secuencias genómicas repetibles, las lecturas con calidad de cartografiado menor de 20 se eliminaron. Para evitar los artefactos de señal y no distorsionar la estadística de muestro de Poisson, las lecturas emparejadas se combinaron conjuntamente en entradas únicas (los fragmentos solapantes se aplanaron y se rellenaron los huecos). Para evitar el sesgo de avidez de oligonucleosoma, lecturas mayores de 220 pb se eliminaron, excepto cuando se indicaba explícitamente de otro modo. Se usó BEDTools (Quinlan y Hall, 2010) para crear gráficos BedGraph de cobertura del genoma.
Para obtener una alta precisión, se tiene como objetivo conseguir una cobertura de IP que varía entre 1000 y 10 lecturas de profundidad y un promedio de profundidad de aportación de al menos -20. Sin embargo, cuanto más profunda sea la secuenciación de la aportación mejor, ya que es el factor limitante para la precisión. Para calcular la eficacia de IP del código de barras, se calculó la relación de cobertura integrada sobre la secuencia completa de cada código de barras en IP sobre la aportación.
Eficacia de IP = ¿y ip
Z™ aportación
donde, n es la longitud de la construcción de código de barras, en este caso es 203 pb, IP es los recuentos integrados para IP y aportación es los recuentos integrados para la aportación.
Para aumentar la precisión, se han promediado los valores de eficacia de IP de código de barras para múltiples códigos de barras. Para calcular la densidad de modificación de histona (HMD) se ha aplicado la siguiente ecuación para información de cobertura genómica para IP y aportación:
HMD ( vp~er/p ~b ') = Wp e°fritcaaccíóîa - d-e-- I-P---
Para estimar los intervalos de confianza del 95 % de HMD se ha aplicado la siguiente ecuación:
1 _0_0_ % * V7p 100 % * IP * ,/aportación _
196 * (------------------------------------)2 (-------------------- --------------)2
Figure imgf000021_0001
aportación * eficacia de IP aportación2 * eficacia de IP
En este caso se supone que la desviación típica de la eficacia es insignificante, y el muestreo de las lecturas en IP y aportación sigue la estadística de muestreo de Poisson. Para calcular el contenido total de HMD de todo el genoma (porcentaje de todos los nucleosomas en todos los locus genómicos que albergan modificación), la señal de HMD se integró y posteriormente se dividió por el número total de pares de bases para el que se tenía cobertura genómica o, como alternativa, por el tamaño total del genoma presentado.
Ejemplo 2: Validación de ICeChIP-seq: reproducibilidad y robustez
Para examinar la uniformidad de ICeChIP tras la replicación, se repitió la ICeChIP-seq de H3K4me3 en mESC y se observó el fuerte acoplamiento de los rastros de HMD. En consecuencia, los valores medios de HMD para cada réplica biológica en los picos asignados están muy correlacionados (R2 = 0,95) y la distribución está dentro del error estimado (figura 6A).
La variación de enriquecimiento de IP como consecuencia de diferentes condiciones de manipulación experimental es un factor de complicación principal en la reproducibilidad de ChIP convencional (Marinov et al., 2014). Fijando los valores producidos de cada experimento a un patrón interno definido, la HMD medida por ICeChIP es más tolerante de variación experimental. Como el enriquecimiento aparente de ChIP es una función de la cantidad de cromatina introducida con respecto al número de sitios de unión de epítopo en la resina, se buscó simular las disparidades de manipulación experimental manipulando la relación de aportación con respecto al anticuerpo inmovilizado en la resina. En un régimen seriado lineal, se examinó HMD de H3K4me3 mediante ICeChIP-qPCR y se descubrió que es independiente de la cantidad de aportación, rastreable para enriquecimiento de IP relativamente uniforme de H3K4me3 en el locus de GAPDH. Aunque estos experimentos confirmaron que la HMD es constante sobre un intervalo de aportación de ChIP típico, se buscaron condiciones experimentales que produjeran enriquecimiento diferencial. Para una cantidad fija de aportación, alterar la cantidad de anticuerpo inmovilizado en resina usado en la inmunoprecipitación producía un intervalo de eficacias de IP mayor de 6 veces, aunque la densidad de H3K4me3 calculada a partir de estos experimentos para los locus Dnmt3A y Hoxa9 era idéntica dentro del error experimental (figura 6B). Asimismo, la alteración radical de las condiciones de unión y lavado durante ICeChIP-seq producen mediciones de HMD muy similares (figura 7A). Finalmente, se valoró la cantidad introducida para examinar el rendimiento de ICeChIP cerca de los límites de los protocolos de número bajo de células, y se descubrió que funcionaba establemente para la aportación equivalente a ~ 400 células (figura 8). En conjunto, estos datos indican que, aunque el enriquecimiento de IP puede variar como una función de las condiciones experimentales, la HMD es estable y muy reproducible.
Ejemplo 3: ICeChIP de escala múltiple mide la especificidad de IP in situ
La señal aparente de ChIP es una mezcla de captura específica, captura inespecífica de epítopos relacionados (por ejemplo, otras marcas de metilo en lisina) y adhesión no específica de nucleosomas a la resina con anticuerpo. La ICeChIP realizada con varios tipos diferentes de patrones internos mide las tres posibles fuentes de señal de ChIP, abordando de forma crucial de ese modo la señal verdadera y error de una ChIP por primera vez. Se indagaron los nucleosomas de mESC dopados con tres tipos de patrones internos, H3K4me3, H3K36me3 y nucleosomas sin modificar reconstituidos en especies de ADN distinguibles (dos nucleosomas de cada tipo) por ICeChIP-qPCR. H3K36me3 se eligió porque alberga una trimetil-lisina incluida en un contexto de secuencia diferente y se ha observado previamente afinidad inespecífica moderada de este anticuerpo por H3K36me3 en micromatrices de péptidos (Bock et al., 2011). Mediante inspección de nuestros patrones internos, se observó un enriquecimiento escasamente detectable de H3K36me3 (2,8 ± 0,4) más allá del fondo de nucleosoma sin modificar (1,9 ± 0,2). En comparación con la robusta señal específica (81 ± 10), hay una especificidad aparente de 30 veces en este experimento. Por tanto, la unión inespecífica del anticuerpo a nucleosomas que albergan H3K36me3 es una contribución insignificante a la densidad aparente de H3K4me3.
Para establecer un conjunto más completo de patrones internos, se construyeron varias histonas modificadas que abarcaban muchas de las di- y trimetil-lisinas mejor estudiadas en histona H3 (Chen et al., 2014) y se diseñó un conjunto mucho más grande de moldes de ADN con código de barras. Específicamente, se diseñó una segunda generación de posibles moldes de ADN (n = 100) que tenían la característica adicional de ser supuestamente resistentes a MNasa con respecto a la primera generación. Se ensayaron todos estos moldes cuando se reconstituyeron en nucleosomas que albergan H3K4me3 en dos experimentos de ICeChIP paralelos, añadiéndolos antes o después de digestión con MNasa de los núcleos de mESC. Los 72 moldes con código de barras únicos que pasaba este ensayo riguroso (combinando esencialmente todos los elementos de nuestra validación previa a la vez) se dividieron en nueve conjuntos, cada uno con 8 miembros. Se reconstituyeron seis escalas diferenciadas para nucleosomas sin modificar, H3K4me3, H3K9me3, H3K27me3, H3K36me3 y H3K79me2, y se dopó un equivalente de cada escala en una sola combinación de núcleos de mESC. Esta mezcla combinada se sometió a digestión con nucleasa microcócica, seguida de purificación en hidroxiapatita como anteriormente, y después, la combinación de fundamentalmente mononucleosomas se dopó con los anticuerpos mejor validados disponibles para cada una de estas marcas.
La secuenciación de cada ICeChIP produjo una evaluación in situ directa de la especificidad del anticuerpo por comparación de la captura de patrón interno específica frente a inespecífica (figura 9A). Gratamente, el anticuerpo contra H3K4me3 demostró ser muy específico cuando se exponía a estos otros patrones internos nucleosómicos (H3K9me3 es equivalente a un 3 % de la captura específica). Los anticuerpos contra H3K9me3 y H3K27me3 eran ligeramente menos específicos, con reconocimiento cruzado mutuo (que representa un 10 % y 26 % de la señal específica, respectivamente), como podría esperarse ya que ambas marcas están dentro de un motivo "ARKS". Sorprendentemente, los anticuerpos más ampliamente usados para H3K36me3 y H3K79me2 eran bastante promiscuos en este experimento (aproximadamente 2-3 veces específicos en el mejor de los casos, a pesar de pasar varias validaciones ENCODE independientes). La moderada selectividad aparente es especialmente problemática para estas dos marcas, ya que son mucho menos abundantes que la mayoría de las marcas nucleosómicas inespecíficas que sus anticuerpos también reconocen. En particular, las mediciones de espectrometría de masas de la misma línea celular informan de que H3K36me3 y H3K79me2 suponen un 2,5 % y un 0,5 % de toda H3, mientras que H3K9me3 y H3K27me3 son un orden de magnitud más abundantes (Voigt et al., 2012). Por tanto, las especificidades factoriales moderadas están más que compensadas por las diferencias de abundancia factorial en la dirección opuesta.
La captura inespecífica es lineal con respecto a la cantidad de epítopo nucleosómico para cinco anticuerpos diferentes (figura 9B-D). Aunque la especificidad de anticuerpo puede variar, el fondo para un anticuerpo dado es determinístico y proporcional a la cantidad de especies inespecíficas presentes en la aportación. Por tanto, nuestra estrategia de aplicar el patrón interno como una escala es válido cuando el patrón interno es lineal y la unión de fondo es moderada y medible. La señal de HMD específica para una marca dada puede corregirse resolviendo un conjunto de ecuaciones lineales. A pesar de los mayores valores de HMD aparentes para H3K36me3 y H3K79me2 en los locus previamente presentados como enriquecidos en estas marcas, las mediciones de HMD, así como las de ChIP natural con estos anticuerpos representan más ruido que señal en nuestros experimentos (figura 9A. A la inversa, los valores de HMD para H3K4me3, H3K9me3 y H3K27me3 presentan inflación mínima y unión inespecífica corregible, de modo que se pueden comparar cuantitativamente las cantidades de estas tres marcas en todo el genoma.
Con mediciones precisas de las cantidades reales de histona a partir de ICeChIP-seq de H3K4me3, H3K9me3 y H3K27me3 de células diploides, elaboramos argumentos estadísticos acerca de la ocupación conjunta nucleosómica de las marcas cuando la suma de las HMD de dos marcas excede del 100 %. Esta interpretación se aplica a dos marcas diferentes, así como a una frente a dos copias de una marca dada dentro de un nucleosoma, denominado nucleosomas modificados asimétricamente y simétricamente, respectivamente (Voigt et al., 2012). La representación de gráficos cromáticos para la densidad de modificación de H3K4me3 y H3K27me3 dispuesta en orden de clasificación de HMD de H3K4me3 localizada en TSS de más alta a más baja para todos los genes en mESC revela varias clases amplias de genes con diferentes patrones de estas dos modificaciones. Sorprendentemente, los niveles de H3K27me3 se reducen solo moderadamente en genes que están muy expresados, como se ejemplifica por genes metabólicos/constitutivos, mientras que las HMD máximas para esta marca están presentes en un subconjunto de genes de desarrollo tempranos. De hecho, otros genes de desarrollo tardíos reprimidos de las clases que son inactivos en mESC, tal como procesos neurológicos y del sistema inmunitario (un 58 y un 62 % de H3K27me3), están significativamente menos enriquecidos en H3K27me3 (p < 10 56, 10 19, respectivamente) que los genes de diferenciación celular reprimidos (70 % de H3K27me3). Los genes de desarrollo en células S2 de Drosophila también albergan el máximo promedio de HMD de H3K27me3.
La marca H3K4me3 promueve el inicio transcripcional mediante varios mecanismos conocidos (Guenther et al., 2007; Lauberth et al., 2013; Ruthenburg et al., 2007a; Santos-Rosa et al., 2002; Schubeler, 2004). A priori, la HMD podría interpretarse para que no fuera informativa para examinar las correlaciones con la expresión génica, porque la altura relativa del pico de ChIP-seq es equivalente a HMD cuando se correlaciona con la expresión génica. Además, cuando se examina H3K4me3 a una escala biológicamente significativa, la abundancia almacenada de ARNm revela una dependencia sigmoidea intrigante del promedio de HMD aparente en TSS correspondientes. Suponiendo una medición precisa de la densidad de H3K4me3, el punto de inflexión de esta curva (~50 % de HMD) está aproximadamente en el límite estadístico entre, en promedio, nucleosomas modificados asimétricamente frente a simétricamente sobre ambos alelos. ¿Podría la población de menor HMD representar simplemente una distribución espacial más amplia de H3K4me3 más allá de TSS como se ha sugerido recientemente para reducir la variación transcripcional? (Benayoun et al., 2014). El examen minucioso revela que valores medios de HMD de picos bastante opuestos se correlacionan positivamente con el tramo del pico en células de ratón y humanas; de nuevo esta distribución es bimodal y esos dominios de mayor modificación tiene valores promedio de HMD mayores, coherentes con la modificación simétrica.
Ejemplo 4: ICe-ChIP como herramienta de diagnóstico
Los materiales y métodos de ICe-ChIP descritos en este documento se idean para su uso en ensayos que tienen el objetivo de detectar niveles de PTM de histona en locus genéticos particulares dentro de muestras de mamífero. Los presentes materiales y métodos pueden usarse en el diagnóstico, pronóstico, clasificación, predicción de riesgo de enfermedad, detección de recidiva, selección de tratamiento y evaluación de eficacia del tratamiento para cualquier enfermedad asociada con cambios en las modificaciones postraduccionales de histona, incluyendo el cáncer.
Por ejemplo, la expresión dirigida por H3K79me2 de dos genes cruciales, HOXA9 y MEIS1 es un punto de comprobación común que acciona un gran porcentaje de leucemias mielógenas agudas que surgen de diversas mutaciones genéticas (Bernt et al., 2011; Kroon et al., 1998). La presente invención puede usarse para medir la HMD de H3K79me2 en estos locus de una muestra de sangre del paciente para determinar si las células del paciente han pasado este punto de comprobación y si pueden diagnosticarse leucemias mielógenas agudas. La HMD de H3K79me2 en estos locus en la muestra de sangre del paciente se compara con la HMD de H3K79me2 en estos locus de una muestra normal y un aumento en la HMD en la muestra del paciente con respecto al control indica un alto riesgo de leucemia mielógena aguda.
En otra realización, puede evaluarse el tratamiento antineoplásico controlando las modificaciones postraduccionales de histona descritas en este documento a lo largo del tiempo en un mamífero que ha recibido tratamiento para una enfermedad. Por ejemplo, antes de la administración de un inhibidor de H3K79me2-metiltransferasa, tal como inhibidor de DOT1L (Diagle et al., 2011), para tratar la leucemia mielógena aguda, puede determinarse el estado de modificación postraduccional de H3K79me2 en los locus de HOXA9 y MEIS1 usando ICe-ChIP. La eficacia del inhibidor se determina entonces comparando la HMD de H3K79me2 con la muestra antes del tratamiento, una muestra de control o un umbral preestablecido como se describe anteriormente. Como la ICe-ChIP normaliza el análisis entre múltiples muestras, la comparación entre antes y después del tratamiento o muestras sanas y que no están sanas, produce información biológicamente relevante y, por tanto, es útil para diagnósticos que evalúan la eficacia de un producto terapéutico en pacientes, incluyendo durante el ciclo de desarrollo farmacéutico.
Además, los presentes métodos y materiales pueden usarse para detectar si un fármaco particular ha tenido efecto sobre la histona, indicando de ese modo la especificidad de un fármaco para modificar las modificaciones postraduccionales de histona de interés.
TABLA 1 (a) - Modificaciones postraduccionales para histonas humanas H2A tipo 1/2/3, H2A.X, H2A.Z y H2A.V isoforma 1/2/3/4/5
Modificaciones postraduccionales de: Histona humana H2A tipo 1/2/3
Posición Descripción de tipo de modificación
1 N-acetilserina
1 Fosfoserina
3 Citrulina
5 N6-acetil-lisina
36 N6-crotonil-L-lisina
118 N6-crotonil-L-lisina
119 N6-crotonil-L-lisina;
120 Fosfotreonina
126 N6-crotonil-L-lisina
13 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 15 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 119 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) Modificaciones postraduccionales de: Histona humana H2A.X
Posición Descripción de tipo de modificación
1 N-acetilserina
1 Fosfoserina
36 N6-acetil-lisina
119 Fosfoserina
142 Fosfotirosina
13 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 15 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 119 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) Modificaciones postraduccionales de: Histona humana H2A.Z
Posición Descripción de tipo de modificación
1 N-acetilalanina
(continuación)
Posición Descripción de tipo de modificación
4 N6-acetil-lisina
7 N6-acetil-lisina
11 N6-acetil-lisina
13 N6-acetil-lisina
121 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) Modificaciones postraduccionales de: Histona humana H2A.V isoforma 1/2/3/4/5
Posición Descripción de tipo de modificación
4 N6-acetil-lisina
7 N6-acetil-lisina
11 N6-acetil-lisina
121 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina)
TABLA 1 (b) - Modificaciones postraduccionales para histona humana H2A.J y H2B tipo 1 Modificaciones postraduccionales de: Histona humana H2A.J
Posición Descripción de tipo de modificación
1 N-acetilserina
1 Fosfoserina
5 N6-acetil-lisina
120 Fosfotreonina
122 Fosfoserina
13 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 15 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 119 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) Modificaciones postraduccionales de: Histona humana H2B tipo 1
Posición Descripción de tipo de modificación
1 N-acetilprolina
6 N6-acetil-lisina
6 N6-crotonil-L-lisina
12 N6-acetil-lisina
12 N6-crotonil-L-lisina
13 N6-acetil-lisina
13 N6-crotonil-L-lisina
16 N6-acetil-lisina
16 N6-crotonil-L-lisina
17 N6-acetil-lisina
17 N6-crotonil-L-lisina
21 N6-acetil-lisina
21 N6-crotonil-L-lisina
24 N6-acetil-lisina
24 N6-crotonil-L-lisina
35 N6-crotonil-L-lisina
37 Fosfoserina
47 N6-metil-lisina
58 N6,N6-dimetil-lisina
80 Arginina dimetilada
85 Fosfoserina
86 N6,N6,N6-trimetil-lisina
86 N6-acetil-lisina
87 Omega-N-metilarginina
93 Omega-N-metilarginina
109 N6-metil-lisina
116 Fosfotreonina
117 Lisina N6-metilada
35 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 121 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina)
TABLA 1 (c) - Modificaciones postraduccionales para histona humana H2B tipo 2/3/F-S Modificaciones postraduccionales de: Histona humana H2B tipo 2/3/F-S
Posición Descripción de tipo de modificación
1 N-acetilprolina
5 N6-acetil-lisina
5 N6-crotonil-L-lisina
11 N6-acetil-lisina
11 N6-crotonil-L-lisina
(continuación)
Modificaciones postraduccionales de: Histona humana H2B tipo 2/3/F-S
Posición Descripción de tipo de modificación
12 N6-acetil-lisina
12 N6-crotonil-L-lisina
14 Fosfoserina
15 N6-acetil-lisina
15 N6-crotonil-L-lisina
16 N6-acetil-lisina
16 N6-crotonil-L-lisina
20 N6-acetil-lisina
20 N6-crotonil-L-lisina
23 N6-acetil-lisina
23 N6-crotonil-L-lisina
34 N6-crotonil-L-lisina
36 Fosfoserina
46 N6-metil-lisina
57 N6,N6-dimetil-lisina
79 Arginina dimetilada
85 N6,N6,N6-trimetil-lisina
85 N6-acetil-lisina
86 Omega-N-metilarginina
92 Omega-N-metilarginina
108 N6-metil-lisina
115 Fosfotreonina
116 Lisina N6-metilada
112 Ligada a O (GlcNAc)
34 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina) 121 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina)
TABLA 1 (d) - Modificaciones postraduccionales para supuesta histona humana H2B tipo 2-D/2-C Modificaciones postraduccionales de: Supuesta histona humana H2B tipo 2-D/2-C
Posición Descripción de tipo de modificación
1 N-acetilprolina
5 N6-acetil-lisina
5 N6-crotonil-L-lisina
11 N6-acetil-lisina
11 N6-crotonil-L-lisina
12 N6-acetil-lisina
12 N6-crotonil-L-lisina
14 Fosfoserina
15 N6-acetil-lisina
15 N6-crotonil-L-lisina
16 N6-acetil-lisina
16 N6-crotonil-L-lisina
20 N6-acetil-lisina
20 N6-crotonil-L-lisina
23 N6-acetil-lisina
23 N6-crotonil-L-lisina
34 N6-crotonil-L-lisina
36 Fosfoserina
46 N6-metil-lisina
57 N6,N6-dimetil-lisina
79 Arginina dimetilada
85 N6,N6,N6-trimetil-lisina
85 N6-acetil-lisina
86 Omega-N-metilarginina
92 Omega-N-metilarginina
TABLA 1(e) - Modificaciones postraduccionales para histona humana H3.1/H3.1t/H3.2/H3.3/H3.3C Modificaciones postraduccionales de: Histona humana H3.1/H3.1t/H3.2/H3.3/H3.3C
Posición Tipo de modificación Posición Tipo de modificación
2 Dimetilarginina asimétrica 28 Fosfoserina
3 Fosfotreonina 36 N6,N6,N6-trimetil-lisina
4 Alisina 36 N6,N6-dimetil-lisina
4 N6,N6,N6-trimetil-lisina 36 N6-acetil-lisina
4 N6,N6-dimetil-lisina 36 N6-metil-lisina
4 N6-acetil-lisina 37 N6-metil-lisina
4 N6-crotonil-L-lisina 41 Fosfotirosina
4 N6-metil-lisina 56 N6,N6,N6-trimetil-lisina
6 Fosfotreonina 56 N6-acetil-lisina
8 Citrulina 56 N6-crotonil-L-lisina
8 Dimetilarginina simétrica 56 N6-metil-lisina
9 N6,N6,N6-trimetil-lisina 57 Fosfoserina
9 N6,N6-dimetil-lisina 64 N6-metil-lisina
9 N6-acetil-lisina 79 N6,N6,N6-trimetil-lisina
9 N6-crotonil-L-lisina 79 N6,N6-dimetil-lisina
9 N6-metil-lisina 79 N6-acetil-lisina
10 Fosfoserina 79 N6-metil-lisina
11 Fosfotreonina 80 Fosfotreonina
14 N6-acetil-lisina 107 Fosfotreonina
17 Dimetilarginina asimétrica 115 N6-acetil-lisina
17 Citrulina 122 N6-acetil-lisina
18 N6-acetil-lisina 122 N6-metil-lisina
18 N6-crotonil-L-lisina
18 N6-metil-lisina
23 N6-acetil-lisina
23 N6-crotonil-L-lisina
23 N6-metil-lisina
27 N6,N6,N6-trimetil-lisina
27 N6,N6-dimetil-lisina
27 N6-acetil-lisina
27 N6-crotonil-L-lisina
27 N6-metil-lisina
TABLA 1 (f) - Modificaciones postraduccionales para proteína A centromérica de tipo histona humana H3 e histona humana H4
Modificaciones postraduccionales de: Proteína A centromérica de tipo histona humana H3
Posición Descripción de tipo de modificación
6 Fosfoserina; por AURKA y AURKB
16 Fosfoserina
18 Fosfoserina
26 Fosfoserina
Modificaciones postraduccionales de: Histona humana H4
Posición Descripción de tipo de modificación
1 N-acetilserina
1 Fosfoserina
3 Dimetilarginina asimétrica
3 Citrulina
3 Omega-N-metilarginina
3 Dimetilarginina simétrica
5 N6-acetil-lisina
5 N6-crotonil-L-lisina
8 N6-acetil-lisina
8 N6-crotonil-L-lisina
12 N6-acetil-lisina
12 N6-crotonil-L-lisina
(continuación)
Modificaciones postraduccionales de: Proteína A centromérica de tipo histona humana H3
Posición Descripción de tipo de modificación
16 N6-acetil-lisina
16 N6-crotonil-L-lisina
20 N6,N6,N6-trimetil-lisina
20 N6,N6-dimetil-lisina
20 N6-metil-lisina
31 N6-acetil-lisina
47 Fosfoserina
51 Fosfotirosina
88 Fosfotirosina
91 N6-acetil-lisina
91 Isopéptido de glicil-lisina (Lys-Gly) (intercatenario con G-Cter en ubicuitina)
0
oj
.Q
Eo
Figure imgf000027_0001
z
601-
Figure imgf000027_0002
GGCGGCcgacgcgatacaccgttcgtcgctggagaatcccggtgccgaggcc 203 Malo A1
gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtgcgttcgacggtacgtcgagcgGCCGCC
601- 6010304 GGCGGCgtatcgcgtcgcgcgtaatcgactggagaatcccggtgccgaggcc 203 Malo A2
gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtgcgcgacgttacgctcgacgtaGCCGCC
601- 6010506 203 Malo A3 GGCGGCaccgatacgcgcgcggtacgatctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgttaatcgacgcgatatcgcgcgtGCCGCC
601- 6010708 203 Buen A4 GGCGGCatatcgcgcgtcgtatcgcggtctggagaatcccggtgccgaggccg o ctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtccc ccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagata tatacatcctgttcgtatcgcgccgcgtattcggGCCGCC
601- 6010910 203 Malo A5 GGCGGCccgcgcgatattacgcgcgaatctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtacgaacgtcgatcgtcgattcgGCCGCC
601- 6011112 GGCGGCcgacgaa cggttcgta cgcga gctggaga a tcccggtgccgaggcc 203 Malo A6
gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat
atatacatcctgttcgcgtacgaatcgcgtaatcgGCCGCC
(continuación)
0 ro -Q
Gl -4 O £—' 0= oj 0 " o O o c .Q 0 -4=o
^3 , Í Q_ E ) o o ’ü
0 £= z c ro co _o S ® cm y 601- 6011314 203 Malo A7 GGCGGCcgcgtaatacgccgcgatacgactggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtaacgcgtatcgcgcgtaacgcgGCCGCC
601- 6011516 203 Malo A8
GGCGGCcgtacgacgctcgcgatatccgctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc
cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtcgacgttaacgcgttacgcgtcGCCGCC
601- 6011718 203 Malo A9 GGCGGCgcgttcga cgggtcgcga acta ctggaga a tcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtgtcgcgaactacgtcgttcgacGCCGCC
601- 6011920
A10 GGCGGCtacgctcggactcgcgcgatgactggagaatcccggtgccgaggcc 203 Malo gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtcgatcgtcgcatcggtacgctaGCCGCC
601- 6012122 203 Bueno A11
GGCGGCtattatgcgcgacccgcgtacgctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtcgtaccgcgatccgacgatcgaGCCGCC
601- 6012324 203 Malo A12 GGCGGCtcgcgaccgtacgaatttcgcgctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtcgcgtcaatcgcgattacgcgaGCCGCC
601- 6012526 203 Malo A13 GGCGGCtcgtacgaccgcgcgtatcgggctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat
atatacatcctgtgcgatcgtacgcgcgacgttaaGCCGCC
(continuación)
0 o r -QCl -tO z £=<
o oo 0 g oj 0 "O
.Q ¿ M f CL a E
LU o E o0 O£=) S ® co z o p
c b ro co O oc y 14 601- 6010916 203 Bueno A14 GGCGGCccgcgcgatattacgcgcgaatctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtcgacgttaacgcgttacgcgtcGCCGCC
15 601- 6011510 203 Malo A15 GGCGGCcgtacgacgctcgcgatatccgctggagaatcccggtgccgaggcc gctcaattggtcgtagacagctctagcaccgcttaaacgcacgtacgcgctgtcc cccgcgttttaaccgccaaggggattactccctagtctccaggcacgtgtcagat atatacatcctgtacgaacgtcgatcgtcgattcgGCCGCC
16 C001 601_C001_R ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc 147 Bueno ev
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctattatgcgcgcgatacgcgttTC
17 C002 601_C002_R ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc 147 Bueno ev
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgcgcataataatcgcgcgattTC
18 C003 601_C003_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcatatcgcgcgttcgacgttcgtTC
19 C004 601_C004_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcacgcgcgatattatcgcgtcgtTC
20 C005 601_C005_R 147 Bueno ev
ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcgtcgacgatcgtcgaatcgtTC
21 C006 601_C006_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgtcgattcgacgcgaatcgtTC
(continuación)
a
Figure imgf000030_0001
LU o 0 £= co z o£= c Cü CO O oc y 22 C007 601_C007_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cct agtctccaggcta cgcgattcgtcgtttcgcgtT C
23 C008 601_C008_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctatacgcgtcgacgattcgcgtTC
24 C009 601_C009_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcgcgtaatcgtttcgacgcgtTC
25 C010 601_C010_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcttaacgtcgcgcgttcgaacgtTC
26 C011 601_C011_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgtattacgcgaatcgcgcgatTC
27 C012 601_C012_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcgattacgcgtcgcgcgtaatTC
28 C013 601_C013_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgtttcgtacgcgcgacgtaatTC
29 C014 601_C014_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgcgtatacgtacgcgcgaatTC
(continuación)
0 -Q 03 Gl -t O £=< 0 oj 0 " o O 'o
.Q _Q M f Q_ E
o O0 O£=) S ® z O £= c Cü CO O cm y C015 601_C015_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgcgtaatacgcgcgaaattcgTC
C016 601_C016_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcgatagtcgacgttatcgcgtcgTC
C017 601_C017_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgtacgaaacgcgttaacgtcgTC
C018 601_C018_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgtcgactatctcgtcgtatcgTC
C019 601_C019_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcttacgcgtaccaacgcgtatcgTC
C020 601_C020_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgaatcgcgtattacgcgatcgTC
C021 601_C021_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcggtacgctatcgtacgatcgTC
C022 601_C022_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgacgcgtatacgaatttcgcgTC
C023 601_C023_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgacgcgataattacgtcgcgTC
(continuación)
0
Figure imgf000032_0001
147 Bueno
Figure imgf000032_0002
ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgcgcgaatattcgtatcgcgTC
C025 601_C025_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctatcgcgtcgagtgatatcgcgTC
C026 601_C026_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgcgtaatcgatacgttacgcgTC
C027 601_C027_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcttacgtcgcgataatcgacgcgTC
C028 601_C028_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcta ttcgcgcgatcgcgatta cgT C
C029 601_C029_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgattacgcgaacgattcgacgTC
C030 601_C030_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgtatacgcgattaacgcgacgTC
C031 601_C031_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctagcgtaccgacgacgttaacgTC
C032 601_C032_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcatcgtcgacgaacgttcgaacgTC
(continuación)
0
03 JCO l -tO £=< 0 oj 0 " o O 'o
.Q f CL _Q M
E
o O O O 0 £=) S ® £= c Cü C0 O oc y C033 601_C033_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgaatcgacgatagttcgcgacTC
C034 601_C034_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgcgacgttaacgcgatatcacTC
C035 601_C035_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcggtacgcgtaacgcgtcgattaTC
C036 601_C036_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcgcgacgtaaattcgcgcgtaTC
C037 601_C037_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgcgtatcggtcgcgtaacgtaTC
C038 601_C038_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgacgaacggtgtcgcgaactaTC
C039 601_C039_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgaacggtcgtttcgcgcgataTC
C040 601_C040_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcccgacgatcgtacgacgcgataTC
C041 601_C041_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgacgtaccgtttacgcgtcgaTC
(continuación)
0
Figure imgf000034_0001
Bueno
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgtacgacgctacgaacgtcgaTC
C043 601_C043_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcccgcgcgatattttcgtcgcgaTC
C044 601_C044_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgcgcgacatcgtaatcgcgaTC
C045 601_C045_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgcgcgatatgattacgcgcgaTC
C046 601_C046_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgcgtattcggttcgta cgcgaT C
C047 601_C047_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgatcgtcggcgatcgtacgaTC
C048 601 C048 R . . „ „ „ „ „ „ 147 Bueno “ ev ~~ ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcacgatcgtcggtcgttcgacgaTC
C049 601_C049_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgacgtatcggcgatacgacgaTC
C050 601_C050_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcatatcgcgcggtcgtcgaacgaTC
(continuación)
0
Figure imgf000035_0001
Bueno
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgacgtaacggacgcgaaacgaTC
C052 601_C052_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcacgaccgttcgcgtcgcgttaaTC
C053 601_C053_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgtatcggtcgcgatcgcgtaaTC
C054 601_C054_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcctcgttcgtcgttcgcgcgta aT C
C055 601_C055_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcaccgttcgtcgtcgacgcgtaaTC
C056 601 C056 R 147 Bueno “ ev ~~ ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcta cgtccgtcgcga cgcga taaTC
C057 601_C057_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcccgttacgtcgtatcgcgcgaaTC
C058 601_C058_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcacggtacgtcgttacgcgcgaaTC
C059 601_C059_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcccgatacgtcgtcgcgtacgaaTC
(continuación)
0
r
C 147 Bueno
Figure imgf000036_0001
ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgcacgatcgcgcgatacgaaTC
C061 601_C061_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgccgaatcgacgcgtcgaaaTC
C062 601_C062_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcta tgcgtcgcgtcgcga cga aaTC
C063 601_C063_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccatatcgcgcgcgtatcgcggtTC
C064 601_C064_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgtatagcgcgccgtacgtcgtTC
C065 601_C065_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcaccgatacgcgtagcgacgcgtTC
C066 601_C066_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcccgaatacgcgtcgacgaccgtTC
C067 601 C067 R 147 Bueno “ ev ~~ ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgtacgaccgcggtcgaacgtTC
C068 601_C068_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcagcgtcgtacgtcgcgacgagtTC
(continuación)
0
03 JCO l -tO £=< 0 oj 0 " o O 'o
.Q f CL _Q M
E
o O O O 0 £=) S ® £= c Cü C0 O oc y C069 601_C069_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgcgctatacgcgtaccgcgatTC
C070 601_C070_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgaccgatacgcgcggtacgatTC
C071 601_C071_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcttcgagcgacgcggcgtacgatTC
C072 601_C072_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcgtcgaacgacgcggtcgacgatTC
C073 601_C073_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcgacgcgtaacgccgcgcgtaatTC
C074 601_C074_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcgacgcgtagcgcgacgcaatTC
C075 601_C075_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgacgaacgagtcgtatcgcggTC
C076 601_C076_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgttacgcgtcttatcgcgcggTC
C077 601_C077_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcta acgtcgcgcatta cgcgcggT C
(continuación)
0
Figure imgf000038_0001
147 Bueno
Figure imgf000038_0002
ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcta cgctcggactata cgcgcggT C
C079 601_C079_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgtcgttcgacacgacgtacggTC
C080 601_C080_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcgcgcgacgttacgattcgacggTC
C081 601 C081 R , , . .. . . . . 147 Bueno “ ev ~~ ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctgtcgcgcgtatacgctcgtcgTC
C082 601 C082 R * „ . .. . . . . 147 Bueno “ ev _ ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcgtccgagcgtagtatcgcgtcgTC
C083 601_C083_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctcgcgaccgtagttacgcgtcgTC
C084 601_C084_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgacggacgtacgtatccgtcgTC
C085 601_C085_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgcgacgcatagcgttacgtcgTC
C086 601_C086_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcctacgcgtcgacgcgttagtcgTC
(continuación)
0
oz ro
oj 0 " o O o
g .Q ¿ M
a E
L U o E p o0
co z o c b ro co
Figure imgf000039_0001
102 C087 601_C087_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcccgacgatcgatcggcgtatcgTC
103 C088 601_C088_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgatcgtgcgacgcgactatcgTC
104 C089 601_C089_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgattcggcgatgcga cgatcgT C
105 C090 601_C090_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcta cggtcgcgaccgtcga atcgT C
106 C091 601_C091_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcatgtcgcgcgacgcgtcaatcgTC
107 C092 601_C092_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccggtcgtacgacgcgatatgcgTC
108 C093 601_C093_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggctacgcgcgacacgtaatcggcgTC
109 C094 601_C094_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggccgtcgctcga atatcggtcgcgT C
110 C095 601_C095_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc
gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc
cctagtctccaggcgcgttcgacggattgcgtcgcgTC
(continuación)
0
Figure imgf000040_0001
111 C096 601_C096_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgcgttacgcgcgatagtcgcgTC
112 C097 601_C097_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggccgcgtaacgcggtcgtatcgcgTC
113 C098 601_C098_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggctcggtacgcgccggatatcgcgTC
114 C099 601_C099_R 147 Bueno ev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcccgtcgaacgccgcatatcgcgTC
115 C100 601_C100_ 147 Bueno Rev ctggagaatcccggtgccgaggccgctcaattggtcgtagacagctctagcacc gcttaaacgcacgtacgcgctgtcccccgcgttttaaccgccaaggggattactc cctagtctccaggcgcgcgtaccgataccgatcgcgTC
TABLA 2 - Secuencias de nucleótidos - mayúscula -> fragmento de hibridación; minúscula -> código de barras; minúscula en negrita -> secuencia de colocación de nucleosoma [601 Widom y Lowary]
BIBLIOGRAFÍA
Alewood, P., Alewood, D., Miranda, L., Love, S., Meutermans, W., y Wilson, D. (1997). Rapid in situ neutralization protocols for Boc and Fmoc solid-phase chemistries. Methods Enzymol. 289, 14-29.
Benayoun, B.A., Pollina, E.A., Ucar, D., Mahmoudi, S., Karra, K., Wong, E.D., Devarajan, K., Daugherty, A.C., Kundaje, A.B., Mancini, E., et al. (2014). H3K4me3 Breadth Is Linked to Cell Identity and Transcriptional Consistency. Cell 158, 673-688.
Bernstein, B.E., Meissner, A., y Lander, E.S. (2007). The mammalian epigenome. Cell 128, 669-681.
Bernt K.M. et al. (2011). MLL-rearranged leukemia is dependent on aberrant H3k79 methylation by DOT1L. Cancer Cell 20, 66-78.
Bin Liu, Yi, J., SV, A., Lan, X., Ma, Y., Huang, T.H., Leone, G., y Jin, V.X. (2013). QChIPat: a quantitative method to identify distinct binding patterns for two biological ChIP-seq samples in different experimental conditions. BMC Genomics 14, S3.
Blankenberg, D., Von Kuster, G., Coraor, N., Ananda, G., Lazarus, R., Mangan, M., Nekrutenko, A., y Taylor, J. (2010). Galaxy: a web-based genome analysis tool for experimentalists. Curr. Protoc. Mol. Biol. Ed. Frederick M Ausubel Al capítulo 19, Unidad 19.10.1-21.
Bock, I., Dhayalan, A., Kudithipudi, S., Brandt, O., Rathert, P., y Jeltsch, A. (2011). Detailed specificity analysis of antibodies binding to modified histone tails with peptide arrays. Epigenetics Off. J. DNA Methylation Soc. 6, 256­ 263.
Brand, M., Rampalli, S., Chaturvedi, C.-P., y Dilworth, F.J. (2008). Analysis of epigenetic modifications of chromatin at specific gene loci by native chromatin immunoprecipitation of nucleosomes isolated using hydroxyapatite chromatography. Nat. Protoc. 3, 398-409.
Chen, Z., Grzybowski, A.T., y Ruthenburg, A. J. (2014). Traceless semisynthesis of a set of histone 3 species bearing specific lysine methylation marks. Chembiochem 15, 2071-2075.
Chi, P., Allis, C. D. y Wang, G. G. Covalent histone modifications--miswritten, misinterpreted and mis-erased in human cancers. Nat. Rev. Cancer 10, 457-469 (2010).
Daigle, S.R. et al. (2011). Selective killing of mixed lineage leukemia cells by a potent small-molecule DOT1L inhibitor. Cancer Cell 20(1) 53-65.
Dawson, M.A., y Kouzarides, T. (2012). Cancer epigenetics: from mechanism to therapy. Cell 150, 12-27. Dawson, P.E., Muir, T. W., Clark-Lewis, I., y Kent, S.B. (1994). Synthesis of proteins by native chemical ligation. Science 266, 776-779.
Feinberg, A.P. (2007). Phenotypic plasticity and the epigenetics of human disease. Nature 447, 433-440. Egelhofer, T. A. et al. An assessment of histone-modification antibody quality. Nat Struct Mol Biol 18, 91-93 (2011).
Fuchs, S. M., Krajewski, K., Baker, R. W., Miller, V. L. y Strahl, B. D. Influence of combinatorial histone modifications on antibody and effector protein recognition. Curr Biol 21, 53-58 (2011).
Giardine, B., Riemer, C., Hardison, R.C., Burhans, R., Elnitski, L., Shah, P., Zhang, Y., Blankenberg, D., Albert, I., Taylor, J., et al. (2005). Galaxy: a platform for interactive large-scale genome analysis. Genome Res. 15, 1451­ 1455. Goecks, J., Nekrutenko, A., Taylor, J., y Galaxy Team (2010). Galaxy: a comprehensive approach for supporting accessible, reproducible, and transparent computational research in the life sciences. Genome Biol. 11, R86. Guenther, M. G., Levine, S.S., Boyer, L.A., Jaenisch, R., y Young, R.A. (2007). A chromatin landmark and transcription initiation at most promoters in human cells. Cell 130, 77-88.
Hattori, T., Taft, J.M., Swist, K.M., Luo, H., Witt, H., Slattery, M., Koide, A., Ruthenburg, A.J., Krajewski, K., Strahl, B.D., et al. (2013). Recombinant antibodies to histone post-translational modifications. Nat Methods 10, 992-995. Henikoff, S. (2008). Nucleosome destabilization in the epigenetic regulation of gene expression. Nat. Rev. Genet.
9, 15-26.
Herold, J., Kurtz, S., y Giegerich, R. (2008). Efficient computation of absent words in genomic sequences. BMC Bioinformatics 9, 167.
Jiang, C., y Pugh, B.F. (2009). Nucleosome positioning and gene regulation: advances through genomics. Nat. Rev. Genet. 10, 161-172.
Johnson, E.C.B., y Kent, S.B.H. (2006). Insights into the mechanism and catalysis of the native chemical ligation reaction. J. Am. Chem. Soc. 128, 6640-6646.
Kroon E y Krosl J. (1998). Hoxa9 transforms primary bone marrow cells through specific collaboration with Meisla but not Pbxlb. EMBO 17(13) 3714-3725.
Landt, S. G. et al. ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia. Genome Res 22, 1813-1831 (2012).
Langmead, B., Trapnell, C., Pop, M., y Salzberg, S.L. (2009). Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10, R25.
Lauberth, S.M., Nakayama, T., Wu, X., Ferris, A.L., Tang, Z., Hughes, S.H., y Roeder, R.G. (2013). H3K4me3 Interactions with TAF3 Regulate Preinitiation Complex Assembly and Selective Gene Activation. Cell 152, 1021­ 1036.
Leroy, G., Dimaggio, P.A., Chan, E.Y., Zee, B. M., Blanco, M.A., Bryant, B., Flaniken, I.Z., Liu, S., Kang, Y., Trojer, P., et al. (2013). A quantitative atlas of histone modification signatures from human cancer cells. Epigenetics Chromatin 6, 20.
Li, B., y Carey, M. (2007). The Role of Chromatin during Transcription. Cell 128, 707-719.
Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G., Abecasis, G., Durbin, R., y 1000 Genome Project Data Processing Subgroup (2009). The Sequence Alignment/Map format and SAMtools. Bioinforma. Oxf. Ingl. 25, 2078-2079.
Liang, K., y Keles, S. (2012). Normalization of ChIP-seq data with control. BMC Bioinformatics 13, 199.
Lowary, P.T., y Widom, J. (1998). New DNA sequence rules for high affinity binding to histone octamer and sequence-directed nucleosome positioning. J. Mol. Biol. 276, 19-42.
Luger, K., Rechsteiner, T.J., y Richmond, T.J. (1999). Preparation of nucleosome core particle from recombinant histones. Methods Enzymol. 304, 3-19.
Marinov, G.K., Kundaje, A., Park, P.J., y Wold, B.J. (2014). Large-scale quality analysis of published ChIP-seq data. G3 (Bethesda) 4, 209-223.
Mikkelsen, T.S., Ku, M., Jaffe, D.B., Issac, B., Lieberman, E., Giannoukos, G., Alvarez, P., Brockman, W., Kim, T.-K., Koche, R.P., et al. (2007). Genome-wide maps of chromatin state in pluripotent and lineage-committed cells. Nature 448, 553-560.
Muthurajan, U.M., Park, Y.-J., Edayathumangalam, R.S., Suto, R. K., Chakravarthy, S., Dyer, P.N., y Luger, K. (2003). Structure and dynamics of nucleosomal DNA. Biopolymers 68, 547-556.
Nady, N., Min, J., Kareta, M.S., Chédin, F., y Arrowsmith, C.H. (2008). A SPOT on the chromatin landscape? Histone peptide arrays as a tool for epigenetic research. Trends Biochem. Sci. 33, 305-313.
Nishikori, S., Hattori, T., Fuchs, S.M., Yasui, N., Wojcik, J., Koide, A., Strahl, B.D., y Koide, S. (2012). Broad ranges of affinity and specificity of anti-histone antibodies revealed by a quantitative peptide immunoprecipitation assay. J Mol Biol 424, 391-399.
Park, P. J. (2009). ChIP-seq: advantages and challenges of a maturing technology. Nat. Rev. Genet. 10, 669-680. Quinlan, A.R., y Hall, I.M. (2010). BEDTools: a flexible suite of utilities for comparing genomic features. Bioinforma. Oxf. Ingl. 26, 841-842.
Ruthenburg, A.J., Li, H., Milne, T.A., Dewell, S., McGinty, R. K., Yuen, M., Ueberheide, B., Dou, Y., Muir, T. W., Patel, D.J., et al. (2011). Recognition of a mononucleosomal histone modification pattern by BPTF via multivalent

Claims (17)

REIVINDICACIONES
1. Un método de determinación de una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, comprendiendo el método:
preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas que comprenden, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa del locus genómico y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo;
añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende
(i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón, forman una asociación estable de proteína-ADN;
añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión, a la colección dopada, para capturar una cantidad de nucleosomas naturales y el patrón que comprende el primer epítopo;
determinar una abundancia genómica relativa para el primer epítopo comparando la cantidad de una secuencia de nucleótidos dada asociada con los nucleosomas naturales capturados que comprenden el primer epítopo y la cantidad de una secuencia de nucleótidos dada asociada con el nucleosoma natural en una cantidad introducida de la colección dopada; determinar una eficacia de captura de patrón para el primer epítopo comparando la cantidad de una secuencia de código de barras asociada con el patrón capturado y la cantidad de una secuencia de nucleótidos dada asociada con el patrón en una cantidad introducida de la colección dopada; y
determinar la densidad del primer epítopo de la histona central en el locus genómico comparando la abundancia genómica relativa respecto a la eficacia de captura de patrón;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.
2. El método de la reivindicación 1, en el que la determinación de la eficacia de captura de patrón comprende comparar la relación de una cantidad capturada de la molécula de código de barras respecto a una cantidad introducida de los nucleosomas reconstituidos.
3. El método de la reivindicación 1, en el que la determinación de la abundancia genómica relativa comprende comparar la relación de una cantidad capturada de la secuencia de nucleótidos del nucleosoma natural con una cantidad introducida de secuencia de nucleótidos del nucleosoma natural.
4. El método de la reivindicación 1, en el que el primer agente de afinidad es un anticuerpo dirigido al primer epítopo.
5. El método de la reivindicación 1, en el que una pluralidad de patrones se añade a la colección, comprendiendo cada patrón un nucleosoma reconstituido que comprende
(i) la histona patrón que tiene el primer epítopo y
(ii) la molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a la molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la molécula de código de barras codifica un parámetro de concentración indicativo de la concentración del patrón añadido a la colección y en el que a la colección se añaden patrones que tienen al menos dos concentraciones diferentes.
6. El método de la reivindicación 5, en el que la pluralidad de patrones comprende además patrones que comprenden nucleosomas reconstituidos que comprenden (i) uno o más epítopos inespecíficos y (ii) un código de barras de molécula patrón que codifica una identidad de epítopo inespecífico y parámetros de concentración indicativos del epítopo inespecífico.
7. El método de la reivindicación 6, que comprende además determinar una especificidad de captura inespecífica para el primer reactivo de afinidad basándose en una o más eficacias de captura para los epítopos inespecíficos y corregir la densidad del primer epítopo de la histona central en el locus genómico basándose en la especificidad de la captura inespecífica.
8. El método de la reivindicación 1, en el que la secuencia de código de barras es una secuencia ausente en el genoma de la célula.
9. El método de la reivindicación 1, en el que se determina una abundancia de al menos una de las secuencias de nucleótidos del nucleosoma y la secuencia de nucleótidos patrón mediante un método seleccionado del grupo que consiste en PCR, qPCR, ddPCR, secuenciación de última generación, hibridación, autorradiografía, marcaje fluorescente, densidad óptica y el uso de sondas fluorescentes intercalantes.
10. El método de la reivindicación 1, en el que el primer epítopo de la histona central comprende al menos una modificación de aminoácido postraduccional seleccionada del grupo que consiste en N-acetilación de serina y alanina; fosforilación de serina, treonina y tirosina; N-crotonilación, N-acetilación de lisina; N6-metilación, N6,N6-dimetilación, N6,N6,N6-trimetilación de lisina; omega-N-metilación, dimetilación simétrica, dimetilación asimétrica de arginina; citrulinación de arginina; ubiquitinilación de lisina; sumoilación de lisina; O-metilación de serina y treonina y ADP-ribosilación de arginina, ácido aspártico y ácido glutámico.
11. El método de la reivindicación 1, en el que el polinucleótido bicatenario comprende una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO 1-115.
12. Un método de diagnóstico de una enfermedad en un paciente, comprendiendo el método:
determinar una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula del paciente, comprendiendo el método:
preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas que comprenden, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa del locus genómico y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo;
añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende
(i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón, forman una asociación estable de proteína-ADN;
añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión, a la colección dopada, para capturar una cantidad de nucleosomas naturales y el patrón que comprende el primer epítopo;
determinar una abundancia genómica relativa para el primer epítopo comparando la cantidad de una secuencia de nucleótidos dada asociada con los nucleosomas naturales capturados que comprenden el primer epítopo y la cantidad de una secuencia de nucleótidos dada asociada con el nucleosoma natural en una cantidad introducida de la colección dopada; determinar una eficacia de captura de patrón para el primer epítopo comparando la cantidad de una secuencia de código de barras asociada con el patrón capturado y la cantidad de una secuencia de nucleótidos dada asociada con el patrón en una cantidad introducida de la colección dopada; y determinar la densidad del primer epítopo de la histona central en el locus genómico comparando la abundancia genómica relativa respecto a la eficacia de captura de patrón;
en el que la cantidad del primer epítopo en un locus dado es indicativa de una enfermedad asociada con cambios en modificaciones postraduccionales de la histona;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.
13. El método de acuerdo con la reivindicación 12, en el que la enfermedad es leucemia mielógena aguda, el primer epítopo es N6,N6-dimetilación de lisina 79 de histona H3 y el locus es HOXA9 y MEIS1.
14. Un método de determinación de una densidad de un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, comprendiendo el método:
preparar una colección de nucleosomas naturales de la cromatina, en el que la colección comprende nucleosomas, comprendiendo, cada uno, la histona central y una secuencia de nucleótidos del nucleosoma indicativa de su locus genómico de origen, y al menos un nucleosoma que comprende la histona central que tiene el primer epítopo; añadir un patrón a la colección para crear una colección dopada; en el que el patrón comprende un nucleosoma reconstituido que comprende
(i) una histona patrón o fragmento de histona patrón que tiene el primer epítopo y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, una secuencia de ácido nucleico bloqueado y una secuencia de ADN; en el que la histona patrón o fragmento de histona patrón y la molécula patrón forman una asociación estable de proteína-ADN;
determinar una cantidad de la histona central en el locus genómico en la colección dopada añadiendo un segundo reactivo de afinidad a la colección dopada para recuperar una cantidad de nucleosomas que comprenden un segundo epítopo, en el que el segundo epítopo es un epítopo invariante presente en la histona central, y determinar una cantidad de secuencia de nucleótidos del nucleosoma en la cantidad de nucleosomas recuperados que comprenden el segundo epítopo, seleccionándose el segundo reactivo de afinidad del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión;
determinar una cantidad de patrón en la colección dopada recuperando una cantidad de nucleosoma reconstituido; en el que el nucleosoma reconstituido comprende el segundo epítopo, y
determinar una cantidad de la molécula patrón en la cantidad de nucleosomas reconstituidos recuperados que comprenden el segundo epítopo;
añadir un primer reactivo de afinidad dirigido al primer epítopo y seleccionado del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, un Fab y un péptido de unión a la colección dopada, para capturar una cantidad de nucleosomas naturales y nucleosomas reconstituidos que comprenden el primer epítopo;
determinar una abundancia genómica relativa para el primer epítopo en un locus genómico basándose en la cantidad del patrón capturado que comprende el primer epítopo y la cantidad de la histona central en el locus genómico en la colección dopada;
determinar una eficacia de captura de patrón para el primer epítopo basándose en la cantidad de nucleosomas reconstituidos capturados y en la cantidad de patrón en la colección dopada; determinar la abundancia genómica relativa del primer epítopo de la histona central en el locus genómico basándose en la abundancia del primer epítopo para la histona central y la eficacia de captura de patrón;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica.
15. El método de la reivindicación 14, en el que el primer reactivo de afinidad es un anticuerpo dirigido al primer epítopo y en el que el segundo reactivo de afinidad es un anticuerpo dirigido al segundo epítopo.
16. Un kit para realizar el método de la reivindicación 1, que comprende:
un conjunto de patrones presentes, cada uno, en una diferente concentración,
en el que cada patrón comprende un nucleosoma reconstituido que comprende:
(i) una histona patrón o fragmento de histona patrón que tiene un primer epítopo de una histona central en un locus genómico en la cromatina de una célula, y
(ii) una molécula patrón que comprende un polinucleótido bicatenario que tiene una secuencia de nucleótidos patrón que se une a una molécula de código de barras que comprende una secuencia de código de barras que indica la concentración en que está presente el patrón, seleccionándose la molécula de código de barras del grupo que consiste en una molécula de secuencia de código de barras de nucleótidos, un ácido nucleico bloqueado y una secuencia de ADN, y siendo de al menos 10 pares de bases de longitud;
en el que dicho primer epítopo es una modificación postraduccional o una isoforma proteínica,
en el que la histona patrón o fragmento de histona patrón y la secuencia de nucleótidos patrón forman una asociación estable de proteína-ADN.
17. Un kit de la reivindicación 16, en el que el kit comprende al menos un reactivo de afinidad que reconoce el primer epítopo, en el que el reactivo de afinidad se selecciona del grupo que consiste en un anticuerpo, un monocuerpo, un aptámero, una Fab y un péptido de unión.
ES15744035T 2014-02-03 2015-02-03 Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína Active ES2808651T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201461935129P 2014-02-03 2014-02-03
PCT/US2015/014296 WO2015117145A1 (en) 2014-02-03 2015-02-03 Compositions and methods for quantitative assesment of dna-protein complex density

Publications (1)

Publication Number Publication Date
ES2808651T3 true ES2808651T3 (es) 2021-03-01

Family

ID=53757840

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15744035T Active ES2808651T3 (es) 2014-02-03 2015-02-03 Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína

Country Status (6)

Country Link
US (2) US10732185B2 (es)
EP (1) EP3102721B1 (es)
JP (2) JP6985010B2 (es)
CN (1) CN107002289B (es)
ES (1) ES2808651T3 (es)
WO (1) WO2015117145A1 (es)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3529400B1 (en) * 2016-10-24 2021-02-17 Geneinfosec, Inc. Concealing information present within nucleic acids
US20200332370A1 (en) * 2018-01-10 2020-10-22 EpiCypher, Inc Methods for Quantification of Nucleosome Modifications and Mutations at Genomic Loci and Clinical Applications Thereof
AU2019228625A1 (en) * 2018-03-01 2020-09-03 Epicypher, Inc. Quantification of nucleosome modifications using chemically-defined recombinant nucleosomes
FR3082103B1 (fr) 2018-06-08 2020-08-28 Decathlon Sa Procede de fabrication d'une chaussure, et chaussure susceptible d'etre obtenue par ledit procede
WO2019237244A1 (en) * 2018-06-12 2019-12-19 Shanghai Institute Of Organic Chemistry, Chinese Academy Of Sciences Use of ubiquitylation of histone 2a protein
CN108680757B (zh) * 2018-06-29 2021-02-09 上海交通大学 一种检测蛋白质和dna相互作用的试剂盒与方法及应用
WO2020041148A1 (en) * 2018-08-20 2020-02-27 10X Genomics, Inc. Methods and systems for detection of protein-dna interactions using proximity ligation
CN111009286B (zh) * 2018-10-08 2023-04-28 深圳华大因源医药科技有限公司 对宿主样本进行微生物分析的方法和装置
WO2020097294A1 (en) * 2018-11-08 2020-05-14 University Of Miami Materials and methods for chromatin immunoprecipitation
EP3899042A4 (en) * 2018-12-21 2022-10-12 Epicypher, Inc. DNA BARCODED NUCLEOSOMES FOR CHROMATINA IMAGE ASSAYS
JP2022520616A (ja) * 2019-02-15 2022-03-31 エピサイファー,インコーポレイテッド クロマチン会合タンパク質の定量的マッピング
US20220259585A1 (en) * 2019-03-04 2022-08-18 The Texas A&M University System Methods of making and utilizing amber-obligated phage display libraries
CN110988362B (zh) * 2019-12-20 2023-11-14 迈克生物股份有限公司 抗组蛋白抗体测定试剂、试剂盒及其使用方法
CA3195344A1 (en) * 2020-11-02 2022-05-05 Matthew R. MARUNDE Improved assays to quantify chromatin targets using antibody-targeted enzyme digestion
CN112375138B (zh) * 2020-11-13 2022-12-13 中元汇吉生物技术股份有限公司 一种重组载脂蛋白e和应用
GB202108185D0 (en) * 2021-06-08 2021-07-21 Belgian Volition Sprl Standardisation of nucleosome assays using biologically derived calibrants
WO2024081782A1 (en) * 2022-10-12 2024-04-18 Epicypher, Inc. High efficiency antibodies for chromatin targets

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012047726A1 (en) * 2010-09-29 2012-04-12 The Broad Institute, Inc. Methods for chromatin immuno-precipitations
WO2012050963A2 (en) * 2010-09-29 2012-04-19 The General Hospital Corporation D/B/A Massachusetts General Hospital Agents providing controls and standards for immuno-precipitation assays
EP2859139B1 (en) * 2012-06-06 2018-08-01 The Trustees Of Princeton University Dna barcoding of designer mononucleosome and chromatin array libraries for the profiling of chromatin readers, writers, erasers, and modulators thereof

Also Published As

Publication number Publication date
WO2015117145A1 (en) 2015-08-06
JP2017506073A (ja) 2017-03-02
CN107002289B (zh) 2019-08-13
JP2019176878A (ja) 2019-10-17
EP3102721B1 (en) 2020-04-15
US20160341743A1 (en) 2016-11-24
JP6985010B2 (ja) 2021-12-22
CN107002289A (zh) 2017-08-01
EP3102721A4 (en) 2017-11-01
EP3102721A1 (en) 2016-12-14
US11965890B2 (en) 2024-04-23
US20200319204A1 (en) 2020-10-08
US10732185B2 (en) 2020-08-04

Similar Documents

Publication Publication Date Title
ES2808651T3 (es) Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína
Sas-Chen et al. Dynamic RNA acetylation revealed by quantitative cross-evolutionary mapping
Erce et al. The methylproteome and the intracellular methylation network
US10407712B2 (en) Methods, compositions and kits for high throughput kinase activity screening using mass spectrometry and stable isotopes
JP5415264B2 (ja) 検出可能な核酸タグ
JP6293742B2 (ja) デザイナーモノヌクレオソーム(designermononucleosome)のDNAバーコード化ならびにクロマチンリーダー、ライター、イレーサーおよびそのモジュレーターをプロファイリングするためのクロマチンアレイライブラリー
ES2960550T3 (es) Cuantificación de modificaciones de nucleosoma utilizando nucleosomas recombinantes definidos químicamente
JP2023182657A (ja) ゲノム遺伝子座におけるヌクレオソーム修飾及び変異の定量化のための方法並びにその臨床応用
ES2963079T3 (es) Detección de proteínas de células hospedadoras residuales en preparaciones de proteínas recombinantes
Hanada et al. AGR2 as a potential biomarker of human lung adenocarcinoma
Gjonaj et al. Development of a DUB-selective fluorogenic substrate
Li et al. Next generation sequencing technologies in cancer diagnostics and therapeutics: A mini review
Qi et al. Proteogenomic analysis unveils the HLA class I-presented immunopeptidome in melanoma and EGFR-mutant lung adenocarcinoma
ES2348187T3 (es) Amplificacion proteomica de pequeñas moleculas que se unen a proteinas celulares diana.
CN113508180A (zh) 用于染色质作图测定的dna条形码化核小体
Højlys-Larsen et al. Probing protein phosphatase substrate binding: affinity pull-down of ILKAP phosphatase 2C with phosphopeptides
Free Delafield, DG, Miles, HN, Liu, TT, Ricke, WA, & Li, L. Proteomic Fingerprinting of Prostate Cancer Progression Through Library-Free DIA-MS Reveals Systematic and Conserved Pathway Dysregulation. In submission. 2023.
Cruise An Investigation of the CK2-dependent Phosphoproteome using Inhibitor Refractory CK2-alpha
Desai Multi-omic stratification of the missense variant and redox-sensitive cysteinome
Krogstad Investigating hydroxylation of the acetyltransferase NAA10 as a potential regulation mechanism
WO2013192298A1 (en) Apoptosis biomarkers
Pack Regulatory mechanisms that govern the activity of human histone demethylase KDM4C
Guo Proteomic studies on gastric cancer to understand the underlying molecular mechanisms of oncogenesis
Bauch et al. Modern Methods in Protein and Nucleic Acid Analysis