ES2970085T3 - Proceso para la producción de una biblioteca de captura de conformación de cromatina (3C) - Google Patents

Proceso para la producción de una biblioteca de captura de conformación de cromatina (3C) Download PDF

Info

Publication number
ES2970085T3
ES2970085T3 ES20703827T ES20703827T ES2970085T3 ES 2970085 T3 ES2970085 T3 ES 2970085T3 ES 20703827 T ES20703827 T ES 20703827T ES 20703827 T ES20703827 T ES 20703827T ES 2970085 T3 ES2970085 T3 ES 2970085T3
Authority
ES
Spain
Prior art keywords
nucleic acid
cells
acid fragments
nucleic acids
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20703827T
Other languages
English (en)
Inventor
James Davies
James R Hughes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford University Innovation Ltd
Original Assignee
Oxford University Innovation Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford University Innovation Ltd filed Critical Oxford University Innovation Ltd
Application granted granted Critical
Publication of ES2970085T3 publication Critical patent/ES2970085T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La presente invención se refiere a un proceso para producir una biblioteca de captura de conformación de cromatina (3C). Esto puede usarse para identificar regiones de ácido nucleico dentro de una muestra de ácido nucleico que interactúan entre sí. El proceso comprende tratar ácidos nucleicos en una población de células eucariotas, comprendiendo el proceso las etapas: (i) inmovilizar los ácidos nucleicos dentro de las células en una población de células eucariotas; (ii) permeabilizar o eliminar las membranas celulares de las células eucariotas; y (iii) fragmentar los ácidos nucleicos inmovilizados dentro de las células para producir fragmentos de ácidos nucleicos. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Proceso para la producción de una biblioteca de captura de conformación de cromatina (3C)
[0001] La presente invención se refiere, entre otras cosas, a un proceso para producir una biblioteca de captura de conformación de cromatina (3C). Esto puede usarse para identificar regiones de ácido nucleico dentro de una muestra de ácido nucleico que interactúan entre sí.
[0002] El progreso en nuestra capacidad para anotar elementos reguladores en el genoma y determinar su función potencial ha sido impulsado por avances tecnológicos, tales como RNA-seq [1], ChlP-seq [2-3], DNase-seq [4] y ATAC-seq [5]. Sin embargo, un desafío pendiente es comprender los mecanismos mediante los cuales los elementos reguladores controlan promotores de genes específicos a una distancia (de 10 a 1000 kb).
[0003] Utilizando la captura de conformación cromosómica convencional (3C), es posible analizar en detalle las interacciones entre potenciadores, silenciadores, elementos límite y promotores en loci individuales a alta resolución [6-11].
[0004] Desde el desarrollo del procedimiento 3C original en 2002 [6], han surgido varias técnicas nuevas basadas en 3C, tales como Captura-C, Hi-C, Captura Hi-C, Hi-Cin situ,Captura de conformación cromosómica circularizada (4C), 4C-seq, ChlA-PET, captura de conformación cromosómica en base a la copia de cabrono (5C) y captura NG-C [12,13] (WO2017/068379). Cada una de estas técnicas tiene sus fortalezas y debilidades particulares. El documento WO2018/232396A1 divulga un procedimiento para ensayos de interacción de cromatina de próxima generación basados en la plataforma de detección de proteínas de molécula única y secuenciación de ADN a nivel de molécula única y de molécula única de núcleo único. Schmitt et al., (Nat. Rev. Mol. Cell Biol. London, (20160901), vol. 17, n.° 12, páginas 743-755 se refiere al "Genome-wide mapping and analysis of chromosome architecture".
[0005] Todavía existe la necesidad de más protocolos de captura de conformación cromosómica con mayor sensibilidad y resolución, que sean sencillos de realizar, pero que puedan generar datos de manera de alto rendimiento.
[0006] La resolución de estos procedimientos sigue siendo limitada cuando se estudian genomas de mamíferos. En la mayoría de los ensayos, la resolución está determinada por el tamaño del “bin” utilizado para agrupar datos y mejorar la intensidad de la señal. Esto es función de la profundidad de la secuenciación y el tamaño del genoma del organismo (los requisitos de secuenciación aumentan con el cuadrado del tamaño o la resolución del genoma). Si se puede obtener suficiente profundidad de secuencia, entonces el factor limitante se convierte en el tamaño del fragmento de restricción, lo que equivale a un límite teórico de ~ 256 pb con 4 enzimas de restricción cortadoras (que son las enzimas de mayor resolución generalmente utilizadas en la preparación de bibliotecas 3C en la actualidad). Aunque anteriormente se han utilizado nucleasas no dependientes de secuencia, tales como ADNasal y nucleasa microcócica, para generar bibliotecas 3C, las etapas de enriquecimiento utilizadas en estos protocolos anteriores no han dado como resultado datos con mayor resolución que las enzimas de restricción en genomas de mamíferos más grandes [14,15].
[0007] Los aumentos en la resolución son potencialmente útiles para resaltar las secuencias reguladoras que controlan los genes con mayor detalle y para identificar nuevas secuencias que controlan los genes. Los aumentos en la resolución también deberían permitir que los polimorfismos de un solo nucleótido identificados mediante estudios de asociación de todo el genoma se vinculen con los genes u otros aspectos de la función o estructura del genoma que controlan con mayor confianza. Esto tiene beneficios potenciales para la medicina personalizada, el diagnóstico y el descubrimiento de fármacos.
[0008] La mejor resolución que se podía obtener anteriormente era con Captura-C de próxima generación [12,13].
[0009] Los inventores han descubierto ahora que se puede obtener una mejora significativa en la resolución utilizando el proceso de la invención. Utilizando este proceso, se pueden obtener resoluciones de un solo par de bases; esta resolución es de un orden de magnitud mayor que la que se puede obtener mediante procedimientos anteriores.
[0010] El proceso de la invención implica una nueva combinación de etapas de fijación y digestión en la producción de la biblioteca 3C.
[0011] En procedimientos anteriores (por ejemplo, WO2017/068379), las células se fijaron (por ejemplo, usando formaldehído) y a continuación se homogeneizaron para romper las células y liberar la cromatina. En el proceso de la presente invención, las células se fijan pero, a continuación, se permeabilizan (para permitir la digestión). Se ha descubierto que este procedimiento más suave contribuye a una mayor resolución.
[0012] La digestión de la cromatina se ha llevado a cabo previamente utilizando varias enzimas diferentes, incluidas endonucleasas de restricción de corte de 4 y 6 pares de bases, por ejemplo Hindll, EcoRl, Ncol, Xbal, Bgllll, Dpnll y Nlallll, y nucleasas bacterianas que incluyen nucleasa microcócica y ADNasal.
[0013] Los inventores han descubierto ahora que la nucleasa microcócica, cuando se utiliza en el proceso de la invención, contribuye a la resolución mejorada obtenida.
[0014] Aunque la nucleasa microcócica se ha utilizado previamente para mapear el plegamiento cromosómico de resolución de nucleosomas en levaduras [14,15], se indicó que las resoluciones obtenidas previamente estaban entre 200 pb y ~4 kb. Además, mientras que las células de levadura(S. cereviseae)son células eucariotas, el genoma de S.cerevisiaetiene aproximadamente 12 millones de pares de bases, lo que representa sólo aproximadamente 1/250a parte del tamaño del genoma humano.
[0015] Por lo tanto, el procedimiento según la invención permite estudiar, entre otros, las interacciones de elementos reguladores en genes de mamíferos con una resolución que antes no se podía obtener.
[0016] En una realización, la invención da a conocer un proceso para tratar ácidos nucleicos en una población de células de mamífero, comprendiendo el proceso las etapas:
(i) inmovilizar los ácidos nucleicos dentro de las células en una población de células de mamífero;
(ii) permeabilizar las membranas celulares externas y las membranas nucleares de las células de mamíferos; y (iii) fragmentar los ácidos nucleicos inmovilizados dentro de las células con una nucleasa microcócica para producir fragmentos de ácidos nucleicos.
En una realización preferida, la presente invención da a conocer un proceso para tratar la cromatina en una población de células de mamífero, comprendiendo el proceso las etapas:
(i) reticular la cromatina dentro de las células en una población de células de mamífero;
(ii) permeabilizar las membranas celulares externas y nucleares de las células de mamíferos; y
(iii) fragmentar la cromatina reticulada dentro de las células permeabilizadas usando nucleasa microcócica para producir mononucleosomas en los que los enlazadores internucleosomales están al menos parcialmente intactos.
[0018] En otra realización, la presente invención da a conocer un proceso para producir una biblioteca 3C, comprendiendo el proceso las etapas:
(a) tratar ácidos nucleicos mediante un proceso tal como se define en cualquiera de las reivindicaciones 2 a 6;
(b) ligar los fragmentos de ácido nucleico para producir fragmentos de ácido nucleico ligados; y
(c) desinmovilizar (por ejemplo, desreticular) los fragmentos de ácido nucleico ligados.
[0019] En otra realización, la presente invención da a conocer un procedimiento para identificar regiones de ácido nucleico dentro de una muestra de ácido nucleico que interactúan entre sí, comprendiendo el procedimiento las etapas: producir una biblioteca 3C mediante un proceso tal como se define en la reivindicación 7;
(d) fragmentar la biblioteca 3C para producir fragmentos de ácido nucleico;
(e) opcionalmente, añadir adaptadores de secuenciación a los extremos de los fragmentos de ácido nucleico y/o amplificar los fragmentos de ácido nucleico;
(f) poner en contacto los fragmentos de ácido nucleico con un ácido nucleico de reconocimiento que se une a un subgrupo de los fragmentos de ácido nucleico, en donde el ácido nucleico de reconocimiento está marcado con la primera mitad de un par de unión;
(g) aislar el subgrupo de fragmentos de ácido nucleico que han sido unidos por el ácido nucleico de reconocimiento utilizando la segunda mitad del par de unión;
(h) amplificar el subgrupo aislado de fragmentos de ácido nucleico;
(j) opcionalmente repetir las etapas (f), (g) y (h) una o más veces; y
(k) opcionalmente secuenciar el subgrupo aislado amplificado de fragmentos de ácido nucleico para identificar regiones de ácido nucleico dentro de la muestra de ácido nucleico que interactúan entre sí.
[0020] Preferiblemente, el ácido nucleico de reconocimiento es un oligonucleótido de ADN.
[0021] En una realización adicional, se da a conocer un procedimiento para identificar perfiles de interacción específicos de alelo en regiones de ácidos nucleicos que contienen SNP, comprendiendo el procedimiento un procedimiento tal como se define en cualquiera de las reivindicaciones 8-13, que incluye la secuenciación del subgrupo aislado amplificado de fragmentos de ácido nucleico para identificar perfiles de interacción específicos de alelos en regiones que contienen SNP.
[0022] En otra realización adicional, se da a conocer un procedimiento para identificar una o más regiones de ácido nucleico que interactúan y que son indicativas de un estado patológico o trastorno particular, comprendiendo el procedimiento:
a) llevar a cabo un procedimiento tal como se define en cualquiera de las reivindicaciones 8 a 13 sobre una muestra de ácido nucleico de células de mamífero obtenidas de un sujeto con un estado patológico o trastorno particular; b) cuantificar una frecuencia de interacción entre una primera región de ácido nucleico y una segunda región de ácido nucleico; y
c) comparar la frecuencia de interacción en la muestra de ácido nucleico del sujeto con dicho estado patológico o trastorno con la frecuencia de interacción en una muestra de ácido nucleico de control de un sujeto sano, de manera que una diferencia en la frecuencia de interacción en la muestra de ácido nucleico es indicativa de un estado patológico o trastorno particular.
[0023] En una realización, el proceso de la presente invención se refiere al tratamiento de los ácidos nucleicos dentro de una población de células de mamífero. Los ácidos nucleicos se tratanin situ,es decir, dentro de las células.
[0024] Preferiblemente, las células de mamífero son de ser humano, mono, ratón, rata, conejo, cobaya, oveja, caballo, cerdo, vaca, cabra, perro o gato. Lo más preferiblemente, las células de mamífero son células humanas.
[0025] En algunas realizaciones, las células son células eritroides o células madre (por ejemplo, células madre embrionarias). Preferiblemente, los ácidos nucleicos se obtienen a partir de células vivas.
[0026] En algunas realizaciones preferidas, la población de células consiste en 104 a 109 células, más preferiblemente, de 106 a 108 células. En otras realizaciones preferidas, la población de células consiste en 1 a 10.000 células, de 10.000 a 1 millón de células o de 1 millón a 100 millones de células.
[0027] Tal como se utiliza en el presente documento, el término "ácido nucleico" abarca cromatina, ADN y ARN. Preferiblemente, el ácido nucleico es ADN o cromatina, lo más preferiblemente cromatina. La cromatina comprende nucleosomas que están unidos por enlaces internucleosomales.
[0028] La etapa (i) comprende inmovilizar (por ejemplo, reticular) los ácidos nucleicos dentro de las células en una población de células de mamífero. La inmovilización (por ejemplo, reticulación) se lleva a cabo en cada célula individual (es decir, inmovilización, por ejemplo, reticulación, dentro de una célula). La inmovilización (por ejemplo, reticulación) se lleva a caboin situ,es decir, dentro del núcleo celular. Preferiblemente, la inmovilización (por ejemplo, reticulación) se lleva a cabo en sustancialmente todas o en todas las células de la población de células de mamífero.
[0029] En esta etapa, los ácidos nucleicos (por ejemplo, dentro de la cromatina) se inmovilizan (por ejemplo, se reticulan) de modo que las regiones dentro de los ácidos nucleicos que interactuaban entre sí se mantienen o fijan en estrecha proximidad.
[0030] Las regiones de ácido nucleico que interactúan entre sí son particularmente elementos de ADN que afectan o controlan la expresión de un gen asociado u otros aspectos de la función o estructura del genoma. Por ejemplo, los elementos de ADN pueden ser promotores, potenciadores, aislantes y/o silenciadores.
[0031] Los ácidos nucleicos se pueden inmovilizar reticulando los ácidos nucleicos o incluyendo los ácidos nucleicos en un agente inmovilizador, entre otras cosas.
[0032] Las regiones de ácidos nucleicos que interactuaban entre sí pueden reticularse directamente (es decir, ácido nucleico con ácido nucleico) o indirectamente (por ejemplo, mediante reticulación de los ácidos nucleicos con restos (por ejemplo, proteínas) que están unidos a los ácidos nucleicos o entre proteínas unidas al ácido nucleico directa o indirectamente). Preferiblemente, los ácidos nucleicos se reticulan usando un reactivo de reticulación. El agente reticulante debe ser uno que sea capaz de entrar en las células (no permeabilizadas). Preferiblemente, el agente reticulante es formaldehído.
[0033] El agente inmovilizador es una sustancia que es capaz de entrar en células (no permeabilizadas) y de inmovilizar los ácidos nucleicos dentro de esas células de manera que las regiones dentro de los ácidos nucleicos que interactuaban entre sí se mantengan o fijen en estrecha proximidad. En algunas realizaciones, las células de mamífero se inmovilizan dentro de tapones del agente inmovilizador. Entre los ejemplos de agentes inmovilizadores se incluyen geles, preferiblemente hidrogeles, formados a partir de polímeros reticulados.
[0034] Un hidrogel es una red de cadenas poliméricas que son hidrófilas, que a veces se encuentran como un gel coloidal, en el que el agua es el medio de dispersión. La estructura del hidrogel se puede cambiar variando la concentración del polímero formador de hidrogel en el hidrogel. Entre los ejemplos de polímeros de hidrogel se incluyen alcohol polivinílico, polímeros de acrilato (por ejemplo, acrilato de sodio) y polímeros con abundancia de grupos hidrófilos. Otros polímeros de hidrogel incluyen agarosa, alginato, metilcelulosa, hialuronano, polipéptidos similares a elastina y otros polímeros de origen natural. Preferiblemente, el agente inmovilizador es gel de agarosa.
[0035] La etapa (ii) comprende permeabilizar las membranas celulares externas y las membranas nucleares de las células de mamífero. En esta etapa, la membrana celular externa y la membrana nuclear de las células se permeabilizan al menos para permitir que la enzima o enzimas fragmentadoras obtengan acceso a los ácidos nucleicos en el núcleo (por ejemplo, a la cromatina).
[0036] Tal como se utiliza en el presente documento, el término "permeabilizar" significa que la membrana celular externa y las membranas nucleares se vuelven permeables a la enzima o enzimas fragmentadoras, pero las membranas por lo demás permanecen intactas.
[0037] En algunas realizaciones, la membrana celular externa y/o la membrana nuclear no se lisan. En algunas realizaciones, la membrana celular externa y/o la membrana nuclear no se destruyen parcial o completamente. En algunas realizaciones, la membrana celular externa y/o la membrana nuclear no se eliminan parcial o completamente.
[0038] En una realización preferida, las membranas celulares externas y las membranas nucleares de las células de mamíferos se permeabilizan sin eliminar las membranas celulares externas o las membranas nucleares.
[0039] En realizaciones en las que las membranas celulares de las células están permeabilizadas, preferiblemente están permeabilizadas en sustancialmente todas o todas las células, respectivamente. En realizaciones en las que las membranas nucleares de las células están permeabilizadas, están permeabilizadas preferiblemente en sustancialmente todas o todas las células, respectivamente.
[0040] La membrana celular externa y la membrana nuclear se permeabilizan usando un agente permeabilizante de membrana. Ejemplos de agentes permeabilizantes de membrana incluyen Digitonina, Saponina, Tergitol tipo NP40, Triton X-100, Dodecilsulfato de sodio y Tween 20. Preferiblemente, el agente permeabilizante es digitonina (por ejemplo, de Sigma).
[0041] En una realización, la cantidad de agente permeabilizante utilizada es la que es suficiente para permeabilizar las membranas celulares externas y las membranas nucleares de las células, preferiblemente sin eliminar parcial o completamente la membrana celular y/o la membrana nuclear. Cantidades mayores de agente permeabilizante eliminarán por completo las membranas celulares externas y las membranas nucleares de las células. Cantidades intermedias de agente permeabilizante eliminarán completamente las membranas celulares externas y permeabilizarán las membranas nucleares de las células.
[0042] La etapa (iii) comprende fragmentar los ácidos nucleicos (por ejemplo, cromatina) inmovilizados (por ejemplo, reticulados) dentro de las células para producir fragmentos de ácidos nucleicos. Los fragmentos de ácido nucleico son preferiblemente cromatina o fragmentos de ADN.
[0043] En esta etapa, los ácidos nucleicos (por ejemplo, cromatina) inmovilizados (por ejemplo, reticulados) se fragmentan para permitir que posteriormente se liguen a otras secuencias de ácidos nucleicos dentro de la cromatina que estaban en estrecha proximidad física en el núcleo en el momento de fijación. En esta etapa de fragmentación, los enlazadores entre nucleosomas se escinden y preferiblemente se reducen sus longitudes.
[0044] Después de la fragmentación, los extremos libres del ácido nucleico dentro de la cromatina se unen entre sí utilizando una reacción de ligadura. Esto produce una biblioteca 3C en la que el orden de los fragmentos de ácido nucleico se reorganiza para reflejar su proximidad en el espacio tridimensional en el momento de la inmovilización/fijación en lugar de su posición original en la molécula de ácido nucleico lineal.
[0045] Preferiblemente, la etapa de fragmentación no debería afectar la integridad de la inmovilización (por ejemplo, reticulación) o no afectan sustancialmente la integridad de la inmovilización (por ejemplo, reticulación).
[0046] En algunas realizaciones de la invención, la etapa de fragmentación no comprende la etapa de marcar los extremos libres de los fragmentos de ácido nucleico con la primera mitad de un par de unión. En particular, en algunas realizaciones de la invención, la etapa de fragmentación no comprende la etapa de marcar los extremos libres de los fragmentos de ácido nucleico con biotina.
[0047] La fragmentación se lleva a cabo utilizando nucleasa microcócica (EC 3.1.31.1). La nucleasa microcócica digiere preferiblemente ácidos nucleicos monocatenarios. La enzima también es activa contra el ADN y el ARN de doble cadena y todas las secuencias finalmente se escinden.
[0048] La fragmentación de los ácidos nucleicos (por ejemplo, cromatina) inmovilizados (por ejemplo, reticulados) no se lleva a cabo hasta el final. En particular, no todos los enlazadores internucleosomales se cortan/digieren en la etapa de fragmentación. Preferiblemente, la fragmentación de los ácidos nucleicos inmovilizados (por ejemplo, reticulados) (por ejemplo, cromatina inmovilizada o reticulada) se lleva a cabo, de manera que todos o sustancialmente todos los enlazadores internucleosomales se mantienen intactos. Preferiblemente, la cromatina se digiere para producir >70% (preferiblemente >80% o >90%) de mononucleosomas.
[0049] Los enlazadores internucleosomales preferiblemente se mantienen al menos parcialmente intactos (es decir, no se digieren hasta el final), pero pueden escindirse. Preferiblemente, los enlazadores internucleosomales tienen una longitud de 10-500, 10-200, 50-200 o 10-100 pares de bases después de la fragmentación (por ejemplo, digestión).
[0050] Preferiblemente, el ácido nucleico (por ejemplo, cromatina) se fragmenta (por ejemplo, se digiere) en mononucleosomas (por ejemplo, 180-200 pb) y más preferiblemente con los enlazadores internucleosomales unidos. Preferiblemente, el ácido nucleico que está enrollado alrededor del núcleo de histona del nucleosoma no se fragmenta (digerido).
[0051] La duración de la etapa de fragmentación y/o la cantidad/concentración de la enzima fragmentadora (cuando se usa) se seleccionan para lograr esto.
[0052] Preferiblemente, se usa un tiempo de incubación relativamente largo en combinación con una cantidad muy pequeña de enzima. Esto crea un mayor control sobre la reacción en comparación con tiempos de incubación más cortos con más enzima.
[0053] El grado de fragmentación de la cromatina y el grado de degradación del enlazador internucleosomal pueden analizarse fácilmente mediante electroforesis en gel, por ejemplo utilizando un sistema automatizado, tal como Agilent TapeStation (reactivos D1000).
[0054] Después de la etapa de fragmentación (es decir, la etapa (iii)), los nucleosomas inmovilizados (por ejemplo, reticulados) se pueden unir entre sí utilizando adaptadores de ADN (por ejemplo, tal como se muestra en Ohno et al., Subnucleosomal Genome Structure Reveals Distinct Nucleosome Folding Motifs, Cell (2019), https://doi.org/10.1016/j.cell.2018.12.014). Por ejemplo, los adaptadores de ADN pueden ligarse al extremo de entrada del ADN y al extremo de salida del ADN de las moléculas de ADN en los nucleosomas. Los adaptadores podrían estar marcados (por ejemplo, conjugados con biotina). En otras realizaciones, los adaptadores no están marcados (por ejemplo, no están conjugados con biotina).
[0055] En otras realizaciones de la presente invención, se da a conocer un proceso para producir una biblioteca 3C, comprendiendo el proceso las etapas:
(a) tratar ácidos nucleicos mediante un proceso tal como se define en cualquiera de las reivindicaciones 2 a 6;
(b) ligar los fragmentos de ácido nucleico para producir fragmentos de ácido nucleico ligados; y
(c) desinmovilizar (por ejemplo, desreticular) los fragmentos de ácido nucleico ligados.
[0056] Tal como se usa en el presente documento, el término "biblioteca 3C" se refiere a una biblioteca de fragmentos de ADN, en donde los fragmentos de ADN comprenden elementos de ADN unidos de manera contigua, en donde los elementos de ADN son aquellos que son capaces de interactuar entre sí (por ejemplo, dentro de una célula).
[0057] La etapa (b) comprende ligar los fragmentos nucleicos obtenidos en la etapa (a) para producir fragmentos de ácido nucleico ligados. Los fragmentos de ácido nucleico ligados son preferiblemente fragmentos de cromatina ligados o fragmentos de ADN ligados.
[0058] En esta etapa, los extremos libres de los fragmentos de ácido nucleico que se produjeron en la etapa (iii) se ligan entre sí para producir fragmentos de ácido nucleico ligados.
[0059] La ligadura se producirá de forma aleatoria entre los extremos libres de los fragmentos de ácido nucleico. Sin embargo, la ligadura se producirá más preferiblemente entre extremos de ácidos nucleicos libres adyacentes que se mantienen muy próximos entre sí mediante el proceso de inmovilización (por ejemplo, reticulación) de la etapa (i). De esta manera, las regiones de ácido nucleico dentro de la muestra de ácido nucleico que previamente interactuaban entre sí ahora preferiblemente se unirán (ligarán) químicamente entre sí.
[0060] Preferiblemente, la longitud de los fragmentos de ácido nucleico ligados es mayor que 200 pb (es decir, hay un aumento en el tamaño de los fragmentos en el perfil de las longitudes de los fragmentos de ADN, preferiblemente de tal manera que hay muy poco ADN del tamaño de los fragmentos en pico mononucleosomal principal después de la reacción de digestión (ver Figura 2).
[0061] Antes de la ligadura, los extremos de los fragmentos de ácido nucleico preferiblemente se pierden y se fosforilan, por ejemplo usando polinucleótido quinasa T4 (PNK) y ADN polimerasa I, fragmento grande (Klenow).
[0062] La ligadura se puede llevar a cabo usando cualquier agente de ligadura adecuado, por ejemplo una ligasa. Preferiblemente, la ligasa es una ADN ligasa. Entre los ejemplos de ADN ligasas adecuadas se incluyen ADN ligasa T4.
[0063] En la etapa (c), los fragmentos de ácido nucleico ligados se desinmovilizan (por ejemplo, se desreticulan). Si las células aún no se han lisado, entonces es posible lisarlo en este momento.
[0064] Si las membranas celulares no se han eliminado previamente, entonces también se eliminan las membranas celulares en este momento, por ejemplo con un tampón de lisis, proteinasa K y tratamiento térmico o un detergente adecuado. De manera alternativa, se pueden usar cantidades suficientes de un agente permeabilizante (por ejemplo, tal como se describe en el presente documento). En algunas realizaciones preferidas, las membranas nucleares y/o celulares no se eliminan hasta esta etapa.
[0065] En esta etapa, los fragmentos de ácido nucleico ligados (por ejemplo, fragmentos de cromatina ligados) se desinmovilizan (por ejemplo, se desreticulan) para producir fragmentos de ácido nucleico lineales (por ejemplo, fragmentos de cromatina lineal). Por ejemplo, el agente inmovilizador se elimina/disuelve o los restos reticulantes se escinden o eliminan.
[0066] En algunas realizaciones, las reticulaciones se eliminan calentando los fragmentos de ácido nucleico ligados hasta una temperatura alta, tal como a 50°C, 60°C, 70°C, 80°C o superior. La desreticulación se lleva a cabo preferiblemente usando Proteinasa K. Opcionalmente, en este momento también se elimina material que no es ácido nucleico (por ejemplo, proteínas, agentes de reticulación, etc.). También es preferible eliminar el ARN de la muestra en este punto, preferiblemente usando ARNasa. Por ejemplo, los fragmentos de ácido nucleico ligados se pueden extraer con fenol/cloroformo o procedimientos de extracción en fase sólida (tales como columnas de centrifugación Qiagen).
[0067] En aún otra realización, la presente invención proporciona un procedimiento para identificar regiones de ácido nucleico dentro de una muestra de ácido nucleico que interactúan entre sí, tal como se define en la reivindicación 8.
[0068] La primera etapa de este procedimiento comprende producir una biblioteca 3C mediante un proceso de la reivindicación 7.
[0069] En la Etapa (d), se fragmentan los fragmentos de ácido nucleico en una biblioteca 3C. Los fragmentos de ácido nucleico son preferiblemente fragmentos de ADN. En esta etapa, las longitudes de los fragmentos de ácido nucleico en la biblioteca 3C se reducen preferiblemente hasta un tamaño que sea adecuado para secuenciación, captura y/o amplificación de alto rendimiento.
[0070] Preferiblemente, las longitudes de los fragmentos de ácido nucleico se reducen hasta 100-500 pares de bases, más preferiblemente 100-300 o 150-250 pares de bases, y lo más preferiblemente hasta aproximadamente 250 pares de bases.
[0071] La fragmentación se puede realizar mediante cualquier proceso adecuado. Entre los ejemplos de procesos de fragmentación adecuados se incluyen el uso de nucleasas (por ejemplo, endonucleasas de restricción) y sonicación. Preferiblemente, la fragmentación se realiza mediante sonicación.
[0072] En la Etapa (e), opcionalmente se añaden adaptadores de secuenciación a los extremos de los fragmentos de ácido nucleico. Además, los fragmentos de ácido nucleico pueden amplificarse en este momento. En esta etapa opcional, se añaden adaptadores de secuenciación y/o cebadores de amplificación (por ejemplo, ácidos nucleicos bicatenarios cortos) a ambos extremos de los fragmentos de ácido nucleico para facilitar la amplificación y posterior secuenciación de los fragmentos de ácido nucleico.
[0073] Cada adaptador de secuenciación puede comprender un código de barras de indexación único, es decir, un motivo de ácido nucleico corto que actúa como un identificador único para ese fragmento de ácido nucleico. Preferiblemente, los adaptadores de secuenciación son adaptadores de secuenciación de próxima generación. En algunas realizaciones, los adaptadores de secuenciación comprenden secuencias P5 o P7, que median la unión a la celda de flujo y la amplificación del puente. También se pueden añadir sitios de unión internos para secuenciar cebadores y códigos de barras para permitir la indexación de muestras. Los adaptadores de secuenciación pueden añadirse a los fragmentos de ácido nucleico mediante PCR mediada por ligadura.
[0074] Los fragmentos de ácido nucleico también pueden amplificarse (por ejemplo, mediante PCR) en este momento. Por ejemplo, se pueden realizar de 1 a 20 rondas de PCR, preferiblemente de 3 a 10 rondas y lo más preferiblemente aproximadamente 6 rondas de PCR.
[0075] Las muestras indexadas ahora pueden agruparse opcionalmente para análisis de secuencia múltiplex.
[0076] En la etapa (f), los fragmentos de ácido nucleico se ponen en contacto con un ácido nucleico diana que se une a un subgrupo de los fragmentos de ácido nucleico, en donde el ácido nucleico diana se marca con la primera mitad de un par de unión. En esta etapa, se preparan los fragmentos de ácido nucleico deseados (por ejemplo, fragmentos de ADN) para aislarlos del entorno de fragmentos de ácido nucleico contaminantes.
[0077] Se utiliza un ácido nucleico de reconocimiento que tiene una secuencia de nucleótidos que es complementaria o sustancialmente complementaria a la de una región deseada de los ácidos nucleicos dentro de la muestra de ácido nucleico. Por lo tanto, el ácido nucleico de reconocimiento se hibridará, en condiciones apropiadas, con la región deseada del ácido nucleico dentro de la muestra de ácido nucleico.
[0078] Por ejemplo, la región deseada del ácido nucleico puede ser la de un promotor de un gen particular (en el que se desea determinar qué regiones de ADN interactúan con ese promotor) o puede ser la de un elemento potenciador (en el que se desea determinar qué genes son potenciados por ese elemento).
[0079] El ácido nucleico de reconocimiento puede ser monocatenario o bicatenario, preferiblemente monocatenario. El ácido nucleico de reconocimiento puede ser ADN o ARN, preferiblemente ADN (por ejemplo, un oligonucleótido de ADN).
[0080] Cuando se usa una endonucleasa de restricción en la producción de la biblioteca 3C, el ácido nucleico de reconocimiento contiene preferiblemente los extremos del fragmento de restricción que contiene la región deseada e incluye el sitio de la endonucleasa de restricción. De esta manera, el ácido nucleico de reconocimiento se une a uniones de ligadura informativas.
[0081] Preferiblemente, la concentración del ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido de ADN) es de 5 pM a 1 pM. Más preferiblemente, la concentración del ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido de ADN) es de 2,9 pM a 29 pM. Aún más preferiblemente, la concentración del ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido de ADN) es de 1 pM a 30 pM, o de 300 nM a 30 pM. Aún más preferiblemente, la concentración del ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido de ADN) es de 30 nM a 0,3 nM. Lo más preferiblemente, la concentración del ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido de ADN) es aproximadamente 2,9 nM. Esto se aplica a cada oligonucleótido utilizado.
[0082] Preferiblemente, se usa el mismo ácido nucleico de reconocimiento en cualquier repetición de la Etapa (f).
[0083] Se pueden diseñar ácidos nucleicos de reconocimiento (por ejemplo, oligonucleótidos marcados) para que se unan a cualquier secuencia dentro del genoma del organismo que se está estudiando. Preferiblemente, el ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido marcado) está situado (es decir, diseñado para unirse) dentro de una región empobrecida en nucleosoma de un promotor de un gen o ARN no codificante de interés, o un elemento regulador (por ejemplo, un potenciador, represor o sitio de unión a CTCF).
[0084] Lo más preferiblemente, el ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido marcado) está situado (es decir, diseñado para unirse) dentro de la región central de una región empobrecida en nucleosoma de un promotor de un gen o ARN no codificante de interés, o un elemento regulador (por ejemplo, un potenciador, represor o sitio de unión a CTCF). Tal como se usa en el presente documento, el término región "central" se refiere al 50 % central (preferiblemente el 30 %, 20 % o 10 % central) de la secuencia de la región empobrecida en nucleosomas. El término región "central" también puede referirse a los 500, 400, 300, 200, 100 o 50 pares de bases centrales de la secuencia de la región empobrecida en nucleosomas.
[0085] De esta manera, se puede obtener una imagen muy clara y de alta resolución de las interacciones funcionales que controlan la expresión del gen (o ARN). Las regiones empobrecidas en nucleosomas se pueden definir fácilmente mediante ensayos que incluyen hipersensibilidad a ADNasal, ATAC-seq e inmunoprecipitación de cromatina.
[0086] En algunas realizaciones, el ácido nucleico de de reconocimiento está diseñado para unirse a (o superponerse con) un sitio hipersensible de ADNasal o una secuencia ATAC de un promotor de un gen o ARN no codificante de interés, o un elemento regulador en el ácido nucleico.
[0087] Por el contrario, cuando el ácido nucleico de reconocimiento (por ejemplo, un oligonucleótido marcado) se mueve 1000 pb a la izquierda o derecha de la región central, el perfil de interacción física se atenúa y se vuelve más difícil definir los contactos reguladores con precisión (ver Figuras 4a-c).
[0088] En los loci donde la regulación genética ya está bien definida (tales como los loci de alfa y beta globina, HBA y HBB), los perfiles que se pueden obtener a partir de los procedimientos de la presente invención de las regiones centrales empobrecidas en nucleosoma en los promotores definen todos los elementos reguladores conocidos hasta una resolución de casi un solo par de bases (ver Figura 4c). Dicha resolución nunca antes había sido posible de obtener.
[0089] Los sitios de unión al factor de transcripción en los elementos reguladores distales también pueden definirse a partir de la señal de la parte central de un promotor. Esto se puede lograr utilizando el sitio de unión entre la parte de la lectura de captura (en el promotor) y la lectura del reportero (en el potenciador). Los sitios de unión a los factores de transcripción se pueden definir porque donde se unen al ADN hay una reducción en la densidad del sitio de corte. Por tanto, las señales más fuertes se producen en los sitios desprotegidos entre los sitios de unión al factor de transcripción. Esto es similar a los ensayos de “footprinting” por hipersensibilidad de ADNasal.
[0090] Los ejemplos de pares de unión incluyen biotina con estreptavidina. Preferiblemente, la primera mitad del par de unión es biotina.
[0091] En la etapa (g), la segunda mitad del par de unión se usa para aislar el subgrupo de fragmentos de ácido nucleico que se han unido mediante el ácido nucleico de reconocimiento. En esta etapa, se permite que la segunda mitad del par de unión se una a la primera mitad del par de unión. Para ayudar al aislamiento de los fragmentos de ácido nucleico de reconocimiento, la segunda mitad del par de unión puede unirse a un soporte físico, por ejemplo una columna o una microesfera (por ejemplo, una microesfera magnética).
[0092] Por ejemplo, la primera mitad del par de unión puede ser biotina y la segunda mitad del par de unión puede ser una microesfera recubierta de estreptavidina. Los fragmentos de ácido nucleico de reconocimiento pueden aislarse entonces de la base (“background”) en virtud del hecho de que se unirán a la columna o a las microesferas magnéticas, en donde entonces pueden eliminarse los ácidos nucleicos de base (“background”).
[0093] En algunas realizaciones de la invención, el procedimiento no se lleva a cabo en una micromatriz.
[0094] En la etapa (h), se amplifica el subgrupo aislado de fragmentos de ácido nucleico. En esta etapa, los fragmentos de ácido nucleico aislados (por ejemplo, fragmentos de ADN) se amplifican para enriquecer los fragmentos de ácido nucleico deseados. Preferiblemente, la amplificación es por PCR. Preferiblemente, la amplificación comprende de 10 a 40 ciclos de amplificación por PCR, más preferiblemente de 12 a 14 ciclos.
[0095] En las realizaciones de la invención en las que los adaptadores de secuenciación comprenden secuencias P5 o P7, se pueden usar cebadores de PCR que se unen a estas últimas secuencias.
[0096] Las etapas (d)-(h) del procedimiento de la presente invención pueden dar como resultado un enriquecimiento de aproximadamente 5-20.000 veces con respecto al procedimiento correspondiente sin las etapas (f), (g) y (h).
[0097] En la etapa (j), las etapas (f), (g) y (h) pueden repetirse (en este orden). Esto da como resultado un mayor enriquecimiento de los fragmentos de ácido nucleico deseados con respecto al procedimiento correspondiente sin las etapas (f), (g) y (h), de modo que a menudo >90 % de las lecturas contienen una secuencia reconocida por la captura de oligonucleótidos. Las etapas (f), (g) y (h) se pueden repetir (en este orden), por ejemplo, de 1 a 5 veces, por ejemplo 1, 2, 3, 4 o 5 veces.
[0098] Las etapas del procedimiento se llevan a cabo preferiblemente en el orden especificado.
[0099] Opcionalmente, el procedimiento comprende adicionalmente la Etapa (k), es decir, secuenciar el subgrupo amplificado de fragmentos de ácido nucleico. El experto conocerá bien numerosos procedimientos de secuenciación de ADN que pueden usarse. Preferiblemente, la secuenciación se realiza usando una plataforma Illumina, por ejemplo, Miseq, HiSeq, NextSeq o NovoSeq, usando secuencias de extremos emparejados de 150 pb (es decir, 300 pb en total).
[0100] Los procedimientos de la invención se llevan a caboin vitrooex vivo.
BREVE DESCRIPCIÓN DE LAS FIGURAS
Figura 1. Descripción general de un procedimiento de la prese nte invención para producir una biblioteca 3C.
Figura 2. Perfiles de fragmentación de nucleosomas. Después de la extracción del ADN, el material se analizó mediante electroforesis en gel automatizada (Agilent TapeStation con reactivos D1000). Se obtuvieron niveles óptimos de digestión cuando la cromatina se digirió predominantemente en mononucleosomas (180-200 pb) pero con los enlazadores internucleosomales unidos (Figuras 2 y 3). La sobredigestión a <160 pb eliminó los enlazadores internucleosomales y esto significó que no fue posible ligar fragmentos muy próximos.
Figura 3. Modelo para explicar el fundamento de la digestión óptima. Antes de la digestión, la cromatina se envuelve alrededor de los nucleosomas. Aproximadamente 148 pb se envuelven alrededor de cada nucleosoma, con una secuencia enlazadora de alrededor de 20 a 80 pb. Cuando la muestra se digiere hasta un tamaño de fragmento máximo de 180-200 pares de bases, los enlazadores entre los nucleosomas se cortan, pero no se digieren. Esto permite que la reacción de ligadura se desarrolle entre diferentes nucleosomas. Si los enlazadores son completamente digeridos entre los nucleosomas, entonces es imposible que se lleve a cabo la reacción de ligadura.
Figura 4a, b y c. Comparación de datos generados por diferentes procedimientos 3C. Estos paneles muestran la resolución aumentada obtenida usando un procedimiento de la invención en comparación con los datos de Hsieh et al. [15].
La Figura 4a muestra una sección de 100 kb del locus de alfa globina y muestra cómo pequeños cambios en la posición de los oligonucleótidos utilizados para la captura cambian drásticamente el perfil de interacción. En particular, los oligonucleótidos colocados directamente sobre el sitio hipersensible en el promotor del gen revelan interacciones muy discretas con los elementos reguladores potenciadores que controlan la expresión génica. Se incluyen datos de los procedimientos NG Captura-C y 4C-seq [10, 12, 13] para permitir la comparación con los mejores procedimientos disponibles anteriormente.
La Figura 4b muestra una sección de 20 kb de la Figura 4a e incluye datos de 20 kb de Hsieh et al. [15], generados a partir de S.cerevisiaepara permitir la comparación.
La Figura 4c muestra una sección de 1 kb de la Figura 4b, que resalta la resolución que se puede obtener con el procedimiento de la presente invención. Cuando se trazan las uniones de ligadura, esto proporciona una resolución cercana a un solo par de bases y esto resalta potencialmente los sitios de unión de los factores de transcripción dentro de la región potenciadora.
La Figura 5 muestra una comparación de MCC realizada con una preparación de células completas intactas en comparación con una preparación nuclear.
Figura 6. Datos Micro-C. Esto ilustra la resolución de la secuencia de nucleótidos obtenida usando un procedimiento de la técnica anterior (tomado de la Figura 5 de Hsieh et al. [14]).
EJEMPLOS
[0102] La presente invención se ilustra con más detalle mediante los siguientes ejemplos, en los que las partes y porcentajes son en peso y los grados son Celsius, a menos que se indique lo contrario. Debe entenderse que estos ejemplos, aunque indican realizaciones preferidas de la invención, se proporcionan únicamente a modo de ilustración.
Ejemplo 1: Preparación de la biblioteca de captura de conformación de cromatina de nucleasa microcócica (MCC)
[0103] En la Figura 1 se muestra una descripción general del procedimiento.
Fijación
[0104] Se fijaron 1-2 x 107 células en 10 ml de medio con una concentración final de formaldehído al 2 % durante 10 minutos a temperatura ambiente. Esta reacción se inactivó añadiendo glicina fría 1 M (concentración final 130 mM) y se centrifugó durante 5 minutos a 300 g/4 °C. Se descartó el sobrenadante y el sedimento celular se resuspendió en solución salina tamponada con fosfato, se centrifugó (300 g/4°C) y se descartó el sobrenadante. A continuación, se resuspendió el sedimento celular en solución salina tamponada con fosfato y se añadió digitonina (Sigma) hasta una concentración final de ~ 0,05 % (suficiente para permeabilizar las células dependiendo del lote de digitonina). En este punto, las células se pueden congelar rápidamente y almacenarse a -80 °C, si se desea.
Digestión
[0105] Las células permeabilizadas se centrifugaron durante 5 minutos a 300 g, se descartó el sobrenadante y las células se resuspendieron en un tampón de nucleasa microcócica con contenido reducido de calcio (Tris HCL pH 7,5 10 mM; CaCl<2>1 mM). Se utilizó una titulación de diferentes concentraciones de nucleasa microcócica (NEB o Worthington) para digerir la cromatina (normalmente entre 0,5 y 40 Kunitz U para un volumen de reacción de 800 pl que contiene 2.000.000 de células). Esta reacción se incubó durante 1 hora a 37 °C en un Thermomixer Eppendorf a 800 rpm. Los perfiles de digestión de nucleosomas se muestran en la Figura 2.
[0106] La reacción se inactivó con EGTA (ácido etilenglicol-bis(p-aminoetiléter)-N,N,N',N'-tetraacético (Sigma)) hasta una concentración final de 5 mM. Se extrajeron 200 pl como control para medir la eficiencia de la digestión. La reacción se centrifugó (5 minutos a 300 g) y se descartó el tampón de digestión. Las células se resuspendieron en solución salina tamponada con fosfato y se centrifugaron nuevamente (5 minutos a 300 g) y se descartó el sobrenadante.
Ligadura
[0107] La reparación y la fosforilación de los extremos de ADN se realizaron antes de la ligadura. Las células se resuspendieron en tampón de ADN ligasa (Thermo Scientific; concentraciones finales Tris HCl 40 mM, pH 7,5, MgCl<2>10 mM, DTT 10 mM, ATP 5 mM) suplementado con dNTP (concentración final 400 uM de cada uno de dATP, dCTP, dGTP y dTTP (Thermo Fischer R0191)) y EGTA 5 mM. Se añadieron polinucleótido quinasa PNK T4 (NEB M0201L) y ADN polimerasa I (fragmento grande (Klenow) NEB M0210L) hasta concentraciones finales de 200 U/ml y 100 U/ml, respectivamente, y la reacción se incubó a 37 °C durante 1 hora. Se añadió ADN ligasa T4 (Thermo Scientific, ligasa de alta concentración (30 U/pl) EL0013) hasta una concentración final de 300 U/ml y la reacción se incubó a 16 °C durante la noche usando un Thermomixer Eppendorf a 800 rpm.
Desreticulación
[0108] La cromatina se desreticuló con proteinasa K a 65 °C (> 2 horas) y se usó fenol cloroformo con tratamiento con ARNasa (Roche: 1119915) o el kit de sangre y tejido Qiagen DNeasy para purificar el ADN.
[0109] Se evaluaron las eficiencias de digestión y ligadura usando electroforesis en gel o Agilent Tapestation (reactivos D1000). Esto debería mostrar > 80 % de mononucleosomas y un aumento significativo en el tamaño de los fragmentos en el producto de ligadura 3C (Figura 2). La sobredigestión de la cromatina elimina las secuencias enlazadoras internucleosomales y cuando esto tiene lugar, las muestras no logran ligarse (Figuras 2 y 3).
Sonicación
[0110] El protocolo de captura de oligonucleótidos se realizó como para la Captura-C de próxima generación convencional. Brevemente, la biblioteca 3C de nucleasa microcócica se sonicó hasta un tamaño de fragmento medio de 200 pares de bases utilizando un ultrasonido enfocado Covaris S220.
Adición de adaptadores de secuenciación
[0111] Se añadieron adaptadores de secuenciación utilizando el kit NEB Ultra II y se amplificaron por PCR utilizando el kit Herculase PCR (Agilent). Estas bibliotecas se hibridaron típicamente con oligonucleótidos biotinilados de 120 pares de bases (a una concentración de 13 pm - 130 fmoles/muestra dependiendo del número de oligonucleótidos usados) durante 72 horas usando los reactivos Roche SeqCap.
Captura de microesferas
[0112] Las muestras se capturaron con microesferas de estreptavidina (Thermo Fischer M270), se lavaron y amplificaron usando los reactivos Roche SeqCap y protocolos estándar. Se realizó una segunda ronda de captura de oligonucleótidos con los mismos oligonucleótidos y reactivos con solo una reacción de hibridación de 24 horas.
Secuenciación
[0113] El material se secuenció usando la plataforma Illumina con lecturas de 300 pares de bases (extremo emparejado de 150 pares de bases).
Resultados
[0114] Los datos se analizaron tal como se ilustra en la Figura 4. La Figura 4 muestra datos del experimento de Captura C de nucleasa microcócica (MCC). En este experimento, se generaron datos para 35 genes simultáneamente. El diseño experimental incluyó un oligonucleótido de captura central diseñado para capturar contactos directamente desde el medio del sitio hipersensible en el promotor del gen y dos oligos flanqueantes, uno de ~1 kb en dirección 5' (etiquetado "izquierda") y uno de ~1 kb en dirección 3' (etiquetado "derecho"). Los datos muestran que la resolución de MCC es mucho mayor que la que se puede lograr con los mejores procedimientos disponibles anteriormente (NG Captura-C y 4C-seq) para definir perfiles de interacción a alta resolución en genomas de mamíferos. Además, los datos tienen una resolución sustancialmente mejorada en comparación con los mapas de contacto todos frente a todos en levadura generados utilizando el protocolo Micro-C [14] a pesar del tamaño del genoma mucho mayor.
[0115] La posición de los oligonucleótidos usados para la captura cambia drásticamente el perfil de interacción. Cuando los oligonucleótidos se colocan directamente sobre el sitio hipersensible en el promotor del gen, MCC revela interacciones muy discretas con los elementos reguladores potenciadores que se sabe que controlan la expresión génica (Figuras 4a, b, c). Sin embargo, cuando los oligonucleótidos biotinilados se colocan aproximadamente 1 kb en dirección 5' o 3' de la posición central del oligo en el sitio de ADNasa, el perfil cambia y las interacciones son más difusas. Se incluyen datos de NG Captura-C y 4C-seq para permitir la comparación con los mejores procedimientos disponibles anteriormente para definir perfiles de interacción uno frente a todos en genomas de mamíferos grandes. La Figura 4b muestra una sección de 20 kb de la Figura 4a e incluye datos de 20 kb de Hsieh et al. [15] generados a partir de S.cerevisiae.
[0116] La Figura 4c muestra una sección de 1 kb de la Figura 4b; esta resalta la resolución que se puede obtener con el procedimiento de la presente invención. Cuando se trazan las uniones de ligadura (a diferencia de una acumulación de lecturas completas que se muestra en los otros trazos), esto proporciona una resolución cercana a la de un solo par de bases. Esto resalta los posibles sitios de unión al factor de transcripción dentro de la región potenciadora de forma similar a los datos de “footprinting” por hipersensibilidad a la ADNasa I. En este experimento se analizaron otros 35 genes y estos datos muestran mejoras similares en la resolución.
Ejemplo 2: Efecto de la digitonina en la resolución
[0117] La Figura 5 muestra una comparación de MCC realizada con una preparación de células completas intactas en comparación con una preparación nuclear. La preparación de células completas muestra picos mucho más distintos con los elementos potenciadores en comparación con los datos generados a partir de los núcleos. Los datos de NG Captura-C y 4C-seq se incluyeron para comparar (ambos se generaron a partir de bibliotecas 3C generadas a partir de núcleos en lugar de células intactas).
Ejemplo Comparativo 3: Resolución obtenida usando el procedimiento Micro-C
[0118] Solo con fines comparativos, se hace referencia al procedimiento Micro-C de la técnica anterior (Hsieh et al., 2015 y 2016 [14, 15]). La Figura 4 muestra datos de Hsieh et al. [15] (Figura 2 complementaria) que muestra una región de 20 kb del cromosoma IX de levadura y la Figura 6 del presente documento (reproducida de la Figura 5C de Hsieh et al. [14]) muestra dos matrices de 20 kb x 20 kb que muestran los datos Micro-C de tipo salvaje y el ssu72-2. Estos ilustran el menor nivel de resolución obtenido en ese procedimiento Micro-C.
REFERENCIAS
[0119]
1. Wang, Z., Gerstein, M. y Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet 10, 57-63 (2009).
2. Mikkelsen, T.S. et al. Genome-wide maps of chromatin state in pluripotent and lineage-committed cells. Nature 448, 553-60 (2007).
3. Robertson, G. et al. Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing. Nat Methods 4, 651-7 (2007).
4. Hesselberth, J.R. et al. Global mapping of protein-DNA interactions in vivo by digital genomic footprinting. Nat Methods 6, 283-9 (2009).
5. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. y Greenleaf, W.J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods 10, 1213-8 (2013).
6. Dekker, J., Rippe, K., Dekker, M. y Kleckner, N. Capturing chromosome conformation. Science 295, 1306-11 (2002).
7. Tolhuis, B., Palstra, R.J., Splinter, E., Grosveld, F. y de Laat, W. Looping and interaction between hypersensitive sites in the active beta-globin locus. Mol Cell 10, 1453-65 (2002).
8. Noordermeer, D. et al. The dynamic architecture of Hox gene clusters. Science 334, 222-5 (2011).
9. Sanyal, A., Lajoie, B.R., Jain, G. y Dekker, J. The long-range interaction landscape of gene promoters. Nature 489, 109-13 (2012).
10. van de Werken, H.J. et al. Robust 4C-seq data analysis to screen for regulatory DNA interactions. Nat Methods 9, 969-72 (2012).
11. de Laat, W. y Duboule, D. Topology of mammalian developmental enhancers and their regulatory landscapes. Nature 502, 499-506 (2013).
12. Davies J.O.J., Oudelaar A.M., Higgs D.R. y Hughes J.R. How best to identify chromosomal interactions: a comparison of approaches. Nature Methods 2017, 14 (2), 125-134
13. Davies J.O.J., Telenius J.M., McGowan S., Roberts N.A., Taylor S., Higgs D.R. y Hughes J.R. 'Multiplexed analysis of chromosome conformation at vastly improved sensitivity', Nature Methods 2016; 13, 74-80
14. Hsieh T.H., Weiner A., Lajoie B., Dekker J., Friedman N., Rando O.J. Mapping Nucleosome Resolution Chromosome Folding in Yeast by Micro-C. Cell. 2 Jul. 2012; 162(1): 108-19.
15. Hsieh T.S. Fudenberg G., Goloborodko A., Rando O.J. Micro-C XL: assaying chromosome conformation from the nucleosome to the entire genome. Nat Methods. Dic 2016; 13(12):1009-1011.

Claims (15)

REIVINDICACIONES
1. Proceso para tratar cromatina en una población de células de mamífero, comprendiendo el proceso las etapas: (i) reticular la cromatina dentro de las células en una población de células de mamífero;
(ii) permeabilizar las membranas celulares externas y nucleares de las células de mamíferos; y
(iii) fragmentar la cromatina reticulada dentro de las células permeabilizadas utilizando nucleasa microcócica para producir mononucleosomas, en el que los enlazadores internucleosomales están al menos parcialmente intactos.
2. Proceso para tratar ácidos nucleicos en una población de células de mamífero, comprendiendo el proceso las etapas:
(i) inmovilizar los ácidos nucleicos dentro de las células en una población de células de mamífero;
(ii) permeabilizar las membranas celulares externas y las membranas nucleares de las células de mamíferos; y (iii) fragmentar los ácidos nucleicos inmovilizados dentro de las células con una nucleasa microcócica para producir fragmentos de ácidos nucleicos.
3. Proceso, según la reivindicación 2, en el que los ácidos nucleicos son cromatina que comprende nucleosomas que están unidos mediante enlazadores internucleosomales.
4. Proceso, según la reivindicación 2 o la reivindicación 3, en el que en la Etapa (i), los ácidos nucleicos se inmovilizan mediante reticulación de los ácidos nucleicos.
5. Proceso, según cualquiera de las reivindicaciones 2 a 4, en el que en la etapa (iii), los ácidos nucleicos inmovilizados se fragmentan de manera que se produzcan mononucleosomas, en el que los enlazadores internucleosomales están al menos parcialmente intactos.
6. Proceso, según cualquiera de las reivindicaciones 2 a 5, en el que el número de células en la población de células de mamífero es de 1 a 10.000, de 10.000 a 1 millón o de 1 millón a 100 millones.
7. Proceso para producir una biblioteca 3C, comprendiendo el proceso las etapas:
(a) tratar ácidos nucleicos mediante un proceso tal como se define en cualquiera de las reivindicaciones 2 a 6; (b) ligar los fragmentos de ácido nucleico para producir fragmentos de ácido nucleico ligados; y
(c) desinmovilizar (preferiblemente, desreticular) los fragmentos de ácido nucleico ligados.
8. Procedimiento para identificar regiones de ácido nucleico dentro de una muestra de ácido nucleico que interactúan entre sí, comprendiendo el procedimiento las etapas:
producir una biblioteca 3C mediante un proceso tal como se define en la reivindicación 7;
(d) fragmentar la biblioteca 3C para producir fragmentos de ácido nucleico;
(e) opcionalmente, añadir adaptadores de secuenciación a los extremos de los fragmentos de ácido nucleico y/o amplificar los fragmentos de ácido nucleico;
(f) poner en contacto los fragmentos de ácido nucleico con un ácido nucleico de reconocimiento que se une a un subgrupo de los fragmentos de ácido nucleico, en donde el ácido nucleico de reconocimiento está marcado con la primera mitad de un par de unión;
(g) aislar el subgrupo de fragmentos de ácido nucleico que han sido unidos por el ácido nucleico de reconocimiento utilizando la segunda mitad del par de unión;
(h) amplificar el subgrupo aislado de fragmentos de ácido nucleico;
(j) opcionalmente repetir las etapas (f), (g) y (h) una o más veces; y
(k) opcionalmente, secuenciar el subgrupo aislado amplificado de fragmentos de ácido nucleico para identificar regiones de ácido nucleico dentro de la muestra de ácido nucleico que interactúan entre sí.
9. Procedimiento, según la reivindicación 8, en el que el ácido nucleico de reconocimiento es un oligonucleótido de ADN.
10. Procedimiento, según la reivindicación 8 o la reivindicación 9, en el que la concentración del ácido nucleico de reconocimiento (preferiblemente, un oligonucleótido de ADN) es de 5 pM a 1 pM, preferiblemente, de 2,9 pM a 29 pM, y más preferiblemente, de 1 pM a 30 pM o de 300 nM a 30 pM.
11. Procedimiento, según la reivindicación 9 o la reivindicación 10, en el que el ácido nucleico de reconocimiento (preferiblemente un oligonucleótido de ADN) se selecciona, de manera que sea capaz de unirse dentro de una región empobrecida en nucleosoma de un promotor de un gen o ARN no codificante de interés, o de un elemento regulador (preferiblemente, un potenciador, represor o sitio de unión a CTCF) en los ácidos nucleicos.
12. Procedimiento, según la reivindicación 11, en el que el ácido nucleico de reconocimiento (preferiblemente, un oligonucleótido de ADN) se selecciona, de manera que sea capaz de unirse dentro de la región central de la región empobrecida en nucleosoma de un promotor de un gen o ARN no codificante de interés, o de un elemento regulador (preferiblemente un potenciador, represor o sitio de unión a CTCF) en los ácidos nucleicos.
13. Procedimiento, según cualquiera de las reivindicaciones 8-12, en el que la etapa (j) se repite 1, 2, 3, 4 o 5 veces.
14. Procedimiento para identificar perfiles de interacción específicos de alelo en regiones de ácidos nucleicos que contienen SNP, comprendiendo el procedimiento un procedimiento, tal como se define en cualquiera de las reivindicaciones 8-13, que incluye la secuenciación del subgrupo aislado amplificado de fragmentos de ácido nucleico para identificar perfiles de interacción específicos de alelos en regiones que contienen SNP.
15. Procedimiento para identificar una o más regiones de ácido nucleico que interactúan y que son indicativas de un estado patológico o trastorno particular, comprendiendo el procedimiento:
a) llevar a cabo un procedimiento, tal como se define en cualquiera de las reivindicaciones 8 a 13, sobre una muestra de ácido nucleico de células de mamífero obtenidas de un sujeto con un estado patológico o trastorno particular; b) cuantificar una frecuencia de interacción entre una primera región de ácido nucleico y una segunda región de ácido nucleico; y
c) comparar la frecuencia de interacción en la muestra de ácido nucleico del sujeto con dicho estado patológico o trastorno con la frecuencia de interacción en una muestra de ácido nucleico de control de un sujeto sano, de manera que una diferencia en la frecuencia de interacción en la muestra de ácido nucleico es indicativa de un estado patológico o trastorno particular.
ES20703827T 2019-02-05 2020-02-05 Proceso para la producción de una biblioteca de captura de conformación de cromatina (3C) Active ES2970085T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1901576.7A GB2581152A (en) 2019-02-05 2019-02-05 Production of 3C library
PCT/GB2020/050253 WO2020161485A1 (en) 2019-02-05 2020-02-05 Process for producing a chromatin conformation capture (3c) library

Publications (1)

Publication Number Publication Date
ES2970085T3 true ES2970085T3 (es) 2024-05-24

Family

ID=65951803

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20703827T Active ES2970085T3 (es) 2019-02-05 2020-02-05 Proceso para la producción de una biblioteca de captura de conformación de cromatina (3C)

Country Status (13)

Country Link
US (1) US20220098656A1 (es)
EP (2) EP4324933A3 (es)
JP (1) JP2022522623A (es)
KR (1) KR20210126056A (es)
CN (1) CN113396228A (es)
AU (1) AU2020217604A1 (es)
CA (1) CA3128298A1 (es)
DK (1) DK3921439T3 (es)
ES (1) ES2970085T3 (es)
GB (1) GB2581152A (es)
PT (1) PT3921439T (es)
SG (1) SG11202108315WA (es)
WO (1) WO2020161485A1 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022175674A1 (en) 2021-02-19 2022-08-25 Oxford University Innovation Limited Modified human cells and uses thereof in the treatment of immune-mediated diseases
CN113215141A (zh) * 2021-02-23 2021-08-06 华南农业大学 细菌hi-c基因组及质粒构象捕获方法
KR102698088B1 (ko) 2021-12-02 2024-08-27 연세대학교 산학협력단 Ctcf매개 전사체 응축 촉진용 조성물
CN116254323B (zh) * 2023-04-14 2023-07-25 中国农业科学院蔬菜花卉研究所 一种用于获取植物叶肉细胞染色质构象信息的方法及试剂盒
CN116536409B (zh) * 2023-06-25 2024-05-28 中国农业科学院农业基因组研究所 一种兼容宽范围ChIP DNA投入量的三维基因组检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003095608A2 (en) * 2001-05-11 2003-11-20 Stamatoyannopoulos, John, A. Dna microarrays comprising active chromatin elements and comprehensive profiling therewith
EP3754027A1 (en) * 2014-12-01 2020-12-23 The Broad Institute, Inc. Methods for altering or modulating spatial proximity between nucleic acids inside of a cell
GB201518843D0 (en) 2015-10-23 2015-12-09 Isis Innovation Method of analysing DNA sequences
AU2018285916A1 (en) * 2017-06-16 2020-01-16 The Jackson Laboratory Single nucleus and single molecule chromatin interaction assays
WO2019023214A1 (en) * 2017-07-25 2019-01-31 Massachusetts Institute Of Technology ATAC IN SITU SEQUENCING

Also Published As

Publication number Publication date
KR20210126056A (ko) 2021-10-19
SG11202108315WA (en) 2021-08-30
GB201901576D0 (en) 2019-03-27
EP4324933A2 (en) 2024-02-21
EP3921439B1 (en) 2023-10-25
DK3921439T3 (en) 2024-01-22
PT3921439T (pt) 2024-01-12
EP3921439A1 (en) 2021-12-15
GB2581152A (en) 2020-08-12
WO2020161485A1 (en) 2020-08-13
US20220098656A1 (en) 2022-03-31
AU2020217604A1 (en) 2021-09-23
CA3128298A1 (en) 2020-08-13
EP4324933A3 (en) 2024-03-20
JP2022522623A (ja) 2022-04-20
CN113396228A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
ES2970085T3 (es) Proceso para la producción de una biblioteca de captura de conformación de cromatina (3C)
JP7532455B2 (ja) 連続性を維持した転位
US20220356465A1 (en) Targeted transposition for use in epigenetic studies
US9890375B2 (en) Isolated oligonucleotide and use thereof in nucleic acid sequencing
US8263367B2 (en) Nucleic acid interaction analysis
US10934578B2 (en) Method of analysing DNA sequences
EP3207134B1 (en) Contiguity preserving transposition
CN105658813B (zh) 包括选择和富集步骤的染色体构象捕获方法
JP4644685B2 (ja) 塩基配列タグの調製方法
WO2019080940A1 (zh) 一种核酸复合体中核酸区段相互作用的分析方法
WO2014190214A1 (en) Targeted transposition for use in epigenetic studies
US20080124707A1 (en) Nucleic acid concatenation
Matteau et al. Precise identification of DNA-binding proteins genomic location by exonuclease coupled chromatin immunoprecipitation (ChIP-exo)
JP2009500033A (ja) 核酸付随分子及び修飾の局在化方法