ES2911613T3 - Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN - Google Patents

Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN

Info

Publication number
ES2911613T3
ES2911613T3 ES20183986T ES20183986T ES2911613T3 ES 2911613 T3 ES2911613 T3 ES 2911613T3 ES 20183986 T ES20183986 T ES 20183986T ES 20183986 T ES20183986 T ES 20183986T ES 2911613 T3 ES2911613 T3 ES 2911613T3
Authority
ES
Spain
Prior art keywords
methylation
tissue
haplotype
dna molecules
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20183986T
Other languages
English (en)
Inventor
Yuk-Ming Dennis Lo
Kwan Chee Chan
Rossa Wai Kwun Chiu
Peiyong Jiang
Kun Sun
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Application granted granted Critical
Publication of ES2911613T3 publication Critical patent/ES2911613T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método para analizar una muestra biológica de un organismo para identificar el origen de una aberración cromosómica, incluyendo la muestra biológica una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos, incluyendo un primer tipo de tejido, comprendiendo el método: analizar, mediante un sistema informático, una pluralidad de moléculas de ADN acelular de la muestra biológica, siendo la pluralidad de moléculas de ADN acelular al menos 1000 moléculas de ADN acelular, en donde el análisis de una molécula de ADN acelular incluye: identificar una ubicación de la molécula de ADN acelular en un genoma de referencia correspondiente al organismo; determinar un alelo respectivo de la molécula de ADN acelular; identificar que una primera región cromosómica presenta una aberración en el número de copias en el organismo en función de una primera cantidad de moléculas de ADN acelular que están ubicadas en la primera región cromosómica; determinar un primer haplotipo y un segundo haplotipo del organismo en la primera región cromosómica; identificar uno o más locus heterocigóticos de la primera región cromosómica, incluyendo cada locus heterocigótico un primer alelo correspondiente en el primer haplotipo y un segundo alelo correspondiente en el segundo haplotipo; identificar un primer conjunto de la pluralidad de moléculas de ADN acelular, cada una de las cuales: está ubicada en uno cualquiera del o los locus heterocigóticos, incluye el primer alelo correspondiente del locus heterocigótico e incluye al menos uno de N sitios genómicos, siendo N un número entero superior o igual a 2; medir los N primeros niveles de metilación de la mezcla en los N sitios genómicos utilizando el primer conjunto de la pluralidad de moléculas de ADN acelular; identificar un segundo conjunto de la pluralidad de moléculas de ADN acelular, cada una de las cuales: está ubicada en uno cualquiera del o los locus heterocigóticos, incluye el segundo alelo correspondiente del locus heterocigótico e incluye al menos uno de los N sitios genómicos; medir los N segundos niveles de metilación de la mezcla en los N sitios genómicos utilizando el segundo conjunto de la pluralidad de moléculas de ADN acelular; para cada tipo de tejido de los M tipos de tejido: determinar, mediante el sistema informático, una primera contribución fraccionaria correspondiente del tipo de tejido en la mezcla utilizando una desconvolución de un sistema lineal de ecuaciones creado a partir de los N primeros niveles de metilación de la mezcla y los niveles de metilación de los M tipos de tejido, siendo M un número entero mayor de uno; determinar, mediante el sistema informático, una segunda contribución fraccionaria correspondiente del tipo de tejido en la mezcla utilizando una desconvolución de un sistema lineal de ecuaciones creado a partir de los N segundos niveles de metilación de la mezcla y los niveles de metilación de los M tipos de tejido; y calcular un valor de separación correspondiente entre la primera contribución fraccionaria correspondiente y la segunda contribución fraccionaria correspondiente; e identificar el primer tipo de tejido como el origen de la aberración del número de copias en función de un primer valor de separación del primer tipo de tejido que tiene un valor máximo entre los valores separados correspondientes.

Description

DESCRIPCIÓN
Análisis de patrones de mutilación de haplotipos en tejidos en una mezcla de ADN
Previamente se ha demostrado que, a través del análisis del ADN plasmático de una mujer embarazada con un feto, los haplotipos maternos heredados por el feto se pueden deducir utilizando el proceso de análisis de dosis relativa de haplotipos (RHDO) (Lo et al. Sci Transl Med 2010; 2: 61ra91 y patente de los Estados Unidos 8467976). Se puede utilizar la información del haplotipo de la mujer embarazada. La información del haplotipo se puede obtener mediante el análisis familiar o un método para el análisis directo del haplotipo (p. ej., Fan et al. Nat Biotechnol 2011; 29: 51-57; Snyder et al. Nat Rev Genet 2015; 16: 344-358). Se pueden usar SNP que son heterocigóticos en la madre pero homocigóticos en el padre para el análisis RHDO.
Tal uso de SNP específicos puede limitar los locus que se pueden utilizar y, por lo tanto, limitar la cantidad de datos y la precisión. Tal uso de SNP específicos también puede limitar la utilidad clínica del método, ya que es posible que no se disponga de muestras de a Dn de otros miembros de la familia y los métodos para el análisis directo de haplotipos añadirían costes al análisis.
El documento US2014/080715A1 desvela la determinación de perfiles de metilación de diversos tejidos y muestras. El perfil de metilación se determina determinando un parámetro de tamaño de una distribución de tamaños de fragmentos de ADN, donde los valores de referencia para el parámetro de tamaño pueden usarse para determinar los niveles de metilación.
Xiaoqi Zheng et al. "MethylPurify: tumor purity deconvolution and differential methylation detection from single tumor DNA methylomes" Genome Biology, vol. 15, n.° 7, página 419 (2014) desvela un algoritmo estadístico que usa regiones con lecturas de bisulfito que muestran niveles de metilación discordantes para inferir la pureza del tumor a partir de muestras de tumor solo.
De acuerdo con un primer aspecto de la invención, se proporciona un método para analizar una muestra biológica de un organismo para identificar el origen de una aberración cromosómica, incluyendo la muestra biológica una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos, incluyendo un primer tipo de tejido, el método como se define en la reivindicación 1 de las reivindicaciones adjuntas.
Se describen realizaciones para determinar las contribuciones de diferentes tejidos a una muestra biológica que incluye una mezcla de moléculas de ADN acelular de diversos tipos de tejidos, p. ej., como ocurre en el plasma o suero y otros líquidos corporales. Las realizaciones pueden analizar los patrones de metilación de la mezcla de ADN (p. ej., los niveles de metilación en locus particulares) para un haplotipo particular y determinar las contribuciones fraccionarias de diversos tipos de tejidos a la mezcla de ADN, p. ej., de tipos de tejidos fetales o tipos de tejidos de órganos específicos que podrían tener un tumor. Dichas contribuciones fraccionarias determinadas para un haplotipo se pueden utilizar de diversas formas.
En algunas realizaciones, se pueden determinar dos contribuciones fraccionarias de un tipo de tejido utilizando los niveles de metilación de dos conjuntos de moléculas de ADN acelular de una muestra materna, siendo cada conjunto para uno diferente de dos haplotipos parentales de un progenitor de un feto, para una región cromosómica que se está analizando. En diversas implementaciones, la muestra materna puede ser la muestra de plasma o suero de una mujer embarazada de uno o más fetos. Las dos contribuciones fraccionarias se pueden utilizar para identificar una parte del genoma fetal. Por ejemplo, un valor de separación entre las dos contribuciones fraccionarias de tejido fetal puede indicar el genotipo fetal en un locus y puede indicar cuál de los dos haplotipos parentales hereda el feto. Por ejemplo, la contribución fraccionaria más alta puede indicar el haplotipo heredado y ambos se pueden heredar si el valor de separación es menor que un umbral; ambos haplotipos podrían heredarse cuando ambos progenitores comparten el haplotipo (o alelo para un genotipo) para la región que se analiza.
En algunas realizaciones, solo se determina una contribución fraccionaria de tejido fetal para un haplotipo. Cuando la contribución fraccionaria supera un valor de referencia (p. ej., según lo determinado a partir de otras muestras), se puede determinar que el feto ha heredado el haplotipo para la región que se analiza.
En algunas realizaciones, se pueden determinar dos niveles de metilación para dos conjuntos de moléculas de ADN acelular de una muestra materna, siendo cada conjunto para uno diferente de dos haplotipos parentales de un progenitor de un feto, como parte de la identificación de una parte del genoma fetal. Los dos niveles de metilación se pueden comparar entre sí para identificar qué haplotipo hereda el feto, p. ej., en función del nivel de metilación más bajo. Por ejemplo, un feto contribuye con moléculas de ADN acelular que están hipometiladas y una medición de un nivel de metilación más bajo de un haplotipo indica que el feto hereda ese haplotipo.
En algunas realizaciones, puede detectarse un desequilibrio de secuencia para una región cromosómica diana de un feto utilizando una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos. Pueden identificarse locus heterocigóticos diana para la región cromosómica diana que tiene un primer haplotipo diana y un segundo haplotipo diana que tiene alelos diferentes. Se puede determinar una primera contribución fraccionaria diana del tipo de tejido fetal en la mezcla utilizando los niveles de mutilación en los locus heterocigóticos diana, donde los niveles de mutilación se determinan utilizando un conjunto diana de moléculas de ADN acelular ubicadas en (es decir, cubriendo) los locus del primer haplotipo. De forma similar, se puede determinar una primera contribución fraccionaria de referencia del tipo de tejido fetal. Un valor de separación de la primera contribución fraccionaria diana y la primera contribución fraccionaria de referencia se puede comparar con un valor umbral para determinar si el feto tiene un desequilibrio de secuencias. Si las dos contribuciones fraccionarias son significativamente diferentes, entonces se puede determinar un desequilibrio de secuencias. El umbral específico que se utiliza puede depender del desequilibrio de secuencias específico (p. ej., una amplificación o una supresión) que se esté probando.
En algunas realizaciones, se puede usar una contribución fraccionaria de un primer haplotipo en un primer tipo de tejido para determinar si el primer tipo de tejido tiene una patología. El primer haplotipo puede tener una identificación específica para células sanas o para células anómalas. Por tanto, el primer haplotipo puede no estar presente en células sanas del organismo o estar presente en células sanas del organismo y no estar presente en células anómalas que puedan estar en la mezcla. Un valor de separación entre la primera contribución fraccionaria y una contribución fraccionaria de referencia se puede comparar con un valor umbral para determinar una clasificación de si el primer tipo de tejido tiene una patología.
En algunas realizaciones, el origen tisular de una aberración del número de copias se puede determinar utilizando la desconvolución de metilación. Puede identificarse una primera región cromosómica que presenta una aberración del número de copias. Se pueden determinar los haplotipos en la primera región cromosómica. Para cada uno de los M tipos de tejido, se puede determinar un valor de separación correspondiente entre la primera contribución fraccionaria correspondiente y la segunda contribución fraccionaria correspondiente. El tipo de tejido con el valor de separación más alto se puede identificar como el tejido de origen.
Otras realizaciones se refieren a sistemas y medios legibles por ordenador asociados con los métodos descritos en el presente documento.
Se puede obtener una mejor comprensión de la naturaleza y ventajas de las realizaciones de la presente invención con referencia a la siguiente descripción detallada y los dibujos adjuntos.
La FIG. 1 es un diagrama de flujo que ilustra un método de análisis de una mezcla de ADN de moléculas de ADN acelular para determinar las contribuciones fraccionarias de diversos tipos de tejidos a partir de los niveles de metilación según las realizaciones de la presente invención.
La FIG. 2 muestra un diagrama esquemático que muestra varias aplicaciones potenciales de la desconvolución de la metilación del ADN (p. ej., utilizando plasma) y sus aplicaciones según realizaciones de la presente invención.
La FIG. 3A muestra un gráfico de porcentajes de contribución de diferentes órganos al ADN plasmático para 15 mujeres embarazadas según realizaciones de la presente invención. La FIG. 3B muestra un gráfico 350 de una correlación entre las fracciones de ADN plasmático aportadas por la placenta deducidas de la desconvolución de metilación del ADN plasmático y las fracciones de ADN fetal deducidas usando alelos SNP específicos del feto según realizaciones de la presente invención.
La FIG. 4 muestra una tabla de porcentajes de contribución determinados a partir de un análisis de mapeo de tejidos de ADN plasmático entre mujeres embarazadas según realizaciones de la presente invención.
La FIG. 5 muestra gráficos de porcentajes de contribución de órganos distintos de la placenta mediante mapeo de tejidos de ADN plasmático y fracciones de ADN fetal basadas en alelos SNP específicos del feto según realizaciones de la presente invención.
La FIG. 6 muestra una tabla de porcentajes de contribución del análisis de mapeo de tejidos de ADN plasmático entre las personas de control sanas no embarazadas según realizaciones de la presente invención.
La FIG. 7 muestra una tabla de las contribuciones estimadas de diferentes órganos al ADN plasmático para 11 mujeres embarazadas y 4 personas sanas no embarazadas usando el primer conjunto de marcadores (con alta especificidad de órgano) según realizaciones de la presente invención.
La FIG. 8 muestra una tabla de las contribuciones estimadas de diferentes órganos al ADN plasmático para 11 mujeres embarazadas y 4 personas sanas no embarazadas usando el segundo conjunto de marcadores (con baja especificidad de órgano) según realizaciones de la presente invención.
La FIG. 9A es un gráfico que muestra la correlación entre la fracción de ADN fetal estimada (contribución de la placenta) y la fracción de ADN fetal determinada contando los alelos específicos del feto en las muestras de plasma materno.
La FIG. 9B es un gráfico que muestra la diferencia absoluta entre la estimación de los marcadores de metilación y la fracción de ADN fetal determinada por el recuento de alelos específicos del feto.
La FIG. 10A es un gráfico que muestra la contribución de la placenta al ADN plasmático deducida utilizando marcadores con diferentes criterios de selección según realizaciones de la presente invención. La FIG. 10B es un gráfico que muestra la precisión de la desconvolución del ADN plasmático usando marcadores con baja variabilidad (categoría i) y alta variabilidad (categoría ii) en el mismo tipo de tejido.
La FIG. 11A muestra un primer escenario en el que el feto ha heredado el alelo M de la madre y tiene un genotipo de MN en un locus particular según realizaciones de la presente invención. La FIG. 11B muestra un segundo escenario en el que el feto ha heredado el alelo N de la madre y tiene un genotipo de NN en un locus particular según realizaciones de la presente invención.
La FIG. 12A muestra una determinación de un haplotipo materno heredado por un feto utilizando desconvolución de metilación según realizaciones de la presente invención. La FIG. 12B muestra una ilustración del análisis de metilación del haplotipo paterno según realizaciones de la presente invención.
La FIG. 13 es un diagrama de flujo que ilustra un método 1300 para determinar una porción de un genoma fetal a partir de una muestra materna utilizando desconvolución de metilación según realizaciones de la presente invención.
La FIG. 14 es un diagrama de flujo que ilustra un método 1400 para determinar una porción de un genoma fetal a partir de una muestra materna utilizando los niveles de metilación según realizaciones de la presente invención.
La FIG. 15 muestra la detección de aneuploidía cromosómica basada en la desconvolución de haplotipos para haplotipos maternos según realizaciones de la presente invención.
La FIG. 16 muestra la detección de aneuploidía cromosómica basada en la desconvolución de haplotipos para haplotipos paternos según realizaciones de la presente invención.
La FIG. 17 es un diagrama de flujo de un método 1700 para detectar un desequilibrio de secuencias en una parte de un genoma fetal de un feto no nacido de una mujer embarazada utilizando una muestra biológica de la mujer embarazada según realizaciones de la presente invención.
La FIG. 18 muestra una ilustración de la desconvolución de haplotipos para la supervisión de trasplantes de órganos según realizaciones de la presente invención.
La FIG. 19 es un diagrama de flujo que ilustra un método de análisis de una muestra biológica de un organismo para detectar si un primer tipo de tejido tiene una patología asociada con un primer haplotipo según realizaciones de la presente invención.
La FIG. 20 muestra un gráfico de aberraciones del número de copias detectadas en el plasma de un paciente con CHC según realizaciones de la presente invención.
La FIG. 21 es un diagrama de flujo que ilustra un método de análisis de una muestra biológica de un organismo para identificar el origen de una aberración cromosómica según realizaciones de la presente invención.
La FIG. 22 muestra un diagrama de bloques de un sistema informático 10 ilustrativo que puede utilizarse con el sistema y los métodos según las realizaciones de la presente invención.
Un "metiloma" proporciona una medida de la cantidad de metilación del ADN en una pluralidad de sitios o locus en un genoma. El metiloma puede corresponder a todo el genoma, una parte sustancial del genoma o parte o partes relativamente pequeñas del genoma. Son ejemplos de metilomas de interés los metilomas de órganos (p. ej., metilomas de células cerebrales, huesos, los pulmones, el corazón, los músculos y los riñones, etc.) que pueden aportar ADN a un fluido corporal (p. ej., plasma, suero, sudor, saliva, orina, secreciones genitales, semen, líquido de las heces, líquido diarreico, líquido cefalorraquídeo, secreciones del tubo digestivo, líquido ascítico, líquido pleural, líquido intraocular, líquido de un hidrocele (p. ej., del testículo), líquido de un quiste, secreciones pancreáticas, secreciones intestinales, esputo, lágrimas, líquidos de aspiración de mama y tiroides, etc.). Los órganos pueden ser órganos trasplantados. El metiloma de un feto es otro ejemplo.
Un "metiloma de plasma" es un metiloma determinado a partir del plasma o suero de un animal (p. ej., un ser humano). El metiloma del plasma es un ejemplo de un metiloma acelular ya que el plasma y el suero incluyen ADN acelular. El metiloma plasmático también es un ejemplo de metiloma mixto, ya que es una mezcla de metiloma fetal/materno o metiloma tumoral/paciente o ADN procedente de diferentes tejidos u órganos o metiloma donante/receptor en el contexto del trasplante de órganos.
Un "sitio" (también denominado "sitio genómico") corresponde a un solo sitio, que puede ser una sola posición de base o un grupo de posiciones de bases correlacionadas, p. ej., un sitio CpG o un grupo más grande de posiciones de bases correlacionadas. Un "locus" puede corresponder a una región que incluye múltiples sitios. Un locus puede incluir solo un sitio, lo que haría que el locus fuera equivalente a un sitio en ese contexto.
El "índice de metilación" para cada sitio genómico (p. ej., un sitio CpG) puede referirse a la proporción de fragmentos de ADN (p. ej., determinados a partir de lecturas de secuencia o sondas) que muestran metilación en el sitio sobre el número total de lecturas que cubren ese sitio. Una "lectura" puede corresponder a información (p. ej., estado de metilación en un sitio) obtenida de un fragmento de ADN. Se puede obtener una lectura utilizando reactivos (p. ej., cebadores o sondas) que hibridan preferentemente con fragmentos de ADN de un estado de metilación particular. Normalmente, dichos reactivos se aplican después del tratamiento con un proceso que modifica o reconoce diferencialmente las moléculas de ADN dependiendo de su estado de metilación, p. ej., conversión de bisulfito, o enzima de restricción sensible a la metilación, o proteínas de unión a la metilación, o anticuerpos anti-metilcitosina, o técnicas de secuenciación de una sola molécula que reconocen metilcitosinas e hidroximetilcitosinas.
La "densidad de metilación" de una región puede referirse al número de lecturas en sitios dentro de la región que muestran metilación dividido por el número total de lecturas que cubren los sitios en la región. Los sitios pueden tener características específicas, p. ej., que son sitios CpG. Por tanto, la "densidad de metilación de CpG" de una región puede referirse al número de lecturas que muestran la metilación de CpG dividido por el número total de lecturas que cubren los sitios CpG en la región (p. ej., un sitio CpG particular, sitios CpG dentro de una isla de CpG o una región más grande). Por ejemplo, la densidad de metilación para cada grupo de 100 kb en el genoma humano se puede determinar a partir del número total de citosinas no convertidas después del tratamiento con bisulfito (que corresponde a la citosina metilada) en los sitios CpG como una proporción de todos los sitios CpG cubiertos por las lecturas de secuencia asignadas a la región de 100 kb. Este análisis también se puede realizar para otros tamaños de grupos, p. ej., 500 pb, 5 kb, 10 kb, 50 kb o 1 Mb, etc. Una región podría ser el genoma completo o un cromosoma o parte de un cromosoma (p. ej., un brazo cromosómico). El índice de metilación de un sitio CpG es el mismo que la densidad de metilación de una región cuando la región solo incluye ese sitio CpG. La "proporción de citosinas metiladas" puede referirse al número de sitios de citosina, "C", que se muestra que están metilados (por ejemplo, no convertidos después de la conversión con bisulfito) sobre el número total de restos de citosina analizados, es decir, incluyendo citosinas fuera del contexto de CpG, en la región. El índice de metilación, la densidad de metilación y la proporción de citosinas metiladas son ejemplos de "niveles de metilación". Aparte de la conversión de bisulfito, se pueden utilizar otros procesos conocidos por los expertos en la materia para consultar el estado de metilación de las moléculas de ADN, incluyendo, pero sin limitación, enzimas sensibles al estado de metilación (p. ej., enzimas de restricción sensibles a la metilación), proteínas de unión a metilación, secuenciación de una sola molécula utilizando una plataforma sensible al estado de metilación (p. ej., secuenciación de nanoporos (Schreiber et al. Proc Natl Acad Sci 2013; 110: 18910­ 18915) y por el análisis en tiempo real de una sola molécula de Pacific Biosciences (Flusberg et al. Nat Methods 2010; 7: 461-465)).
Un "perfil de metilación" (también denominado estado de metilación) incluye información relacionada con la metilación del ADN para una región. La información relacionada con la metilación del ADN puede incluir, pero sin limitación, un índice de metilación de un sitio CpG, una densidad de metilación de los sitios CpG en una región, una distribución de sitios CpG en una región contigua, un patrón o nivel de metilación para cada sitio CpG individual dentro de una región que contiene más de un sitio CpG y metilación distinta de CpG. Un perfil de metilación de una parte sustancial del genoma puede considerarse equivalente al metiloma. La "metilación del ADN" en los genomas de mamíferos normalmente se refiere a la adición de un grupo metilo al carbono 5' de los restos de citosina (es decir, 5-metilcitosinas) entre los dinucleótidos CpG. La metilación del ADN puede producirse en citosinas en otros contextos, por ejemplo, CHG y CHH, donde H es adenina, citosina o timina. La metilación de citosina también puede ser en forma de 5-hidroximetilcitosina. También se ha informado de metilación sin citosina, tal como N6-metiladenina.
La "secuenciación con determinación de metilación" se refiere a cualquier método de secuenciación que permita determinar el estado de metilación de una molécula de ADN durante un proceso de secuenciación, incluyendo, pero sin limitación, secuenciación con bisulfito o secuenciación precedida por digestión con enzimas de restricción sensibles a la metilación, inmunoprecipitación usando anticuerpo anti-metilcitosina o proteína de unión a metilación, o secuenciación de una sola molécula que permite dilucidar el estado de metilación.
Un "tejido" corresponde a un grupo de células que se agrupan como una unidad funcional. En un mismo tejido pueden encontrarse más de un tipo de células. Los distintos tipos de tejidos pueden estar formados por diferentes tipos de células (p. ej., hepatocitos, células alveolares o células sanguíneas), pero también pueden corresponder a tejidos de organismos diferentes (madre frente a feto) o a células sanas frente a células tumorales. Los "tejidos de referencia" corresponden a los tejidos utilizados para determinar los niveles de metilación específicos de tejido. Se pueden utilizar múltiples muestras de un mismo tipo de tejido de diferentes individuos para determinar un nivel de metilación específico de tejido para ese tipo de tejido.
Una "muestra biológica" se refiere a cualquier muestra que se tome de un sujeto (p. ej., un ser humano, tal como una mujer embarazada, una persona con cáncer o una persona que se sospecha que tiene cáncer, un receptor de un trasplante de órganos o un sujeto que se sospecha que padece una enfermedad que afecta a un órgano (p. ej., el corazón en el infarto de miocardio, o el cerebro en el ictus, o el sistema hematopoyético en la anemia) y que contiene una o más moléculas de ácido nucleico de interés. La muestra biológica puede ser un líquido corporal, tal como sangre, plasma, suero, orina, secreción vaginal, líquido de un hidrocele (p. ej., del testículo), o líquidos de lavados vaginales, líquido pleural, líquido ascítico, líquido cefalorraquídeo, saliva, sudor, lágrimas, esputo, líquido de lavado broncoalveolar, etc. También pueden utilizarse muestras de heces. En diversas realizaciones, la mayoría del ADN en una muestra biológica que se ha enriquecido con ADN acelular (p. ej., una muestra de plasma obtenida a través de un protocolo de centrifugación) puede estar sin células (a diferencia de las células), p. ej., más del 50 %, 60 %, 70 %, 80 %, 90 %, 95 % o 99 %. El protocolo de centrifugación puede incluir 3000 g x 10 minutos, obtener la parte fluida y volver a centrifugar a 30000 g durante otros 10 minutos para eliminar las células residuales.
La expresión "nivel de cáncer" puede referirse a si existe el cáncer (es decir, presencia o ausencia), un estadio de un cáncer, un tamaño del tumor, si hay metástasis, la carga tumoral total del cuerpo y/u otra medida de la gravedad de un cáncer (p. ej., la recaída del cáncer). El nivel de cáncer puede ser un número u otros indicios, tales como símbolos, letras del alfabeto y colores. El nivel podría ser cero. El nivel de cáncer también incluye las afecciones (estados) premalignas o precancerosas asociadas a mutaciones o a un número de mutaciones. El nivel de cáncer puede usarse de diversas maneras. Por ejemplo, el cribado puede comprobar si el cáncer está presente en una persona que no se sabe que haya tenido cáncer con anterioridad. La evaluación puede investigar a una persona a la que se le ha diagnosticado un cáncer para supervisar la evolución del mismo a lo largo del tiempo, estudiar la eficacia de las terapias o para determinar el pronóstico. En una realización, el pronóstico puede expresarse como la probabilidad de que un paciente muera de cáncer o la probabilidad de que el cáncer progrese después de una duración o tiempo específicos, o la probabilidad de que el cáncer metastatice. La detección puede significar "cribado" o puede significar comprobar si alguien, con características indicativas de cáncer (p. ej., síntomas u otras pruebas positivas), tiene cáncer.
La expresión "desequilibrio de secuencia" de una región cromosómica puede referirse a cualquier desviación significativa en una cantidad de moléculas de ADN acelular de la región cromosómica en relación con un valor esperado, si el organismo estuviera sano. Por ejemplo, una región cromosómica puede presentar una amplificación o una supresión en un tejido determinado, lo que da lugar a un desequilibrio de secuencia para la región cromosómica en una mezcla de ADN que contiene ADN del tejido, mezclada con ADN de otros tejidos. Como ejemplos, el valor esperado se puede obtener de otra muestra o de otra región cromosómica que se supone normal (p. ej., una cantidad representativa de dos copias para un organismo diploide). Una región cromosómica puede estar compuesta por múltiples subregiones discontinuas.
Un "tipo" para un locus genómico (marcador) corresponde a atributos específicos para un locus entre los tipos de tejidos. La descripción se refiere principalmente a locus de tipo I y locus de tipo II, cuyas propiedades se detallan a continuación. Un locus de un tipo dado puede tener una variación estadística específica en los niveles de metilación entre los tipos de tejido. Una "categoría" para un locus genómico (marcador) corresponde a una variación específica en los niveles de metilación de un locus entre diferentes individuos para un mismo tipo de tejido. Un conjunto de locus genómicos (marcadores) puede estar compuesto por cualquier número de locus de diversos tipos y/o categorías. Por tanto, un conjunto de locus corresponde a locus seleccionados para una medida particular y no connota ninguna propiedad particular de los locus en el conjunto.
Un "valor de separación" corresponde a una diferencia o una relación entre dos valores, p. ej., dos contribuciones fraccionarias o dos niveles de metilación. El valor de separación puede ser una simple diferencia o relación. El valor de separación puede incluir otros factores, p. ej., factores multiplicativos. Como otros ejemplos, se puede utilizar una diferencia o relación de funciones de los valores, p. ej., una diferencia o relación de los logaritmos neperianos (In) de los dos valores. Un valor de separación puede incluir una diferencia y una relación.
El término "clasificación", como se usa en el presente documento, se refiere a cualquier número y uno o más caracteres distintos que se asocian a una propiedad particular de una muestra. Por ejemplo, un símbolo "+" (o la palabra "positivo") podría significar que una muestra está clasificada como con supresiones o amplificaciones. La clasificación puede ser binaria (p. ej., positiva o negativa) o tener más niveles de clasificación (p. ej., una escala de 1 a 10 o de 0 a 1). La expresión "valor de corte" y "umbral" se refieren a un número predeterminado utilizado en una operación. Un valor umbral puede ser un valor por encima o por debajo del cual se aplica una determinada clasificación. Cualquiera de estas expresiones puede utilizarse en cualquiera de estos contextos.
Las diferencias de metilación entre tipos de tejido (p. ej., tejidos fetales, hígado, etc.) en una mezcla de ADN (p. ej., plasma) pueden usarse para diferenciar las propiedades de los haplotipos en un tipo de tejido específico. Por ejemplo, los niveles de metilación de dos haplotipos maternos en el plasma de una mujer embarazada pueden usarse para determinar qué haplotipo hereda el feto de la madre. Como otro ejemplo, los niveles de metilación de dos haplotipos en tejido fetal pueden utilizarse para detectar un desequilibrio de secuencias (p. ej., una aneuploidía) en el feto. También se pueden analizar otros tipos de tejidos, p. ej., para detectar una patología en un tipo de tejido específico. También se puede determinar el tipo de tejido a partir del cual se origina una aberración del número de copias.
Algunas realizaciones pueden determinar porcentajes de ADN acelular en plasma (u otra mezcla de ADN) de diversos tipos de tejido usando niveles de metilación conocidos en determinados sitios genómicos para los tipos de tejido específicos. Por ejemplo, los niveles de metilación en los sitios genómicos se pueden medir para una muestra de hígado y estos niveles de mutilación específicos de tejido se pueden usar para determinar cuánto ADN acelular en la mezcla proviene del hígado. Los niveles de mutilación se pueden medir para los tipos de tejido que proporcionan contribuciones sustanciales a la mezcla de ADN, de modo que se puede justificar un predominio (p. ej., más del 90 %, 95 % o 99 %) de la mezcla de ADN acelular. Dichas otras muestras pueden incluir, pero sin limitación, algunos o todos los siguientes: pulmón, colon, intestinos delgados, páncreas, glándulas suprarrenales, esófago, tejidos adiposos, corazón y cerebro.
Se puede utilizar un proceso de desconvolución para determinar las contribuciones fraccionarias (p. ej., porcentaje) para cada uno de los tipos de tejido para los que se conocen los niveles de metilación específicos de tejido. En algunas realizaciones, se puede crear un sistema lineal de ecuaciones a partir de los niveles de metilación específicos de tejido conocidos y los niveles de metilación de la mezcla en los sitios genómicos especificados, y se pueden determinar las contribuciones fraccionarias que mejor se aproximan a los niveles de metilación de la mezcla medidos (p. ej., usando mínimos cuadrados).
Una vez determinadas las contribuciones fraccionarias, las contribuciones fraccionarias se pueden utilizar para diversos fines. Por ejemplo, las diferencias en las contribuciones fraccionarias del tejido fetal se pueden usar para determinar qué haplotipo se hereda de un progenitor. Los alelos en uno o más locus heterocigóticos pueden determinarse para cada uno de dos haplotipos parentales. El ADN acelular en uno o más locus heterocigóticos se puede utilizar para determinar dos contribuciones fraccionarias: una para cada haplotipo. Por ejemplo, las moléculas de ADN acelular que tienen alelos de un primer haplotipo se pueden utilizar para determinar una primera contribución fraccionaria y las moléculas de ADN acelular que tienen alelos de un segundo haplotipo se pueden utilizar para determinar una segunda contribución fraccionaria. El haplotipo heredado corresponderá a la mayor contribución fraccionaria de tejido fetal.
Además, un haplotipo heredado tendrá niveles de metilación más bajos debido a la hipometilación general del ADN acelular fetal. Se pueden comparar los niveles de metilación de los dos haplotipos y el haplotipo con el nivel de metilación más bajo se puede identificar como el haplotipo heredado.
Como otro ejemplo, se puede detectar un desequilibrio de secuencia en una región cromosómica diana de un feto. Se puede determinar una contribución fraccionaria diana del tipo de tejido fetal en la mezcla para un primer haplotipo en la región cromosómica diana. De forma similar, se puede determinar una contribución fraccionaria de referencia del tipo de tejido fetal para una región cromosómica de referencia. Un valor de separación entre las dos contribuciones se puede comparar con un valor de umbral para determinar si el feto tiene un desequilibrio de secuencias (p. ej., una aneuploidía).
Como otro ejemplo, un primer haplotipo puede tener una identificación específica para células sanas o para células anómalas. Un valor de separación entre la contribución fraccionaria determinada para el primer haplotipo y una contribución fraccionaria de referencia se puede comparar con un valor umbral para determinar una clasificación de si el primer tipo de tejido tiene una patología. Como ejemplos, el primer haplotipo puede ser de un órgano trasplantado o de un tumor, o estar solo en células sanas y no en un órgano trasplantado o en un tumor. La patología puede ser si el órgano trasplantado es rechazado o si un tumor aumenta de tamaño o se ha metastatizado (p. ej., después de una cirugía no se extirpó todo el tumor).
Como otro ejemplo, el origen tisular de una aberración del número de copias se puede determinar utilizando la desconvolución de metilación. Puede identificarse una primera región cromosómica que presenta una aberración del número de copias. Para cada uno de los M tipos de tejido, se puede determinar un valor de separación correspondiente entre las contribuciones fraccionarias de los dos haplotipos en la primera región cromosómica. El tipo de tejido con el valor de separación más alto se puede identificar como el tejido de origen.
Primero se describe la desconvolución de metilación y después se describe la selección de marcadores de metilación y la precisión de la desconvolución de metilación. A continuación, se describe el uso de las contribuciones fraccionarias para determinar parte de un genoma fetal.
I. COMPOSICIÓN DE LA MEZCLA DE ADN POR DESCONVOLUCIÓN DE METILACIÓN
Diferentes tipos de tejido pueden tener diferentes niveles de metilación para un sitio genómico. Estas diferencias se pueden utilizar para determinar las contribuciones fraccionarias de ADN de los distintos tipos de tejido en una mezcla. Por tanto, la composición de una mezcla de ADN se puede determinar mediante un análisis de patrón de metilación específico de tejido. En los ejemplos a continuación se analizan las densidades de metilación, pero pueden utilizarse otros niveles de metilación.
A. Sitio genómico único
El principio de desconvolución de metilación se puede ilustrar usando un solo sitio genómico de metilación (marcador de metilación) para determinar la composición de una mezcla de ADN de un organismo. Se supone que el tejido A está completamente metilado para el sitio genómico, es decir, densidad de metilación (DM) del 100 %, y el tejido B está completamente desmetilado, es decir, DM de 0 %. En este ejemplo, la densidad de metilación se refiere al porcentaje de restos de citosina con el contexto de que los dinucleótidos CpG están metilados en la región de interés.
Si la mezcla de ADN C está compuesta por tejido A y tejido B y la densidad de metilación total de la mezcla de ADN C es del 60 %, se puede deducir la contribución proporcional de los tejidos A y B a la mezcla de ADN C según la siguiente fórmula:
DMc = DMa X a DMb X b,
donde DMa, DMb, DMc representan la DM de los tejidos A, tejido B y la mezcla de ADN C, respectivamente; y a y b son las contribuciones proporcionales de los tejidos A y B a la mezcla de ADN C. En este ejemplo particular, se supone que los tejidos A y B son los dos únicos constituyentes de la mezcla de ADN. Por lo tanto, a b = 100 %. Por tanto, se calcula que los tejidos A y B aportan el 60 % y el 40 %, respectivamente, a la mezcla de ADN.
Las densidades de metilación en el tejido A y el tejido B se pueden obtener a partir de muestras del organismo o de muestras de otros organismos del mismo tipo (p. ej., otros seres humanos, potencialmente de una misma subpoblación). Si se utilizan muestras de otros organismos, un análisis estadístico (p. ej., promedio, mediana, media geométrica) de las densidades de metilación de las muestras de tejido A se puede utilizar para obtener la densidad de metilación DMa, y de manera similar para DMb .
El sitio genómico se puede elegir para que tenga una variación interindividual mínima, por ejemplo, menos que una cantidad absoluta específica de variación, o estar dentro de una parte más baja de sitios genómicos probados. Por ejemplo, para la parte más baja, las realizaciones pueden seleccionar solo sitios genómicos que tengan el 10 % más bajo de variación entre un grupo de sitios genómicos probados. Los otros organismos se pueden tomar de personas sanas, así como las que tienen afecciones fisiológicas particulares (p. ej., mujeres embarazadas o personas de diferentes edades o personas de un sexo en particular), que pueden corresponder a una subpoblación particular que incluye el organismo actual que se prueba.
Los otros organismos de una subpoblación también pueden tener otras afecciones patológicas (p. ej., pacientes con hepatitis o diabetes, etc.). Dicha subpoblación puede tener patrones de metilación específicos de tejido alterados para diversos tejidos. El patrón de metilación del tejido con dicha afección de enfermedad se puede utilizar para el análisis de desconvolución además de usar el patrón de metilación del tejido normal. Este análisis de desconvolución puede ser más preciso cuando se prueba un organismo de dicha subpoblación con esas afecciones. Por ejemplo, un hígado cirrótico o un riñón fibrótico pueden tener un patrón de metilación diferente en comparación con un hígado normal y un riñón normal, respectivamente. Por tanto, si se exploró a un paciente con cirrosis hepática para detectar otras enfermedades, puede ser más preciso incluir un hígado cirrótico como uno de los candidatos que aportan ADN al ADN plasmático, junto con los tejidos sanos de otros tipos de tejidos.
B. Múltiples sitios genómicos
Se pueden usar más sitios genómicos (p. ej., 10 o más) para determinar la constitución de la mezcla de ADN cuando hay más tejidos candidatos potenciales. La precisión de la estimación de la composición proporcional de la mezcla de ADN depende de varios factores, incluido el número de sitios genómicos, la especificidad de los sitios genómicos (también denominados "sitios") para los tejidos específicos y la variabilidad de los sitios entre diferentes tejidos candidatos y entre diferentes individuos utilizados para determinar los niveles específicos de tejido de referencia. La especificidad de un sitio para un tejido se refiere a la diferencia en la densidad de metilación de los sitios genómicos entre el tejido particular y otros tipos de tejido.
Cuanto mayor sea la diferencia entre sus densidades de metilación, más específico sería el sitio para el tejido en particular. Por ejemplo, si un sitio está completamente metilado en el hígado (densidad de metilación = 100 %) y está completamente desmetilado en todos los demás tejidos (densidad de metilación = 0 %), este sitio sería muy específico para el hígado. Por otro lado, la variabilidad de un sitio entre diferentes tejidos puede ser reflejada por, por ejemplo, pero sin limitación, el intervalo o la desviación típica de las densidades de metilación del sitio en diferentes tipos de tejido. Un mayor intervalo o una desviación típica más alta permitirían una determinación matemática más precisa y exacta de las contribuciones relativas de los diferentes órganos a la mezcla de ADN. Los efectos de estos factores sobre la precisión de la estimación de la contribución proporcional de los tejidos candidatos a la mezcla de ADN se ilustran en las secciones posteriores de la presente solicitud.
Aquí, se usan ecuaciones matemáticas para ilustrar la deducción de la contribución proporcional de diferentes órganos a la mezcla de ADN. La relación matemática entre las densidades de metilación de los diferentes sitios en la mezcla de ADN y las densidades de metilación de los sitios correspondientes en diferentes tejidos se puede expresar como:
Figure imgf000008_0001
donde representa la densidad de metilación del sitio i en la mezcla de ADN; pk representa la contribución proporcional del tejido k a la mezcla de ADN; DMk representa la densidad de mutilación del sitio i en el tejido k. Cuando el número de sitios es igual o mayor que el número de órganos, se pueden determinar los valores de la pk individual. Las densidades de metilación específicas de tejido se pueden obtener de otros individuos y los sitios se pueden elegir para que tengan una variación interindividual mínima, como se ha mencionado anteriormente.
Se pueden incluir criterios adicionales en el algoritmo para mejorar la precisión. Por ejemplo, la contribución agregada de todos los tejidos puede limitarse al 100 %, es decir,
£kpk = 100 %
Asimismo, puede ser necesario que ninguna de las contribuciones de los órganos sean negativas:
Pk > 0,V k
Debido a variaciones biológicas, el patrón de metilación general observado puede no ser completamente idéntico al patrón de metilación deducido a partir de la metilación de los tejidos. En tal circunstancia, sería necesario un análisis matemático para determinar la contribución proporcional más probable de los tejidos individuales. En este sentido, la diferencia entre el patrón de metilación observado en el ADN y el patrón de metilación deducido de los tejidos se indica mediante W.
W = 0 - ^ ( p fex M , )
k
donde O es el patrón de metilación observado para la mezcla de ADN y Mk es el patrón de metilación del tejido individual k. pk es la contribución proporcional del tejido k a la mezcla de ADN. El valor más probable de cada pk se puede determinar minimizando W, que es la diferencia entre los patrones de metilación observados y deducidos. Esta ecuación se puede resolver utilizando algoritmos matemáticos, por ejemplo, pero sin limitación, mediante el uso de la programación cuadrática, regresión lineal/no lineal, algoritmo de maximización de expectativas (ME), algoritmo de máxima verosimilitud, estimación máxima a posteriori y método de mínimos cuadrados.
C. Método de desconvolución de metilación
Como se ha descrito anteriormente, una muestra biológica que incluye una mezcla de moléculas de ADN acelular de un organismo se puede analizar para determinar la composición de la mezcla, específicamente las contribuciones de diferentes tipos de tejido. Por ejemplo, se puede determinar el porcentaje de contribución de las moléculas de ADN acelular del hígado. Estas medidas de los porcentajes de contribución en la muestra biológica se pueden utilizar para realizar otras mediciones de la muestra biológica, p. ej., identificaciones de dónde está ubicado un tumor, como se describe en secciones posteriores.
La FIG. 1 es un diagrama de flujo que ilustra un método 100 de análisis de una mezcla de ADN de moléculas de ADN acelular para determinar las contribuciones fraccionarias de diversos tipos de tejidos a partir de los niveles de metilación según las realizaciones de la presente invención. Una muestra biológica incluye una mezcla de moléculas de ADN acelular de M tipos de tejidos. La muestra biológica puede ser una cualquiera de diversos ejemplos, p. ej., como se menciona en el presente documento. El número M de tipos de tejido es mayor de dos. En diversas realizaciones, M puede ser 3, 7, 10, 20 o más, o cualquier número intermedio. El método 100 puede realizarse al menos parcialmente usando un sistema informático, al igual que otros métodos descritos en el presente documento.
En el bloque 110, se identifican N sitios genómicos para el análisis. Los N sitios genómicos pueden tener diversos atributos, p. ej., como se describe con más detalle en la sección II, que describe los sitios genómicos de tipo I y tipo II. Como ejemplos, los N sitios genómicos pueden incluir solo sitios de tipo I o tipo II, o una combinación de ambos. Los sitios genómicos se pueden identificar según los análisis de una o más muestras, p. ej., según datos obtenidos de bases de datos sobre los niveles de metilación medidos en diversos individuos.
Se pueden seleccionar sitios genómicos específicos para proporcionar el nivel deseado de precisión. Por ejemplo, se pueden usar locus que tienen al menos un umbral de variabilidad, en lugar de usar solo locus que son específicos para un tipo de tejido. Se puede seleccionar un primer conjunto (p. ej., 10) de los sitios genómicos de modo que cada uno tenga un coeficiente de variación de los niveles de metilación de al menos 0,15 entre M tipos de tejido y de modo que cada uno tenga una diferencia entre un nivel de metilación máximo y mínimo para los M tipos de tejido que supera 0,1 para una o más muestras adicionales. Es posible que este primer conjunto de sitios genómicos no tenga una identificación de metilación específica para un tipo de tejido específico, p. ej., solo o predominantemente metilado en el tipo de tejido específico. Dicho primer conjunto se denomina sitios de tipo II. Estos sitios genómicos se pueden usar en combinación con sitios genómicos que tienen una identificación específica, que se denominan sitios de tipo I.
El uso de los sitios de tipo II puede garantizar que los sitios genómicos abarquen todo el espacio de niveles de mutilación entre los tipos de tejido, proporcionando de este modo una mayor precisión sobre los sitios de tipo I. El simple uso de más sitios de tipo I proporciona vectores de base redundante para el espacio de metilación (es decir, más sitios genómicos que tienen el mismo patrón que otros sitios), mientras que la adición de otros sitios genómicos cuyos niveles de metilación tienen diversos valores en diferentes tejidos añade nuevos vectores básicos para diferenciar contribuciones fraccionarias a través del sistema lineal de ecuaciones.
En algunas realizaciones, al menos 10 de los N sitios genómicos tienen cada uno un coeficiente de variación de los niveles de metilación de al menos 0,15 entre los M tipos de tejido. Los al menos 10 sitios genómicos también pueden tener cada uno una diferencia entre un nivel de metilación máximo y mínimo para los M tipos de tejido que supera 0,1. Estas propiedades de metilación de los locus genómicos se pueden medir para una muestra o un conjunto de muestras. El conjunto de muestras puede ser para una subpoblación de organismos que incluye el organismo actual que se esté analizando, p. ej., una subpoblación que tiene un rasgo particular que se comparte con el organismo actual. Estas otras muestras pueden denominarse tejidos de referencia y pueden usarse diferentes tejidos de referencia de diferentes muestras.
En el bloque 120, se obtienen N niveles de metilación específicos de tejido en los N sitios genómicos para cada uno de los M tipos de tejido. N es mayor o igual que M, de modo que los niveles de metilación específicos de tejido puedan utilizarse en la desconvolución para determinar los porcentajes fraccionarios. Los niveles de metilación específicos de tejido pueden formar una matriz A de dimensiones N por M. Cada columna de la matriz A puede corresponder a un patrón de metilación para un tipo de tejido particular, donde el patrón es de niveles de metilación en los N sitios genómicos.
En diversas realizaciones, los patrones de metilación específicos de tejido se pueden recuperar de bases de datos públicas o estudios previos. En ejemplos en el presente documento, los datos de metilación de neutrófilos y linfocitos B se descargaron del Gene Expression Omnibus (Hodges et al. Mol Cell 2011; 44: 17-28). Los patrones de metilación de otros tejidos (hipocampo, hígado, pulmón, páncreas, aurícula, colon (incluidas sus diversas partes, p. ej., colon sigmoide, colon transverso, colon ascendente, colon descendente), glándula suprarrenal, esófago, intestino delgado y linfocitos T CD4) se descargaron del proyecto RoadMap Epigenomics (Ziller et al. Nature 2013; 500: 477-81). Los patrones de metilación de la capa leucocítica, placenta, tumores y datos de plasma procedían de informes publicados (Lun et al. Clin Chem. 2013; 59: 1583-94; Chan et al. Proc Natl Acad Sci USA. 2013; 110: 18761-8). Estos patrones de metilación específicos de tejido se pueden utilizar para identificar los N sitios genómicos que se van a utilizar en el análisis de desconvolución.
En el bloque 130, se recibe la muestra biológica que incluye una mezcla de moléculas de ADN acelular de los M tipos de tejidos. La muestra biológica puede obtenerse del organismo del paciente de diversas formas. La manera de obtener dichas muestras puede ser no invasiva o invasiva. Los ejemplos de muestras obtenidas de forma no invasiva incluyen determinados tipos de fluidos (p. ej., plasma, suero u orina) o heces. Por ejemplo, el plasma incluye moléculas de ADN acelular de muchos tejidos de órganos y, por tanto, es útil para analizar muchos órganos a través de una muestra.
En el bloque 140, las moléculas de ADN acelular de la muestra biológica se analizan para identificar sus ubicaciones en un genoma de referencia correspondiente al organismo. Por ejemplo, las moléculas de ADN acelular pueden secuenciarse para obtener lecturas de secuencia, y las lecturas de secuencia pueden cartografiarse (alinearse) con el genoma de referencia. Si el organismo fuera un ser humano, el genoma de referencia sería un genoma humano de referencia, potencialmente de una subpoblación particular. Como otro ejemplo, las moléculas de ADN acelular pueden analizarse con diferentes sondas (p. ej., tras la PCR u otro tipo de amplificación), donde cada sonda corresponde a una ubicación genómica, que puede abarcar un sitio heterocigótico y uno o más sitios CpG, como se describe a continuación.
Se puede analizar una cantidad estadísticamente significativa de moléculas de ADN acelular con el fin de proporcionar una desconvolución precisa para determinar las contribuciones fraccionarias de los M tipos de tejido. En algunas realizaciones, se analizan al menos 1000 moléculas de ADN acelular. En otras realizaciones, se pueden analizar al menos 10000 o 50000 o 100000 o 500000 o 1000000 o 5000000 de moléculas de ADN acelular o más. El número total de moléculas que se van a analizar puede depender de M y N, y de la precisión deseada (exactitud). En diversos ejemplos, el número total de análisis de ADN acelular puede ser inferior a 500000, un millón, dos millones, cinco millones, diez millones, 20 millones o 50 millones.
En el bloque 150, los N niveles de metilación de la mezcla se miden en los N sitios genómicos utilizando moléculas de ADN acelular que están ubicadas en uno cualquiera de los N sitios genómicos del genoma de referencia. Una molécula de ADN se puede identificar como ubicada en un sitio o locus genómico por una o más bases de la molécula de ADN correspondientes a una o más posiciones de bases del sitio o locus genómico. Por tanto, la secuencia de la molécula de ADN abarcaría una o más posiciones de bases del sitio o locus genómico. Esta información se puede determinar en función de las ubicaciones determinadas en el bloque 140. Dicha identificación de una molécula de ADN ubicada en un sitio de un locus puede usarse para cualquier bloque similar de métodos descritos en el presente documento.
Los N niveles de mutilación de la mezcla se refieren a los niveles de mutilación en la mezcla de la muestra biológica. A modo de ejemplo, si una molécula de ADN acelular de la mezcla se ubica en uno de los N sitios genómicos, entonces se puede incluir un índice de metilación para esa molécula en el sitio en una densidad de metilación general para ese sitio. Los N niveles de metilación de la mezcla pueden formar un vector de metilación b de longitud N, donde b corresponde a los valores observados a partir de los cuales se puede determinar la contribución fraccionaria de cada tipo de tejido correspondiente.
En una realización, los niveles de metilación de los sitios genómicos en la mezcla de ADN se pueden determinar utilizando la secuenciación con bisulfito del genoma completo. En otras realizaciones, los niveles de metilación de los sitios CpG se pueden determinar mediante el análisis de micromatrices de metilación, tal como el sistema Illumina HumanMethylation450, o mediante el uso de inmunoprecipitación de metilación (p. ej., mediante un anticuerpo antimetilcitosina) o el tratamiento con una proteína de unión a la metilación seguido de análisis de micromatrices o secuenciación de ADN, o mediante el uso de un tratamiento con enzimas de restricción sensibles a la metilación seguido de micromatrices o secuenciación de ADN, o mediante el uso de secuenciación con determinación de la metilación, p. ej., usando un método de secuenciación de una sola molécula (p. ej., mediante una secuenciación de nanoporos (Schreiber et al. Proc Natl Acad Sci 2013; 110: 18910-18915) o por el análisis en tiempo real de una sola molécula de Pacific Biosciences (Flusberg et al. Nat Methods 2010; 7: 461-465)). Los niveles de metilación específicos de tejido se pueden medir de la misma manera. En otras realizaciones más, se pueden utilizar otros métodos, por ejemplo, pero sin limitación, secuenciación de bisulfito dirigida, PCR específica de metilación, secuenciación con determinación de metilación no basada en bisulfito (p. ej., mediante plataformas de secuenciación de una sola molécula (Powers et al. Efficient and accurate whole genome assembly and methylome profiling of E. coli. BMC Genomics. 2013; 14: 675)) para el análisis del nivel de metilación del ADN plasmático para el análisis de desconvolución de la metilación del ADN plasmático.
En el bloque 160, se determinan M valores de un vector de composición. Cada valor M corresponde a una contribución fraccionaria de un tipo de tejido particular de los M tipos de tejido a la mezcla de ADN. Los M valores del vector de composición se pueden resolver para proporcionar los N niveles de metilación de la mezcla (p. ej., vector de metilación b) dada la matriz A compuesta por NxM niveles de metilación específicos de tejido (es decir, N niveles de metilación específicos de tejido para cada uno de los M tipos de tejido). Las M contribuciones fraccionarias pueden corresponder a un vector x que se determina resolviendo Ax=b. Cuando N es mayor que M, la solución puede implicar una minimización de errores, p. ej., utilizando mínimos cuadrados.
En el bloque 170, el vector de composición se usa para determinar una cantidad de cada uno de los M tipos de tejido en la mezcla. Los M valores del vector de composición pueden tomarse directamente como las contribuciones fraccionarias de los M tipos de tejido. En algunas implementaciones, los M valores se pueden convertir a porcentajes. Los términos de error se pueden usar para desplazar los M valores a valores más altos o más bajos.
D. Aplicaciones
Como se ha mencionado anteriormente, las contribuciones fraccionarias se pueden utilizar en mediciones posteriores de la muestra biológica y otras determinaciones, p. ej., si una región cromosómica particular tiene un desequilibrio de secuencias, si un tipo de tejido en particular está enfermo y para determinar qué haplotipo de dos haplotipos parentales hereda el feto de una mujer embarazada de la que se obtuvo la muestra.
La FIG. 2 muestra un diagrama esquemático que muestra varias aplicaciones potenciales de la desconvolución de la metilación del ADN (p. ej., utilizando plasma) según realizaciones de la presente invención. En la FIG. 2, una muestra biológica 205 se somete a secuenciación con bisulfito de todo el genoma en 210. En 230, el mapeo de tejido de ADN en plasma usa perfiles de metilación 220 específicos de tejido para determinar los porcentajes de contribución de tejido. Se muestran perfiles de metilación específicos de tejido ilustrativos como hígado, células sanguíneas, tejidos adiposos, pulmones, intestino delgado y colon. Los porcentajes de contribución se pueden determinar como se ha descrito anteriormente y en otros lugares, p. ej., resolviendo Ax=b. Los ejemplos de aplicaciones incluyen pruebas prenatales 241, detección y seguimiento 242 del cáncer, seguimiento de trasplantes de órganos y evaluación 244 de daños en órganos.
Se puede identificar una lista de marcadores de metilación (sitios genómicos) que son útiles para determinar las contribuciones de diferentes órganos al ADN plasmático comparando los perfiles de metilación (FIG. 2) de diferentes tejidos, incluyendo el hígado, pulmones, esófago, corazón, páncreas, colon sigmoide, intestinos delgados, tejidos adiposos, glándulas suprarrenales, colon, linfocitos T, linfocitos B, neutrófilos, cerebro y placenta. En diversos ejemplos, los datos de secuenciación de bisulfito del genoma completo para el hígado, pulmones, esófago, corazón, páncreas, colon, intestinos delgados, tejidos adiposos, glándulas suprarrenales, cerebro y linfocitos T se recuperaron del Human Epigenome Atlas del Baylor College of Medicine (www.genboree.org/epigenomeatlas/index.rhtml). Los datos de secuenciación de bisulfito para linfocitos B y neutrófilos provienen de la publicación de Hodges et al. (Hodges et al.; Directional DNA methylation changes and complex intermediate states accompany lineage specificity in the adult hematopoietic compartment. Mol Cell 2011; 44: 17-28). Los datos de secuenciación de bisulfito para la placenta fueron de Lun et al. (Lun et al. Clin Chem 2013; 59: 1583-94). En otras realizaciones, se pueden identificar marcadores a partir de conjuntos de datos generados mediante análisis de micromatrices, p. ej., usando la matriz Illumina Infinium HumanMethylation450 BeadChip.
II. SELECCIÓN DE MARCADORES DE METILACIÓN
Anteriormente, se ha descrito el principio de utilizar el análisis de mutilación para determinar la composición de una mezcla de ADN. En particular, el porcentaje de contribución de diferentes órganos (o tejidos) al ADN plasmático se puede determinar mediante análisis de metilación. En esta sección, se describe además el método para la selección de marcadores de metilación y aplicaciones clínicas de esta tecnología.
Los resultados de determinar la composición de la mezcla de ADN por análisis de metilación se ven afectados por los marcadores de metilación utilizados para la desconvolución de la composición de la mezcla de ADN. Por tanto, la selección de marcadores de metilación genómicos adecuados puede ser importante para la determinación precisa de la constitución de la mezcla de ADN.
A. Criterios para un marcador de metilación para desconvolución
Para la selección de marcadores, se pueden considerar los siguientes tres atributos. (i) Es deseable que un marcador de metilación tenga una baja variabilidad en el nivel de metilación medido en el mismo tipo de tejido entre diferentes individuos. Como la determinación de la composición de la mezcla de ADN depende del reconocimiento de los patrones de metilación específicos de tejido, la baja variabilidad en el nivel de metilación en el mismo tipo de tejido entre diferentes individuos sería útil para la identificación precisa de los patrones específicos de tejido en la mezcla de ADN. En realizaciones en las que los niveles de metilación específicos de tejido se obtienen de muestras de otros organismos (p. ej., de una base de datos), la baja variabilidad significa que los niveles de metilación de las otras muestras son similares a los niveles de metilación específicos de tejido para el organismo actual que se está analizando.
(ii) Es deseable que un marcador de metilación tenga una alta variabilidad en los niveles de metilación en diferentes tejidos. Para un marcador en particular, una mayor diferencia en los niveles de metilación entre diferentes tejidos puede proporcionar una determinación más precisa de la contribución de diferentes tejidos a la mezcla de ADN. En particular, se puede obtener una mejora en la precisión utilizando un conjunto de marcadores que tengan el atributo (ii) y otro conjunto de marcadores que tengan el atributo (iii).
(iii) Es deseable que un marcador de metilación tenga un nivel de metilación particularmente diferente en un tejido particular en comparación con los de la mayoría o todos los demás tejidos. En contraste con el punto (ii) anterior, un marcador puede tener una baja variabilidad en el nivel de metilación de la mayoría de los tejidos, pero su nivel de metilación en un tejido en particular es diferente de la mayoría de los otros tejidos. Este marcador sería particularmente útil para la determinación de la contribución del tejido que tiene un nivel de metilación diferente al de otros tejidos.
B. Ejemplo
En los siguientes ejemplos hipotéticos de la tabla 1 se ilustra un principio de selección de marcadores.
Tabla lación
Figure imgf000012_0001
En este ejemplo hipotético, el marcador 2 tiene menor variabilidad en la densidad de metilación en el hígado de tres individuos en comparación con el marcador 1. Por lo tanto, el marcador 2 es superior al marcador 1 como identificación para determinar la contribución del hígado en una mezcla de ADN.
En comparación con el marcador 4, el marcador 3 tiene una mayor variabilidad en la densidad de metilación en diferentes tipos de tejido. El mismo nivel de cambio en la contribución estimada de los diferentes tejidos proporcionaría un cambio mayor en la densidad de metilación deducida de la mezcla de ADN para el marcador 3 que para el marcador 4 según la relación matemática analizada anteriormente. Por lo tanto, la estimación de la contribución de cada tejido puede ser más precisa con el marcador 3.
El marcador 5 tiene una baja variabilidad en la densidad de metilación en el hígado, corazón y pulmón. Sus densidades de metilación varían del 10 % al 14 %. Sin embargo, la densidad de metilación del colon es del 80 %. Este marcador sería particularmente útil para determinar la contribución del colon en la mezcla de ADN. De forma similar, el corazón está hipometilado en comparación con los otros tejidos para el marcador 6. Por lo tanto, la contribución del corazón se puede determinar con precisión mediante el marcador 6. Por tanto, la combinación de los marcadores 5 y 6 podría determinar con precisión las contribuciones del colon y el corazón. La suma de los marcadores 2 y 3 sería entonces suficiente para deducir la contribución de cada uno de los cuatro órganos, incluyendo el hígado, corazón, pulmón y colon.
C. Diferentes tipos de marcadores
Es posible que un marcador de metilación no tenga necesariamente que tener los tres atributos anteriores. Un marcador de metilación de tipo I normalmente tendría el atributo (iii) anterior. Varios de estos marcadores también pueden tener el atributo (i). Por otra parte, un marcador de metilación de tipo II normalmente tendría el atributo (ii) anterior. Varios de estos marcadores también pueden tener el atributo (i). También es posible que un marcador en particular pueda tener los tres atributos.
En algunas realizaciones, los marcadores se dividen en general en dos tipos (tipo I y tipo II). Los marcadores de tipo I tienen especificidad tisular. El nivel de metilación de estos marcadores para un grupo particular de uno o más tejidos es diferente de la mayoría de los otros tejidos. Por ejemplo, un tejido en particular puede tener un nivel de metilación significativo en comparación con el nivel de metilación de todos los demás tejidos. En otro ejemplo, dos tejidos (p. ej., el tejido A y el tejido B) tienen niveles de metilación similares, pero los niveles de metilación de los tejidos A y B son significativamente diferentes de los del resto de los tejidos.
Los marcadores de tipo II tienen una alta variabilidad de metilación entre tejidos. Los niveles de metilación de estos marcadores son muy variables en diferentes tejidos. Un solo marcador en esta categoría puede no ser suficiente para determinar la contribución de un tejido particular a la mezcla de ADN. Sin embargo, una combinación de marcadores de tipo II o en combinación con uno o más marcadores de tipo I puede usarse colectivamente para deducir la contribución de tejidos individuales. Según la definición anterior, un marcador en particular puede ser solo un marcador de tipo I, solo un marcador de tipo II o ser simultáneamente un marcador de tipo I y tipo II.
1. Marcadores de tipo I
En una realización, un marcador de tipo I puede identificarse comparando la densidad de metilación del marcador con la media y la desviación típica (DT) de las densidades de metilación de este marcador en particular para todos los tejidos candidatos. En una implementación, se identifica un marcador si su densidad de metilación en un tejido es diferente de la media de todos los tejidos en 3 desviaciones típicas (DT).
Se estudiaron los perfiles de metilación de 14 tejidos obtenidos de las fuentes mencionadas anteriormente para seleccionar marcadores. En un análisis, se identificaron un total de 1013 marcadores de tipo I (marcadores etiquetados como de tipo I en la Tabla S1 del Apéndice A de la Solicitud provisional de los Estados Unidos n.° 62/158466) utilizando los criterios anteriores. En otras realizaciones, se pueden usar otros puntos de corte entre los tejidos particulares y las densidades medias de metilación, por ejemplo, pero sin limitación, 1,5 DT, 2 DT, 2,5 DT, 3,5 DT y 4 DT. En otra realización más, un marcador de tipo I se puede identificar mediante la comparación de la densidad de metilación del tejido particular con la mediana de la densidad de metilación de todos los tejidos.
En otras realizaciones, los marcadores de tipo I se pueden obtener cuando más de un tejido (por ejemplo, pero sin limitación, dos, tres, cuatro o cinco tejidos) muestran densidades de metilación significativamente diferentes a la densidad de metilación media de todos los tejidos candidatos. En una implementación, se puede calcular un punto de corte de la densidad de metilación a partir de la media y la DT de las densidades de metilación de todos los tejidos candidatos. Con fines ilustrativos, el punto de corte se puede definir como 3 DT superior o inferior a las densidades de metilación medias. Se selecciona un marcador cuando las densidades de metilación de más de uno (por ejemplo, pero sin limitación, dos, tres, cuatro, cinco o más de cinco) de los tejidos son más de 3 DT superiores a la densidad de metilación media o más de 3 DT inferiores a la densidad de metilación media de los tejidos.
2. Marcadores de tipo II
Para la identificación de marcadores de tipo II, se calcularon la media y la DT de las densidades de metilación en los 14 tejidos candidatos y la relación de la D t con respecto a la media se denominó coeficiente de variación (CV). En este ejemplo ilustrativo, se usó un punto de corte de >0,25 para el CV para identificar los marcadores calificados de tipo II, así como la diferencia entre las densidades de metilación máxima y mínima para el grupo de tejidos superior a 0,2. Usando estos criterios, se identificaron 5820 marcadores de tipo II (marcadores etiquetados como de tipo II en la tabla S1 del apéndice A). En otras realizaciones, se pueden usar otros puntos de corte para el CV, por ejemplo, pero sin limitación, 0,15, 0,2, 0,3 y 0,4. En otras realizaciones más, se pueden utilizar otros puntos de corte para la diferencia entre las densidades de metilación máxima y mínima, por ejemplo, pero sin limitación, 0,1, 0,15, 0,25, 0,3, 0,35, 0,4, 0,45 y 0,5.
En otras realizaciones, se pueden utilizar los valores promedio entre múltiples muestras del mismo tipo de tejido para medir una variación de los niveles de metilación en diferentes tejidos. Por ejemplo, se pueden promediar 10 niveles de mutilación de un mismo sitio genómico de 10 muestras para obtener un único nivel de mutilación para el sitio genómico. Se puede realizar un proceso similar para determinar los niveles de metilación promedio para otros tipos de tejido para el sitio genómico. A continuación, se pueden utilizar los valores promedio entre los tipos de tejidos para determinar si el sitio genómico tiene una variación significativa entre los tipos de tejidos. Se pueden utilizar otros valores estadísticos además de un promedio, p. ej., una mediana o una media geométrica. Dichos valores estadísticos se pueden usar para identificar marcadores de tipo I y/o tipo II.
Las diferentes muestras de un mismo tipo de tejido (p. ej., de diferentes individuos) se pueden usar para determinar una variación de los niveles de metilación entre las diferentes muestras. Por tanto, si hay múltiples muestras del mismo tipo de tejido, las realizaciones pueden medir además la variación de un marcador particular entre dichas muestras del mismo tipo de tejido. Un marcador con una variación baja entre muestras sería un marcador más fiable que uno con una variación alta. Se pueden encontrar más detalles de los marcadores y la desconvolución en la publicación de patente de los Estados Unidos de propiedad común 2016/0017419, titulada "Methylation Pattern Analysis Of Tissues In A DNA Mixture", de Chiu et al., y la publicación PCT WO2014/043763 titulada "NonInvasive Determination Of Methylome Of Fetus Or Tumor From Plasma".
D. Diferentes categorías de marcadores
Una "categoría" para un locus genómico (marcador de metilación) corresponde a una variación específica en los niveles de metilación de un locus entre diferentes individuos para un mismo tipo de tejido. Diferentes categorías pueden tener diferentes rangos de variación entre un tipo de tejido particular entre individuos. Una primera categoría de marcadores de metilación podría tener una diferencia del 10 % en los niveles de metilación o menos entre los individuos analizados. Una segunda categoría de marcadores de metilación podría tener una diferencia de más del 10 % en los niveles de metilación entre los individuos analizados. El uso de marcadores de metilación con variaciones interindividuales bajas (marcadores de primera categoría) mejoraría potencialmente la precisión de la determinación de la contribución de un órgano particular en la mezcla de ADN.
E. Identificación de posibles marcadores de metilación
En algunas realizaciones, se identificaron marcadores de metilación potenciales de la siguiente manera. A continuación, dichos marcadores de metilación potenciales pueden someterse a los criterios anteriores para identificar los marcadores de tipo I y tipo II. En otras realizaciones, no se necesita una identificación de tipo I o tipo II. Además, otras realizaciones pueden usar otras técnicas para identificar posibles marcadores de metilación.
En algunas realizaciones, todas las islas CpG (CGI) y las orillas de CpG en los autosomas se consideraron como posibles marcadores de metilación. No se utilizaron CGI ni orillas de CpG en los cromosomas sexuales para minimizar la variación en los niveles de metilación en relación con la diferencia de dosis cromosómica asociada al sexo en los datos de origen. Los CGI se descargaron de la base de datos de Universidad de California, Santa Cruz (UCSC) (genome.ucsc.edu/, 27048 islas de CpG para el genoma humano) (Kent et al., The human genome browser at UCSC, Genome Res. 2002; 12 (6): 996-1006) y las orillas de CpG se definieron como ventanas flanqueantes de 2 kb de las islas de CpG (Irizarry et al. The human colon cancer methylome shows similar hypo- and hypermethylation at conserved tissue-specific CpG island shores. Nat Genet 2009; 41 (2): 178 - 186). A continuación, las islas y orillas de CpG se subdividieron en unidades de 500 pb no solapantes y cada unidad se consideró como un marcador potencial de metilación.
Las densidades de metilación (es decir, el porcentaje de CpG que se metilan dentro de una unidad de 500 pb) de todos los locus potenciales se compararon entre los 14 tipos de tejidos. Como se ha indicado anteriormente (Lun et al. Clin Chem. 2013; 59: 1583-94), se descubrió que la placenta estaba globalmente hipometilada en comparación con los tejidos restantes. Por tanto, el perfil de metilación de la placenta no se incluyó en la fase de identificación de marcadores. Usando los perfiles de metilación de los 13 tipos de tejido restantes, se identificaron los dos tipos de marcadores de metilación. Por ejemplo, los marcadores de tipo I pueden referirse a cualquier sitio genómico con densidades de metilación que estén 3 DT por debajo o por encima en un tejido en comparación con el nivel medio de los 13 tipos de tejido. Los marcadores de tipo II se pueden considerar muy variables cuando (A) la densidad de metilación del tejido más hipermetilado es al menos un 20 % superior a la del más hipometilado; y (B) la DT de las densidades de metilación entre los 13 tipos de tejido cuando se divide por la densidad de metilación media (es decir, el coeficiente de variación) del grupo es al menos 0,25. Por último, para reducir el número de marcadores potencialmente redundantes, solo se puede seleccionar un marcador en un bloque contiguo de dos orillas de CpG que flanquean una isla de CpG.
F. Selección basada en la solicitud
El conjunto de marcadores de metilación elegidos para aplicaciones particulares puede variar según los parámetros de las aplicaciones deseadas. Por ejemplo, para aplicaciones centradas en el análisis de haplotipos o alelos, los marcadores útiles serían aquellos ubicados en las mismas moléculas de ADN acelular que uno de los alelos heterocigóticos. Como las moléculas de ADN acelular (p. ej., ADN plasmático) suelen tener menos de 200 pb, los marcadores útiles pueden ser sitios de CpG dentro de 200 pb de un locus heterocigótico (p. ej., un SNP). Como otro ejemplo, para aplicaciones en las que la liberación de ADN de un tejido particular al plasma es de especial importancia, se puede seleccionar una cantidad preferentemente mayor de marcadores de metilación que estén metilados de manera diferencial en este tipo de tejido (p. ej., marcador de tipo I) en comparación con los demás en el conjunto de marcadores.
El número y elección de marcadores de metilación en el análisis de desconvolución puede variar según el uso previsto. Si la contribución fraccionaria del hígado es de particular interés, p. ej., en un paciente que ha recibido un trasplante de hígado, se pueden utilizar más marcadores específicos de hígado de tipo I en el análisis de desconvolución para aumentar la precisión de la cuantificación de la contribución del hígado trasplantado al ADN plasmático.
III. PRECISIÓN DE LA COMPOSICIÓN
Como se ha descrito anteriormente, las realizaciones pueden identificar los contribuyentes de tejido del ADN plasmático. En diversos ejemplos, se realizó y analizó secuenciación con bisulfito de todo el genoma del ADN plasmático con referencia a los perfiles de metilación de diferentes tejidos. Usando la programación cuadrática como ejemplo, los datos de secuenciación de ADN plasmático se desconvolucionaron en contribuciones proporcionales de diferentes tejidos. Se probaron realizaciones para mujeres embarazadas, pacientes con carcinoma hepatocelular, de pulmón y colorrectal, y sujetos después de un trasplante de médula ósea y de hígado.
En la mayoría de los sujetos, los glóbulos blancos fueron los contribuyentes predominantes al conjunto de ADN circulante. Las contribuciones placentarias en mujeres embarazadas se correlacionaron con las contribuciones proporcionales reveladas por marcadores genéticos específicos del feto. Las contribuciones derivadas del injerto al plasma en los receptores de trasplante se correlacionaron con las determinadas utilizando marcadores genéticos específicos del donante. Los pacientes con cáncer hepatocelular, de pulmón o colorrectal mostraron contribuciones elevadas de ADN plasmático del órgano con el tumor. Las contribuciones del hígado en pacientes con carcinoma hepatocelular también se correlacionaron con las mediciones realizadas utilizando aberraciones del número de copias asociadas al tumor.
En pacientes con cáncer y en mujeres embarazadas que presenten aberraciones en el número de copias en plasma, la desconvolución de la metilación identificó el tipo de tejido responsable de las aberraciones. En una mujer embarazada diagnosticada de linfoma folicular durante el embarazo, la desconvolución de la metilación indicó una contribución muy elevada de los linfocitos B en el conjunto de ADN plasmático y los linfocitos B localizados (en lugar de la placenta) como el origen de las aberraciones del número de copias observadas en el plasma. Por consiguiente, las realizaciones pueden servir como una poderosa herramienta para evaluar una amplia gama de condiciones fisiológicas y patológicas en función de la identificación de contribuciones proporcionales alteradas de diferentes tejidos en el plasma.
A. Contribución de diferentes tipos de células sanguíneas
Como ejemplo de la desconvolución de metilación, se determinó la contribución de diferentes tejidos y tipos de células al ADN circulante. Se recogieron dos muestras de sangre de dos pacientes que padecían lupus eritematoso sistémico (LES). Después de la recogida, las muestras de sangre venosa se centrifugaron a 1500 g durante 10 minutos. Después de la centrifugación, se separaron las células sanguíneas y el plasma. A continuación, se extrajo el ADN de las células sanguíneas. El ADN se convirtió con bisulfito y se secuenció usando un carril de una celda de flujo en un secuenciador HiSeq2000. Se analizaron dos muestras de células sanguíneas mediante el análisis del patrón de metilación específico del tipo de célula. Los patrones de metilación de los neutrófilos, linfocitos, el esófago, colon, páncreas, hígado, pulmón, corazón, las glándulas suprarrenales y el hipocampo se incluyeron como candidatos potenciales del ADN de las células sanguíneas. Se seleccionaron 609 marcadores de metilación para el análisis. Las muestras de sangre completa de los dos sujetos también se enviaron para recuento celular para determinar la composición fraccionaria de los neutrófilos y linfocitos de las células sanguíneas.
T l 2. n ri i n l i n ín m i n n li i ^ r n nv l i n r n l l
Figure imgf000015_0001
continuación
Figure imgf000016_0001
Para el análisis de patrones de mutilación, se determinaron los neutrófilos y linfocitos como los componentes principales que constituyen el ADN de las células sanguíneas. La proporción relativa de la contribución de neutrófilos y linfocitos se asemeja a su abundancia relativa en las muestras de sangre según el análisis de recuento celular.
B. Mujeres embarazadas
Las contribuciones de diferentes tejidos, incluyendo el hígado, pulmón, páncreas, colon, hipocampo, intestinos delgados, células sanguíneas, corazón, glándula suprarrenal, esófago y placenta, se analizaron mediante análisis de metilación del ADN plasmático de mujeres embarazadas. Como el genotipo placentario es en general idéntico al genotipo del feto pero diferente al genotipo de la mujer embarazada, la contribución precisa de la placenta al plasma materno se puede determinar con precisión contando el número de alelos específicos fetales en la muestra.
1. Composición y correlación con el porcentaje de ADN fetal
Se realizó secuenciación de bisulfito en todo el genoma del ADN plasmático para 15 mujeres embarazadas, cinco de cada uno del primer, segundo y tercer trimestres. Se realizó desconvolución de metilación y se dedujeron los porcentajes de contribución de diferentes tejidos. Las contribuciones de diferentes órganos se determinaron en función de los niveles de metilación (tales como las densidades de metilación) de todos los marcadores de tipo I y tipo II en la tabla S1 usando análisis de programación cuadrática.
La FIG. 3A muestra un gráfico 300 de porcentajes de contribución de diferentes órganos al ADN plasmático para 15 mujeres embarazadas según realizaciones de la presente invención. Cada barra corresponde a los resultados de una muestra. Los diferentes colores representan las contribuciones de diferentes órganos al plasma. Estos resultados muestran que los glóbulos blancos (es decir, neutrófilos y linfocitos) son los contribuyentes más importantes a la reserva de ADN plasmático. Esta observación es coherente con las obtenidas previamente después de un trasplante de médula ósea (Lui YY et al. Clin Chem 2002; 48: 421-7).
La FIG. 4 muestra una tabla 400 de porcentajes de contribución determinados a partir de un análisis de mapeo de tejidos de ADN plasmático entre mujeres embarazadas según realizaciones de la presente invención. Estos resultados también muestran que la placenta es otro contribuyente clave del ADN plasmático en mujeres embarazadas, con concentraciones fraccionarias del 9,9 % al 38,4 %.
También se midieron las contribuciones placentarias utilizando alelos de polimorfismos mononucleotídicos (SNP) fetales heredados del padre que no poseían las mujeres embarazadas como se ha descrito anteriormente (31). Para analizar los alelos SNP específicos del feto, los genotipos de los fetos se determinaron analizando las muestras de vellosidades coriónicas o la placenta. Los genotipos de las mujeres embarazadas se determinaron analizando las células sanguíneas. Los resultados basados en SNP muestran la validación independiente de los resultados de desconvolución de metilación.
La FIG. 3B muestra un gráfico 350 de una correlación entre las fracciones de ADN plasmático aportadas por la placenta deducidas de la desconvolución de metilación del ADN plasmático y las fracciones de ADN fetal deducidas usando alelos SNP específicos del feto según realizaciones de la presente invención. El gráfico 350 muestra que las contribuciones placentarias determinadas por desconvolución de metilación tienen una fuerte correlación con las fracciones de ADN fetal medidas utilizando SNP (r = 0,99, p < 0,001, correlación de Pearson). Por consiguiente, se observa una buena correlación positiva entre los valores de los dos parámetros, lo que sugiere que la desconvolución de la metilación del ADN plasmático determina con precisión la contribución de la placenta a las muestras de plasma materno.
La FIG. 5 muestra gráficos de porcentajes de contribución de órganos distintos de la placenta mediante mapeo de tejidos de ADN plasmático y fracciones de ADN fetal basadas en alelos SNP específicos del feto según realizaciones de la presente invención. El eje X representa las fracciones de ADN fetal estimadas por análisis basado en SNP y el eje Y representa el porcentaje de contribución deducido por análisis de mapeo de ADN de tejido plasmático. Las contribuciones de a Dn plasmático de los neutrófilos muestran una correlación inversa. Esto probablemente se deba al hecho de que los neutrófilos son un importante contribuyente al conjunto de ADN plasmático y, por lo tanto, a medida que aumenta la contribución placentaria, la contribución relativa de los neutrófilos necesariamente disminuiría. Los resultados de desconvolución de metilación de los tejidos restantes no muestran correlación con la fracción de ADN fetal.
La FIG. 6 muestra una tabla 600 de porcentajes de contribución del análisis de mapeo de tejidos de ADN plasmático entre las personas de control sanas no embarazadas según realizaciones de la presente invención. Cuando el proceso se aplicó al plasma de controles sanos no embarazadas, la contribución placentaria estuvo ausente en la mayoría de las muestras (mediana: 0 %; intervalo intercuartílico: de 0 % a 0,3 %).
2. Comparación de marcadores seleccionados frente a marcadores aleatorios
La precisión de los porcentajes de contribución se probó con marcadores seleccionados en relación con marcadores aleatorios. Se realizaron diferentes cálculos de composición para diferentes conjuntos de marcadores. Se eligió un conjunto en función de los criterios mencionados anteriormente y el otro fue un conjunto aleatorio. Los resultados muestran que es importante elegir con criterio el uso de marcadores de metilación (locus genómicos), para obtener resultados precisos.
Once mujeres embarazadas y cuatro personas sanas no embarazadas fueron reclutadas para este análisis. Su ADN plasmático se convirtió con bisulfito y se secuenció utilizando el secuenciador Illumina HiSeq2000. Cada muestra de plasma se secuenció con un carril de una celda de flujo de secuenciación. A continuación, las lecturas de secuencia se analizaron utilizando un programa bioinformático, Methy-Pipe (Jiang P. PLoS One 2014; 9: e100360). Este programa puede alinear las lecturas de secuencias convertidas con bisulfito con el genoma de referencia y determinar el estado de metilación de cada sitio de CpG en cada fragmento secuenciado.
El primer conjunto de marcadores tiene una especificidad alta para identificar los diferentes tejidos en el ADN plasmático. Para cada tipo de tejido, se seleccionaron marcadores que tienen la mayor diferencia en la densidad de metilación en comparación con los otros tejidos. Los marcadores se determinaron a partir de regiones genómicas que contenían al menos un dinucleótido CpG. En este ejemplo, se utilizaron islas de CpG (CGI) como marcadores potenciales, que tiene una frecuencia alta de sitios de CpG en un tramo particular de a Dn . Las CGI en este ejemplo particular se descargan de la base de datos de la Universidad de California, Santa Cruz (UCSC): (genome.ucsc.edu). En total, se obtuvieron 27048 islas de CpG del genoma humano. La mediana del tamaño de una isla de CpG es de 565 pb (intervalo: de 200 pb a 45 kb). El 90 % de las islas tienen menos de 1,5 kb.
Para cada marcador de metilación, se determinó la diferencia de la densidad de metilación entre el tejido de interés y los otros tejidos. A continuación, la diferencia se expresa como el número de desviaciones típicas (DT) entre los otros tejidos. Para el tejido de interés, todos los marcadores se clasificaron según esta diferencia en la densidad de metilación. Se seleccionaron los 20 marcadores con la mayor diferencia por encima (10 marcadores) y por debajo (10 marcadores) de las densidades medias de metilación de los demás tejidos. El número de marcadores puede variar, por ejemplo, pero sin limitación, hasta 5, 15, 20, 30, 40, 50, 100 y 200.
Adicionalmente, también se seleccionaron marcadores con una alta variabilidad entre los diferentes tejidos. En este ejemplo, se seleccionaron marcadores con >50 % de diferencia entre los tejidos con las densidades de metilación más altas y más bajas. En otras solicitudes, se pueden utilizar otros valores, por ejemplo, pero sin limitación, 20 %, 30 %, 40 %, 60 %, 70 % y 80 %. Asimismo, también se calculó la variabilidad de las densidades de metilación en diferentes tejidos en función de la media y la DT. En este ejemplo, también se seleccionó un marcador si el valor de DT es más de dos veces la media. En otras solicitudes, también se pueden utilizar otros valores de corte, por ejemplo, pero sin limitación, 1, 1,5, 2,5 y 3. En función de estos criterios de selección, se seleccionaron 344 marcadores de metilación para el primer conjunto.
Para el segundo conjunto, se seleccionaron aleatoriamente 341 marcadores de los 27048 CGI analizados anteriormente. Todas las CGI se numeraron primero del 1 al 27048. A continuación, un ordenador generó un número aleatorio (entre 1 y 27048) para la selección de marcadores. A continuación, se repitió este proceso hasta seleccionar un total de 341 marcadores. Si se hubiera utilizado un número aleatorio generado, se generaría otro. Se espera que este conjunto de marcadores tenga una especificidad mucho menor para identificar los patrones de metilación específicos de tejido. Por tanto, se espera que se reduzca la precisión de la determinación de la composición del ADN plasmático.
La FIG. 7 muestra una tabla 700 de las contribuciones estimadas de diferentes órganos al ADN plasmático para 11 mujeres embarazadas y 4 personas sanas no embarazadas usando el primer conjunto de marcadores (con alta especificidad de órgano) según realizaciones de la presente invención. Las fracciones de ADN fetal se determinaron contando los alelos específicos del feto y se muestran en la fila inferior. En cada uno de los cuatro sujetos de control no embarazadas, se determinó que la contribución de la placenta al plasma era cercana al 0 %. Esto indica la especificidad de este enfoque.
La FIG. 8 muestra una tabla 800 de las contribuciones estimadas de diferentes órganos al ADN plasmático para 11 mujeres embarazadas y 4 personas sanas no embarazadas usando el segundo conjunto de marcadores (con baja especificidad de órgano) según realizaciones de la presente invención. Las fracciones de ADN fetal determinadas contando los alelos específicos del feto se muestran en la fila inferior. Usando estos marcadores menos específicos, se observó un porcentaje relativamente no concordante de contribución de la placenta y se observaron contribuciones considerables de la placenta en los cuatro sujetos de control no embarazadas. Esto indica que la especificidad tisular de los marcadores es importante en este enfoque.
La FIG. 9A es un gráfico 900 que muestra la correlación entre la fracción de ADN fetal estimada (contribución de la placenta) y la fracción de ADN fetal determinada contando los alelos específicos del feto en las muestras de plasma materno. Los resultados de las dos técnicas tienen una buena correlación utilizando el primer conjunto de marcadores de metilación. Sin embargo, utilizando el segundo conjunto de marcadores de metilación, la estimación mediante el análisis de metilación mostró una desviación significativa de los valores reales determinados mediante el recuento de alelos específicos del feto.
La FIG. 9B es un gráfico 950 que muestra la diferencia absoluta entre la estimación de los marcadores de metilación y la fracción de ADN fetal determinada por el recuento de alelos específicos del feto. La mediana del error de la estimación mediante el análisis de metilación fue del 4 % y del 8 % con el primer conjunto de marcadores y el segundo conjunto de marcadores, respectivamente.
C. Efecto de diferentes criterios
Como se ha descrito anteriormente, se pueden usar diversos criterios para identificar marcadores de diferentes tipos. Por ejemplo, un marcador de tipo I puede identificarse por un nivel de metilación en un tejido particular que es diferente del nivel medio de metilación para todos los tejidos, p. ej., al menos por un umbral específico, tal como 3 DT. Además, para marcadores de tipo II, se utilizan criterios de determinada variación y diferencia máxima. Las siguientes secciones muestran la precisión de diferentes criterios para identificar marcadores.
1. Rendimiento de marcadores con criterios menos rigurosos
Se comparó el rendimiento del análisis de desconvolución de metilación utilizando marcadores con diferente variabilidad entre diferentes tejidos. Se determinaron las contribuciones de la placenta al ADN plasmático para 15 mujeres embarazadas en función de dos conjuntos de marcadores con diferentes criterios de selección. Ambos conjuntos de marcadores incluyen todos los marcadores de tipo I como se ha descrito en las secciones anteriores. Sin embargo, los criterios de selección de los marcadores de tipo II son diferentes para los dos conjuntos de marcadores.
Los marcadores del conjunto I incluyen los 5820 marcadores de tipo II que cumplen los criterios de tener un CV de densidad de metilación > 0,25 y la diferencia entre las densidades de metilación máxima y mínima para los grupos de tejidos que superan 0,2. Para los marcadores del conjunto II, el requisito de CV fue >0,15 y la diferencia entre las densidades de metilación máxima y mínima para los grupos de tejidos superó 0,1. Había 8511 marcadores de tipo II en este conjunto de marcadores.
La FIG. 10A es un gráfico 1000 que muestra la contribución de la placenta al ADN plasmático deducida utilizando marcadores con diferentes criterios de selección según realizaciones de la presente invención. El eje vertical corresponde a la contribución placentaria deducida utilizando los marcadores del conjunto II. El eje horizontal corresponde a la contribución placentaria deducida utilizando los marcadores del conjunto I. Hubo una buena correlación entre los resultados de la contribución placentaria basados en los dos conjuntos de marcadores con diferentes criterios de selección (r=0,99, correlación de Pearson). Por consiguiente, se puede obtener una buena precisión utilizando los requisitos de CV > 0,15 y de la diferencia entre las densidades de metilación máxima y mínima para los grupos de tejidos superiores a 0,1.
2. Efecto de la variación del nivel de metilación dentro del mismo tipo de tejido
Para investigar si la variación en el nivel de metilación de los marcadores entre el mismo tipo de tejidos (p. ej., de diferentes individuos) afectaría el rendimiento del análisis de desconvolución, se analizaron los tejidos placentarios de dos casos de embarazadas. Se identificaron dos categorías de marcadores de metilación. Específicamente, las dos categorías se identificaron en función de su similitud en los niveles de metilación en dos tejidos placentarios. Los marcadores de categoría i tienen una densidad de metilación del 10 % o inferior. Los marcadores de categoría ii tienen una alta variabilidad entre los dos tejidos placentarios (diferencia en la densidad de metilación de más del 10 %).
La FIG. 10B es un gráfico 1050 que muestra la precisión de la desconvolución del ADN plasmático usando marcadores con baja variabilidad (categoría i) y alta variabilidad (categoría ii) en el mismo tipo de tejido. Se realizó desconvolución del ADN plasmático para determinar la contribución placentaria al ADN plasmático de 15 mujeres embarazadas. Para cada marcador, se utilizó la media de las densidades de metilación de los dos tejidos placentarios para representar el nivel de metilación de la placenta en el análisis. Para cada uno de los análisis de desconvolución utilizando los marcadores de categoría i y categoría ii, se utilizaron un total de 1024 marcadores.
La cantidad de ADN procedente de la placenta en el plasma se determinó adicionalmente en función de la proporción de los alelos de SNP específicos del feto. El porcentaje de contribución deducido por el análisis de desconvolución de metilación basado en marcadores de categoría i y categoría ii se comparó después con los resultados basados en alelos de SNP específicos del feto. La mediana de la desviación de la contribución placentaria derivada del valor estimado en función de los alelos específicos del feto fue del 2,7 % y del 7,1 % utilizando marcadores de categoría i y categoría ii, respectivamente. Por tanto, el uso de marcadores de categoría i que tenían una variación interindividual más baja en el nivel de metilación tisular proporcionó una mayor precisión en el análisis de desconvolución de metilación.
Se observó una diferencia significativamente mayor entre los resultados de la desconvolución de la metilación y el análisis de alelos específicos del feto cuando se usaron marcadores con alta variabilidad dentro del mismo tipo de tejido (categoría ii) (P<0,0001, prueba de rangos con signo de Wilcoxon). En otras palabras, el uso de marcadores con baja variabilidad dentro del mismo tipo de tejido aumentaría la precisión del análisis de desconvolución de metilación. Por consiguiente, los marcadores se pueden seleccionar en función de la variabilidad dentro del mismo tipo de tejidos, por ejemplo, pero sin limitación, el valor de CV y la diferencia entre la densidad de metilación máxima y mínima para el mismo tipo de tejidos.
IV. DESCONVOLUCIÓN DE IDENTIFICACIONES FETALES
Si se conoce una identificación genómica (p. ej., un alelo de SNP en particular), las realizaciones pueden determinar qué tejido es el origen de dichas identificaciones. Por tanto, si una identificación particular es representativa de un feto (p. ej., un alelo paterno en un locus particular), entonces la contribución fraccionaria para la identificación sería sustancial para el tejido placentario.
Para ilustrar que la alteración de un solo nucleótido también se puede utilizar para determinar el tejido de origen del que procede la alteración, se analizó el ADN plasmático de una mujer embarazada. La placenta y la capa leucocítica materna se genotiparon para identificar los SNP de que la madre era homocigótica y el feto era heterocigótico. Se indica el alelo compartido por el feto y la madre como A y el alelo específico del feto como B. Por lo tanto, la madre tenía un genotipo A a y el feto tenía un genotipo AB en cada uno de estos SNP.
Después de la secuenciación con bisulfito del ADN del plasma materno, todos los fragmentos de ADN que portaban el alelo específico del feto (alelo B) y al menos un sitio CpG se seleccionaron y utilizaron para el análisis posterior. Se secuenciaron un total de 1310 millones de fragmentos y se usaron 677 140 fragmentos que portaban el alelo específico del feto (alelo B) para el análisis de desconvolución. Todos los sitios CpG que estaban cubiertos por al menos 10 fragmentos de ADN se usaron para el análisis de desconvolución. Se pueden usar otros números de fragmentos de ADN que abarcan un sitio, tales como 5, 15, 20, 25 o 30. Como el alelo B era específico del feto, se esperaba que estos fragmentos de ADN procedieran de la placenta.
T abla 3. Análisis de desconvolución de metilación usando alelo es ecífico fetal.
Figure imgf000019_0001
En la tabla 3, a partir del análisis de desconvolución de metilación, se mostró que se dedujo que la placenta era el principal contribuyente de estos fragmentos de ADN que portaban alelos SNP específicos del feto. Estos resultados sugieren que el análisis de desconvolución de metilación identificó con precisión el origen tisular de estos fragmentos de ADN que portan alelos específicos del feto.
Esto muestra que un alelo particular se puede atribuir a un feto. Dicha técnica se describe con más detalle a continuación para determinar genotipos y haplotipos de un feto utilizando análisis de desconvolución de metilación.
V. DETERMINACIÓN DEL GENOMA FETAL (ANÁLISIS MUTACIONALES)
Para pruebas prenatales no invasivas, el análisis de la herencia de una mutación materna utilizando el ADN del plasma materno es una tarea compleja. Por ejemplo, si una mujer embarazada es heterocigótica para una mutación, el análisis del estado mutacional del feto mediante el análisis del ADN plasmático materno sería técnicamente difícil porque tanto los alelos mutantes como los normales estarían presentes en su plasma, independientemente del estado mutacional de su feto. Anteriormente, se han desarrollado varios enfoques diferentes para abordar este problema (Lun et al. Proc Natl Acad Sci USA. 2008; 105: 19920-5; Lo et al. Sci Transl Med. 2010; 2: 61ra91; Lam et al. Clin Chem. 2012; 58: 1467-75). El principio de estos enfoques anteriores implica la comparación entre las cantidades relativas de la mutación y el alelo normal en el plasma materno. Para mejorar la potencia estadística de las comparaciones, algunos de estos enfoques implican además las comparaciones de las cantidades relativas de alelos de SNP ligados a la mutación y los ligados al alelo normal. Como alternativa, o además, algunas realizaciones de la presente invención pueden deducir el estado mutacional del feto mediante análisis de desconvolución de metilación.
A. Contribución para los alelos utilizando la desconvolución de metilación
En este ejemplo, se determina un genotipo del feto. Se supone que los genotipos del padre y la madre son NN y MN en un locus particular, respectivamente. M y N indican los alelos mutantes y normales, respectivamente. En este escenario, el feto puede heredar el alelo M o el alelo N de la madre. Por lo tanto, existen dos genotipos posibles para el feto, a saber, Mn y NN. En el plasma materno, el ADN que porta el genotipo fetal procede, en realidad, de la placenta. Por tanto, estos fragmentos de ADN presentarían el perfil de metilación placentaria.
La FIG. 11A muestra un primer escenario en el que el feto ha heredado el alelo M de la madre y tiene un genotipo de MN en un locus particular según realizaciones de la presente invención. En la parte superior de la FIG. 11A (genotipos marcados), se muestra que el padre tiene el genotipo NN, se muestra que la madre tiene el genotipo MN y que el feto tiene el genotipo MN. Los fragmentos de ADN que presentan el perfil de metilación placentaria están marcados con una P, donde se muestran en el genotipo fetal. Por ejemplo, el perfil de metilación placentaria puede corresponder a determinados niveles de metilación en sitios genómicos cerca del locus particular. Los fragmentos de ADN que se alinean con el locus particular también pueden incluir sitios genómicos cerca del locus (p. ej., a una distancia de 200 pb del locus) y, por tanto, se pueden usar para medir los niveles de metilación para el análisis de desconvolución de metilación. Teniendo en cuenta los genotipos de los progenitores, el alelo M es específico de la madre y el alelo N se comparte entre el padre y la madre.
En la parte inferior de la FIG. 11A (plasma materno marcado), se muestran casos de los dos alelos M y N, representando cada caso una molécula de ADN diferente en el plasma en el locus de interés. Solo se muestra una pequeña cantidad de moléculas de ADN con fines ilustrativos. En este ejemplo, se supone que el porcentaje de ADN fetal es del 25 %, como lo muestra el 25 % de las moléculas de ADN marcadas con una P.
En la muestra de plasma materno, se analizaron selectivamente los fragmentos de ADN que portaban el alelo M y se realizó el análisis de desconvolución de metilación. Debido a que el feto tiene un genotipo de MN, la placenta contribuiría con los alelos M y N al ADN plasmático materno. Por lo tanto, algunos de los fragmentos de ADN que portan el alelo M también portarían el perfil de metilación específico de la placenta en sitios genómicos cerca del locus. El análisis de desconvolución de metilación indicaría que algunos de los fragmentos de ADN que portan el alelo M procederían de la placenta y, por tanto, el genotipo fetal incluye el alelo M.
La FIG. 11B muestra un segundo escenario en el que el feto ha heredado el alelo N de la madre y tiene un genotipo de NN en un locus particular según realizaciones de la presente invención. En esta situación, solo los fragmentos de ADN que portan el alelo N presentarían el perfil de metilación placentaria en el plasma materno. Por tanto, el análisis selectivo de los fragmentos de ADN que portan el alelo M con desconvolución de metilación indicaría que estos fragmentos de ADN no tienen una contribución significativa de la placenta. Por consiguiente, se puede determinar que el feto no tiene M y, por tanto, tiene un genotipo de NN
En algunas realizaciones, se puede comparar la contribución placentaria para los alelos M y N. Aquí, se supone que el ADN fetal representa aproximadamente el 10 % del ADN plasmático materno total. La desconvolución selectiva de los alelos M y N sería útil para indicar qué alelo ha heredado el feto de la madre. Los resultados esperados se muestran a continuación en la tabla 4:
T l 4. n ri i n l n ri r l l l M N r l n i rn NN.
Figure imgf000020_0001
En la tabla 4, se puede comparar el porcentaje de contribución placentaria de los alelos M y N. Una contribución placentaria aproximadamente igual para los dos alelos (p. ej., dentro de un umbral uno del otro) sugiere que el genotipo fetal es MN. Por otra parte, una contribución placentaria significativamente más alta para el alelo N en comparación con el alelo M indicaría un genotipo fetal de NN
En otra realización, no es necesario tener en cuenta el genotipo paterno. En esta situación, los posibles genotipos del feto incluyen MM, MN y NN
T l . n ri i n l n ri r l l l M N r l n i rn n i .
Figure imgf000021_0001
En la tabla 5, se muestra la contribución placentaria de los fragmentos de ADN que portan los alelos M y N para diferentes genotipos fetales. Cuando el feto tiene un genotipo de MM, la contribución placentaria para el alelo M sería significativamente mayor que la del alelo N. Cuando el feto tiene un genotipo de NN, la contribución placentaria para el alelo N sería significativamente mayor que la del alelo N. Cuando el feto tiene un genotipo de NM, la contribución placentaria para el alelo M sería aproximadamente igual a la contribución placentaria para el alelo N.
Por consiguiente, cuando no se conoce el genotipo paterno, se pueden determinar contribuciones fraccionarias para ambos alelos. Es decir, se puede determinar una primera contribución fraccionaria utilizando un primer conjunto de moléculas de ADN acelular que se alinean con el locus e incluyen N. Los niveles de metilación del primer conjunto de moléculas de ADN acelular se pueden medir en K sitios genómicos cerca del locus. Además, se puede determinar una segunda contribución fraccionaria utilizando un segundo conjunto de moléculas de ADN acelular que se alinean con el locus e incluyen M. Los niveles de metilación del segundo conjunto de moléculas de ADN acelular se pueden medir en K sitios genómicos cerca del locus. Para el primer escenario del genotipo fetal que es MN, las contribuciones fraccionarias determinadas para cualquiera de los alelos serían aproximadamente iguales, como puede probarse determinando si las contribuciones fraccionarias están dentro de un valor umbral entre sí.
A fin de ilustrar la viabilidad de este enfoque, se analizó el ADN plasmático de una mujer embarazada. El ADN plasmático se convirtió con bisulfito y se analizó usando secuenciación paralela masiva. Adicionalmente, se analizaron la placenta y las células sanguíneas para determinar el genotipo del feto y de la madre. Para fines ilustrativos, se analizó un SNP ubicado dentro del gen KLF2. Para este SNP, los genotipos de la madre y el feto fueron CG y CC, respectivamente. Con esta combinación de genotipos, la placenta aportaría el alelo C al plasma materno, pero todos los alelos G en el plasma materno procederían de los tejidos maternos.
En los datos de secuenciación, había 24 fragmentos que portaban el alelo G y 55 fragmentos que portaban el alelo C. Los sitios CpG dentro de estos fragmentos de ADN se utilizaron para la desconvolución de metilación. En este análisis, un objetivo es determinar la contribución placentaria de los dos alelos. Para ilustrar el principio, solo la placenta y las células sanguíneas se consideraron tejidos candidatos para el análisis de desconvolución de metilación. En otra realización, pueden utilizarse tres o más tipos de tejidos como candidatos. En otra realización más, se pueden utilizar como candidatos tejidos que se espera que tengan una contribución significativa, por ejemplo, células sanguíneas, hígado, pulmón, intestino y placenta.
T abl . nri i n l n ri r l l l r n i rn nocido.
Figure imgf000021_0002
En la tabla 6, se dedujo que la contribución de la placenta es del 62,6 % y del 1,8 % para el alelo C y el alelo G, respectivamente. La relación de contribución placentaria para C/G es 34. Estos resultados sugieren que el genotipo del feto sería CC. Esto es coherente con el resultado de genotipado del tejido placentario.
Esta realización es diferente y potencialmente tiene más utilidad que un método anterior para pruebas prenatales no invasivas basadas en el análisis de la relación alélica de ADN con un patrón de metilación específico (Tong et al. Clin Chem
2006; 52: 2194-202). En este método anterior, el ADN específico de tejido se identifica primero a partir de una mezcla de ADN (p. ej., ADN plasmático) en función del patrón de metilación. Por ejemplo, un gen particular está completamente desmetilado en las células sanguíneas y metilado en la placenta. La identificación se realiza usando una enzima que deja intacto el ADN placentario metilado.
Por tanto, todas las moléculas de ADN metiladas que quedan en el plasma procederían de la placenta y no de las células sanguíneas. A continuación, la relación alélica de un SNP ubicado en las moléculas de ADN procedentes de la placenta se puede determinar midiendo las cantidades de los diferentes alelos en el locus utilizando el ADN placentario intacto. Cuando el feto es heterocigótico para el SNP, la relación de los dos alelos en el ADN específico de la placenta sería de aproximadamente 1. Sin embargo, si el feto está afectado por un cromosoma aneuploide y tiene tres copias del cromosoma que porta este SNP en particular, la relación de los dos alelos sería 1:2 o 2:1.
En este método anterior, las moléculas de ADN específicas de tejido deben identificarse primero en función de un estado de metilación que es exclusivo del tejido de interés. Las moléculas de ADN metiladas son exclusivas de la placenta porque las células sanguíneas están completamente desmetiladas para la región diana. Sin embargo, en esta presente realización, no se requiere la exclusividad de un estado de metilación determinado. Solo es necesario que los tejidos candidatos sean diferentes en sus perfiles de metilación, en consecuencia, se pueden usar más locus, permitiendo de este modo la desconvolución de haplotipos. Por tanto, se pueden determinar las contribuciones tisulares para los diferentes alelos en función de sus perfiles de metilación. Además, el método anterior puede ser más susceptible a variaciones estadísticas ya que el número de lecturas fetales con cada alelo se compara directamente entre sí. Por otro lado, cuando las contribuciones placentarias se comparan entre sí, los números de lecturas fetales no se comparan directamente entre sí. En su lugar, la contribución placentaria se determina a partir de todas las lecturas (metiladas o no) y, por tanto, las contribuciones placentarias pueden ser iguales, incluso cuando el número de lecturas fetales difiere. Por tanto, se puede explicar un sesgo de cobertura hacia un haplotipo.
B. Determinación del haplotipo heredado mediante desconvolución
Previamente se ha demostrado que, a través del análisis del ADN plasmático (u otro ADN acelular) de una mujer embarazada con un feto, los haplotipos maternos heredados por el feto se pueden deducir utilizando el proceso de análisis de dosis relativa de haplotipos (RHDO) (Lo et al. Sci Transl Med 2010; 2: 61ra91 y patente de los Estados Unidos 8467976). En este método, se usa la información del haplotipo para la mujer embarazada. Esta última información del haplotipo se puede obtener mediante el análisis familiar o un método para el análisis directo del haplotipo (p. ej., Fan et al. Nat Biotechnol 2011; 29: 51-57; Snyder et al. Nat Rev Genet 2015; 16: 344-358). Se pueden usar SNP que son heterocigóticos en la madre pero homocigóticos en el padre para el análisis RHDO. Tal uso de SNP específicos puede limitar los locus que se pueden utilizar y, por lo tanto, limitar la cantidad de datos y la precisión. Las realizaciones pueden no estar tan restringidas a dichos s Np específicos. Además, las realizaciones se pueden utilizar en combinación con las referencias anteriores para proporcionar una mayor precisión.
Las realizaciones pueden usar la desconvolución de metilación para determinar las contribuciones placentarias usando las moléculas de ADN acelular para dos haplotipos. Las contribuciones placentarias se pueden comparar para determinar qué haplotipo hereda el feto. Las realizaciones pueden comenzar con haplotipos maternos o paternos deducidos y después medir los niveles de metilación de moléculas de ADN plasmático que contienen alelos de SNP en cada uno de esos haplotipos deducidos. A continuación, se puede realizar la desconvolución de metilación. El haplotipo fetal se puede identificar como el que tiene la contribución placentaria más alta del análisis de desconvolución de metilación. En todas las realizaciones anteriores, los haplotipos paternos o maternos pueden, en lugar de ser uno deducido, también determinarse mediante análisis familiar (es decir, analizando el ADN de otros miembros de la familia) o mediante un método directo (p. ej., el método descrito por Fan et al. Nat Biotechnol 2012).
1. Haplotipos maternos
En este ejemplo, se demuestra que se puede utilizar análisis de desconvolución de metilación del ADN plasmático para deducir los haplotipos maternos heredados por un feto. Una fuente de ADN genómico de la mujer embarazada, p. ej., el ADN de la capa leucocitaria, puede ser objeto de genotipado, p. ej., utilizando una micromatriz. A continuación, los resultados del genotipado materno se introducen en un programa de deducción de haplotipos (p. ej., IMPUTE2, Howie et al. PLoS Genet. 2009; 7: e1000529) para deducir el primer haplotipo materno probable y el segundo haplotipo materno. La información de genotipos y haplotipos específicos de la población se puede tener en cuenta para mejorar la precisión de la deducción. En otras realizaciones, los haplotipos parentales se pueden resolver mediante análisis de una sola molécula, por ejemplo, pero sin limitación, los métodos descritos por Fan et al. (Nat Biotechnol. 2011; 29: 51-7), Kaper et al. (Proc Natl Acad Sci USA. 2013; 110: 5552-7), Lan et al. (Nat Commun. 2016; 7: 11784) y Selvaraj et al. (Nat Biotech 2013; 31: 1111-1118). A continuación, el ADN del plasma materno puede someterse a secuenciación y alineación por bisulfito de todo el genoma con secuencias genómicas de referencia. A continuación, se puede realizar la desconvolución de metilación para cada uno de los haplotipos predichos. Ya que el ADN fetal en el plasma materno es predominantemente de origen placentario, el haplotipo materno heredado por el feto es el que presenta mayor contribución placentaria.
La información del haplotipo materno se puede utilizar para ligar entre sí los alelos de SNP y los sitios de CpG en el mismo cromosoma homólogo. A continuación, los fragmentos de ADN de la misma copia cromosómica (haplotipo) se pueden identificar utilizando los alelos de SNP. Los sitios de CpG (u otros sitios) en esta copia cromosómica particular (haplotipo) se pueden utilizar para la desconvolución de metilación. Ya que la cantidad de sitios de CpG que se pueden utilizar para la desconvolución sería proporcional a la cantidad de SNP en el cromosoma homólogo y mucho mayor que la cantidad de sitios de CpG ligados a un solo SNP en el análisis de desconvolución basado en haplotipos, este método sería más preciso que el análisis de desconvolución mediante sitio o sitios de CpG que están ligados a un único SNP. El principio se ilustra en la FIG. 12A.
La FIG. 12A muestra una determinación de un haplotipo materno heredado por un feto utilizando desconvolución de mutilación según realizaciones de la presente invención. En la parte superior de la FIG. 12A, los dos haplotipos de la madre y el feto se muestran en tres locus en los que la madre es heterocigótica. Los dos haplotipos maternos están etiquetados como Hap I y Hap II. En este ejemplo, el feto ha heredado Hap I de la madre. Con fines ilustrativos, solo se muestran los locus de SNP en los que la madre es heterocigótica. Para fines ilustrativos, el padre es homocigótico para cada uno de estos locus en este ejemplo. Sin embargo, el mismo principio se extiende a escenarios en los que el padre es heterocigótico sin ningún cambio.
En la parte inferior de la FIG. 12A (plasma materno marcado), se muestran casos de los dos alelos en cada locus, representando cada caso una molécula de ADN diferente en el plasma en el locus de interés. Solo se muestra una pequeña cantidad de moléculas de ADN con fines ilustrativos. En este ejemplo, se supone que el porcentaje de ADN fetal es del 20 %, como lo muestra el 20 % de las moléculas de ADN marcadas con una P.
En el plasma materno, las moléculas de ADN que portan el genotipo fetal proceden de la placenta y, por lo tanto, portan los patrones de metilación específicos de la placenta. Los círculos marcados con "P" representan los sitios de CpG que presentan el patrón de metilación placentaria cerca del locus heterocigótico. Se puede utilizar una lectura que incluya un locus heterocigótico y un sitio adyacente para medir un nivel de metilación para detectar el patrón de metilación placentaria. En este ejemplo, un objetivo es determinar si el feto ha heredado Hap I o Hap II de la madre. Para conseguir esto, los fragmentos de ADN plasmático que portan alelos en Hap I y abarcan al menos un sitio de CpG se seleccionan para la desconvolución de metilación. Ya que el feto ha heredado Hap I de la madre, la placenta contribuiría con una proporción significativa a este conjunto de moléculas de ADN plasmático. Por otra parte, cuando los fragmentos que portan alelos en Hap II se analizan con desconvolución de metilación, se observaría una contribución muy baja de la placenta.
Para ilustrar esto, se analizó la muestra de plasma materno mencionada anteriormente para la tabla 6. Los inventores se centraron en una región de 5 Mb en el cromosoma 1. Los SNP en los que la madre era heterocigótica y el feto era homocigótico se seleccionaron para el análisis. Para cada uno de estos locus de SNP, los alelos que compartían la madre y el feto formaban un haplotipo (denominado Hap I) y los alelos que estaban presentes solo en el genoma materno formaban otro haplotipo (denominado Hap II). Por tanto, en este ejemplo, hay dos haplotipos maternos (Hap I y Hap II) y el feto ha heredado el Hap I de la madre. En el plasma materno, los fragmentos de ADN que portaban los alelos en Hap I y los que portaban los alelos en Hap II se analizaron por separado usando desconvolución de metilación. Todos los sitios CpG en la misma molécula de ADN plasmático de un SNP heterocigótico se usaron para el análisis de desconvolución. En este ejemplo, ninguno de estos sitios de CpG se solapó con marcadores de tipo I o tipo II.
T l 7. D nv l i n m il i n r H I H II.
Figure imgf000023_0001
La tabla 7 muestra la desconvolución de fragmentos de ADN plasmático que portan los alelos en los dos haplotipos maternos, a saber, Hap I y Hap II. El feto había heredado el Hap I materno. A partir de este análisis de desconvolución, se dedujo que la placenta aportaba el 53,5 % de los fragmentos de ADN plasmático que portaban los alelos en Hap I. Por otro lado, no hubo contribución de la placenta a los fragmentos de ADN plasmático que portaban los alelos en Hap II. Por lo tanto, el análisis de desconvolución de metilación había predicho con precisión que el feto había heredado Hap I de la madre. Se puede lograr una mayor precisión utilizando sitios de CpG que solapan con marcadores de tipo I y/o tipo II.
Como ejemplo adicional, para demostrar la utilidad práctica de este enfoque, se reclutó a otra mujer embarazada. Se tomó sangre periférica materna. La muestra de sangre se fraccionó en plasma y los componentes celulares. La capa leucocitaria materna se analizó utilizando una matriz Illumina HumanOmni2.5-8 BeadChip. Se utilizó IMPUTE2 (Howie et al. PLoS Genet. 2009; 7: e1000529) para deducir la fase de 851 SNP heterocigóticos en una región de 5 Mb en el extremo telomérico del cromosoma 1p. La estimación de la fase de haplotipos se basó en haplotipos de referencia de 1000 genomas (mathgen.stats.ox.ac.uk/impute/1000GP_Phase3.tgz).
Después de obtenerse los haplotipos estimados, los sitios CpG ligados a los dos haplotipos se utilizaron para realizar la desconvolución de metilación. Todos los sitios CpG en la misma molécula de ADN plasmático de un SNP heterocigótico se usaron para el análisis de desconvolución. En este ejemplo, ninguno de estos sitios de CpG se solapó con marcadores de tipo I o tipo II. Entre los 851 SNP utilizados para la desconvolución, 820 (96,2 %) estaban en regiones intrónicas e intergénicas. Ninguno de ellos se solapó con islas u orillas de CpG.
I.
Figure imgf000024_0001
La tabla 8 muestra una desconvolución de fragmentos de ADN plasmático que portan los alelos en los dos haplotipos maternos deducidos de un panel de haplotipos de referencia. Los dos haplotipos se denominan Hap I y Hap II. E1Hap I deducido tiene una cantidad significativamente mayor de contribución placentaria que e1Hap II, a saber, 68,9 % frente a 9,3 %. Por tanto, se dedujo que el Hap I materno había sido heredado por el feto. La herencia materna basada en la deducción de haplotipos fue coherente con los resultados de los genotipos maternos y fetales.
Una ventaja de este método es que no se limita a los SNP para los que el padre del feto es homocigótico y la madre del feto es heterocigótica. De hecho, en el ejemplo anterior, se había realizado el análisis sin conocer ni deducir el genotipo o haplotipo paterno. Esta es una ventaja sobre los métodos descritos anteriormente ((Lo et al. Sci Transl Med 2010; 2: 61ra91, patente de los Estados Unidos 8467976, Fan et al. Nature 2012; 487: 320-324, Kitzman et al. Sci Transl Med 2012; 4: 137ra76).
En algunas realizaciones, una primera contribución fraccionaria para un primer haplotipo se puede comparar con un valor de referencia derivado en función de la fracción de ADN fetal para determinar si el haplotipo ha sido heredado por el feto. Los puntos de corte se pueden calcular como, por ejemplo, pero sin limitación, 1 vez, 1,2 veces, 1,4 veces, 1,6 veces, 1,8 veces, 2 veces, 2,2 veces, 2,4 veces, 2,6 veces o 2,8 veces la fracción de ADN fetal. De esta manera, no es necesario determinar la segunda contribución fraccionaria para un segundo haplotipo, si la primera contribución fraccionaria es suficientemente grande.
En algunas realizaciones, el haplotipo heredado puede tener una concentración fraccionaria desconvolucionada del doble de la fracción fetal y el no heredado tiene una contribución insignificante. La contribución del haplotipo no heredado puede no tener una contribución nula ya que los haplotipos paternos pueden aportar ruido a este análisis ya que algunos alelos paternos pueden ser los mismos que los alelos maternos. Si el nivel de ruido es alto, se puede determinar la contribución fraccionaria del segundo haplotipo y se puede deducir que el que tiene una fracción desconvolucionada más alta será heredado por el feto.
Algunas implementaciones podrían probar ambos haplotipos usando el valor de referencia, para confirmar que solo se hereda uno. Si ambos parecen ser heredados, entonces las dos contribuciones fraccionarias se pueden comparar entre sí. Adicionalmente, si ambos parecen ser heredados, se puede comprobar el genoma paterno, ya que el feto podría haber heredado un haplotipo paterno que coincide con el haplotipo materno no heredado.
En otras realizaciones, la segunda contribución fraccionaria se puede utilizar para determinar el valor de referencia, p. ej., la segunda contribución fraccionaria más un valor umbral. Por tanto, el valor de referencia puede ser una suma de la segunda contribución fraccionaria y un valor umbral.
2. Haplotipo paterno
En otra realización, el análisis de desconvolución de metilación se puede aplicar para el análisis de la herencia del haplotipo paterno.
La FIG. 12B muestra una ilustración del análisis de metilación del haplotipo paterno según realizaciones de la presente invención. Se puede realizar desconvolución de metilación en los fragmentos de ADN del plasma materno que portan los alelos en Hap III y Hap IV paternos. Ya que Hap III ha sido heredado por el feto, la contribución placentaria sería mayor para Hap III en comparación con Hap IV. Por tanto, se puede deducir la herencia paterna del feto.
Esta realización tiene ventajas sobre los métodos anteriores basados en el análisis de alelos específicos paternos. Por ejemplo, para SNP en la posición 1, el alelo A está presente en el padre, pero no en la madre. Por lo tanto, la detección del alelo A específico paterno en el plasma materno indica la herencia de1Hap III por parte del feto. Sin embargo, para SNP en la posición 2, los alelos C y T no son específicos del feto. En esta situación, no se puede utilizar el análisis de alelos específicos paternos. Sin embargo, el análisis de desconvolución de metilación no requiere la presencia de un alelo específico paterno. Por tanto, los SNP que son heterocigóticos tanto en el padre como en la madre pueden usarse para el análisis de desconvolución de metilación de los dos haplotipos paternos.
Por consiguiente, un proceso similar, como se usa para los haplotipos maternos, se puede utilizar para determinar qué haplotipo paterno se hereda. En la FIG. 12B, la contribución placentaria de Hap III sería mayor que la contribución placentaria de Hap IV. Los haplotipos paternos se pueden determinar de la misma manera o de manera similar a la forma en que se pueden determinar los haplotipos maternos.
3. Método mediante desconvolución
La FIG. 13 es un diagrama de flujo que ilustra un método 1300 para determinar una porción de un genoma fetal a partir de una muestra materna utilizando desconvolución de metilación según realizaciones de la presente invención. La muestra biológica incluye una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos, incluidos tipos de tejido materno y un tipo de tejido fetal. El feto tiene un padre y una madre que es la mujer embarazada. La porción del genoma fetal puede ser una copia cromosómica completa o solo parte de la copia cromosómica. Las porciones determinadas del genoma fetal se pueden combinar para proporcionar información sobre diferentes porciones del genoma fetal, hasta el genoma fetal completo.
En el bloque 1310, se analiza una pluralidad de moléculas de ADN acelular de la muestra biológica. El bloque 1310 se puede realizar utilizando las técnicas descritas en el bloque 140 del método 100 de la FIG. 1. Por ejemplo, se pueden analizar al menos 1000 moléculas de ADN acelular para determinar dónde se ubican las moléculas de ADN acelular y los niveles de metilación se pueden medir como se describe a continuación. Además, las moléculas de ADN acelular se analizan para determinar un alelo respectivo de la molécula de ADN acelular. Por ejemplo, un alelo de una molécula de ADN se puede determinar a partir de una lectura de secuencia obtenida de la secuenciación o de una sonda particular que se hibrida con la molécula de ADN, donde ambas técnicas pueden proporcionar una lectura de secuencia (p. ej., la sonda puede tratarse como la lectura de secuencia cuando hay hibridación).
En el bloque 1320, se determinan un primer haplotipo y un segundo haplotipo de una primera región cromosómica de un primer genoma parental de un primer progenitor del feto. Un experto en la materia conocerá diversas técnicas para determinar los haplotipos de un progenitor. Los haplotipos se pueden determinar a partir de la misma muestra que se utilizó para determinar los niveles de metilación inferiores o a partir de una muestra diferente. En algunas implementaciones, los haplotipos se pueden determinar a partir de muestras celulares, p. ej., la capa leucocitaria de una muestra de sangre o el tejido de otro órgano. Se proporcionan ejemplos de determinación de haplotipos en la patente de los Estados Unidos n.° 8467976. El primer progenitor puede ser la madre o el padre. Otros ejemplos de métodos para detectar los haplotipos parentales incluyen, pero sin limitación, los métodos descritos por Fan et al. (Nat Biotechnol 2011; 29: 51-57), Snyder et al. (Nat Rev Genet 2015; 16: 344-358), la tecnología GemCode de 10X Genomics (www.10xgenomics.com/) y la tecnología Targeted Locus Amplification (TLA) de Cergentis (www.cergentis.com/).
En el bloque 1330, se identifican uno o más locus heterocigóticos a partir del primer y segundo haplotipo. Cada locus heterocigótico tiene un primer alelo correspondiente en el primer haplotipo y un segundo alelo correspondiente en el segundo haplotipo. El o los locus heterocigóticos pueden ser una primera pluralidad de locus heterocigóticos, donde una segunda pluralidad de locus heterocigóticos puede corresponder a una región cromosómica diferente.
En el bloque 1340, se identifica un primer conjunto de la pluralidad de moléculas de ADN acelular. Cada una de la pluralidad de moléculas de ADN acelular está ubicada en uno cualquiera de los locus heterocigóticos del bloque 1330 e incluye un primer alelo correspondiente, de modo que la molécula de ADN acelular pueda identificarse como correspondiente al primer haplotipo. Es posible que una molécula de ADN acelular esté ubicada en más de uno de los locus heterocigóticos, pero normalmente una lectura solo incluiría un locus heterocigótico. Cada una del primer conjunto de moléculas de ADN acelular también incluye al menos uno de N sitios genómicos, donde los sitios genómicos se utilizan para medir los niveles de metilación. N es un número entero, p. ej., mayor o igual a 2, 3, 4, 5, 10, 20, 50, 100, 200, 500, 1000, 2000 o 5000. Por tanto, una lectura de una molécula de ADN acelular puede indicar la cobertura de 1 sitio, 2 sitios, etc.
En el bloque 1350, se miden N primeros niveles de mutilación de la mezcla en los N sitios genómicos (p. ej., sitios de CpG) utilizando el primer conjunto de la pluralidad de moléculas de ADN acelular. Se puede medir un primer nivel de metilación de la mezcla para cada uno de los N sitios genómicos. El bloque 1350 se puede realizar de manera similar al bloque 150 del método 100 de la FIG. 1. En algunas realizaciones, la medición del nivel de metilación de una molécula de ADN puede utilizar resultados de secuenciación con determinación de metilación, que también se pueden utilizar para determinar la ubicación y el alelo respectivo de la molécula de ADN. Un experto en la materia conocerá las diversas técnicas que se pueden utilizar para determinar el estado de metilación de un sitio en una molécula de ADN.
En el bloque 1360, una primera contribución fraccionaria del tipo de tejido fetal en la mezcla se determina utilizando los N primeros niveles de metilación. En algunas realizaciones, el bloque 1360 se puede realizar a través de los bloques 160 y 170 del método 100 de la FIG. 1. Por tanto, se puede determinar una contribución fraccionaria simultáneamente para un panel de M tipos de tejido. El bloque 1360 puede usar N niveles de metilación específicos de tejido en N sitios genómicos, determinados para cada uno de los M tipos de tejido, p. ej., como en el bloque 120 del método 100 de la FIG. 1.
En el bloque 1370, se identifica un segundo conjunto de la pluralidad de moléculas de ADN acelular. Cada una de la pluralidad de moléculas de ADN acelular está ubicada en uno cualquiera de los locus heterocigóticos del bloque 1330 e incluye un segundo alelo correspondiente, de modo que la molécula de ADN acelular pueda identificarse como correspondiente al segundo haplotipo. Cada una del segundo conjunto de moléculas de ADN acelular también incluye al menos uno de los N sitios genómicos, donde los sitios genómicos se utilizan para medir los niveles de metilación.
En el bloque 1380, Los N segundos niveles de metilación de la mezcla en los N sitios genómicos se miden usando el segundo conjunto de la pluralidad de moléculas de ADN acelular. El bloque 1380 puede realizarse de un modo similar al bloque 1350.
En el bloque 1385, una segunda contribución fraccionaria del tipo de tejido fetal en la mezcla se determina utilizando los N segundos niveles de metilación. El bloque 1385 puede realizarse de un modo similar al bloque 1360.
En el bloque 1390, se calcula un primer valor de separación entre la primera contribución fraccionaria y la segunda contribución fraccionaria. En el presente documento, se describen ejemplos de valores de separación, p. ej., incluyendo una diferencia o una relación.
En el bloque 1395, la porción del genoma fetal se determina en el o los locus heterocigóticos en función del primer valor de separación. Por tanto, se puede determinar un haplotipo heredado del primer progenitor. Por ejemplo, el primer valor de separación puede ser una relación de la primera contribución fraccionaria y la segunda contribución fraccionaria. Se puede determinar que la porción del genoma fetal tiene una o más copias del primer haplotipo y ninguna copia del segundo haplotipo cuando la relación es mayor que un valor umbral. Los ejemplos de valores umbral incluyen, pero sin limitación, 1,3, 1,4, 1,5, 1,6, 1,8, 2,0, 2,2, 2,4, 2,6, 2,8 y 3,0. Se puede determinar que la porción del genoma fetal tiene una o más copias del segundo haplotipo y ninguna copia del primer haplotipo cuando la relación es menor que un valor umbral. Los ejemplos de valores umbral incluyen, pero sin limitación, 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7 y 0,8. Se puede determinar que la porción del genoma fetal tiene el primer haplotipo y el segundo haplotipo cuando la relación es igual a uno dentro de un valor de corte. Los ejemplos de valores de corte incluyen, pero sin limitación, 0,85, 0,9, 0,95, 1,0, 1,05, 1,1 y 1,15. Ambos haplotipos podrían heredarse cuando ambos progenitores tienen el mismo haplotipo en la región que se analiza.
Como otro ejemplo, el primer valor de separación es una diferencia de la primera contribución fraccionaria y la segunda contribución fraccionaria. Se puede determinar que la porción del genoma fetal tiene una o más copias del primer haplotipo y ninguna copia del segundo haplotipo cuando la diferencia es mayor que un valor umbral. Los ejemplos de valores umbral incluyen, pero sin limitación, 1 %, 1,5 %, 2 %, 2,5 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 10 %, 12 %, 14 %, 16 %, 18 % y 20 %. Se puede determinar que la porción del genoma fetal tiene una o más copias del segundo haplotipo y ninguna copia del primer haplotipo cuando la diferencia es menor que un valor umbral, p. ej., cuando el valor umbral es un número negativo.
También se puede determinar el haplotipo heredado del otro progenitor. Por ejemplo, una segunda pluralidad de locus heterocigóticos de la primera región cromosómica puede identificarse en el genoma del otro progenitor. Se pueden determinar contribuciones fraccionarias para cada uno de los haplotipos del otro progenitor y se puede utilizar un valor de separación para determinar el haplotipo heredado del otro progenitor.
Por ejemplo, la primera pluralidad de locus heterocigóticos y la segunda pluralidad de locus heterocigóticos pueden ser los mismos locus o ser diferentes. Cada uno de la segunda pluralidad de locus heterocigóticos puede incluir un tercer alelo correspondiente en un primer haplotipo del otro progenitor (p. ej., un primer haplotipo paterno) y un cuarto alelo correspondiente en un segundo haplotipo del otro progenitor (p. ej., un segundo haplotipo paterno). Los alelos tercero y cuarto pueden ser los mismos que los alelos primero y segundo. Además del primer y segundo conjunto de moléculas de ADN acelular para el primer progenitor, cada una de un tercer conjunto de la pluralidad de moléculas de ADN acelular puede ubicarse en una cualquiera de la segunda pluralidad de locus heterocigóticos, incluir el tercer alelo correspondiente del locus heterocigótico e incluir al menos uno de los K sitios genómicos. Los K sitios genómicos pueden ser iguales o diferentes a los N sitios genómicos utilizados para el primer progenitor. De manera similar al primer progenitor, los K terceros niveles de metilación de la mezcla se pueden medir en los K sitios genómicos utilizando el tercer conjunto de la segunda pluralidad de moléculas de ADN acelular y se puede determinar una tercera contribución fraccionaria del tipo de tejido fetal en la mezcla utilizando los K terceros niveles de metilación. La tercera contribución fraccionaria corresponde al primer haplotipo del otro progenitor (p. ej., el primer haplotipo paterno).
Cada una de un cuarto conjunto de la pluralidad de moléculas de ADN acelular puede ubicarse en una cualquiera de la segunda pluralidad de locus heterocigóticos, incluir el cuarto alelo correspondiente del locus heterocigótico e incluir al menos uno de los K sitios genómicos. Por tanto, el cuarto conjunto de ADN se puede utilizar para probar el segundo haplotipo del otro progenitor. Los K cuartos niveles de metilación de la mezcla en los K sitios genómicos se pueden medir utilizando el cuarto conjunto de la segunda pluralidad de moléculas de ADN acelular y puede determinarse una cuarta contribución fraccionaria del tipo de tejido fetal en la mezcla utilizando los K cuartos niveles de metilación. Se puede calcular un segundo valor de separación entre la tercera contribución fraccionaria y la cuarta contribución fraccionaria, y la porción del genoma fetal en la segunda pluralidad de locus heterocigóticos se puede determinar en función del segundo valor de separación. El haplotipo heredado del otro progenitor se puede determinar de manera similar al del primer progenitor. La cuarta contribución fraccionaria corresponde al segundo haplotipo del otro progenitor (p. ej., el segundo haplotipo paterno).
En algunas realizaciones, no es necesario determinar la segunda contribución fraccionaria. En su lugar, se puede determinar que un haplotipo se hereda si la contribución fraccionaria correspondiente es suficientemente alta. Por ejemplo, la primera contribución fraccionaria se puede comparar con un valor de referencia para determinar si el feto heredó el primer haplotipo en la primera región cromosómica. Se puede determinar que el feto ha heredado el primer haplotipo en la primera región cromosómica cuando la primera contribución fraccionaria supera el valor de referencia.
En otras realizaciones, el valor de referencia puede determinarse a partir de la segunda contribución fraccionaria. Por ejemplo, el valor de referencia puede ser una suma de la segunda contribución fraccionaria y un valor umbral. La suma con el valor umbral puede garantizar que la primera contribución fraccionaria sea suficientemente mayor que la segunda contribución fraccionaria.
Se puede realizar una determinación separada de herencia para el segundo haplotipo comparando la segunda contribución fraccionaria con el valor de referencia para determinar si el feto heredó el segundo haplotipo en la primera región cromosómica. Se puede determinar que el feto ha heredado el segundo haplotipo en la primera región cromosómica cuando la segunda contribución fraccionaria supera el valor de referencia. Si se determina que ambas contribuciones fraccionarias superan el valor de referencia, las dos contribuciones fraccionarias se pueden comparar entre sí para determinar si una es significativamente mayor que la otra (p. ej., utilizando un umbral). Los haplotipos del otro progenitor se pueden determinar para identificar si uno de estos haplotipos es el mismo que los haplotipos del primer progenitor, explicando de este modo que se podrían haber heredado ambos haplotipos del primer progenitor.
C. Determinación del haplotipo heredado mediante niveles de metilación
Otras realizaciones pueden utilizar la hipometilación general del ADN fetal acelular para identificar el haplotipo heredado como el que tiene el nivel de metilación global más bajo. Las realizaciones pueden comenzar con haplotipos maternos o paternos deducidos y después medir los niveles de metilación de moléculas de ADN plasmático que contienen alelos de SNP en cada uno de esos haplotipos deducidos. En una implementación del análisis de los haplotipos maternos, se pueden comparar los niveles de metilación de los dos haplotipos maternos deducidos y se predeciría que el que tiene el nivel de metilación más bajo es el haplotipo heredado por el feto. En otra implementación del análisis de los haplotipos paternos, se pueden comparar los niveles de metilación de los dos haplotipos paternos deducidos y se predeciría que el que tiene el nivel de metilación más bajo es el haplotipo heredado por el feto.
1. Ejemplo
A modo de ejemplo, se puede determinar un nivel de metilación de cada uno de los dos haplotipos maternos. Ya que el tejido placentario está relativamente hipometilado en comparación con otros tejidos, se espera que el haplotipo materno heredado por el feto esté más hipometilado que el que no hereda el feto. Las densidades de metilación se probaron en el plasma materno utilizando los haplotipos reales de la madre, que se dedujeron utilizando los genotipos materno, paterno y fetal.
T l . D n i m il i n r H I H II r l .
Figure imgf000027_0001
La tabla 9 muestra las densidades metiladas de los dos haplotipos maternos en el plasma materno. Ya que Hap I era el haplotipo real heredado por el feto por genotipado, los resultados del análisis de metilación del haplotipo identificaron correctamente la herencia.
En otras realizaciones, los haplotipos maternos se pueden deducir basándose solo en los genotipos de la madre o también se pueden utilizar para este análisis los haplotipos de referencia de la población de la base de datos de haplotipos. Se estimaron los haplotipos maternos utilizados en este ejemplo usando el programa IMPUTE2. Por tanto, también se pueden utilizar en este análisis haplotipos maternos deducidos.
T l 1 . D n i m il i n r H I ^ H II i .
Figure imgf000028_0001
La tabla 10 muestra las densidades metiladas de los dos haplotipos maternos deducidos en el plasma materno. El haplotipo materno deducido que heredó el feto tenía densidades de metilación más bajas. Un ejemplo de un procedimiento estadístico que se puede utilizar para determinar si un haplotipo tiene una densidad de metilación suficientemente inferior incluye la prueba de chi-cuadrado. Puede ser necesaria una separación entre los dos niveles de metilación sea lo suficientemente grande (p. ej., mayor que un umbral) para realizar la determinación. Si la separación no es suficiente, entonces se puede realizar una clasificación indeterminada. En algunas realizaciones, se puede determinar una herencia de ambos haplotipos si la separación no es lo suficientemente grande y si ambos niveles de metilación están por debajo de un nivel umbral, que puede caracterizarse por la inclusión de ADN fetal. Por ejemplo, las tablas 9 y 10 indican que una densidad de metilación inferior al 70 % puede indicar que el feto ha heredado ese haplotipo. Ambos haplotipos se pueden heredar cuando los progenitores comparten un haplotipo para la región que se analiza.
En otra realización, pueden compararse las densidades de metilación generales del ADN plasmático materno que porta el Hap III y el Hap IV paternos. De forma similar al análisis de haplotipo materno, se deduciría que el feto ha heredado el haplotipo paterno que tiene densidades de metilación generales más bajas.
2. Método con niveles de metilación
La FIG. 14 es un diagrama de flujo que ilustra un método 1400 para determinar una porción de un genoma fetal a partir de una muestra materna utilizando los niveles de metilación según realizaciones de la presente invención. La muestra biológica incluye una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos, incluidos tipos de tejido materno y un tipo de tejido fetal. El feto tiene un padre y una madre que es la mujer embarazada. La porción del genoma fetal puede ser una copia cromosómica completa o solo parte de la copia cromosómica. Las porciones determinadas del genoma fetal se pueden combinar para proporcionar el genoma fetal completo, como con otros métodos descritos en el presente documento.
En el bloque 1410, se analiza una pluralidad de moléculas de ADN acelular de la muestra biológica. El bloque 1410 se puede realizar de manera similar al bloque 1310 del método 1300 de la FIG. 13.
En el bloque 1420, se determinan un primer haplotipo y un segundo haplotipo de una primera región cromosómica de un primer genoma parental de un primer progenitor del feto. El bloque 1420 se puede realizar de manera similar al bloque 1320 de la FIG. 13. En algunas realizaciones, los genotipos del genoma del primer precursor se pueden determinar en la pluralidad de locus heterocigóticos utilizando una muestra del primer progenitor, p. ej., una muestra de sangre u otro tejido que puede o no incluir ADN fetal. Se puede obtener una pluralidad de haplotipos de referencia, p. ej., de bases de datos de genomas de referencia. El primer haplotipo y el segundo haplotipo se pueden deducir utilizando los genotipos y la pluralidad de haplotipos de referencia. Por ejemplo, los alelos de cada genotipo se pueden comparar con los haplotipos de referencia y puede descartarse cualquier haplotipo que no incluya los alelos en el locus correspondiente. Una vez que queden dos haplotipos de referencia, esos haplotipos pueden identificarse como el primer haplotipo y el segundo haplotipo.
En el bloque 1430, se identifica una pluralidad de locus heterocigóticos a partir del primer y segundo haplotipos. Cada locus heterocigótico tiene un primer alelo en el primer haplotipo y un segundo alelo en el segundo haplotipo.
En el bloque 1440, se identifica un primer conjunto de la pluralidad de moléculas de ADN acelular. El bloque 1440 se puede realizar de manera similar al bloque 1340 de la FIG. 13.
En el bloque 1450, se mide un primer nivel de metilación de la mezcla utilizando el primer conjunto de la pluralidad de moléculas de ADN acelular. Por ejemplo, el primer nivel de metilación de la mezcla puede ser una densidad de metilación para las moléculas de a Dn acelular del primer conjunto. La densidad de metilación se puede calcular como una densidad de metilación total para todas las moléculas de ADN acelular del primer conjunto. En otro ejemplo, se pueden calcular las densidades de metilación separadas para cada locus y las densidades de metilación separadas se pueden combinar para obtener el primer nivel de metilación de la mezcla, p. ej., un promedio de las densidades de metilación separadas.
En el bloque 1460, se identifica un segundo conjunto de la pluralidad de moléculas de ADN acelular. El 1460 se puede realizar de manera similar al bloque 1370 de la FIG. 13.
En el bloque 1470, se mide un segundo nivel de metilación de la mezcla utilizando el segundo conjunto de la pluralidad de moléculas de ADN acelular. Por ejemplo, el segundo nivel de metilación de la mezcla puede ser una densidad de metilación para las moléculas de ADN acelular del segundo conjunto.
En el bloque 1480, se determina cuál del primer haplotipo y el segundo haplotipo es heredado por el feto basándose en cuál del primer nivel de metilación de la mezcla y el segundo nivel de metilación de la mezcla es más bajo. Como parte del bloque 1480, se puede determinar un valor de separación entre el primer nivel de metilación de la mezcla y el segundo nivel de metilación de la mezcla, y compararlo con un valor umbral. El valor umbral puede garantizar que el nivel inferior sea suficientemente inferior. El valor umbral se puede determinar mediante la prueba de chi-cuadrado. Por ejemplo, se pueden realizar mediciones de muestras donde se conoce el haplotipo heredado y se puede determinar una distribución de los valores de separación, y se puede seleccionar un valor umbral que determine con precisión el haplotipo heredado en los datos de formación obtenidos de las muestras. También se pueden combinar los métodos 1300 y 1400, realizándose cada uno como una verificación, y determinar el haplotipo heredado si ambos métodos son coherentes entre sí.
D. Selección de locus
Pueden usarse diversas realizaciones para la comparación de los niveles de metilación o las contribuciones fraccionarias de los dos haplotipos maternos deducidos en el plasma materno. En una realización, el número de locus de SNP que se van a analizar puede determinarse antes del análisis. Por ejemplo, el número de locus de SNP utilizados en el análisis de desconvolución de haplotipos se puede determinar según varios factores, por ejemplo, pero sin limitación, la potencia estadística deseada, la diferencia media en los niveles de metilación en la placenta y las células sanguíneas en la región de interés y el número de moléculas que se analizan para cada SNP.
El tamaño de la región de interés se puede fijar y se pueden utilizar todos los SNP dentro de la región de interés en el análisis. El tamaño de la región de interés se puede determinar teniendo en cuenta varios factores, por ejemplo, pero sin limitación, la potencia estadística deseada, la diferencia media en el nivel de metilación en la placenta y las células sanguíneas en la región de interés, el número de moléculas que se analizan para cada SNP y la probabilidad de recombinación meiótica con la región de interés.
En otras realizaciones, el número de SNP y el tamaño de la región que se va a analizar no se determinan antes del análisis. Por ejemplo, el número de SNP se puede aumentar secuencialmente hasta que los datos sean suficientes para llegar a una conclusión estadísticamente significativa sobre qué haplotipo materno está significativamente menos metilado desde el punto de vista estadístico que el otro. Por ejemplo, los SNP en la región de interés se pueden disponer en orden ascendente de sus coordenadas genómicas. Entonces se pueden llevar a cabo pruebas estadísticas con los datos del SNP con el menor número de coordenada genómica. Si esto es suficiente para llegar a una conclusión sobre qué haplotipo está menos metilado estadísticamente, entonces se llega a una conclusión. De forma similar, los SNP se pueden organizar en orden descendente, utilizándose un número más alto de coordenada genómica que es suficiente.
Si la precisión estadística no es suficiente, se puede realizar otra comparación estadística a partir del siguiente SNP con un mayor número de coordenadas genómicas. Por otra parte, si los datos del primer SNP no son suficientes para concluir que un haplotipo está menos metilado que el otro (o que el valor de separación entre contribuciones fraccionarias no es suficientemente grande), se pueden añadir los datos de otro SNP y se lleva a cabo otro ciclo de pruebas estadísticas. Este procedimiento puede continuar hasta que los datos acumulados sean suficientes para llegar a una conclusión estadísticamente significativa. Se pueden realizar varias pruebas estadísticas para comparar los niveles de metilación de los dos haplotipos, por ejemplo, pero sin limitación, la prueba de t de Student, la prueba de suma de rangos de Mann-Whitney y la prueba de Chi-cuadrado. El nivel de significación estadística se puede determinar en función de la confianza deseada de la conclusión, por ejemplo, pero sin limitación, adoptando un valor de P de 0,05, 0,01, 0,001, 0,0001 o 0,00001.
E. Combinaciones con RHDO
En algunas realizaciones, los resultados generados por el análisis de RHDO de la patente de los Estados Unidos 8 467976 se pueden combinar con las presentes realizaciones de metilación para llegar a un procedimiento más preciso para el diagnóstico o para reducir la cantidad de secuenciación necesaria. Por ejemplo, los haplotipos fetales se pueden determinar utilizando las presentes realizaciones y utilizando los resultados del análisis de RHDO de la patente de los Estados Unidos 8467976 y pueden compararse los haplotipos fetales determinados a partir de ambas técnicas. Por ejemplo, los resultados de los dos análisis serían aceptados solo si son concordantes. Se puede realizar un análisis adicional si los dos análisis muestran conclusiones diferentes, p. ej., las mediciones se pueden repetir a mayor profundidad de cobertura en el genoma.
Para que un enfoque combinado de este tipo sea más rentable, se prefiere tener un tipo de secuenciación que pueda generar datos para ambos métodos. En una realización, esto se puede hacer mediante un método de moléculas individuales que generaría información de secuenciación y mutilación, p. ej., utilizando la tecnología de secuenciación en tiempo real de moléculas individuales de Pacific Biosciences, o la secuenciación de nanoporos (p. ej., de Oxford Nanopore Technologies). Estos son dos ejemplos de secuenciación con determinación de la metilación. En otra realización, el análisis de RHDO se puede realizar en los resultados de secuenciación con bisulfito. Para dicha realización, cualquier información genética materna y paterna se puede determinar también utilizando secuenciación con bisulfito. La secuenciación con bisulfito es, por tanto, otro ejemplo de secuenciación con determinación de metilación. Asimismo, se pueden utilizar otras tecnologías de secuenciación con determinación de metilación, tales como la secuenciación oxidativa con bisulfito (Booth et al. Science 2012; 336: 934-937) o secuenciación con bisulfito asistida por Tet (Yu et al. Cell 2012; 149: 1368-1380). Estos últimos ejemplos permitirían analizar la distribución de 5-metilcitosina de las moléculas de ADN analizadas.
F. Usos del conocimiento del genoma fetal
El análisis prenatal no invasivo del genoma fetal se puede utilizar para determinar si un feto ha heredado una enfermedad de los progenitores. Esto es particularmente útil para la detección de enfermedades monogénicas, por ejemplo, hiperplasia suprarrenal congénita (New et al. J Clin Endocrinol Metab 2014; 99: E1022-30), beta-talasemia (Lam et al. Clin Chem. 2012; 58: 1467-75) y distrofias musculares hereditarias (Genet Med 2015; 17: 889-96). Si se detecta una enfermedad monogénica, se pueden realizar diversos tratamientos, p. ej., se puede interrumpir el embarazo, tratamiento proporcionado antes del embarazo o después del parto. Por ejemplo, el tratamiento con esteroides puede administrarse prenatalmente a una mujer embarazada con un feto aquejado de hiperplasia suprarrenal congénita para evitar un desarrollo sexual anómalo.
VI. ANÁLISIS DE DESCONVOLUCIÓN DE HAPLOTIPOS PARA LA DETECCIÓN DE ANEUPLOIDÍA
La desconvolución de haplotipos también se puede utilizar para detectar un desequilibrio de secuencias de una región cromosómica de un feto, tal como aneuploidías, microsupresiones o microamplificaciones (p. ej., microduplicaciones). Por ejemplo, una contribución fraccionaria de un haplotipo en una región se puede comparar con una contribución fraccionaria de otro haplotipo en otra región.
A. Madre
La FIG. 15 muestra una detección de aneuploidía cromosómica basada en la desconvolución de haplotipos para haplotipos maternos según realizaciones de la presente invención. En esta ilustración, la madre tiene dos haplotipos maternos, a saber, Hap I y Hap II. Para fines ilustrativos, se supone que el 80 % de su ADN plasmático procedió de sus propias células y el 20 % procedió de la placenta, que son porcentajes ilustrativos en intervalos medidos habitualmente. Este método se puede aplicar en general para embarazos con diferentes porcentajes de ADN fetal. No se requiere conocimiento del porcentaje de ADN fetal, pero se proporciona simplemente para ilustración, aunque se puede realizar una medición del porcentaje de ADN fetal de varias maneras, p. ej., utilizando alelos específicos del feto o marcadores de metilación específicos del feto.
El feto ha heredado Hap I y otro haplotipo del padre, a saber, Hap III. El ADN procedente de la placenta presentaría los genotipos fetales y se puede detectar un desequilibrio de secuencias analizando la contribución fraccionaria resultante del ADN procedente de la placenta.
Como se ha ilustrado anteriormente, la herencia fetal del haplotipo materno se puede determinar mediante la desconvolución de los dos haplotipos maternos. Se puede realizar un análisis de la contribución placentaria al ADN materno para cada uno de los dos haplotipos maternos. El haplotipo materno heredado por el feto (Hap I en este ejemplo) tendría una contribución placentaria mucho mayor en comparación con el haplotipo materno que no hereda el feto (Hap II). La contribución placentaria para Hap I se correlacionaría positivamente con la fracción de ADN fetal en el plasma materno.
Después de determinar qué haplotipo materno ha heredado el feto, la dosis del cromosoma que el feto ha heredado de la madre se puede determinar adicionalmente a través de la desconvolución del haplotipo materno. En esta ilustración, dos regiones cromosómicas se analizan utilizando la desconvolución del haplotipo materno. En una realización, el cromosoma de referencia (CrRef) es un cromosoma o una región cromosómica que es poco probable que se vea afectada por una aneuploidía cromosómica. La región cromosómica de referencia se muestra en el lado izquierdo de la FIG. 15. El cromosoma diana (CrDiana) es un cromosoma o una región cromosómica que potencialmente se ve afectada por una aneuploidía cromosómica. La región cromosómica diana se muestra en el lado derecho de la FIG. 15. Las dos regiones pueden ser para diferentes regiones de un mismo cromosoma o para regiones de dos cromosomas diferentes.
En el ejemplo mostrado, se ha deducido que el feto ha heredado Hap I de la madre tanto para el cromosoma de referencia como para el cromosoma diana a través de la desconvolución de metilación de Hap I y Hap II en cada región. A continuación, puede compararse la contribución placentaria al ADN del plasma materno para Hap I entre el cromosoma de referencia y el cromosoma diana. Si la contribución placentaria de Hap I para la región cromosómica diana es significativamente diferente de la contribución placentaria de Hap I para la región cromosómica de referencia (p. ej., mayor para la amplificación o menor para la supresión), entonces se puede identificar un desequilibrio de secuencias.
Con fines ilustrativos, se usó la detección de trisomía como ejemplo. Sin embargo, otros tipos de aneuploidías cromosómicas, incluidas la monosomía, la amplificación de una región subcromosómica o la supresión de una región subcromosómica también se pueden detectar usando este método. Para la trisomía, la copia adicional del cromosoma afectado se puede heredar del padre (denominado Trisomía (F)) o de la madre (denominado Trisomía (M)). En más del 90 % de los casos de trisomía del 21, la copia adicional del cromosoma 21 procede de la madre (Driscoll et al. N Engl J Med 2009; 360: 2556-2562). En el escenario de trisomía (M), la contribución placentaria de Hap I para el cromosoma diana sería mayor que la del cromosoma de referencia. En la FIG. 15, La trisomía (M) se muestra con dos casos de Hap I, lo que proporcionaría una mayor contribución placentaria para la región diana que el único caso de Hap I para la región de referencia.
Se puede determinar si la contribución placentaria de Hap I para el cromosoma diana es mayor que la del cromosoma de referencia comparando un valor de separación entre las dos contribuciones placentarias y un umbral, que puede basarse en una medición separada del porcentaje de ADN fetal. Un porcentaje de ADN fetal más alto daría lugar a un valor de separación esperado más alto entre las dos contribuciones placentarias y, por tanto, el umbral se puede establecer más alto. Por ejemplo, siendo el porcentaje de ADN fetal del 20 %, la contribución placentaria de Hap I para la región de referencia sería de aproximadamente el 20 % y la contribución placentaria de Hap I para la región diana sería de aproximadamente el 36,4 %.
Por ejemplo, si se supone que existen 10 moléculas de ADN en el cromosoma de referencia, entonces dos de ellos son fetales y ocho de ellos son maternos. Para las dos moléculas de ADN fetal, uno procede de Hap I y uno procede de Hap III. Para las ocho moléculas de ADN maternas, cuatro son Hap I y cuatro son Hap II. Para la región diana, habría una molécula adicional de ADN de Hap I del feto. Por tanto, habría dos moléculas de ADN Hap I fetal y 4 moléculas de ADN Hap I materno en total, lo que proporciona 2/6=33,3 %. El valor umbral para la diferencia (p. ej., 13,3 %) se puede colocar entre 0 y 13,3 % para proporcionar una especificidad y sensibilidad óptimas. Se puede determinar una distribución de valores de separación a partir de un grupo de muestras de referencia. En el escenario de euploidía, las contribuciones placentarias serían aproximadamente iguales, p. ej., el valor de separación sería menor que el umbral. Un experto en la materia sabrá cómo seleccionar un umbral adecuado basándose en la descripción del presente documento y en la patente de los Estados Unidos 8467976 y otras referencias citadas en el presente documento.
En una realización, la relación (u otro valor de separación) de la contribución placentaria de Hap I entre los cromosomas diana y de referencia para un grupo de mujeres embarazadas, cada uno de los cuales se sabe que porta un feto euploide, se puede utilizar como intervalo de referencia. La relación en el caso probado se puede comparar con este grupo de referencia para determinar si está presente una elevación significativa de la contribución placentaria de Hap I para la región diana en relación con la región de referencia. En el ejemplo del 20 % de ADN fetal, la relación sería 33,3/20 = 1,67. La relación se puede generalizar a 2/(1+f), donde f representa la fracción de ADN fetal. En otra realización, se puede determinar la diferencia en la contribución placentaria de Hap I entre la diana y los cromosomas de referencia. Esta diferencia se compara después con un grupo de referencia.
B. Padre
En otra realización, la desconvolución de haplotipos de los haplotipos paternos (Hap III y Hap IV) se puede realizar en el plasma materno. El análisis de los haplotipos paternos se puede realizar de manera similar al de los haplotipos maternos.
La FIG. 16 muestra una detección de aneuploidía cromosómica basada en la desconvolución de haplotipos para haplotipos paternos según realizaciones de la presente invención. En esta ilustración, el padre tiene dos haplotipos paternos, a saber, Hap III y Hap IV. Como en la FIG. 15, el feto ha heredado Hap I de la madre y Hap III del padre.
En el escenario donde la copia adicional del cromosoma procede del padre (Trisomía (F)), la contribución placentaria de Hap III sería mayor para el cromosoma diana que para el cromosoma de referencia. Esto se muestra para el ejemplo de trisomía (F), donde se muestran dos copias de Hap III. Como se ha descrito anteriormente para los haplotipos maternos, un valor de separación entre las contribuciones placentarias de Hap III para las regiones diana y de referencia puede compararse con un umbral para determinar si existe una copia adicional de Hap III para la región diana. En diversas realizaciones, una relación o diferencia de las dos contribuciones placentarias del caso probado se puede comparar con un grupo de referencia de mujeres embarazadas, de las que se sabe que cada una lleva un feto euploide para determinar si el feto tiene una trisomía cromosómica para el cromosoma, diana o amplificación o supresión de una región cromosómica diana. El umbral puede basarse en los valores de separación para el grupo de referencia de fetos euploides, un grupo de referencia de fetos con aneuploidía o ambos. También se puede utilizar una medida separada del porcentaje de ADN fetal, como se describe en el presente documento.
C. Método de detección de un desequilibrio de secuencia
La FIG. 17 es un diagrama de flujo de un método 1700 para detectar un desequilibrio de secuencias en una parte de un genoma fetal de un feto no nacido de una mujer embarazada utilizando una muestra biológica de la mujer embarazada según realizaciones de la presente invención.
En el bloque 1710, se analiza una pluralidad de moléculas de ADN acelular de la muestra biológica. El bloque 1710 se puede realizar de manera similar al bloque 1310 del método 1300 de la FIG. 13.
En el bloque 1720, se determina un primer haplotipo diana de una región cromosómica diana de un primer genoma parental de un primer progenitor del feto y se determina un primer haplotipo de referencia de una región cromosómica de referencia del primer genoma parental. El bloque 1720 se puede realizar de manera similar al bloque 1320 de la FIG. 13. La región cromosómica diana y la región cromosómica de referencia pueden ser un cromosoma completo o solo parte de un cromosoma. Por tanto, la región cromosómica diana puede ser un primer cromosoma y la región cromosómica de referencia puede ser un segundo cromosoma diferente del primer cromosoma. El primer progenitor puede ser la madre o el padre del feto.
La región cromosómica diana se puede seleccionar en función de diversos criterios. Por ejemplo, se puede seleccionar una pluralidad de regiones diana, como puede ocurrir para probar muchas regiones no solapantes de un tamaño específico, tal como 1 Mb, 5 Mb, 10 Mb, 20 Mb, 50 Mb, etc. Como otro ejemplo, la región cromosómica diana se puede seleccionar en función de un análisis del número de copias que identifica que la región tiene más moléculas de ADN de las esperadas, p. ej., como se describe en las publicaciones de patente de los Estados Unidos 2009/0029377 and 2011/0276277.
En algunas realizaciones, se puede determinar que el feto ha heredado el primer haplotipo diana del primer progenitor y que el feto ha heredado el primer haplotipo de referencia del primer progenitor. La determinación puede incluir realizaciones de la FIG. 13 o la FIG. 14. Por ejemplo, determinar que el feto ha heredado el primer haplotipo diana del primer progenitor puede incluir determinar una segunda contribución fraccionaria diana del tipo de tejido fetal en la mezcla correspondiente al segundo haplotipo diana, calcular un segundo valor de separación entre la primera contribución fraccionaria diana y la segunda contribución fraccionaria diana y determinar que el feto ha heredado el primer haplotipo diana del primer progenitor basándose en el segundo valor de separación.
En el bloque 1730, se identifica una pluralidad de locus heterocigóticos diana de la región cromosómica diana del primer genoma parental. Cada locus heterocigótico diana incluye un primer alelo diana correspondiente en el primer haplotipo diana y un segundo alelo diana correspondiente en un segundo haplotipo diana de la primera región cromosómica del primer genoma parental. Volviendo al ejemplo de la FIG. 15, los locus heterocigóticos diana tienen los primeros alelos diana correspondientes de {G,T,A} en Hap I y tienen los segundos alelos diana correspondientes de {A,G,C} en Hap II.
En el bloque 1740, se identifica un conjunto diana de la pluralidad de moléculas de ADN acelular. Cada molécula de ADN acelular del conjunto diana se ubica en uno cualquiera de los locus heterocigóticos diana, incluye un primer alelo diana correspondiente e incluye al menos uno de N sitios genómicos en la región cromosómica diana. El bloque 1740 se puede realizar de manera similar a la descrita en el presente documento. Por ejemplo, las lecturas de secuencia se pueden asignar a un genoma de referencia, donde el conjunto diana de una pluralidad de moléculas de ADN acelular se alinea con uno cualquiera de los locus heterocigóticos diana.
En el bloque 1750, se miden N primeros niveles de metilación de la mezcla en los N sitios genómicos utilizando el conjunto diana de la pluralidad de moléculas de ADN acelular. El bloque 1750 se puede realizar de manera similar al bloque 1350 de la FIG. 13.
En el bloque 1760, una primera contribución fraccionaria del tipo de tejido fetal en la mezcla se determina utilizando los N primeros niveles de metilación. El bloque 1760 se puede realizar de manera similar al bloque 1360 de la FIG.
13.
En el bloque 1770, se identifica una pluralidad de locus heterocigóticos de referencia para la región cromosómica de referencia del primer genoma parental. Cada locus heterocigótico de referencia incluye un primer alelo de referencia correspondiente en el primer haplotipo de referencia y un segundo alelo de referencia correspondiente en un segundo haplotipo de referencia de la región cromosómica de referencia del primer genoma parental. Volviendo al ejemplo de la FIG. 15, los locus heterocigóticos de referencia tienen los primeros alelos diana correspondientes de {A,T,C} en Hap I y tienen los segundos alelos diana correspondientes de {T,C,A} en Hap II.
En el bloque 1775, se identifica un conjunto de referencia de la pluralidad de moléculas de ADN acelular. Cada molécula de ADN acelular del conjunto de referencia se ubica en uno cualquiera de los locus heterocigóticos de referencia, incluye un primer alelo de referencia correspondiente e incluye al menos uno de K sitios genómicos en la región cromosómica de referencia.
En el bloque 1780, se miden K niveles de metilación de la mezcla de referencia en los K sitios genómicos utilizando el conjunto de referencia de la pluralidad de moléculas de ADN acelular.
En el bloque 1785, se determina una primera contribución fraccionaria de referencia del tipo de tejido fetal en la mezcla utilizando los K niveles de metilación de referencia.
En el bloque 1790, se calcula un primer valor de separación entre la primera contribución fraccionaria diana y la primera contribución fraccionaria de referencia.
En el bloque 1795, el primer valor de separación se compara con un valor umbral para determinar una clasificación de si el feto tiene un desequilibrio de secuencias para la región cromosómica diana. Si el primer valor de separación supera el valor umbral, entonces se puede identificar un desequilibrio de secuencias. El valor umbral se puede determinar como se ha descrito anteriormente, p. ej., en función de los valores de separación observados en un grupo de referencia de muestras que no tienen un desequilibrio de secuencias y/o un grupo de referencia de muestras que tienen el desequilibrio de secuencias. Como ejemplos, la clasificación puede ser positiva, negativa o indeterminada para el desequilibrio de secuencia que se prueba.
Se pueden utilizar diferentes valores umbral, dependiendo del tipo de desequilibrio de secuencias. Por ejemplo, si el desequilibrio de secuencias es una supresión, entonces se esperaría que el primer valor de separación fuera un valor negativo. En tal caso, el valor umbral puede ser un número negativo y la comparación puede determinar que el primer valor umbral supera el valor umbral al ser un número negativo mayor. Si el desequilibrio de secuencias que se prueba es una amplificación, entonces se puede probar si el valor de separación es mayor que el valor umbral. Por tanto, el valor umbral utilizado puede depender del tipo de desequilibrio de secuencias que se pruebe.
VII. DESCONVOLUCIÓN DE IDENTIFICACIONES PARA IDENTIFICAR TEJIDO ENFERMO
Si se conoce una identificación genómica (p. ej., un alelo de SNP en particular), las realizaciones pueden determinar qué tejido es el origen de dichas identificaciones. Ya que las moléculas de ADN acelular que presentan las identificaciones provienen del tejido de origen, el tejido de origen se puede identificar a partir de las contribuciones fraccionarias determinadas utilizando moléculas de ADN acelular que presentan las identificaciones. Por tanto, las moléculas de ADN acelular con una identificación de un órgano trasplantado (p. ej., una identificación de un haplotipo del órgano trasplantado) se pueden utilizar para controlar los cambios en las cantidades de moléculas de ADN acelular del órgano trasplantado con alta sensibilidad, p. ej., ya que un alto aporte fraccionario del ADN en la mezcla sería del órgano trasplantado. Se proporcionan ejemplos de trasplantes para mostrar que la técnica es precisa. En otro ejemplo, se puede usar una identificación de un tumor para identificar los tejidos en los que reside el tumor.
A. Trasplante de órganos
Como ejemplo de trasplante de órganos, se analizó el plasma de un paciente que había recibido un trasplante de hígado y un paciente que había recibido un trasplante de médula ósea. Para cada caso, los alelos de SNP específicos del donante se identificaron mediante el genotipado de los tejidos de los pacientes y los donantes. Para el receptor de trasplante de hígado, se secuenciaron una biopsia del hígado del donante y las células sanguíneas del receptor. Para el caso del trasplante de médula ósea, se secuenciaron el hisopado bucal (genotipo receptor) y las células sanguíneas (genotipo donante). Las muestras de ADN plasmático se secuenciaron después de la conversión con bisulfito. Se utilizaron fragmentos de ADN secuenciados que portaban un alelo de SNP específico del donante y al menos un sitio de CpG para el análisis de desconvolución de metilación posterior. Se secuenciaron un total de 72 millones y 121 millones de lecturas de los pacientes que habían recibido un trasplante de hígado y médula ósea, respectivamente. Para los dos casos, se utilizaron 38 y 5355 fragmentos para el análisis de desconvolución, respectivamente.
Tabla 6. Contribuciones fraccionarias para diferentes órganos a fragmentos de ADN plasmático que portan alelos es ecíficos del donante en los dos rece tores de tras lante.
Figure imgf000033_0001
La tabla 6 muestra el análisis de desconvolución de mutilación en fragmentos de ADN plasmático que portan alelos específicos del donante en un receptor de trasplante de hígado y un receptor de trasplante de médula ósea. Los números representan el porcentaje de contribución de diferentes tejidos a los fragmentos de ADN plasmático específicos del donante. Para el caso del trasplante de hígado, se mostró que el hígado es el contribuyente más importante a estos fragmentos de ADN. Para el caso del trasplante de médula ósea, el sistema hematopoyético (que incluye los linfocitos T, linfocitos B y neutrófilos) fue la principal contribución de los fragmentos de ADN específicos del donante. Estos resultados indican que la desconvolución de metilación puede indicar con precisión el origen del tejido de los fragmentos de ADN que tienen alteraciones de un solo nucleótido. Una pequeña cantidad de fragmentos secuenciados se atribuyó a otros tejidos, probablemente debido a la imprecisión de la medición, ya que se utilizó una cantidad relativamente pequeña de fragmentos específicos del donante para el análisis de desconvolución.
Las contribuciones fraccionarias para el tejido asociado con el órgano trasplantado pueden determinarse de la manera anterior y controlarse. Con la contribución fraccionaria de referencia (un ejemplo de una contribución fraccionaria de referencia) relativamente alta como resultado del uso exclusivo de moléculas de ADN acelular que presentan la identificación del donante, se pueden detectar cambios pequeños en la cantidad total de ADN del donante en el plasma. Por consiguiente, el análisis de desconvolución de metilación se puede aplicar para el seguimiento del trasplante de órganos.
Como se ha podido ver anteriormente para el trasplante de hígado, la desconvolución de la metilación no es absolutamente específica. En este análisis, se usaron fragmentos de ADN plasmático que portaban los alelos específicos del donante para el análisis de desconvolución de metilación. Estos fragmentos son específicos para el donante y deben proceder únicamente del hígado en este receptor de trasplante de hígado. Por lo tanto, la contribución teórica del hígado debe ser del 100 %. Otra posibilidad es que determinados tipos de células estén presentes en diferentes tipos de tejidos, lo que hace que el perfil de metilación del hígado se solape con otros tejidos. Por ejemplo, las células del tejido conjuntivo del hígado también pueden estar presentes en otros órganos. No obstante, los porcentajes relativos de otros pacientes u otras muestras (p. ej., en otros momentos) del paciente actual pueden identificar si se liberan más moléculas de ADN acelular.
En diversas realizaciones, la identificación del donante puede corresponder a un haplotipo particular del genoma del donante o a ambos haplotipos en una región cromosómica. Se puede realizar desconvolución de metilación utilizando moléculas de ADN acelular ubicadas en los haplotipos donantes particulares y se pueden supervisar los aumentos de la contribución fraccionaria del haplotipo particular. Si se produce un aumento significativo (p. ej., medido por un porcentaje o un umbral absoluto), entonces se puede identificar un rechazo del órgano trasplantado.
La FIG. 18 muestra una ilustración de la desconvolución de haplotipos para la supervisión de trasplantes de órganos según realizaciones de la presente invención. El donante tiene haplotipos marcados como Hap I y Hap II y el receptor tiene haplotipos marcados como Hap III y Hap IV. El donante tiene una identificación en el locus 1 y locus 3, ya que los alelos no se encuentran en los haplotipos receptores. El locus 2 y el locus 4 no tienen una identificación de donante. Por tanto, las realizaciones pueden utilizar moléculas de ADN que están ubicadas en el locus 1 y el locus 3 como parte de un proceso de desconvolución.
La desconvolución del ADN plasmático se puede utilizar para determinar si la contribución fraccionaria determinada del órgano trasplantado está en el valor de referencia o aumenta en relación con el valor de referencia. En algunas realizaciones, se pueden determinar las contribuciones fraccionarias para cada Hap I y Hap II por separado, si existen identificaciones diferentes; tales identificaciones diferentes pueden existir en diferentes locus. En otras realizaciones, se puede determinar una única contribución fraccionaria para ambos haplotipos, p. ej., cuando comparten una identificación. En el ejemplo mostrado en la FIG. 18, Hap I y Hap II comparten una identificación en el locus 1 y el locus 3.
Por consiguiente, la contribución del órgano trasplantado se puede determinar utilizando la desconvolución de haplotipos. El aumento de la contribución del haplotipo al órgano trasplantado sería útil para indicar la mayor contribución del órgano al ADN plasmático. En diversas realizaciones, el nivel de referencia se puede determinar a partir de una cohorte de receptores de trasplantes que no presentan rechazo o de una cohorte de receptores de trasplantes que presentan rechazo. Cuando se utilizan receptores con rechazo, el nivel de referencia se puede determinar como inferior a los de una cohorte de receptores de trasplantes que presentan rechazo.
Como se ha mencionado anteriormente, el donante puede tener dos haplotipos idénticos o el receptor también puede tener dos haplotipos idénticos. Asimismo, el donante y el receptor pueden compartir un haplotipo. Siempre que el donante o el receptor tenga un haplotipo exclusivo, se puede determinar un cambio en un porcentaje de moléculas de ADN acelular del tejido del donante. En el primero, se detectará un rechazo cuando se vea un aumento en la contribución del haplotipo exclusivo del donante en el plasma (u otra muestra). En este último, se detectará un rechazo cuando se vea una disminución en la contribución del haplotipo exclusivo del receptor en el plasma.
Por consiguiente, algunas realizaciones pueden usar un primer haplotipo que está presente en las células normales del organismo y no está presente en las células anómalas que pueden estar en la mezcla. Esto correspondería al último ejemplo anterior, cuando el receptor tiene un haplotipo exclusivo. Otro ejemplo es en el que un paciente tiene un haplotipo exclusivo en células sanas en comparación con un tumor (p. ej., previamente hallado en el organismo). En esta realización, se puede determinar que el primer tipo de tejido tiene la patología cuando el primer valor de separación es menor que el valor umbral.
En algunas realizaciones, si se detecta que se ha rechazado el órgano trasplantado, se puede proporcionar tratamiento. Por ejemplo, se puede proporcionar un cambio en la dosis del medicamento antirrechazo. Como otro ejemplo, se puede obtener un nuevo órgano y se puede realizar cirugía para extirpar el viejo órgano trasplantado y colocar el nuevo órgano trasplantado.
B. Carcinoma hepatocelular (CHC)
A modo de ejemplo para determinar un tejido de origen para una identificación de cáncer o aberración (o supervisar la presencia de un tumor que se sabía que existía o había existido), se analizó el plasma de un paciente con CHC. Se secuenciaron el tumor y las células sanguíneas de los pacientes para identificar las mutaciones de un solo nucleótido específicas del cáncer. Se utilizaron fragmentos de ADN secuenciados que portaban una mutación específica del cáncer y al menos un sitio de CpG para el análisis de desconvolución de metilación posterior. Se utilizó un total de 11 968 fragmentos para el análisis de desconvolución. Además de los perfiles de metilación de los órganos tisulares normales, también se ha incluido el perfil de metilación de los tejidos de CHC como tejido candidato de origen.
En otra realización, se pueden considerar más tipos de tejidos tumorales como tejidos candidatos para las mutaciones. En una realización, los perfiles de metilación de los cánceres habituales, por ejemplo, pero sin limitación, cáncer colorrectal, cáncer de pulmón, cáncer de mama, cáncer de páncreas, cáncer de próstata, cáncer de vejiga, cáncer de cuello uterino y cáncer de ovario, pueden incluirse como tejidos candidatos. En otra realización más, solo se pueden incluir en el análisis los cánceres más probables específicos del paciente. Por ejemplo, en mujeres, se tienen en cuenta el cáncer de mama, cáncer de ovario, cáncer colorrectal y cáncer de cuello uterino. En otra realización más, se tienen en cuenta el origen étnico y la edad en la selección de los tejidos candidatos.
La tabla 7 muestra la desconvolución de metilación de los fragmentos de ADN plasmático que portan mutaciones asociadas al cáncer. El análisis de desconvolución determinó con precisión que los fragmentos de ADN que portan mutaciones asociadas al cáncer se obtienen predominantemente de los tejidos del cáncer de hígado.
Tabla 7. C nri i n fr i n ri r i n n H m i n m i n de cáncer.
Figure imgf000035_0001
En algunas realizaciones, el tumor se puede identificar inicialmente mediante la detección de una aberración en el número de copias, p. ej., como se describe en las patentes de los Estados Unidos N.° 8741 811 y 9121 069. El tejido particular de origen se puede determinar, p. ej., como se describe en la solicitud de patente de los Estados Unidos 14/994053 en función de patrones de aberraciones en el número de copias previamente identificadas en diversos tumores. Una vez identificado el tumor, se puede realizar un tratamiento, p. ej., mediante cirugía, radioterapia o quimioterapia. De cualquier manera, se puede obtener una biopsia después de determinar el tejido de origen. Se puede determinar una mutación puntual específica del cáncer a partir de la biopsia o de fragmentos de ADN en plasma (p. ej., como se describe en la publicación de patente de los Estados Unidos 2014/0100121, u otras mezclas que están asociadas con la aberración del número de copias.
Después del tratamiento, un cambio clave sería la desaparición de las aberraciones genómicas, incluida la aberración del número de copias y la mutación puntual. Cuando estas aberraciones desaparezcan, el análisis de la identificación genómica de la mutación puntual en las regiones afectadas proporcionaría un cambio en la contribución del tejido a través del análisis de desconvolución de metilación. Si el tumor regresa en el futuro, los cambios asociados al cáncer en la composición del tejido (determinados mediante el análisis de desconvolución de metilación) se verían de nuevo. Por ejemplo, la contribución fraccionaria se puede comparar con una contribución fraccionaria de referencia y, si se detecta un cambio, entonces se pueden proporcionar nuevos ciclos de tratamiento.
En diversas realizaciones, la mutación específica del cáncer puede estar en un solo haplotipo o en ambos haplotipos, p. ej., de una manera similar al ejemplo del donante anterior. Por tanto, como con el donante, se pueden determinar las contribuciones fraccionarias para cada Hap I y Hap II por separado, si existen identificaciones diferentes; tales identificaciones diferentes pueden existir en diferentes locus. En otras realizaciones, se puede determinar una única contribución fraccionaria para ambos haplotipos, p. ej., cuando comparten una identificación.
C. Impronta
En otra realización, el análisis de desconvolución de haplotipos se puede aplicar para el análisis de las regiones genómicas que muestran una impronta específica de tejido. Se ha mostrado que la metilación diferencial de los alelos heredados por vía paterna y materna en diferentes órganos tisulares es un fenómeno común (Baran et al. Genome Res 2015; 25: 927-36). La desconvolución de haplotipos sería útil para el seguimiento de la contribución del órgano que presenta una impronta específica de tejido. Por ejemplo, cuando los haplotipos heredados por vía paterna y materna tienen un estado de metilación diferente en el hígado pero no en otros tejidos, se puede realizar desconvolución de metilación en los haplotipos heredados tanto por vía paterna como por vía materna. En una realización, los patrones de metilación tanto paternos como maternos pueden incluirse como tejidos candidatos en el análisis.
D. Método con identificación genómica
La FIG. 19 es un diagrama de flujo que ilustra un método 1900 de análisis de una muestra biológica de un organismo para detectar si un primer tipo de tejido tiene una patología asociada con un primer haplotipo según realizaciones de la presente invención. La muestra biológica incluye una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos, incluyendo un primer tipo de tejido. El método 1900 se realiza al menos parcialmente usando un sistema informático.
En el bloque 1910, se analiza una pluralidad de moléculas de ADN acelular de la muestra biológica. El bloque 1910 se puede realizar utilizando las técnicas descritas en el bloque 140 del método 100 de la FIG. 1. Por ejemplo, se pueden analizar al menos 1000 moléculas de ADN acelular para determinar dónde se ubican las moléculas de ADN acelular y los niveles de metilación se pueden medir como se describe a continuación. Además, las moléculas de ADN acelular se analizan para determinar un alelo respectivo de la molécula de ADN acelular. Por ejemplo, un alelo de una molécula de ADN se puede determinar a partir de una lectura de secuencia o de una sonda particular que se hibrida con la molécula de ADN.
En el bloque 1920, se identifican uno o más locus. Cada locus tiene un primer alelo en un primer haplotipo de una primera región cromosómica. El primer haplotipo tiene una propiedad de: (1) no estar presente en las células sanas del organismo, sino que, en cambio, puede ser de un tumor o tejido trasplantado, como ejemplos; o (2) estar presente en células normales del organismo y no estar presente en células anómalas que puedan estar en la mezcla. Por tanto, el primer haplotipo tiene una identificación genómica. De esta manera, hay una diferencia entre las células sanas (normales) y las células anómalas, permitiendo de este modo que las realizaciones rastreen una contribución fraccionaria de uno u otro, o de ambos, para rastrear una extensión (p. ej., una contribución fraccionaria) de las células anómalas. Con la propiedad (1), el primer haplotipo está asociado con una patología, p. ej., cáncer o un rechazo del tejido trasplantado. Por tanto, un cáncer particular puede tener el primer haplotipo en un genoma de cáncer del cáncer particular.
El o los primeros alelos pueden identificarse en el o los locus en el primer haplotipo obteniendo una muestra de tejido (p. ej., del tumor o tejido trasplantado) y analizando las moléculas de ADN de la muestra de tejido para determinar el primer haplotipo. Dicha muestra de tejido puede obtenerse de una biopsia y el método 1900 puede usarse para probar si el cáncer se ha metastatizado a otros tejidos o si ha reaparecido después de la cirugía. Cada uno de los locus puede ser un locus heterocigótico o un locus homocigótico en las células anómalas. Por ejemplo, en la FIG. 18, el locus 1 y el locus 3 son homocigóticos en el órgano donante. No obstante, en última instancia, se observaría más de un alelo en el plasma para todos los locus, ya que cada locus tendría una identificación para células sanas o para células anómalas. Por tanto, existirían dos haplotipos entre los tipos de tejido, pero un solo tipo de tejido podría tener solo un haplotipo en una región que se analiza.
En el bloque 1930, se identifica un primer conjunto de la pluralidad de moléculas de ADN acelular. Cada una de la pluralidad de moléculas de ADN acelular está ubicada en uno cualquiera de los locus del bloque 1920 e incluye un primer alelo correspondiente en el locus, de modo que la molécula de ADN acelular pueda identificarse como correspondiente al primer haplotipo. Cada una del primer conjunto de moléculas de ADN acelular también incluye al menos uno de N sitios genómicos, donde los sitios genómicos se utilizan para medir los niveles de metilación. N es un número entero, p. ej., mayor o igual a 2, 3, 4, 5, 10, 20, 50, 100, 200, 500, 1000, 2000 o 5000.
En el bloque 1940, se miden N primeros niveles de metilación de la mezcla en los N sitios genómicos utilizando el primer conjunto de la pluralidad de moléculas de ADN acelular. Se puede medir un primer nivel de metilación de la mezcla para cada uno de los N sitios genómicos. El bloque 1940 se puede realizar de manera similar al bloque 150 del método 100 de la FIG. 1. En algunas realizaciones, la medición del nivel de metilación de una molécula de ADN puede utilizar resultados de secuenciación con determinación de metilación, que también se pueden utilizar para determinar la ubicación y el alelo respectivo de la molécula de ADN.
En el bloque 1950, una primera contribución fraccionaria del primer tipo de tejido en la mezcla se determina utilizando los N primeros niveles de metilación. En algunas realizaciones, el bloque 1950 se puede realizar a través de los bloques 160 y 170 del método 100 de la FIG. 1. Por tanto, se puede determinar una contribución fraccionaria simultáneamente para un panel de M tipos de tejido. El bloque 1950 puede usar N niveles de metilación específicos de tejido en N sitios genómicos, determinados para cada uno de los M tipos de tejido, p. ej., como en el bloque 120 del método 100 de la FIG. 1.
En el bloque 1960, se calcula un valor de separación entre la primera contribución fraccionaria y una contribución fraccionaria de referencia. En el presente documento, se describen ejemplos de valores de separación. La contribución fraccionaria de referencia se puede determinar utilizando muestras de organismos que están sanos para el primer tipo de tejido. Para un ejemplo de trasplante, la contribución fraccionaria de referencia puede determinarse a partir de una o más mediciones de muestras biológicas de organismos cuyo primer tejido trasplantado no se rechaza.
En el bloque 1970, el valor de separación se puede comparar con un valor umbral para determinar una clasificación de si el primer tipo de tejido tiene una patología. Por ejemplo, si el primer haplotipo está asociado con el cáncer, entonces una primera contribución fraccionaria apreciable indica que el primer tipo de tejido tiene cáncer, como se puede medir por el valor de separación que supera el valor umbral (p. ej., cuando la contribución fraccionaria de referencia es cero). La cantidad en que la primera contribución fraccionaria supera el valor umbral puede indicar un determinado nivel de cáncer. Como otro ejemplo, el primer haplotipo puede ser específico del tejido trasplantado y una contribución alta en relación con la referencia puede indicar que el organismo rechaza el tejido trasplantado.
En una realización donde el primer haplotipo está presente en células normales del organismo y no está presente en células anómalas que pueden estar en la mezcla, se puede determinar que el primer tipo de tejido tiene la patología cuando el primer valor de separación es menor que el valor umbral. Un ejemplo de una patología es la preeclampsia, que puede estar asociada con un espectro de cambios patológicos en un tejido fetal tal como la placenta. A modo de ejemplo, en dicha situación, si el primer haplotipo es específico del feto, p. ej., haplotipo heredado por vía paterna, este puede aumentar en el plasma materno en un embarazo complicado con preeclampsia.
En algunas realizaciones, un segundo haplotipo para el tejido enfermo, p. ej., también se puede utilizar el tejido trasplantado o un tumor. Por tanto, se puede calcular una segunda contribución fraccionaria y compararla con la contribución fraccionaria de referencia. Por consiguiente, cada una de un segundo conjunto de la pluralidad de moléculas de ADN acelular puede ubicarse en uno cualquiera del o los locus, incluyen un segundo alelo correspondiente en un segundo haplotipo de la primera región cromosómica e incluyen al menos uno de los N sitios genómicos. El segundo haplotipo tendría la misma propiedad de ser solo de células sanas o de células anómalas.
Se puede analizar una pluralidad de tipos de tejido (p. ej., utilizando el método 100 de la FIG. 1), para determinar un tejido de origen del primer haplotipo, p. ej., cuando se asocia con cáncer. Por consiguiente, se pueden determinar las contribuciones fraccionarias de otros tipos de tejido en la mezcla utilizando los N primeros niveles de metilación y los valores de separación correspondientes entre las contribuciones fraccionarias correspondientes y la contribución fraccionaria de referencia respectiva se pueden comparar con el valor umbral para determinar una clasificación de si cada uno de los otros tipos de tejido tiene el cáncer en particular. Diferentes tejidos podrían tener diferentes contribuciones fraccionarias de referencia.
VIII. IDENTIFICACIÓN DEL TEJIDO DE ORIGEN DE ANC DE CÁNCER
En algunas realizaciones, es posible que no se conozca el origen de un tumor. Por tanto, puede ser difícil identificar mutaciones puntuales en un tumor, como pueden utilizarse para el método 1900 de la FIG. 19 u otros métodos descritos en el presente documento. Adicionalmente, un tumor puede no tener un número significativo de mutaciones puntuales, pero puede tener regiones cromosómicas que presenten amplificaciones y supresiones (ejemplos de aberraciones en el número de copias).
Para abordar este problema, las realizaciones pueden utilizar un análisis del número de copias para identificar regiones que presentan una aberración en el número de copias (ANC). Normalmente, una ANC se produce en solo un haplotipo de una región. Como solo un haplotipo tiene una amplificación o una supresión, habrá una diferencia relativamente grande entre las contribuciones fraccionarias del tipo de tejido dentro del que reside el tumor.
El análisis de ANC se puede realizar de diversas maneras, p. ej., como se describe en las patentes de los Estados Unidos N.° 8741 811 y 9121 069. Por ejemplo, el genoma humano (o el genoma de otro tipo de organismo) se puede dividir en aproximadamente 3000 grupos de 1 Mb no solapantes. Se puede determinar el número de lecturas asignadas a cada grupo de 1 Mb. Después de corregir el sesgo de GC (Chen EZ, et al. (2011) PLoS One 6 (7): e21791), se puede calcular la densidad de lectura de secuencia de cada grupo. Para cada grupo, la densidad de lectura de secuencia del caso de prueba se puede comparar con los valores de los sujetos de control de referencia. Las ganancias y pérdidas del número de copias se pueden definir como 3 desviaciones típicas por encima y por debajo, respectivamente, de la media de los controles. Por consiguiente, la identificación de una primera región cromosómica que presenta una aberración en el número de copias puede basarse en una primera cantidad de moléculas de ADN acelular que están ubicadas en la primera región cromosómica.
Para determinar el origen tisular de las aberraciones en el número de copias en plasma, se puede realizar mapeo de tejido de ADN plasmático usando los marcadores de metilación ubicados dentro de las regiones genómicas que presentan tales aberraciones en plasma. En los siguientes ejemplos para los pacientes con cáncer, el mapeo de las aberraciones en el número de copias de ADN en plasma se realizó solo en los casos en que las aberraciones afectaban a una región cromosómica contigua de al menos 30 Mb para que se pudiera usar un número suficiente de marcadores de metilación para el mapeo.
A. Identificación de regiones con aberración en el número de copias (ANC)
Se reclutó a un hombre de 62 años con CHC del Departamento de Cirugía, Hospital Prince of Wales, Hong Kong, con consentimiento informado. Se recogieron diez mililitros de sangre venosa en tubos EDTA en el momento del diagnóstico y 3 meses después de la resección del tumor. Las muestras de sangre se centrifugaron a 3000 g durante 10 minutos para separar las células sanguíneas del plasma. El plasma se volvió a centrifugar a 30000 g durante 10 minutos para eliminar las células restantes.
Se utilizó ADN extraído de las células sanguíneas para estimar los SNP para construir los haplotipos del paciente utilizando la plataforma genómica 10x siguiendo las instrucciones del fabricante. El ADN de alto peso molecular se extrajo de muestras de sangre o tejido utilizando el equipo de ADN MagAttract HMW (QIagen, Alemania). La calidad del ADN se verificó mediante análisis de ADN genómico ScreenTape en un sistema 4200 TapeStation (Agilent, Alemania). El ADN se cuantificó mediante el equipo de ensayo de ADNbc HS en un fluorómetro Qubit 3.0 (Thermo Fisher Scientific, Waltham, MA). La indexación de muestras y la preparación de bibliotecas se realizaron utilizando el sistema GemCode y sus reactivos asociados (10X Genomics, Pleasanton, CA) (Zheng et al. Nat Biotechnol. marzo de 2016; 34: 303-11). En resumen, se introdujo 1 ng de ADN para reacciones GEM en las que se dividieron moléculas de ADN individuales para introducir códigos de barras específicos y extender el ADN. Después de las reacciones GEM, se prepararon bibliotecas de secuenciación según las recomendaciones del fabricante. Las bibliotecas se cuantificaron mediante qPCR utilizando el equipo de cuantificación de biblioteca KAPA (KAPA Biosystems, Wilmington, MA). Las bibliotecas normalizadas se secuenciaron en un secuenciador HiSeq 2500 (Illumina, San Diego, CA), con secuenciación de extremos emparejados de 15 lecturas de índices de 98 pb, 14 pb y 17 de 8 pb. Los resultados de la secuenciación se analizaron utilizando el paquete de programas informáticos Long Ranger (10X Genomics) de modo que se estimaron todos los SNP heterocigóticos y se determinaron los dos haplotipos del paciente.
Las muestras de plasma se secuenciaron utilizando Illumina hasta una profundidad de 17x. Se detectaron aberraciones en el número de copias en el plasma del paciente con CHC según el método descrito anteriormente (Chan et al. Clin Chem. 2013; 59: 211-24).
La FIG. 20 muestra un gráfico de aberraciones del número de copias detectadas en el plasma de un paciente con CHC según realizaciones de la presente invención. El círculo interior representa el resultado de la muestra de plasma recogida en el momento del diagnóstico (preoperatorio) y el círculo exterior representa el resultado de la muestra de plasma recogida a los 3 meses de la resección del tumor (postoperatorio). Cada punto representa una región de 1 Mb. Los puntos verdes, rojos y grises representan regiones con ganancia de número de copias, pérdida de número de copias y sin cambio en el número de copias, respectivamente. Se detectaron aberraciones en el número de copias en la muestra de plasma en el momento del diagnóstico y estos cambios desaparecieron después de extirpar el tumor.
En la FIG. 20, se destacan dos regiones por tener una ANC. La región 2010 tiene una ganancia del número de copias y la región 2020 tiene una pérdida del número de copias. Los haplotipos de estas regiones se pueden determinar utilizando cualquier muestra de tejido del sujeto y no solo una muestra de tumor. La diferencia en el número de copias es lo que impulsa la diferencia en las contribuciones fraccionarias y esa diferencia debería ser mayor en el tipo de tejido con el tumor.
B. Determinación del origen tisular de las aberraciones del número de copias
Se realizó un análisis de desconvolución de metilación para los dos haplotipos de forma independiente. Para fines ilustrativos, los dos haplotipos se denominan Hap I y Hap II. Las moléculas de ADN plasmático que abarcan los SNP heterocigóticos y al menos un sitio de CpG se utilizaron para este análisis. Las moléculas de ADN plasmático que portan los alelos de SNP en Hap I se analizaron independientemente de las que portan alelos en Hap II. El estado de metilación de los sitios de CpG se utilizó para la desconvolución de metilación para moléculas asignadas a Hap I y Hap II de forma independiente. Como resultado, se pudo determinar la contribución tisular a Hap I y Hap II en el Ad N plasmático.
En primer lugar, los inventores se centraron en las regiones con amplificación. Para fines ilustrativos, se analizó la región amplificada en el cromosoma 1q como ejemplo.
Figure imgf000039_0003
La tabla 11 muestra el número de lecturas de secuencia de los dos haplotipos. En el momento del diagnóstico, el número de lecturas asignadas a Hap I aumentó en comparación con el número de lecturas asignadas a Hap II. Esto indicó que Hap I se amplifica en relación con Hap II. Esta observación es compatible con el hecho de que un cromosoma en particular se duplica en el cáncer en lugar de que ambos cromosomas homólogos se amplifiquen en la misma medida, lo que estaba en consonancia con el hecho de que las aberraciones del número de copias se producen preferentemente en un haplotipo (Adey A. et al., Nature. 2013; 500: 207-11; La-Framboise T. et al., PLoS Comput Biol. 2005; 1 (6): e65). La diferencia en la dosis de los dos haplotipos desapareció después de la resección del tumor. La diferencia en el número absoluto de lecturas de secuencia entre las muestras de plasma tomadas en el momento del diagnóstico y después de la resección del tumor se debió a la diferencia en el número total de lecturas de secuencia generadas para las dos muestras de plasma.
Figure imgf000039_0004
La tabla 12 muestra un porcentaje de contribución de diferentes tejidos al ADN plasmático para los dos haplotipos en el momento del diagnóstico y después de la resección del tumor. En el momento del diagnóstico, las contribuciones del hígado al ADN plasmático fueron del 19,7 % y del 8,0 % para Hap I y Hap II, respectivamente. Una diferencia del 11,7 % fue la más alta entre los diferentes tipos de tejido. Esto indicó que la diferencia de dosis entre Hap I y Hap II en el plasma probablemente se debió a la contribución del hígado. Esto indicó además que el origen probable de la aberración cromosómica era del hígado porque los cambios en el número de copias probablemente se debieron a la duplicación de Hap I en el análisis de recuentos de lecturas de secuencia. En otra realización, la diferencia en la contribución de Hap I y Hap II se puede clasificar para indicar la probabilidad relativa de que diferentes tejidos sean la fuente de las aberraciones del número de copias.
El valor para el corazón es -17, que está en la dirección opuesta a la aberración del número de copias identificada en la tabla 11. Por tanto, aunque el valor absoluto para el corazón es mayor que el valor absoluto para el hígado, el signo contrario descartaría al corazón como un candidato viable para el tipo de tejido del origen del tumor. Como la contribución total de todos los órganos es del 100 %, la diferencia positiva en las contribuciones del hígado da lugar a que otros tejidos tengan valores negativos.
De forma similar, esta desconvolución de metilación específica de haplotipo también se puede realizar en regiones con pérdida del número de copias. Con fines ilustrativos, se realizó este análisis en una región en el cromosoma 1p que presentó pérdida del número de copias.
Figure imgf000039_0002
La tabla 13 muestra un número de lecturas de secuencia de los dos haplotipos. En el momento del diagnóstico, el número de lecturas asignadas a Hap II disminuyó en comparación con el número de lecturas asignadas a Hap I. En tejidos tumorales, la mayoría de las regiones con pérdida del número de copias cromosómicas solo implicarían la eliminación de uno de los dos cromosomas. Por tanto, la reducción relativa de la dosis de Hap II fue compatible con la supresión de Hap II. La diferencia en la dosis de los dos haplotipos desapareció después de la resección del tumor, lo que indicó que la cantidad de ADN procedente del tumor había disminuido o desaparecido del plasma.
Figure imgf000039_0001
continuación
Figure imgf000040_0001
La tabla 14 muestra un porcentaje de contribución de diferentes tejidos al ADN plasmático para los dos haplotipos en el momento del diagnóstico y después de la resección del tumor. En el momento del diagnóstico, las contribuciones del hígado al ADN plasmático fueron del 13,3 % y del 5,5 % para Hap I y Hap II, respectivamente. Una diferencia del 7,8 % fue la más alta entre los diferentes tipos de tejido. Esto indicó que la diferencia de dosis entre Hap I y Hap II en el plasma probablemente se debió a la contribución del hígado. Esto indicó además que el origen probable de la aberración cromosómica era del hígado porque los cambios en el número de copias probablemente se debieron a la supresión de Hap II en el análisis de recuentos de lecturas de secuencia. En otra realización, la diferencia en la contribución de Hap I y Hap II se puede clasificar para indicar la probabilidad relativa de que diferentes tejidos sean la fuente de las aberraciones del número de copias.
C. Método para determinar el origen tisular del tumor
La FIG. 21 es un diagrama de flujo que ilustra un método de análisis de una muestra biológica de un organismo para identificar el origen de una aberración cromosómica según realizaciones de la presente invención. La muestra biológica incluye una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos que incluyen un primer tipo de tejido.
En el bloque 2110, se analiza una pluralidad de moléculas de ADN acelular de la muestra biológica. El bloque 2110 se puede realizar utilizando las técnicas descritas en el bloque 1910 de la FIG. 1 y el bloque 140 del método 100 de la FIG. 1, así como otros bloques que describen características similares.
En el bloque 2115, se identifica que una primera región cromosómica presenta una aberración en el número de copias en el organismo en función de una primera cantidad de moléculas de ADN acelular que están ubicadas en la primera región cromosómica. A modo de ejemplo, se realiza análisis de ADN plasmático para identificar regiones que presentan aberraciones en el número de copias. La aberración puede corresponder a una representación excesiva o insuficiente. En algunas realizaciones, el genoma se puede separar en grupos (p. ej., grupos de 1 Mb) y se puede determinar la cantidad de moléculas de ADN acelular de un grupo particular (p. ej., mapeando lecturas de secuencias en esa parte de un genoma de referencia). La cantidad para un grupo en particular se puede normalizar (p. ej., con respecto a una cantidad promedio para un grupo) y se puede identificar una representación excesiva o insuficiente.
Se pueden usar otras técnicas además del recuento de moléculas de ADN que se asignan a una región particular. Por ejemplo, se puede usar una distribución de tamaños de las moléculas de ADN que se alinean con la primera región cromosómica para detectar la ANC. Por ejemplo, el ADN tumoral acelular es más pequeño que el ADN acelular de las células normales. Esta diferencia de tamaño se puede utilizar para detectar diferencias en una distribución de tamaños (p. ej., tamaño promedio o relación del número de moléculas de ADN en diferentes tamaños) entre dos haplotipos para la región o entre la región y otra región.
En el bloque 2120, se determinan un primer haplotipo y un segundo haplotipo del organismo en la primera región cromosómica. Los dos haplotipos pueden haberse determinado como parte del bloque 2115. Los dos haplotipos se pueden determinar utilizando la misma mezcla acelular o de una muestra diferente, p. ej., una muestra celular.
En el bloque 2130, se identifican uno o más locus heterocigóticos de la primera región cromosómica. Cada locus heterocigótico incluye un primer alelo correspondiente en el primer haplotipo y un segundo alelo correspondiente en el segundo haplotipo. El bloque 2130 se puede realizar de manera similar a otros bloques similares de métodos descritos en el presente documento.
En el bloque 2140, se identifica un primer conjunto de la pluralidad de moléculas de ADN acelular. Cada molécula de ADN del primer conjunto está ubicada en uno cualquiera de uno o más locus heterocigóticos, incluye el primer alelo correspondiente del locus heterocigótico e incluye al menos uno de N sitios genómicos. N es un número entero superior o igual a 2. El bloque 2140 se puede realizar de manera similar a otros bloques similares de métodos descritos en el presente documento.
En el bloque 2150, los N primeros niveles de metilación de la mezcla en los N sitios genómicos se miden usando el segundo conjunto de la pluralidad de moléculas de ADN acelular. El bloque 2150 se puede realizar de manera similar a otros bloques similares de métodos descritos en el presente documento.
En el bloque 2160, se identifica un segundo conjunto de la pluralidad de moléculas de ADN acelular. Cada molécula de ADN del segundo conjunto está ubicada en uno cualquiera de uno o más locus heterocigóticos, incluye el segundo alelo correspondiente del locus heterocigótico e incluye al menos uno de los N sitios genómicos. El bloque 2160 se puede realizar de manera similar a otros bloques similares de métodos descritos en el presente documento.
En algunas realizaciones, se puede determinar un primer número de moléculas de ADN acelular en el primer conjunto de la pluralidad de moléculas de ADN acelular y se puede determinar un segundo número de moléculas de ADN acelular en el segundo conjunto de la pluralidad de moléculas de ADN acelular, p. ej., como se muestra en la tabla 11. Se puede determinar qué número es mayor, proporcionando de este modo información acerca del valor de separación esperado para el tejido de origen, p. ej., qué haplotipo debería tener una contribución fraccionaria más alta.
El primer conjunto de la pluralidad de moléculas de ADN acelular puede tener una primera distribución de tamaños y el segundo conjunto de la pluralidad de moléculas de ADN acelular puede tener una segunda distribución de tamaños. Se puede determinar un valor estadístico de una distribución de tamaños de las moléculas de ADN para cada haplotipo, proporcionando de este modo un primer valor estadístico y un segundo valor estadístico. Se esperaría que el haplotipo con la distribución de tamaño más pequeña tuviera un número de copias más alto que el otro haplotipo, ya que se sabe que el ADN acelular tumoral es más pequeño, como se describe en la patente de los Estados Unidos n.° 8741 811. Son ejemplos de un valor estadístico de una distribución de tamaños una relación de un número de moléculas de ADN en diferentes tamaños, un tamaño promedio o un porcentaje de las moléculas de ADN en un tamaño específico (p. ej., inferior a un punto de corte de tamaño).
En el bloque 2170, Los N segundos niveles de metilación de la mezcla en los N sitios genómicos se miden usando el segundo conjunto de la pluralidad de moléculas de ADN acelular. El bloque 2170 se puede realizar de manera similar a otros bloques similares de métodos descritos en el presente documento.
Los bloques 2180 y 2190 se pueden realizar para cada uno de una pluralidad de M tipos de tejido. Los M tipos de tejido pueden incluir una lista predeterminada de tipos de tejido que se examinan y para los que se pueden conocer los niveles de metilación de referencia. La lista predeterminada puede incluir tejidos en los que el cáncer se ve de forma más predominante. M es un número entero mayor de uno.
En el bloque 2180, un sistema informático determina una primera contribución fraccionaria correspondiente del tipo de tejido en la mezcla utilizando los N primeros niveles de metilación. El sistema informático determina una segunda contribución fraccionaria correspondiente del tipo de tejido en la mezcla utilizando los N segundos niveles de metilación. El bloque 2180 se puede realizar de manera similar a otros bloques similares de métodos descritos en el presente documento.
En el bloque 2190, se calcula un valor de separación correspondiente entre la primera contribución fraccionaria correspondiente y la segunda contribución fraccionaria correspondiente. Se pueden utilizar diversos valores de separación, p. ej., como se describen en el presente documento.
En el bloque 2195, el primer tipo de tejido se identifica como un origen de la aberración del número de copias en función de un primer valor de separación del primer tipo de tejido que tiene un valor máximo entre los valores separados correspondientes. La determinación puede requerir que el valor de separación más alto sea suficientemente más alto que el segundo valor de separación más alto. Por ejemplo, puede ser necesario que la diferencia sea al menos un valor umbral, p. ej., 1 %, 2 %, 35, 4 %, 5 %, 6 % o 7 %. En una implementación, una diferencia entre el primer valor de separación y el siguiente valor de separación más alto se puede comparar con un umbral para determinar una clasificación de la probabilidad de que el primer tipo de tejido sea el origen de la aberración del número de copias. Por tanto, incluso si la diferencia no es superior al umbral, se puede proporcionar una probabilidad u otra clasificación. Por ejemplo, se puede usar una relación lineal desde 0 hasta el umbral, donde la probabilidad es del 100 % una vez que la diferencia es igual al umbral.
Dependiendo de cómo se determine el valor de separación, el valor máximo puede ser un número negativo máximo o un número positivo máximo. Por ejemplo, los valores de diferencia en la tabla 14 se podrían determinar usando Hap II - Hap I. Se puede determinar si el máximo debe ser un valor positivo o negativo utilizando el análisis de moléculas de ADN en cada haplotipo, p. ej., un recuento como en la tabla 13 o un análisis de tamaño como se ha descrito anteriormente. En algunas implementaciones, el valor de separación siempre se puede determinar de tal manera que se espere un valor positivo máximo, p. ej., restando la contribución fraccionaria del haplotipo con un número de copias más bajo de la contribución fraccionaria del haplotipo con el número de copias más alto.
Después de identificar el origen, se puede realizar una investigación utilizando modalidades de captura de imágenes, p. ej., tomografía computarizada (TC) o imágenes por resonancia magnética (IRM), del sujeto (sujeto completo o específicamente del órgano candidato) para confirmar o descartar la presencia de un tumor en el órgano. Si se confirma la presencia de un tumor, se puede realizar un tratamiento, p. ej., cirugía (con bisturí o con radioterapia) o quimioterapia.
IX. SISTEMA INFORMÁTICO
Cualquiera de los sistemas informáticos mencionados en el presente documento puede utilizar cualquier número adecuado de subsistemas. En la FIG. 22, en el aparato informático 10 se muestran ejemplos de dichos subsistemas. En algunas realizaciones, un sistema informático incluye un único aparato informático, donde los subsistemas pueden ser los componentes del aparato informático. En otras realizaciones, un sistema informático puede incluir varios aparatos informáticos, siendo cada uno de ellos un subsistema, con componentes internos. Un sistema informático puede incluir ordenadores de escritorio y portátiles, tabletas, teléfonos móviles y otros dispositivos móviles.
Los subsistemas mostrados en la FIG. 22 están interconectados a través de un bus de sistema 75. Se muestran subsistemas adicionales tales como una impresora 74, teclado 78, dispositivo o dispositivos de almacenamiento 79, monitor 76, que está acoplado al adaptador de pantalla 82, y otros. Los dispositivos periféricos y de entrada/salida (I/O, por sus siglas en inglés), que se acoplan al controlador de I/O 71, pueden conectarse al sistema informático mediante cualquier tipo de medio conocido en la técnica, tal como el puerto de entrada/salida (I/O) 77 (p. ej., USB, FireWire®). Por ejemplo, el puerto de I/O 77 o la interfaz externa 81 (p. ej., Ethernet, Wi-Fi, etc.) pueden utilizarse para conectar el sistema informático 10 a una red de área amplia, tal como Internet, un dispositivo de entrada de ratón o un escáner. La interconexión mediante el bus de sistema 75 permite que el procesador central 73 se comunique con cada subsistema y así controlar la ejecución de diversas instrucciones procedentes de la memoria del sistema 72 o del dispositivo o los dispositivos de almacenamiento 79 (p. ej., un disco fijo, tal como un disco duro o un disco óptico), así como el intercambio de información entre subsistemas. La memoria del sistema 72 y/o los dispositivos de almacenamiento 79 pueden ser realizaciones de un medio legible por ordenador. Otro subsistema es un dispositivo de recogida de datos 85, tal como una cámara, micrófono, acelerómetro y similares. Cualquiera de los datos mencionados en el presente documento puede ser la salida de un componente a otro componente y puede ser la salida al usuario.
Un sistema informático puede incluir una pluralidad de los mismos componentes o subsistemas, p. ej., conectados entre sí por la interfaz externa 81 o por una interfaz interna. En algunas realizaciones, los sistemas informáticos, subsistema o aparatos pueden comunicarse a través de una red. En dichos casos, un ordenador puede considerarse como cliente y otro ordenador como servidor, donde cada uno puede formar parte de un mismo sistema informático. Un cliente y un servidor pueden incluir cada uno múltiples sistemas, subsistemas o componentes.
Algunos aspectos de las realizaciones pueden implementarse en forma de lógica de control utilizando un equipo físico (p. ej., un circuito integrado de aplicación específica o una matriz de puertas programables en campo) y/o utilizando programas informáticos con un procesador generalmente programable de forma modular o integrada. Como se utiliza en el presente documento, un procesador incluye un procesador de un solo núcleo, un procesador de varios núcleos en un mismo chip integrado o múltiples unidades de procesamiento en una sola placa de circuito o en red. Basándose en la divulgación y las enseñanzas proporcionadas en el presente documento, un experto habitual en la materia conocerá y percibirá otras formas y/o métodos para implementar las realizaciones de la presente invención utilizando equipos físicos y una combinación de equipos físicos y programas informáticos.
Puede implementarse cualquiera de los componentes o las funciones de programas informáticos descritos en la presente solicitud como código de programación para su ejecución mediante un procesador utilizando cualquier lenguaje informático adecuado, tal como, por ejemplo, Java, C, C++, C#, Objective-C, Swift o lenguaje de guiones tal como Perl o Python utilizando, por ejemplo, técnicas convencionales u orientadas por objetos. El código de programación puede almacenarse como una serie de instrucciones o comandos en un medio legible por ordenador para su almacenamiento y/o transmisión. Un medio legible por ordenador no transitorio adecuado puede incluir una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), un medio magnético tal como un disco duro o disquete o un medio óptico tal como un disco compacto (CD) o un DVD (disco digital versátil), memoria flash y similares. El medio legible por ordenador puede ser cualquier combinación de tales dispositivos de almacenamiento o transmisión.
Dichos programas también pueden codificarse y transmitirse utilizando señales portadoras adaptadas para la transmisión a través de redes cableadas, ópticas y/o inalámbricas que se ajusten a diversos protocolos, incluida Internet. De este modo, se puede crear un medio legible por ordenador utilizando una señal de datos codificada con dichos programas. Los medios legibles por ordenador codificados con el código del programa pueden empaquetarse con un dispositivo compatible o proporcionarse por separado de otros dispositivos (p. ej., a través de descarga de Internet). Cualquier medio legible por ordenador puede residir en o dentro de un solo producto informático (p. ej., un disco duro, un CD o un sistema informático completo) y puede estar presente en o dentro de diferentes productos informáticos dentro de un sistema o red. Un sistema informático puede incluir un monitor, una impresora u otro dispositivo de presentación adecuado para proporcionar a un usuario cualquiera de los resultados mencionados en el presente documento.
Cualquiera de los métodos descritos en el presente documento puede realizarse total o parcialmente con un sistema informático que incluya uno o más procesadores, que pueden configurarse para realizar las etapas. Por tanto, las realizaciones pueden dirigirse a sistemas informáticos configurados para realizar las etapas de cualquiera de los métodos descritos en el presente documento, potencialmente con diferentes componentes que realizan una etapa o un grupo de etapas respectivas. Aunque se presentan como etapas numeradas, las etapas de los métodos descritos en el presente documento pueden realizarse al mismo tiempo o en un orden diferente. Adicionalmente, pueden usarse partes de estas etapas con partes de otras etapas de otros métodos. Además, la totalidad de una etapa o partes de la misma pueden ser opcionales. Adicionalmente, cualquiera de las etapas de cualquiera de los métodos puede realizarse con módulos, unidades, circuitos u otros medios para realizar estas etapas.
La descripción anterior de las realizaciones ilustrativas de la invención se ha presentado con fines ilustrativos y descriptivos. No pretenden ser exhaustivos ni limitar la invención a la forma precisa descrita y son posibles muchas modificaciones y variaciones a la luz de las enseñanzas anteriores.
Una cita de "un", "una" o "el/la" se entiende como "uno o más" a menos que se indique específicamente lo contrario. Se entiende que el uso de "o" hace referencia a un "o inclusivo", y no a un "o exclusivo", a menos que se indique específicamente lo contrario. La referencia a un "primer" componente no requiere necesariamente que se proporcione un segundo componente. Además, la referencia a un "primer" o un "segundo" componente no limita el componente referido a una ubicación concreta, a menos que se indique expresamente.

Claims (15)

REIVINDICACIONES
1. Un método para analizar una muestra biológica de un organismo para identificar el origen de una aberración cromosómica, incluyendo la muestra biológica una mezcla de moléculas de ADN acelular de una pluralidad de tipos de tejidos, incluyendo un primer tipo de tejido, comprendiendo el método:
analizar, mediante un sistema informático, una pluralidad de moléculas de ADN acelular de la muestra biológica, siendo la pluralidad de moléculas de ADN acelular al menos 1000 moléculas de ADN acelular, en donde el análisis de una molécula de ADN acelular incluye:
identificar una ubicación de la molécula de ADN acelular en un genoma de referencia correspondiente al organismo;
determinar un alelo respectivo de la molécula de ADN acelular;
identificar que una primera región cromosómica presenta una aberración en el número de copias en el organismo en función de una primera cantidad de moléculas de ADN acelular que están ubicadas en la primera región cromosómica;
determinar un primer haplotipo y un segundo haplotipo del organismo en la primera región cromosómica; identificar uno o más locus heterocigóticos de la primera región cromosómica, incluyendo cada locus heterocigótico un primer alelo correspondiente en el primer haplotipo y un segundo alelo correspondiente en el segundo haplotipo; identificar un primer conjunto de la pluralidad de moléculas de ADN acelular, cada una de las cuales:
está ubicada en uno cualquiera del o los locus heterocigóticos,
incluye el primer alelo correspondiente del locus heterocigótico e
incluye al menos uno de N sitios genómicos, siendo N un número entero superior o igual a 2;
medir los N primeros niveles de metilación de la mezcla en los N sitios genómicos utilizando el primer conjunto de la pluralidad de moléculas de ADN acelular;
identificar un segundo conjunto de la pluralidad de moléculas de ADN acelular, cada una de las cuales:
está ubicada en uno cualquiera del o los locus heterocigóticos,
incluye el segundo alelo correspondiente del locus heterocigótico e
incluye al menos uno de los N sitios genómicos;
medir los N segundos niveles de metilación de la mezcla en los N sitios genómicos utilizando el segundo conjunto de la pluralidad de moléculas de ADN acelular;
para cada tipo de tejido de los M tipos de tejido:
determinar, mediante el sistema informático, una primera contribución fraccionaria correspondiente del tipo de tejido en la mezcla utilizando una desconvolución de un sistema lineal de ecuaciones creado a partir de los N primeros niveles de metilación de la mezcla y los niveles de metilación de los M tipos de tejido, siendo M un número entero mayor de uno;
determinar, mediante el sistema informático, una segunda contribución fraccionaria correspondiente del tipo de tejido en la mezcla utilizando una desconvolución de un sistema lineal de ecuaciones creado a partir de los N segundos niveles de metilación de la mezcla y los niveles de metilación de los M tipos de tejido; y calcular un valor de separación correspondiente entre la primera contribución fraccionaria correspondiente y la segunda contribución fraccionaria correspondiente; e
identificar el primer tipo de tejido como el origen de la aberración del número de copias en función de un primer valor de separación del primer tipo de tejido que tiene un valor máximo entre los valores separados correspondientes.
2. El método de la reivindicación 1, que comprende además:
determinar una diferencia entre el primer valor de separación y el siguiente valor de separación más alto; y comparar la diferencia con un umbral para determinar una clasificación de la probabilidad de que el primer tipo de tejido sea el origen de la aberración del número de copias.
3. El método de la reivindicación 1, en donde la identificación de la primera región cromosómica que presenta la aberración del número de copias incluye:
comparar la primera cantidad de moléculas de ADN acelular que están ubicadas en la primera región cromosómica con un valor de referencia determinado a partir de cantidades de moléculas de ADN acelular que están ubicadas en otras regiones cromosómicas.
4. El método de la reivindicación 1, en donde la aberración del número de copias es una ganancia del número de copias.
5. El método de la reivindicación 1, que comprende además:
determinar un primer número de moléculas de ADN acelular en el primer conjunto de la pluralidad de moléculas de ADN acelular;
determinar un segundo número de moléculas de ADN acelular en el segundo conjunto de la pluralidad de moléculas de ADN acelular; y
usar el primer número y el segundo número para determinar si el valor máximo debe ser positivo o negativo.
6. El método de la reivindicación 1, en donde el análisis de la molécula de ADN acelular incluye:
determinar el tamaño de la molécula de ADN acelular, en donde el primer conjunto de la pluralidad de moléculas de ADN acelular tiene una primera distribución de tamaños y en donde el segundo conjunto de la pluralidad de moléculas de ADN acelular tiene una segunda distribución de tamaños, comprendiendo el método además:
determinar un primer valor estadístico de la primera distribución de tamaños;
determinar un segundo valor estadístico de la segunda distribución de tamaños; y
usar el primer valor estadístico y el segundo valor estadístico para determinar si el valor máximo debe ser positivo o negativo.
7. El método de la reivindicación 6, que comprende además:
determinar cuál del primer haplotipo y el segundo haplotipo tiene un mayor número de copias usando el primer valor estadístico y el segundo valor estadístico; y
calcular los valores de separación correspondientes de manera que el primer valor de separación sea positivo.
8. El método de una cualquiera de las reivindicaciones 1-7, en donde el análisis de las moléculas de ADN acelular comprende analizar los resultados obtenidos por secuenciación con bisulfito, secuenciación precedida por digestión con enzimas de restricción sensibles a la metilación, inmunoprecipitación usando anticuerpo anti-metilcitosina o proteína de unión a metilación, o secuenciación de una sola molécula que permite dilucidar los niveles de metilación.
9. El método de una cualquiera de las reivindicaciones anteriores, en donde el valor de separación correspondiente es una relación de la primera contribución fraccionaria correspondiente y la segunda contribución fraccionaria correspondiente.
10. El método de una cualquiera de las reivindicaciones anteriores, en donde uno o más locus heterocigóticos son una primera pluralidad de locus heterocigóticos.
11. El método de una cualquiera de las reivindicaciones anteriores, en donde el primer tipo de tejido es un tipo de tejido fetal.
12. El método de una cualquiera de las reivindicaciones 1-10, en donde los M tipos de tejido incluyen hígado, pulmón, colon, páncreas, neutrófilos y linfocitos.
13. El método de una cualquiera de las reivindicaciones anteriores, en donde N es 10 o más.
14. El método de la reivindicación 13, en donde los N primeros niveles de metilación de la mezcla forman un vector de metilación b y en donde la determinación de las primeras contribuciones fraccionarias correspondientes incluye: para cada uno de los M tipos de tejido:
obtener N niveles de metilación específicos de tejido en los N sitios genómicos, siendo N mayor o igual que M, en donde los niveles de metilación específicos de tejido N forman una matriz A de dimensiones N por M, incluyendo los M tipos de tejido el primer tipo de tejido;
resolver para un vector de composición x que proporciona el vector de metilación b para la matriz A; y para cada uno de uno o más componentes del vector de composición x:
usar el componente para determinar la primera contribución fraccionaria correspondiente de un tipo de tejido correspondiente de los M tipos de tejido en la mezcla.
15. Un programa informático que comprende una pluralidad de instrucciones que pueden ejecutarse en un sistema informático, que cuando se ejecutan de este modo controlan el sistema informático para realizar el método de una cualquiera de las reivindicaciones anteriores.
ES20183986T 2015-07-20 2016-07-20 Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN Active ES2911613T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201562194702P 2015-07-20 2015-07-20

Publications (1)

Publication Number Publication Date
ES2911613T3 true ES2911613T3 (es) 2022-05-20

Family

ID=57833669

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20183986T Active ES2911613T3 (es) 2015-07-20 2016-07-20 Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN

Country Status (12)

Country Link
US (2) US10689706B2 (es)
EP (3) EP3325663B1 (es)
CN (2) CN115287348A (es)
AU (2) AU2016295712B2 (es)
CA (1) CA2993588A1 (es)
DK (1) DK3739061T3 (es)
ES (1) ES2911613T3 (es)
HK (2) HK1248283A1 (es)
HU (1) HUE059407T2 (es)
PT (1) PT3739061T (es)
TW (2) TWI798718B (es)
WO (1) WO2017012544A1 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2741400T3 (es) 2014-07-18 2020-02-10 Univ Hong Kong Chinese Análisis de patrones de metilación de tejidos en mezcla de ADN
JP2020503003A (ja) 2016-11-30 2020-01-30 ザ チャイニーズ ユニバーシティ オブ ホンコン 尿および他のサンプルにおける無細胞dnaの分析
EP3574108A4 (en) 2017-01-25 2020-12-23 The Chinese University Of Hong Kong DIAGNOSTIC APPLICATIONS WITH THE USE OF NUCLEIC ACID FRAGMENTS
EP3642747A1 (en) * 2017-06-20 2020-04-29 Illumina, Inc. Methods and systems for decomposition and quantification of dna mixtures from multiple contributors of known or unknown genotypes
DK3658684T3 (da) 2017-07-26 2023-10-09 Univ Hong Kong Chinese Forbedring af cancerscreening ved hjælp af cellefrie, virale nukleinsyrer
US20210087630A1 (en) * 2018-02-18 2021-03-25 Yissum Research Development Company Of The Hebrew University Of Jerusalmem Ltd. Cell free dna deconvolusion and use thereof
US20190341127A1 (en) * 2018-05-03 2019-11-07 The Chinese University Of Hong Kong Size-tagged preferred ends and orientation-aware analysis for measuring properties of cell-free mixtures
KR20210013061A (ko) * 2018-05-16 2021-02-03 트윈스트랜드 바이오사이언시스, 인코포레이티드 핵산 혼합물 및 혼합된 세포 집단을 해상하기 위한 방법 및 시약 및 관련 응용
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL
CA3121926A1 (en) * 2018-12-18 2020-06-25 Grail, Inc. Systems and methods for estimating cell source fractions using methylation information
CA3125647A1 (en) * 2019-03-13 2020-09-17 Grail, Inc. Systems and methods for enriching for cancer-derived fragments using fragment size
IL302199B1 (en) 2019-08-16 2024-02-01 Univ Hong Kong Chinese Determination of base changes of nucleic acids
EP4045685A4 (en) * 2019-10-18 2023-11-15 Washington University METHOD AND SYSTEMS FOR MEASURING CELL STATES
BR112022015073A2 (pt) * 2020-02-05 2022-11-16 Univ Hong Kong Chinese Método de análise de uma amostra biológica, produto de programa de computador, mídia de armazenamento, e, sistema de computação

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103849684A (zh) 2007-07-23 2014-06-11 香港中文大学 利用靶向扩增和测序的非侵入性胎儿基因组筛查
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US8563242B2 (en) * 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
DK2496717T3 (en) * 2009-11-05 2017-07-24 Univ Hong Kong Chinese ANALYSIS OF BORN THROUGH FROM A MATERNAL BIOLOGICAL TEST
WO2011054936A1 (en) 2009-11-06 2011-05-12 The Chinese University Of Hong Kong Size-based genomic analysis
KR102185244B1 (ko) 2010-11-30 2020-12-02 더 차이니즈 유니버시티 오브 홍콩 암과 연관된 유전적 또는 분자적 이상들의 검출
EP3901955A1 (en) * 2011-01-05 2021-10-27 The Chinese University Of Hong Kong Noninvasive prenatal genotyping of fetal sex chromosomes
US10900080B2 (en) * 2011-02-24 2021-01-26 The Chinese University Of Hong Kong Molecular testing of multiple pregnancies
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
PL3536807T3 (pl) 2012-09-20 2024-05-06 The Chinese University Of Hong Kong Nieinwazyjne określanie metylomu guza z wykorzystaniem osocza
US9732390B2 (en) * 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
MX363345B (es) 2013-03-15 2019-03-20 Univ Hong Kong Chinese Determinación de genomas fetales para embarazos de múltiples fetos.
US20150004601A1 (en) 2013-06-28 2015-01-01 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
US20160340740A1 (en) 2014-01-30 2016-11-24 The Regents Of The University Of California Methylation haplotyping for non-invasive diagnosis (monod)
CN106574296B (zh) 2014-04-14 2021-03-02 耶路撒冷希伯来大学伊森姆研究发展公司 用于测定dna的组织或细胞来源的方法和试剂盒
ES2741400T3 (es) 2014-07-18 2020-02-10 Univ Hong Kong Chinese Análisis de patrones de metilación de tejidos en mezcla de ADN

Also Published As

Publication number Publication date
TW201718871A (zh) 2017-06-01
DK3739061T3 (da) 2022-04-19
US20200270707A1 (en) 2020-08-27
CN115287348A (zh) 2022-11-04
TWI732771B (zh) 2021-07-11
CA2993588A1 (en) 2017-01-26
WO2017012544A1 (en) 2017-01-26
US10689706B2 (en) 2020-06-23
AU2016295712B2 (en) 2022-06-02
TWI798718B (zh) 2023-04-11
EP4063517A1 (en) 2022-09-28
EP3739061B1 (en) 2022-03-23
EP3325663A1 (en) 2018-05-30
CN108138233B (zh) 2022-08-26
HUE059407T2 (hu) 2022-11-28
AU2022218555A1 (en) 2022-09-15
EP3739061A1 (en) 2020-11-18
US20170029900A1 (en) 2017-02-02
EP3325663A4 (en) 2018-07-25
CN108138233A (zh) 2018-06-08
PT3739061T (pt) 2022-04-05
AU2016295712A1 (en) 2018-02-08
EP3325663B1 (en) 2020-08-19
HK1252222A1 (zh) 2019-05-24
TW202205300A (zh) 2022-02-01
HK1248283A1 (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
ES2911613T3 (es) Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN
US11984195B2 (en) Methylation pattern analysis of tissues in a DNA mixture
ES2908347T3 (es) Detección de mutaciones para cribado de cáncer y análisis fetal
CN107779506B (zh) 用于癌症检测的血浆dna突变分析
Nordentoft et al. Whole genome mutational analysis for tumor-informed ctDNA based MRD surveillance, treatment monitoring and biological characterization of urothelial carcinoma
TW202409295A (zh) Dna混合物中之組織甲基化模式分析