ES2965274T3 - Cariotipado molecular prenatal no invasivo a partir de plasma materno - Google Patents

Cariotipado molecular prenatal no invasivo a partir de plasma materno Download PDF

Info

Publication number
ES2965274T3
ES2965274T3 ES14737956T ES14737956T ES2965274T3 ES 2965274 T3 ES2965274 T3 ES 2965274T3 ES 14737956 T ES14737956 T ES 14737956T ES 14737956 T ES14737956 T ES 14737956T ES 2965274 T3 ES2965274 T3 ES 2965274T3
Authority
ES
Spain
Prior art keywords
genomic
density
genomic regions
consecutive
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14737956T
Other languages
English (en)
Inventor
Wai Kwun Rossa Chiu
Yuk Ming Dennis Lo
Kwan Chee Chan
Peiyong Jiang
Cheuk Yin Jandy Yu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Application granted granted Critical
Publication of ES2965274T3 publication Critical patent/ES2965274T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

En el presente documento se describen métodos, sistemas y aparatos para detectar microamplificaciones o microdeleciones en el genoma de un feto. En algunas realizaciones, el método comprende recibir etiquetas de secuencia para cada uno de una pluralidad de fragmentos de ADN en una muestra biológica; determinar posiciones genómicas para las etiquetas de secuencia; determinar si la densidad de ADN en cada una de una pluralidad de regiones genómicas es aberrantemente alta o baja; identificar como una microamplificación un conjunto de regiones genómicas consecutivas que tienen una densidad aberrantemente alta; e identificar como una microdeleción un conjunto de regiones genómicas consecutivas que tienen una densidad aberrantemente baja. La muestra biológica puede ser una muestra de sangre obtenida de forma no invasiva de una mujer embarazada del feto. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Cariotipado molecular prenatal no invasivo a partir de plasma materno
La presente invención proporciona procedimientos y programas informáticos para identificar microamplificaciones o microdeleciones en un genoma de un feto.
La presencia de ADN fetal en el plasma materno ha abierto interesantes posibilidades para realizar pruebas prenatales no invasivas [1, 2]. Recientemente, ha habido mucho interés en el uso de la secuenciación masiva en paralelo (MPS) para analizar el ADN fetal circulante con fines de pruebas prenatales. Por lo tanto, las trisomías fetales 21, 13, 18 y aneuploidías cromosómicas sexuales seleccionadas se han detectado utilizando MPS en el ADN del plasma materno [3 - 7] y se han introducido rápidamente en el servicio clínico.
Aparte de las anomalías debidas a cambios en el número de copias que afectan a un cromosoma completo, sería importante evaluar si el análisis del plasma materno basado en MPS podría ser lo suficientemente sensible para detectar deleciones o duplicaciones subcromosómicas. En este sentido, Peters et al. informaron sobre la detección de una deleción de 4,2 Mb en el cromosoma 12 en una muestra de plasma materno, obtenida en la semana 35 de gestación [8]. Jensen et al. informaron sobre la detección de una deleción de 3 Mb en el cromosoma 22 en muestras de plasma materno obtenidas de dos mujeres embarazadas en las semanas 19 y 20 de gestación [9]. Además de la región delecionada, Peters et al. también realizaron análisis estadísticos en otra región del cromosoma 12, así como en 20 regiones de 4 Mb no superpuestas en el cromosoma 14 [8]. Jensen et al., por otro lado, sólo enfocaron su análisis estadístico en la región delecionada del cromosoma 22 [9]. Por lo tanto, a partir de los datos presentados por Peters et al. y Jensen et al., no está claro si el enfoque sería lo suficientemente sólido para un estudio de microdeleciones o microduplicaciones en todo el genoma, o incluso para la determinación no invasiva de un cariotipo fetal.
Lo et al. informaron que los polimorfismos de un solo nucleótido (SNP) fetales se pueden genotipar a escala de todo el genoma utilizando la secuenciación del ADN del plasma materno [10]. En particular, estos investigadores han demostrado que los alelos y mutaciones de SNP para trastornos de un solo gen que el feto hereda de su madre pueden dilucidarse por medio de un proceso llamado análisis de dosis relativa de haplotipos [10]. Fan et al. confirmaron la solidez del análisis de dosis relativa de haplotipos y utilizaron este enfoque para detectar una deleción de ~ 2,85 Mb heredada por un feto de su madre [11]. Existen dos preocupaciones sobre el uso de este procedimiento para la implementación clínica del cariotipado prenatal no invasivo. En primer lugar, este procedimiento requiere la realización de haplotipos maternos, lo que requeriría etapas analíticas adicionales [12,13] o análisis genealógicos. En segundo lugar, no está claro si este procedimiento podría ser utilizado para detectar la deleción o duplicación subcromosómica de novo. El documento de patente WO 2012/071621 A1 proporciona un procedimiento para detectar regiones de un genoma fetal que tienen aberraciones. Joep de Ligt et al.: “P1-47: Massively parallel sequencing for noninvasive prenatal diagnosis of partial fetal aneuploidies [P1-47: Secuenciación masiva en paralelo para el diagnóstico prenatal no invasivo de aneuploidías fetales parciales]”, 16a Conferencia Internacional de ISPD sobre Diagnóstico y Terapia Prenatales, Diagnóstico Prenatal; vol. 32, núm. Supl. 1, 1 de junio de 2012, página 59, proporciona un procedimiento para detectar aneuploidía fetal parcial mediante la agrupación de lecturas de ADN fetal libre de células circulantes en ventanas cromosómicas de 10 kb.
De acuerdo con la presente invención, se proporciona un procedimiento de identificación de microamplificaciones o microdeleciones en un genoma de un feto mediante el análisis de una muestra biológica obtenida de un sujeto femenino embarazado del feto, incluyendo la muestra biológica ADN libre de células del feto y del sujeto femenino, comprendiendo el procedimiento: recibir una o más etiquetas de secuencia para cada uno de una pluralidad de fragmentos de ADN en la muestra biológica; determinar posiciones genómicas para las etiquetas de secuencia; para cada una de una pluralidad de regiones genómicas: determinar, con un sistema informático, una cantidad respectiva de fragmentos de ADN dentro de la región genómica a partir de etiquetas de secuencia que tienen posiciones genómicas dentro de la región genómica; normalizar la cantidad respectiva para obtener una densidad respectiva; y comparar la densidad respectiva con una densidad de referencia para identificar si la densidad respectiva es estadísticamente diferente de la densidad de referencia; determinar si cualquiera de las regiones genómicas identificadas por tener una densidad respectiva estadísticamente diferente de la densidad de referencia es consecutiva con otra región genómica identificada por tener una densidad respectiva estadísticamente diferente de la densidad de referencia; cuando al menos N primeras regiones genómicas identificadas por tener densidades respectivas estadísticamente superiores a la densidad de referencia son consecutivas, identificar las primeras regiones genómicas consecutivas como una microamplificación, siendo N un número entero igual o mayor que tres; cuando al menos N segundas regiones genómicas identificadas por tener densidades respectivas estadísticamente inferiores a las densidades de referencia son consecutivas, identificar las segundas regiones genómicas consecutivas como una microdeleción. La muestra biológica puede ser una muestra de sangre obtenida de forma no invasiva de un sujeto femenino embarazado del feto. A diferencia de WO 2012/071621 A1 y Joep de Ligt et al., la presente invención utiliza múltiples regiones genómicas consecutivas para identificar microamplificación o microdeleción.
La Figura 1 es un diagrama de flujo que muestra un procedimiento de identificación de microamplificaciones o microdeleciones en un genoma de un feto.
La Figura 2 es un gráfico de Circos de las aberraciones detectadas en el número de copias en todo el genoma en plasma materno. De adentro hacia afuera: casos 01 a 06. Los ideogramas de los cromosomas (anillo más externo) están orientados de pter a qter en el sentido de las agujas del reloj. Cada barra representa una ventana de 1 Mb. Las regiones con tres o más contenedores consecutivos de 1 Mb de representación aumentada o reducida en plasma se indican con barras verdes y rojas, respectivamente. Las flechas rojas resaltan las ubicaciones cromosómicas aproximadas en estas regiones aberrantes.
Las Figuras 3 y 4 muestran aberraciones en el número de copias detectadas en plasma materno. Se muestran los cromosomas que muestran aberraciones en el número de copias para cada caso. La posición genómica se muestra en el eje x y la puntuación z se traza en el eje y. Cada barra vertical representa un contenedor de 1 Mb. Las regiones con tres o más contenedores consecutivos de 1 Mb de representación aumentada o reducida en plasma se indican con barras verdes y rojas, respectivamente.
La Figura 5 es una tabla que muestra el porcentaje de ADN fetal estimado por las alteraciones de la representación genómica de las regiones afectadas por la microdeleción/microduplicación, y las proporciones de secuencias del cromosoma Y en el plasma materno. (a) El enfoque chr Y solo es aplicable en aquellos casos con feto masculino. (b) Para el caso 05, dado que la madre también portaba la aberración, la representación genómica de la región afectada en el plasma materno no pudo ser utilizada para determinar el porcentaje de ADN fetal. (c) Las primera y última figuras representan el porcentaje de ADN fetal estimado a partir de la microduplicación en el cromosoma 3 y la microdeleción en el cromosoma 4, respectivamente.
La Figura 6 muestra la sensibilidad diagnóstica para la detección de una microdeleción/microduplicación de 3 Mb. La sensibilidad diagnóstica para detectar la aberración se traza frente al porcentaje de ADN fetal. El análisis de simulación por ordenador se realizó asumiendo que se analizaron un total de 150 millones de moléculas de ADN plasmático.
La Figura 7 es una tabla que muestra el número de moléculas que se requieren secuenciar y alinear para lograr diferentes resoluciones de diagnóstico y sensibilidades de diagnóstico suponiendo que el porcentaje de ADN fetal es del 5%. En este análisis teórico, la especificidad diagnóstica es > 99,9% para todos los casos según el criterio de que tres grupos consecutivos tengan representaciones genómicas > 3 SD (para sobrerrepresentación o subrepresentación) de la media de las referencias en la misma dirección.
La Figura 8 es una tabla que muestra información sobre las muestras analizadas en el Ejemplo.
La Figura 9 muestra un diagrama de bloques de un sistema informático de ejemplo 900 que se puede usar con el sistema y los procedimientos de acuerdo con las realizaciones de la presente invención.
Las realizaciones de la presente invención proporcionan procedimientos y programas informáticos para determinar si existe una microamplificación o una microdeleción en un genoma fetal. En resumen, esta determinación se puede realizar obteniendo una muestra biológica y cuantificando la cantidad de ADN genómico en la muestra que se origina en cada una de una pluralidad de regiones genómicas. La cantidad para cada región genómica puede normalizarse adecuadamente para obtener una densidad para esa región (es decir, una densidad respectiva) y compararse con una densidad de referencia. Una diferencia estadísticamente significativa entre una densidad respectiva y una densidad de referencia puede indicar la presencia de una microamplificación o microdeleción dentro de la región genómica, o que abarca múltiples regiones genómicas. Para evitar falsos positivos, se identifica una microamplificación o microdeleción cuando existe una diferencia estadísticamente significativa para cada una de al menos tres regiones genómicas consecutivas.
I. INTRODUCCIÓN
La invención se puede usar para detectar diferencias en el número de copias de genes o regiones de cromosomas. Un número aberrantemente alto de copias de genes resultantes de la microamplificación (también llamada microduplicación) puede causar sobreexpresión o expresión patológica de estos genes, lo que lleva a enfermedades como el cáncer. Por el contrario, un número bajo de copias de genes resultantes de la microdeleción puede causar una expresión reducida o pérdida de la función biológica (por ejemplo, enzimática). Por lo tanto, la detección de números de copias aberrantes puede proporcionar una alerta temprana de enfermedades que el feto puede enfrentar antes o después del nacimiento.
La muestra biológica se puede obtener de forma no invasiva de un sujeto femenino embarazado del feto. La muestra puede comprender sangre, plasma, suero, orina o saliva. La sangre contiene fragmentos de ADN libres de células y, en un sujeto femenino embarazado, una parte de estos fragmentos son de origen fetal. Los fragmentos de ADN pueden secuenciarse, por ejemplo, utilizando técnicas de secuenciación masiva en paralelo, para obtener etiquetas de secuencia. Se puede utilizar cualquier plataforma de secuenciación masiva en paralelo, incluida una plataforma de secuenciación por síntesis (por ejemplo, Illumina/Solexa), una plataforma de secuenciación por ligación (por ejemplo, la plataforma Life Technology SOLiD) o una plataforma de secuenciación de una sola molécula (por ejemplo, Helices o Pacific Biosciences). Cada etiqueta de secuencia contiene toda o parte de la secuencia del fragmento de ADN a partir del cual se generó y se puede alinear con una secuencia del genoma de referencia para determinar la región genómica de origen del fragmento.
Las regiones genómicas, también denominadas “contenedores”, se pueden delinear dividiendo una secuencia del genoma de referencia. Las regiones corresponden a porciones de secuencia consecutiva de cromosomas. En realizaciones preferentes, cada región está asociada con un cromosoma y no abarca múltiples cromosomas. En algunas realizaciones, las regiones son del mismo tamaño, como 1 Mb. El tamaño de las regiones genómicas determina la resolución del procedimiento descrito en la presente y el número de fragmentos de ADN necesarios para identificar microamplificaciones y microdeleciones con certeza estadística.
II. PROCEDIMIENTO
La Figura 1 es un diagrama de flujo de un procedimiento 100 para identificar microamplificaciones o microdeleciones en un genoma de un feto mediante el análisis de una muestra biológica obtenida de un sujeto femenino embarazado del feto, incluyendo la muestra biológica ADN libre de células del feto y del sujeto femenino.
En la etapa 110, se recibe una o más etiquetas de secuencia para cada uno de una pluralidad de fragmentos de ADN en la muestra biológica. Las etiquetas de secuencia se pueden obtener secuenciando los fragmentos de ADN usando cualquier procedimiento conocido en la técnica, por ejemplo, secuenciación de Sanger o secuenciación masiva en paralelo. Cada etiqueta puede ser denominada como “lectura” de secuenciación y puede corresponder a la totalidad o parte del fragmento de ADN a partir del cual se genera. Por ejemplo, la etiqueta puede contener la secuencia de un extremo del fragmento o el interior del fragmento.
Los fragmentos de ADN pueden aislarse de la muestra biológica y prepararse para secuenciación usando cualquier procedimiento conocido. Por ejemplo, los fragmentos pueden copiarse antes de la secuenciación, como mediante la reacción en cadena de la polimerasa (PCR), o pueden ligarse a moléculas adaptadoras o secuencias de “códigos de barras” apropiadas para la tecnología de secuenciación siendo utilizada. Los fragmentos también se pueden utilizar para generar grupos clonales para la amplificación de puentes, como se hace en la secuenciación de Illumina y tecnologías similares. El conjunto de fragmentos de ADN preparados para la secuenciación puede denominarse “biblioteca de secuenciación”.
En algunas realizaciones, las etiquetas de secuencia se generan de acuerdo con una secuenciación de extremos en pares, en la que se secuencian copias de un fragmento de ADN en dos direcciones, desde extremos opuestos. La comparación de los datos de secuenciación de las dos direcciones permite verificar la secuencia del fragmento, en particular en los extremos del fragmento. El número bruto de etiquetas de secuencia obtenidas de la secuenciación de extremos en pares proporciona una estimación del número de fragmentos de ADN en la muestra. Este número puede variar entre 1 millón, 10 millones, 100 millones, 1.000 millones y 10.000 millones, dependiendo del tamaño y la naturaleza de la muestra. En algunas realizaciones, cuando múltiples etiquetas de secuencia representan una secuencia idéntica (es decir, una secuencia que es igual en ambos extremos), las etiquetas duplicadas pueden descartarse o excluirse de análisis adicionales.
En la etapa 120, se determinan las posiciones genómicas para las etiquetas de secuencia. Esto se hace alineando primero cada etiqueta de secuencia con una secuencia de referencia, tal como el genoma de referencia humano enmascarado sin repetición (NCBI Build 36.1/hg18), usando procedimientos estándar conocidos en la técnica. En algunas realizaciones, solo se conservan para análisis posteriores las etiquetas con ambos extremos alineados con el mismo cromosoma. Las etiquetas también pueden descartarse si, por ejemplo, existen demasiadas discrepancias con la secuencia de referencia o si las etiquetas no están dentro de un intervalo de tamaño prescrito. De acuerdo con su secuencia, cada etiqueta se asigna a una región genómica o “contenedor” dentro de la secuencia de referencia, como se describió anteriormente.
En la etapa 130, para cada una de una pluralidad de regiones genómicas, la cantidad respectiva de fragmentos de ADN dentro de la región genómica se determina a partir de etiquetas de secuencia que tienen posiciones genómicas dentro de la región genómica. La cantidad respectiva de fragmentos de ADN para una región genómica es un parámetro que puede calcularse a partir de la totalidad de los datos, o una parte de los mismos, contenidos en las etiquetas de secuencia asignadas a la región. Estos datos incluyen el número y la longitud de las etiquetas y la cantidad de superposición entre las mismas, por ejemplo. El parámetro de cantidad se calcula con conocimiento de la técnica utilizada para producir las etiquetas de secuencia y tiene en cuenta los artefactos de esta técnica, como la presencia de múltiples etiquetas que pueden haberse originado a partir del mismo fragmento de ADN. La cantidad respectiva dentro de una región genómica puede ser, por ejemplo, el número de fragmentos que se infiere que existieron en la muestra y que se originan en la región genómica, o la masa total de ADN de la región genómica. En realizaciones preferentes, la cantidad respectiva de fragmentos de ADN dentro de una región genómica es una medida cuantitativa de la cantidad de ADN de esa región en la muestra. En la etapa 140, para cada una de una pluralidad de regiones genómicas, la cantidad respectiva se normaliza para obtener una densidad respectiva. La normalización se puede realizar de muchas maneras, por ejemplo, dividiendo la cantidad respectiva para una región genómica por la suma de las cantidades respectivas para el cromosoma en el que se produce la región genómica, o por la suma de las cantidades respectivas para todo el genoma. El resultado de la normalización, la densidad respectiva, permite comparar cantidades respectivas de diferentes regiones genómicas, por ejemplo, de diferentes cromosomas o muestras. La densidad respectiva puede tener muchas interpretaciones diferentes, como la fracción del número de fragmentos de ADN en una muestra que se origina en una región genómica. En algunas realizaciones, cuando las cantidades respectivas se pueden comparar directamente, no es necesaria ninguna normalización y la densidad respectiva puede igualar la cantidad respectiva.
En la etapa 150, para cada una de una pluralidad de regiones genómicas, la densidad respectiva se compara con una densidad de referencia para identificar si la densidad respectiva es estadísticamente diferente de la densidad de referencia. La densidad de referencia para una región genómica se puede obtener utilizando algunos o todos los datos de la muestra. La densidad de referencia puede ser igual, por ejemplo, a la media de las densidades respectivas para un cromosoma o para todo el genoma. La densidad de referencia también se puede calcular utilizando datos de otras muestras. Por ejemplo, se pueden obtener muestras de una pluralidad de sujetos femeninos, cada uno de ellos embarazado de un feto, y se pueden realizar las etapas 110-140 en cada muestra de una manera idéntica. La densidad de referencia para una región genómica particular es, por lo tanto, la media de las densidades respectivas para esa región de todas las muestras, o de un subconjunto de las muestras. En algunas realizaciones, pueden existir datos independientes para demostrar que un subconjunto de sujetos femeninos está embarazado de un feto que carece de microamplificaciones o microdeleciones genómicas y, por lo tanto, se pueden calcular densidades de referencia para reflejar una ausencia de microamplificaciones o microdeleciones.
En vista de lo anterior, la densidad de referencia puede ser (dependiendo de cómo se calcula) la misma para múltiples o todas las regiones genómicas, o un valor diferente para cada región genómica.
La identificación de si la densidad respectiva es estadísticamente diferente de la densidad de referencia (es decir, si la diferencia es estadísticamente significativa) puede requerir conocimiento de la distribución de las densidades respectivas utilizadas para calcular la densidad de referencia. Por ejemplo, si la densidad de referencia para una región genómica es la media de un conjunto de densidades respectivas, entonces se puede calcular una desviación estándar para ese conjunto. Utilizando una densidad respectiva para esa región genómica (por ejemplo, para la muestra de interés), la densidad de referencia y la desviación estándar, se puede realizar una prueba estadística. Dicha prueba estadística puede ser una prueba Z o una prueba t de Student y puede proporcionar una probabilidad de que la densidad respectiva se extraiga de la misma distribución que los valores de referencia. La diferencia entre la densidad respectiva y la densidad de referencia podrá considerarse estadísticamente significativa si esta probabilidad cae por debajo de un umbral. Alternativamente, la diferencia puede considerarse estadísticamente significativa si excede un límite, como un cierto múltiplo de la desviación estándar.
Preferentemente, las comparaciones de las densidades respectivas y las densidades de referencia, y las identificaciones de diferencias estadísticas entre las mismas, se realizan utilizando los mismos criterios para todas las regiones genómicas. Se debe tener cuidado en esta etapa para observar, en el caso de que exista una diferencia estadística para una región genómica, si la densidad respectiva es mayor o menor que la densidad de referencia.
Además de la media y la desviación estándar, se pueden calcular otros parámetros para un conjunto de densidades respectivas para determinar una densidad de referencia y determinar si las densidades respectivas y de referencia difieren. Sin limitación, estos parámetros incluyen la mediana, la moda, el percentil, la varianza, el sesgo, la curtosis y otros. Además de la prueba Z y la prueba t, se pueden emplear otras pruebas estadísticas para estos fines, por ejemplo, pruebas que utilizan los parámetros anteriores como entradas.
En la etapa 160, se determina si alguna de las regiones genómicas identificadas por tener una densidad respectiva estadísticamente diferente de la densidad de referencia es consecutiva con otras regiones genómicas así identificadas. Esta determinación se puede hacer con respecto a una porción de un cromosoma, un cromosoma completo, múltiples cromosomas o el genoma completo, según convenga a los intereses del profesional. En este caso, las regiones genómicas son consecutivas si corresponden a porciones sucesivas de la secuencia del genoma de referencia. En realizaciones preferentes, las regiones genómicas sólo pueden ser consecutivas si corresponden al mismo cromosoma. En este caso son de interés principalmente conjuntos de regiones genómicas consecutivas en las que la densidad respectiva es estadísticamente diferente de la densidad de referencia para cada región, y todas las diferencias están en la misma dirección. Es decir, dentro de dicho conjunto, todas las densidades respectivas son superiores a las densidades de referencia (es decir, estadísticamente superiores), o todas son inferiores (es decir, estadísticamente inferiores). Un ejemplo de tal conjunto de regiones genómicas serían tres regiones consecutivas en las que, para las tres regiones, la densidad de referencia es estadísticamente diferente y mayor (es decir, estadísticamente mayor) que la densidad de referencia. Las regiones genómicas consecutivas con densidades respectivas estadísticamente superiores o inferiores a las densidades de referencia son consistentes con microamplificaciones o microdeleciones, respectivamente. Un mayor número de regiones genómicas consecutivas en un conjunto son consistentes con microamplificaciones o microdeleciones más grandes.
En la etapa 170, las primeras regiones genómicas consecutivas se identifican como una microamplificación cuando al menos N primeras regiones genómicas identificadas por tener densidades respectivas estadísticamente superiores a las densidades de referencia son consecutivas, siendo N un número entero igual o mayor que tres.
En la etapa 180, las segundas regiones genómicas se identifican como una microdeleción cuando al menos N segundas regiones genómicas identificadas con densidades respectivas estadísticamente inferiores a las densidades de referencia son consecutivas.
III. DETERMINACIÓN DE REGIONES ABERRANTES
Para detectar microamplificaciones y microdeleciones genómicas usando la presente invención, una secuencia del genoma de referencia se divide en regiones genómicas o “contenedores”. Los fragmentos de ADN de una muestra se asocian con cada región dependiendo de la secuencia y se determina la densidad del ADN en cada región. Las regiones con densidades inusualmente altas o bajas se consideran “aberrantes” y pueden corresponder a microamplificaciones o microdeleciones. Los criterios y procedimientos para identificar regiones genómicas aberrantes y determinar si corresponden a microamplificaciones o microdeleciones se analizan a continuación.
A. Contenedores y cantidades
El tamaño de las regiones genómicas utilizadas en la presente memoria descriptiva puede ser de varios tamaños, según lo desee el profesional y sea adecuado para el procedimiento de secuenciación utilizado. Las regiones más pequeñas permiten una mayor resolución de densidades aberrantes, pero requieren una mayor cantidad de fragmentos de ADN (y, por lo tanto, muestras más grandes) para identificar densidades aberrantes con certeza estadística. Por el contrario, las regiones más grandes proporcionan una resolución peor, pero requieren un número menor de fragmentos de ADN. En realizaciones preferentes, se usan regiones genómicas de igual tamaño para permitir la comparación y normalización de densidades entre los cromosomas y el genoma. Las regiones genómicas pueden tener tamaños del orden de 100 kb, 200 kb, 500 kb, 1 Mb, 2 Mb, 5 Mb o 10 Mb, por ejemplo. En algunas realizaciones, las regiones genómicas no se superponen y/o son contiguas (como se analiza a continuación), aunque en algunos casos puede haber superposiciones o espacios entre regiones, por ejemplo, para simplificar el análisis de etiquetas de secuencia que ocurren cerca de los bordes de las regiones. Los fragmentos de ADN pueden secuenciarse usando técnicas de secuenciación masiva en paralelo conocidas en la técnica. En algunas realizaciones, la secuenciación se realiza utilizando el procedimiento de secuenciación por síntesis de Illumina. Se sabe que este procedimiento produce etiquetas de secuencia con una eficiencia inconsistente dependiendo del contenido de GC del fragmento de ADN que se secuencia. Por consiguiente, puede ser deseable corregir las cantidades respectivas de ADN determinadas para las regiones genómicas, que tienen niveles variables de contenido de GC en escalas que van desde cientos a miles de pares de bases, para tener en cuenta este artefacto de secuenciación. Cuando se utilizan regiones genómicas de 1 Mb, cada cromosoma se puede dividir primero en contenedores de 100 kb y se puede realizar un suavizado de diagrama de dispersión ponderado localmente (LOESS) para corregir el sesgo asociado a GC en el número de etiquetas de secuencia [20]. Los contenedores de 100 kb pueden luego fusionarse en regiones genómicas de 1 Mb, de modo que las densidades corregidas por GC puedan ser utilizadas en todos los cálculos posteriores.
En una realización, la densidad de ADN en una región genómica (por ejemplo, contenedor de 1 Mb) se puede calcular como la representación genómica(GRx-y),donde x y y indican las coordenadas genómicas de inicio y fin de la región. El número de lecturas de secuencia (o etiquetas) que se origina en cada región esRCx-y,yGRx-yse calcula usando esta ecuación [20]:
dondeRCtotaies el recuento total de lecturas.
Dividir por RCtotal es un ejemplo de la normalización de la cantidad respectiva de ADN dentro de una región genómica para obtener la densidad respectiva. En otras implementaciones del procedimiento, no se determina ninguna relación y los valores de RCx-y se comparan directamente entre regiones genómicas. Esto se puede hacer cuando se controla que RCtotal sea el mismo en todas las muestras.
B. Comparación con la referencia
Como se describió anteriormente, la densidad respectiva en una región genómica se puede comparar con una densidad de referencia. La densidad de referencia se puede obtener de varias maneras diferentes, por ejemplo, promediando las densidades respectivas sobre múltiples regiones genómicas, o promediando las densidades respectivas para la misma región genómica obtenida de múltiples muestras. Para determinar si la densidad respectiva en una región genómica es aberrante, se calcula un parámetro utilizando la densidad respectiva y la densidad de referencia, y luego el parámetro se compara con un límite. Ejemplos de parámetros incluyen la diferencia entre los dos valores, el valor absoluto de la diferencia o la relación. Estos valores pueden manipularse según sea apropiado, por ejemplo, multiplicados por un escalar, para obtener el parámetro y permitir una comparación significativa con un límite.
C. Límites
En algunas realizaciones, si el parámetro calculado a partir de la densidad respectiva y la densidad de referencia excede un límite puede indicar si la densidad respectiva es aberrante (estadísticamente diferente). El signo del parámetro puede indicar si la densidad respectiva es aberrantemente alta o baja, lo que sugiere (pero no es determinante) de una microamplificación o microdeleción, respectivamente. Por ejemplo, si el parámetro es la simple diferencia entre la densidad respectiva y la densidad de referencia, entonces las densidades respectivas aberrantemente altas y bajas corresponden a signos positivos y negativos del parámetro, respectivamente. Por consiguiente, el límite puede ser positivo o negativo, y el hecho de que el parámetro exceda el límite puede entenderse que significa que excede un límite positivo o cae por debajo de un límite negativo. De manera similar, si el parámetro es una relación, entonces puede exceder el límite si es mayor que un cierto valor o menor que el recíproco de ese valor. El límite puede ser elegido de cualquier forma que desee el practicante. Por ejemplo, el límite puede ser arbitrario o puede ser elegido para garantizar que la determinación de la densidad aberrante sea realizada con un nivel deseado de certeza estadística.
En una realización, el parámetro se compara con el límite en una prueba z. Una prueba z es una prueba estadística y produce una puntuación z, que es una medida de qué tan lejos está un número de la media de una distribución, en términos del ancho de la distribución. En este caso, el parámetro utilizado para comparar la densidad respectiva y la densidad de referencia es la diferencia entre estas densidades dividida por la desviación estándar de los valores utilizados para calcular la densidad de referencia.
A modo de demostración, se obtuvieron muestras biológicas de ocho sujetos femeninos embarazados (singleton) con cariotipos fetales normales, y se calcularon las densidades respectivas para las regiones genómicas individuales de 1 Mb utilizando cada muestra. Para una región genómica determinada x-y, se promediaron las densidades respectivas de las muestras (es decir, se calculó la media) para obtener una densidad de referenciameanGRx-y-reference,y se calculó la desviación estándar de las densidades respectivas,SDx-y-reference.Luego se obtuvo una muestra de prueba de otro sujeto femenino embarazado de interés, y se calculó la densidad respectiva para la región x-y(GRx-y-test)utilizando datos de la muestra de prueba. La puntuación z para esta densidad respectiva(z-scoreGRx-y)se calculó de la siguiente manera:
Luego se comparó la puntuación z con un límite, por ejemplo, 3. Las puntuaciones Z mayores que 3 o menores que -3 indicaron que la densidad respectiva de la muestra de prueba era aberrantemente alta o baja, respectivamente. Para minimizar las variaciones sistemáticas entre muestras entre diferentes cromosomas, se realizó una corrección mediana para cada cromosoma. Por lo tanto, se utilizó como línea basal la representación genómica mediana de todas las regiones genómicas correspondientes a un cromosoma particular. Para todas las regiones ubicadas en ese cromosoma en particular, la diferencia con respecto a este valor basal se utilizó para el cálculo de la puntuación z.
La puntuación z, o cualquier otra medida de densidad aberrante en una región genómica, puede ser sensible a la abundancia de ADN fetal en la muestra. Como se sabe en la técnica, un porcentaje significativo del ADN libre de células en una muestra de sangre de un sujeto femenino embarazado es de origen fetal. Se ha observado que este porcentaje oscila entre menos del 1% y más del 20%, dependiendo del tiempo de gestación y otros factores. En el procedimiento descrito en la presente memoria descriptiva, se generan etiquetas de secuencia a partir del ADN materno y fetal en la muestra. Si una microamplificación o microdeleción está presente en el genoma del feto, pero no en el de la madre, se observa una aberración relativamente pequeña en la densidad del ADN en la(s) región(es) genómica(s) correspondiente(s) porque la minoría del ADN utilizada para generar etiquetas de secuencia y determinar la densidad es fetal. Por el contrario, si la microamplificación o microdeleción es de origen materno (es decir, heredada por vía materna), está presente en los genomas tanto del feto como de la madre y, por lo tanto, en sustancialmente todo el ADN de la muestra. De este modo, se observará una mayor aberración en la densidad del ADN. (Es poco probable que haya una microamplificación o microdeleción en el genoma materno, pero no en el genoma fetal).
Por consiguiente, se puede utilizar un segundo límite para determinar si una aberración en la densidad respectiva del ADN en una región genómica se hereda por vía materna. El segundo límite es típicamente mayor que el límite utilizado para identificar una aberración en el genoma fetal y requiere una desviación mayor o más estadísticamente significativa de la densidad respectiva con respecto a la densidad de referencia. Cuando se comparan la densidad respectiva y la densidad de referencia utilizando una prueba z, por ejemplo, la puntuación z que sirve como el límite para identificar una aberración heredada materna puede ser varias veces mayor que la utilizada para identificar una aberración ausente en el genoma materno. En algunas realizaciones, el segundo límite corresponde a una puntuación z de 10, 20 o más.
Las aberraciones más altas en la densidad del ADN, como las que resultan de microamplificaciones o microdeleciones heredadas por la madre, requieren menos ADN y menos etiquetas de secuencia para identificarse con el mismo nivel de certeza que las aberraciones más bajas. Por consiguiente, la sensibilidad de los procedimientos divulgados en la presente memoria descriptiva para detectar anomalías genómicas fetales depende del porcentaje de ADN fetal en la muestra(%Fetal),como se analiza a continuación. El grado de representación insuficiente o excesiva de etiquetas de secuencia en una región genómica aberrante se correlaciona linealmente con el porcentaje de ADN fetal para esa región [4]. En algunas realizaciones, el porcentaje de ADN fetal se calcula usando la siguiente ecuación:
D. Densidad de referencia
Como se describió anteriormente, la densidad respectiva de ADN en una región genómica particular se compara con una densidad de referencia para determinar si la densidad respectiva es aberrante. La densidad de referencia se puede calcular de muchas maneras diferentes utilizando los datos obtenidos de una muestra o de varias muestras. En el caso de una muestra, la densidad de referencia puede ser, por ejemplo, la media de las densidades respectivas para un conjunto de regiones genómicas. Este conjunto puede corresponder a parte o la totalidad de un cromosoma, múltiples cromosomas o el genoma completo. En el caso de múltiples muestras, cada muestra usualmente se adquiere de un individuo diferente. La densidad de referencia para una región genómica puede ser la densidad respectiva para esa región, o conjunto de regiones, promediada entre individuos. En algunas realizaciones, se obtienen muestras biológicas de sujetos femeninos embarazados con cariotipos fetales normales conocidos para establecer densidades de referencia que reflejen una ausencia de microamplificaciones o microdeleciones. Posteriormente, las densidades de referencia pueden ser comparadas con las densidades respectivas de un sujeto de prueba con un cariotipo fetal desconocido. En algunas realizaciones, se desconocen los cariotipos fetales de múltiples (o todos) los individuos, y las densidades de referencia se calculan sin conocimiento previo de las aberraciones que pueden estar presentes en las muestras de estos individuos.
La densidad de referencia puede ser igual o diferente para diferentes regiones genómicas. Por ejemplo, se puede utilizar el mismo valor para todas las regiones genómicas de un cromosoma o del genoma. Alternativamente, se puede asignar un valor diferente a la densidad de referencia para cada región genómica. No es necesario calcular la densidad de referencia a partir de las densidades respectivas, como promediando las densidades respectivas; por ejemplo, puede reflejar simplemente los tamaños relativos de las regiones genómicas. Como se describió anteriormente, la densidad de referencia puede corregirse para detectar artefactos, como la generación no uniforme de etiquetas de secuencia para diferentes cromosomas o regiones genómicas.
E. Evitar falsos positivos
Después de que se ha descubierto que la densidad respectiva para una región genómica es aberrante (por ejemplo, estáticamente mayor o menor que la densidad de referencia), se puede identificar una microamplificación o microdeleción si la región genómica es consecutiva con al menos otra región genómica que también es aberrante. Como se analizó anteriormente, para que se realice tal identificación, la densidad respectiva debe apartarse de la densidad de referencia en la misma dirección para las regiones consecutivas. De este modo, una microamplificación corresponde a regiones genómicas consecutivas donde la densidad respectiva es aberrantemente alta en cada región, y una microdeleción corresponde a regiones genómicas consecutivas en las que la densidad respectiva es aberrantemente baja.
Dependiendo del procedimiento utilizado para comparar la densidad respectiva con la densidad de referencia para una región genómica, puede haber una probabilidad significativa de que la región tenga una densidad aberrante de ADN cuando en realidad no hay microamplificación o microdeleción presente. Por lo tanto, cuando se establecen muchas regiones genómicas y se evalúan sus respectivas densidades, algunas regiones pueden considerarse aberrantes simplemente por casualidad. Requerir regiones aberrantes consecutivas para identificar microamplificaciones o microdeleciones reduce la probabilidad de falsos positivos, es decir, identificar dichos eventos por error. Este requisito también establece el límite de resolución del procedimiento en un múltiplo (por ejemplo, 3) del tamaño de las regiones genómicas. Por ejemplo, el límite de resolución para regiones genómicas de 1 Mb es de 3 Mb si se requieren tres o más regiones consecutivas para identificar una microamplificación o microdeleción.
Las microamplificaciones o microdeleciones identificadas usando el procedimiento descrito en la presente memoria descriptiva pueden verificarse usando otros procedimientos conocidos en la técnica. Estos otros procedimientos incluyen la amniocentesis y la cordocentesis, por ejemplo, y pueden ser invasivos o incluir un riesgo de aborto espontáneo. La verificación de números de copias aberrantes utilizando múltiples procedimientos puede reducir aún más la probabilidad de falsos positivos.
En la presente memoria descriptiva, dos o más regiones genómicas se consideran consecutivas si ocupan posiciones de secuencia consecutivas a lo largo de un cromosoma, o en una secuencia de referencia genómica, sin otras regiones genómicas entre las mismas. En algunas realizaciones, pares de regiones consecutivas se unen entre sí directamente en secuencia y, por lo tanto, se consideran contiguas. Un espacio en la secuencia entre dos regiones (por ejemplo, unos pocos pares de bases) impide que las regiones sean contiguas, pero no impide que sean consecutivas, si el espacio no se trata como otra región genómica de conformidad con los procedimientos divulgados en la presente memoria descriptiva. En algunas realizaciones, las regiones genómicas no se superponen, pero en su lugar se pueden usar regiones superpuestas y pueden ser consecutivas. Es posible que el profesional desee establecer regiones genómicas que no sean contiguas o que se superpongan, para centrarse en determinadas regiones del genoma, para simplificar el análisis de datos o por otras razones.
IV. ANÁLISIS DE SIMULACIÓN
La sensibilidad y especificidad de la detección de una microdeleción o una microduplicación pueden verse afectadas por diferentes parámetros, incluido el porcentaje fetal en la muestra, el número de moléculas de ADN plasmático secuenciadas y alineadas, y el tamaño de la aberración. Por lo tanto, se pueden realizar análisis de simulación por ordenador para determinar 1) la sensibilidad de detectar una microdeleción/microduplicación (por ejemplo, ~3 Mb de tamaño) con la profundidad de secuenciación existente; y 2) el número de moléculas que es necesario analizar para lograr una sensibilidad particular (por ejemplo, 95%/99%) en un porcentaje fetal particular (por ejemplo, 5%).
En cada análisis de simulación, el genoma completo (3000 Mb) se puede dividir en contenedores de igual tamaño dependiendo de la resolución deseada, por ejemplo, 3 Mb. En algunas realizaciones, para la detección de una aberración subcromosómica, se requieren tres grupos consecutivos para tener una representación genómica de >3 desviaciones estándar (ya sea sobrerrepresentación o subrepresentación) de la media del grupo de referencia en la misma dirección. Por lo tanto, el tamaño del contenedor sería igual a 1/3 de la resolución de diagnóstico deseada. Por ejemplo, se necesita un tamaño de contenedor de 1 Mb para detectar aberraciones de 3 Mb. Se puede suponer que los tres contenedores cubiertos por la microdeleción/microduplicación tienen una representación genómica anormal resultante de la contribución de la población minoritaria de ADN fetal. En el plasma, la proporción esperada de moléculas totales (E) que caen en un contenedor dentro de una región afectada se puede calcular como:
donde f es el porcentaje de ADN fetal en plasma,
d es el cambio en el número de cromosomas en la aberración (d es igual a -1 para microdeleción y 1 para microduplicación), y
T es el número total de contenedores para todo el genoma.
Se pueden realizar simulaciones, por ejemplo, de 1000 casos normales y 1000 casos afectados, suponiendo una distribución binomial de las moléculas de ADN plasmáticas con las representaciones plasmáticas esperadas como se calculó anteriormente. El porcentaje fetal, el tamaño del contenedor y el número total de moléculas que se analizan se pueden cambiar para lograr el propósito deseado. La simulación se puede realizar utilizando la función rbinom en R (www.r-project.org/).
V. EJEMPLO
Este Ejemplo proporciona la identificación de microamplificaciones y microdeleciones en ADN materno y fetal humano.
A. Marco para el análisis de datos
Se utilizó un carril de una celda de flujo en un secuenciador Illumina HiSeq 2000 para analizar cada muestra de plasma materno de los seis casos de prueba y los ocho controles. Se secuenció una media de 211 millones (intervalo: 177 millones a 236 millones) de fragmentos de ADN de cada muestra de ADN plasmático. Dicha secuenciación dio como resultado una media de 144 millones (intervalo: 96 millones a 180 millones) de lecturas secuenciadas alineables y no duplicadas por caso, lo que equivalía a 4,81 múltiplos del genoma humano haploide.
Para obtener un cariotipo plasmático, el genoma completo se dividió en 2687 contenedores de 1 Mb. La representación genómica de cada contenedor de 1 Mb de la muestra de prueba se comparó con la del grupo de referencia. Para regiones con representación genómica normal, las distribuciones esperadas de puntuaciones z de todos los contenedores de 1 Mb serían cercanas a cero. Un intervalo de referencia se definió como una puntuación z de 3 a -3. Con tal intervalo de referencia, estadísticamente aproximadamente el 0,3% de los contenedores quedarían fuera de este intervalo simplemente por casualidad. Dado que se analizaron 2687 contenedores, uno esperaría en promedio que 8 contenedores quedaran fuera del intervalo de referencia simplemente por casualidad. Por lo tanto, para reducir los llamados falsos positivos, se incluyó un criterio adicional de llamar a una aberración del número de copia solo si tres contenedores consecutivos de 1 Mb exhibían una puntuación z fuera del intervalo de referencia y en la misma dirección.
B. Detección de aberraciones del número de copias subcromosómicas
Las puntuaciones z de todos los contenedores de 1 Mb en todo el genoma para cada caso se representaron mediante gráficos de Circos [21] (Figura 2). En las muestras de prueba, entre el 94,9% y el 98,7% de los contenedores de 1 Mb mostraron una representación normal. Con el criterio mencionado anteriormente de considerar una aberración en el número de copias solo si tres contenedores consecutivos mostraban la misma aberración, las aberraciones en el número de copias se identificaron correctamente en todos los casos sin falsos positivos.
Las Figuras 3 y 4 muestran las puntuaciones z de todos los contenedores de 1 Mb de los cromosomas que muestran aberraciones en el número de copias para cada caso. Para los casos 01, 02 y 03, se detectó una representación insuficiente en tres contenedores consecutivos de 1 Mb en el brazo q del cromosoma 22. Estos fueron los tres casos con microdeleción de novo 22q11.2. Para los casos 04 y 05, se detectó sobrerrepresentación en tres contenedores consecutivos de 1 Mb en el cromosoma 22q. El caso 04 fue un caso con una microduplicación de novo 22q11.2 de 2,4 Mb. El caso 05 fue un caso con una microduplicación heredada por vía materna en la misma región. Para el caso 05, dado que la propia madre albergaba la microduplicación, la aberración pudo detectarse fácilmente en el plasma materno. Esto fue respaldado por los valores extremadamente altos de puntuación z (intervalo, 39,7 a 71,7) para los tres grupos consecutivos. Una exploración adicional de las pruebas prenatales no invasivas del feto podría proceder con el uso de procedimientos basados en SNP, es decir, análisis de dosis relativa de mutación o análisis de dosis relativa de haplotipos [10, 11, 22]. Para el caso 06, se detectaron cinco contenedores consecutivos de 1 Mb con sobrerrepresentación en el brazo q del cromosoma 3 y treinta y un contenedores consecutivos de 1 Mb con representación insuficiente en el brazo q del cromosoma 4, lo que correspondió a una duplicación de 5 Mb en 3q y una deleción de 31 Mb en 4q. En todos los casos, las aberraciones en el número de copias detectadas tenían tamaños comparables a los confirmados por matriz CGH, FISH y/o QF-PCR. Para el caso 05, la microduplicación portada por la madre fue confirmada mediante matriz CGH. Para el caso 06, la translocación equilibrada llevada por la madre se confirmó mediante cariotipado completo.
C. Porcentaje de ADN fetal
Se usaron secuencias de ADN de las regiones que mostraban una representación insuficiente o excesiva para estimar el % fetal en plasma materno (Figura 5). Este enfoque se validó comparando el % fetal calculado usando este procedimiento y el procedimiento basado en chr Y [4] para los tres casos con fetos masculinos (es decir, casos 02, 03 y 04). Los valores del % fetal coincidieron bien entre los dos procedimientos (Figura 5). Para los cinco casos con aberraciones fetales en el número de copias de novo, el porcentaje fetal osciló entre el 9,2% y el 17,8%. Para el caso 05, el % fetal estimado por la representación genómica de la microduplicación fue del 96,7%, lo que sugiere que casi todo el ADN circulante albergaría este cambio. Este resultado es consistente con el hecho de que la madre portaba la aberración.
D. Análisis de simulación para la sensibilidad diagnóstica.
Se utilizaron simulaciones por ordenador para determinar la sensibilidad diagnóstica del cariotipado molecular prenatal no invasivo basado en MPS dirigida (Figura 6). Con la profundidad de secuenciación existente de ~150 millones de lecturas, la sensibilidad diagnóstica para detectar una aberración cromosómica de 3 Mb sería aproximadamente del 96% cuando el % fetal es del 5%. La sensibilidad aumentaría al 99% cuando el % fetal alcance el 6%. Para detectar aberraciones cromosómicas de tamaños más pequeños, sería necesario analizar más moléculas de ADN plasmático. La Figura 7 muestra el número de moléculas de ADN plasmático que deben analizarse para lograr una resolución de diagnóstico de 3 Mb, 2 Mb y 1 Mb con una sensibilidad del 95%/99%, utilizando el criterio de tres contenedores consecutivos. Para lograr una sensibilidad diagnóstica del 95%, sería necesario analizar aproximadamente 42.000 moléculas en cada contenedor. Por lo tanto, el número total de moléculas de ADN plasmático que deben analizarse para detectar una microdeleción/microduplicación de 2 Mb y 1 Mb para una sensibilidad diagnóstica del 95% sería de 192 millones y 380 millones, respectivamente. Para lograr una sensibilidad diagnóstica del 99%, el número total de moléculas que deben analizarse sería de 240 millones y 480 millones para las dos resoluciones diferentes, respectivamente.
E. Discusión
En este trabajo, se demostró la viabilidad de realizar la detección prenatal no invasiva de microdeleciones y microduplicaciones cromosómicas fetales a nivel del genoma completo y con una resolución de 3 Mb. Se detectaron deleciones o duplicaciones subcromosómicas derivadas del feto que involucran los cromosomas 3q, 4q o 22q en 5 casos. En el sexto caso, se detectó una microduplicación del cromosoma 22q de origen materno, como lo demuestran las puntuaciones z muy altas observadas. De hecho, los casos 04 y 06 representan la primera vez que se detecta una microduplicación fetal de forma no invasiva a partir del plasma materno. Estos resultados representan un importante paso adelante en comparación con los informes anteriores de Peters et al.
[8] y Jensen et al. [9], que se enfocaron principalmente en pruebas de aberraciones en el número de copias en una o un pequeño número de regiones genómicas. Los datos presentados en la presente memoria descriptiva demuestran claramente que la MPS dirigida se puede utilizar para detectar aberraciones en el número de copias subcromosómicas a escala del genoma, en otras palabras, para obtener un cariotipo molecular fetal.
En tres de los casos estudiados, las muestras de plasma materno se tomaron después de procedimientos invasivos. Los porcentajes de ADN fetal en estos casos oscilan entre el 9,2 y el 17,4%, que se encuentran dentro del intervalo observado previamente por Chiu et al. [4] para muestras recolectadas antes de procedimientos invasivos. De manera similar, si bien la mayoría de las muestras estudiadas se tomaron después de la semana 20 de gestación, los porcentajes de ADN fetal de estos casos también se superponen en gran medida con los de las muestras tomadas en etapas anteriores de la gestación. No obstante, sería útil validar estos resultados en futuros estudios multicéntricos prospectivos a gran escala que utilicen muestras recolectadas antes de cualquier procedimiento invasivo en el primer y principios del segundo trimestre.
Analíticamente, el algoritmo de diagnóstico requiere, en algunas realizaciones, tres grupos consecutivos con puntuaciones z de todas por encima de 3 o todas por debajo de -3 para detectar una aberración del número de copias subcromosómicas. Este algoritmo requiere que una aberración en el número de copias sea detectable en un tramo contiguo de aproximadamente 3 Mb. De hecho, como lo indican los datos, el algoritmo pudo detectar una aberración en el número de copias de 2,4 Mb (casos 04 y 05).
La profundidad de la secuenciación realizada para alcanzar dicha resolución diagnóstica fue mucho mayor que la necesaria para las pruebas de trisomía. Por lo tanto, para cada caso, la secuenciación se realizó en un carril de un secuenciador Illumina HiSeq 2000, en comparación con la secuenciación dirigida de 12 plex utilizando la misma plataforma de secuenciación que realiza al menos un proveedor comercial de pruebas de trisomía. Con la profundidad actual de secuenciación y su resolución diagnóstica resultante de 3 Mb, el protocolo actual podría cubrir aproximadamente el 20% de las variantes patógenas conocidas del número de copias [23]. Anteriormente se predijo que sería necesario secuenciar y alinear 240 millones y 480 millones de moléculas de ADN plasmático para ampliar la resolución diagnóstica a 2 Mb y 1 Mb, respectivamente, con una sensibilidad del 99%. Con estas resoluciones de diagnóstico, se esperaría que las MPS dirigida del ADN del plasma materno cubrieran aproximadamente el 50% y el 80%, respectivamente, de las variantes patógenas conocidas del número de copias [23]. Con un aumento continuo en el rendimiento de secuenciadores masivamente paralelos y la reducción concomitante de los costos de secuenciación, es probable que los costos asociados con tales profundidades de secuenciación alcancen un nivel que sería aceptable para los proveedores de atención médica dentro de unos años. La cantidad de secuenciación requerida por este enfoque ya es una reducción significativa con respecto a un procedimiento de detección de variación de un solo nucleótido derivado de fetos previamente informado que se realizó utilizando miles de millones de lecturas secuenciadas por muestra [10]. Una mayor reducción de los costes podría provenir de la secuenciación dirigida de regiones genómicas que albergan variantes patógenas en el número de copias, similar a lo que se ha logrado para la detección de variaciones de un solo nucleótido derivadas del feto a partir del plasma materno [24,25]. Finalmente, también se esperaría que la llegada de la secuenciación de una sola molécula mejorara aún más la precisión diagnóstica de este enfoque, ya que no es necesario el proceso de amplificación, que podría distorsionar la representación genómica de las moléculas secuenciadas [26].
En resumen, se demuestra que es factible obtener un cariotipo molecular prenatal no invasivo mediante MPS dirigida del ADN del plasma materno. Este procedimiento puede detectar cambios en el número de copias fetales de novo, translocaciones desequilibradas y cambios en el número de copias maternas. Estos resultados han ampliado aún más el espectro diagnóstico del diagnóstico prenatal no invasivo. En conclusión, se han desarrollado procedimientos basados en el análisis MPS del ADN del plasma materno para la detección prenatal de aneuploidías de cromosomas completos [3 - 7], cambios en el número de copias subcromosómicas y mutaciones fetales para trastornos de un solo gen [10]. Este conjunto de pruebas no invasivas podría aplicarse en primera instancia para la detección de anomalías cromosómicas y genómicas fetales. Las anomalías divulgadas por las pruebas no invasivas de ADN en plasma materno podrían confirmarse mediante pruebas prenatales invasivas convencionales. Tras la validación mediante estudios prospectivos a gran escala, se prevé que la secuenciación no invasiva del ADN del plasma materno podría proporcionar una evaluación prenatal de un amplio espectro de anomalías genómicas y cromosómicas fetales y proporcionar evaluaciones prenatales más seguras.
F. Materiales y procedimientos
Declaración ética.El estudio fue aprobado por el Comité de Ética de Investigación Clínica del Grupo Conjunto de la Universidad China de Hong Kong y la Autoridad Hospitalaria de los Nuevos Territorios del Este. Se reclutaron sujetos femeninos embarazados con consentimiento informado por escrito del Hospital Príncipe de Gales, el Hospital Kwong Wah y el Hospital Tsan Yuk en Hong Kong, y el Centro Médico Asan en Seúl.
Recolección de muestras.Para los casos 01, 02 y 03, se recolectaron muestras de sangre periférica materna en tubos que contenían EDTA después de procedimientos invasivos (Tabla 1). Para los casos 04, 05 y 06, se recolectaron muestras de sangre periférica materna antes de realizar cualquier procedimiento invasivo. Se extrajeron muestras de sangre materna entre las semanas 123/7 y 284/7 de gestación (Figura 8).
Entre las seis muestras de prueba, hubo tres casos (casos 01, 02 y 03) de microdeleción fetal de novo 22q11.2, un caso (caso 04) de microduplicación fetal de novo 22q11.2 (2,4 Mb) y un caso (caso 05) de microduplicación 22q11.2 heredada de la madre (2,4 Mb). También hubo un caso (caso 06) en el que la madre tuvo una translocación equilibrada de t(3;4)(q29;q32) y se encontró que el feto tenía microduplicación 3q29 (5,1 Mb) y deleción 4q32.1-q35.2 (32,9 Mb). Se realizó un cariotipado completo y los cariotipos fetales se determinaron adicionalmente mediante hibridación genómica comparativa en matriz (matriz CGH) [16], hibridación fluorescentein situ(FISH) o una combinación de PCR de fluorescencia cuantitativa (QF-PCR) y FISH.
Procesamiento de muestras y extracción de ADN.Las muestras de sangre periférica se centrifugaron a 1600 g durante 10 min a 4 °C y la porción de plasma se centrifugó a 16000 g durante 10 min a 4 °C [17]. Se extrajo ADN libre de células de 1,8 a 8,4 ml de plasma materno con el Mini Kit QIAamp DSP DNA Blood (Qiagen) como se describió anteriormente [3]. El ADN plasmático extraído se cuantificó mediante un ensayo de PCR en tiempo real dirigido al gen de la leptina (LEP) como se describió anteriormente [18].
Secuenciación del ADN plasmático.Las bibliotecas de secuenciación de ADN plasmático se prepararon con el kit de preparación de muestras de secuenciación de extremos en pares (Illumina) como se describió anteriormente [19]. Se utilizaron de 13 a 20 ng del ADN plasmático extraído para la preparación de la biblioteca. El ADN plasmático ligado al adaptador se enriqueció mediante una PCR de 12 ciclos. La generación de grupos se realizó en un sistema de amplificación clonal cBot (Illumina) con el kit TruSeq PE Cluster Generation v3 (Illumina). Cada biblioteca (tanto muestras de prueba como de referencia) se secuenció con un carril de una celda de flujo en un sistema de secuenciación HiSeq 2000 (Illumina) en un formato de extremos en pares de 50 pb * 2.
Alineación y filtrado de secuencias.Las lecturas de extremos en pares se alinearon con el genoma de referencia humano enmascarado sin repetición (NCBI Build 36.1/hg18) utilizando el Programa 2 de alineación de oligonucleótidos cortos (SOAP2) (http:// http://soap.genomics.org.cn/). Se permitieron hasta dos discrepancias de nucleótidos para cada miembro de las lecturas de extremos en pares. En el análisis posterior solo se incluyeron lecturas de extremos en pares con ambos extremos alineados con el mismo cromosoma con la orientación correcta, que abarcan un tamaño de inserción < 600 pb. También se eliminaron las lecturas duplicadas que se definieron como lecturas de extremos en pares que muestran posiciones inicial y final idénticas en el genoma humano.
G. Resumen del ejemplo
El ADN fetal está presente en el plasma de sujetos femeninos embarazados. Se ha utilizado la secuenciación masiva en paralelo del ADN del plasma materno para detectar trisomías fetales 21, 18, 13 y aneuploidías cromosómicas sexuales seleccionadas de forma no invasiva. Se han publicado informes de casos que describen la detección de microdeleciones fetales en plasma materno mediante secuenciación masiva en paralelo. Sin embargo, estos informes anteriores dependían del polimorfismo o utilizaban análisis estadísticos que se limitaban a una o un pequeño número de partes seleccionadas del genoma. En este Ejemplo, se informó sobre un procedimiento para realizar cariotipado prenatal no invasivo con una resolución de 3 Mb en todo el genoma mediante la secuenciación masiva en paralelo del ADN del plasma materno. Este procedimiento se ha utilizado para analizar el plasma obtenido de 6 casos. En 5 casos se han detectado con éxito microduplicaciones o microdeleciones fetales a partir del plasma materno. Los dos casos con microduplicaciones fetales representaron la primera detección prenatal no invasiva de tales cambios en el plasma materno. En el caso restante, el resultado de la secuenciación del ADN plasmático fue consistente con que la madre embarazada era portadora de una microduplicación. Se realizaron análisis de simulación para determinar la cantidad de moléculas de ADN plasmático que necesitarían secuenciarse y alinearse para mejorar la resolución diagnóstica del cariotipado prenatal no invasivo a 2 Mb y 1 Mb. En conclusión, el cariotipado molecular prenatal no invasivo a partir del plasma materno mediante secuenciación masiva en paralelo es factible y mejoraría el espectro diagnóstico de las pruebas prenatales no invasivas.
VI. SISTEMA INFORMÁTICO
Cualquiera de los sistemas informáticos mencionados en la presente memoria descriptiva puede utilizar cualquier número adecuado de subsistemas. En la Figura 9 en el aparato informático 900. En algunas realizaciones, un sistema informático incluye un único aparato informático, en el que los subsistemas pueden ser los componentes del aparato informático. En otras realizaciones, un sistema informático puede incluir múltiples aparatos informáticos, siendo cada uno un subsistema, con componentes internos.
Los subsistemas mostrados en la Figura 9 están interconectados a través de un bus de sistema 975. Se muestran subsistemas adicionales tales como una impresora 974, un teclado 978, un(os) dispositivo(s) de almacenamiento 979, un monitor 976, que está acoplado al adaptador de pantalla 982, y otros. Los periféricos y los dispositivos de entrada/salida (I/O), que se acoplan al controlador de I/O 971, se pueden conectar al sistema informático mediante cualquier medio conocido en la técnica, tal como el puerto serial 977. Por ejemplo, el puerto serial 977 o se puede utilizar una interfaz externa 981 (por ejemplo, Ethernet, Wi-Fi, etc.) para conectar el sistema informático 900 a una red de área amplia tal como Internet, un dispositivo de entrada de ratón o un escáner. La interconexión a través del bus del sistema 975 permite que el procesador central 973 se comunique con cada subsistema y controle la ejecución de instrucciones desde la memoria del sistema 972 o los dispositivos de almacenamiento 979 (por ejemplo, un disco fijo, tal como un disco duro o un disco óptico), así como el intercambio de información entre subsistemas. La memoria del sistema 972 y/o el(los) dispositivo(s) de almacenamiento 979 pueden incorporar un medio legible por ordenador. Cualquiera de los datos mencionados en la presente memoria descriptiva se puede enviar de un componente a otro componente y se puede enviar al usuario.
Un sistema informático puede incluir una pluralidad de los mismos componentes o subsistemas, por ejemplo, conectados entre sí mediante una interfaz externa 981 o mediante una interfaz interna. En algunas realizaciones, los sistemas, subsistemas o aparatos informáticos pueden comunicarse a través de una red. En tales casos, un ordenador puede considerarse un cliente y otro ordenador, un servidor, donde cada una puede ser parte de un mismo sistema informático. Un cliente y un servidor pueden incluir cada uno múltiples sistemas, subsistemas o componentes.
Debe entenderse que cualquiera de las realizaciones de la presente invención se puede implementar en forma de lógica de control usando hardware (por ejemplo, un circuito integrado de aplicación específica o una matriz de compuertas programables en campo) y/o usando software de computadora con un procesador generalmente programable de una manera modular o integrada. Como se usa en la presente memoria descriptiva, un procesador incluye un procesador de múltiples núcleos en un mismo chip integrado, o múltiples unidades de procesamiento en una sola placa de circuito o en red. Con base en la divulgación y las enseñanzas proporcionadas en la presente memoria descriptiva, una persona con conocimientos habituales en la técnica conocerá y apreciará otras formas y/o procedimientos para implementar realizaciones de la presente invención utilizando hardware y una combinación de hardware y software.
Cualquiera de los componentes o funciones de software descritos en la presente solicitud se puede implementar como código de software para ser ejecutado por un procesador usando cualquier lenguaje informático adecuado tal como, por ejemplo, Java, C++ o Perl usando, por ejemplo, técnicas convencionales u orientadas a objetos. El código de software puede almacenarse como una serie de instrucciones o comandos en un medio legible por ordenador para almacenamiento y/o transmisión, los medios adecuados incluyen memoria de acceso aleatorio (RAM), una memoria de sólo lectura (ROM), un medio magnético tal como un disco duro o un disquete, o un medio óptico como un disco compacto (CD) o DVD (disco versátil digital), memoria flash y similares. El medio legible por ordenador puede ser cualquier combinación de dichos dispositivos de almacenamiento o transmisión. Dichos programas también pueden codificarse y transmitirse utilizando señales portadoras adaptadas para la transmisión a través de redes cableadas, ópticas y/o inalámbricas que se ajusten a una variedad de protocolos, incluido Internet. Como tal, se puede crear un medio legible por ordenador de acuerdo con una realización de la presente invención usando una señal de datos codificada con tales programas. Los medios legibles por ordenador codificados con el código del programa pueden empaquetarse con un dispositivo compatible o proporcionarse por separado de otros dispositivos (por ejemplo, mediante descarga de Internet). Cualquier medio legible por ordenador puede residir en o dentro de un único producto de programa informático (por ejemplo, un disco duro, un CD o un sistema informático completo) y puede estar presente en o dentro de diferentes productos de programas informáticos dentro de un sistema o red. Un sistema informático puede incluir un monitor, una impresora u otra pantalla adecuada para proporcionar cualquiera de los resultados mencionados en la presente memoria descriptiva a un usuario.
Cualquiera de los procedimientos descritos en la presente memoria puede realizarse total o parcialmente con un sistema informático que incluya uno o más procesadores, que pueden estar configurados para realizar las etapas. Por lo tanto, las realizaciones pueden dirigirse a sistemas informáticos configurados para realizar las etapas de cualquiera de los procedimientos descritos en la presente memoria descriptiva, potencialmente con diferentes componentes que realizan las respectivas etapas o un respectivo grupo de etapas. Aunque se presentan como etapas numeradas, las etapas de los procedimientos de la presente memoria descriptiva se pueden realizar al mismo tiempo o en un orden diferente. Además, se pueden usar partes de estas etapas con partes de otras etapas de otros procedimientos. Además, toda o parte de una etapa puede ser opcional. Además, cualquiera de las etapas de cualquiera de los procedimientos se puede realizar con módulos, circuitos u otros medios para realizar estas etapas.
La mención de “un”, “uno” “una”, “el” o “la” pretende significar “uno o más”, a menos que se indique específicamente lo contrario.
Referencias
1. Lo YMD, Corbetta N, Chamberlain PF, Rai V, Sargent IL, et al. (1997) Presence of fetal DNA in maternal plasma and serum(Presencia de ADN fetal en plasma y suero maternos).Lancet 350: 485-487.
2. Lo YMD, Chiu RWK (2012) Genomic analysis of fetal nucleic acids in maternal blood(Análisis genómico de ácidos nucleicos fetales en sangre materna).Annu Rev Genomics Hum Genet 13: 285-306.
3. Chiu RWK, Chan KCA, Gao Y, Lau VYM, Zheng W, et al. (2008) Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of d Na in maternal plasma(Diagnóstico prenatal no invasivo de aneuploidía cromosómica fetal mediante secuenciación genómica masiva en paralelo de ADN en plasma materno).Proc Natl Acad Sci U S A 105: 20458-20463.
4. Chiu RWK, Akolekar R, Zheng YWL, Leung TY, Sun H, et al. (2011) Noninvasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study(Evaluación prenatal no invasiva de la trisomía 21 mediante secuenciación multiplexada de ADN de plasma materno: Estudio de validez a gran escala).BMJ 342: c7401.
5. Palomaki GE, Kloza EM, Lambert-Messerlian GM, Haddow JE, Neveux LM, et al. (2011) DNA sequencing of maternal plasma to detect Down syndrome: An international clinical validation study(Secuenciación de ADN de plasma materno para detectar el síndrome de Down: Un estudio de validación clínica internacional).Genet Med 13: 913-920.
6. Palomaki GE, Deciu C, Kloza EM, Lambert-Messerlian GM, Haddow JE, et al. (2012) DNA sequencing of maternal plasma reliably identifies trisomy 18 and trisomy 13 as well as Down syndrome: an international collaborative study(La secuenciación de a Dn del plasma materno identifica de forma fiable la trisomía 18 y la trisomía 13, así como el síndrome de Down: Un estudio colaborativo internacional).Genet Med 14: 296 305.
7. Bianchi DW, Platt LD, Goldberg JD, Abuhamad AZ, Sehnert AJ, et al. (2012) Genome-wide fetal aneuploidy detection by maternal plasma DNA sequencing(Detección de aneuploidía fetal en todo el genoma mediante secuenciación de ADN de plasma materno).Obstet Gynecol 119: 890-901.
8. Peters D, Chu T, Yatsenko SA, Hendrix N, Hogge WA, et al. (2011) Noninvasive prenatal diagnosis of a fetal microdeletion syndrome(Diagnóstico prenatal no invasivo de un síndrome de microdeleción fetal).N Engl J Med 365: 1847-1848.
9. Jensen TJ, Dzakula Z, Deciu C, van den Boom D, Ehrich M (2012) Detection of microdeletion 22q1 1.2 in a fetus by next-generation sequencing of maternal plasma(Detección de microdeleción 22q1 1.2 en un feto mediante secuenciación de plasma materno de próxima generación).Clin Chem 58: 1148-1151.
10. Lo YMD, Chan KCA, Sun H, Chen EZ, Jiang P, et al. (2010) Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus(La secuenciación de ADN de plasma materno revela el perfil genético y mutacional del feto en todo el genoma).Sci Transl Med 2: 61ra91.
11. Fan HC, Gu W, Wang J, Blumenfeld YJ, El-Sayed YY, et al. (2012) Noninvasive prenatal measurement of the fetal genome(Medición prenatal no invasiva del genoma fetal).Nature 487: 320-324.
12. Fan HC, Wang J, Potanina A, Quake SR (2011) Whole-genome molecular haplotyping of single cells(Haplotipado molecular del genoma completo de células individuales).Nat Biotechnol 29: 51-57.
13. Peters BA, Kermani BG, Sparks AB, Alferov O, Hong P, et al. (2012) Accurate whole-genome sequencing and haplotyping from 10 to 20 human cells(Secuenciación precisa del genoma completo y haplotipado de 10 a 20 células humanas).Nature 487: 190-195.
14. Chan KCA, Jiang P, Zheng YWL, Liao GJW, Sun H, et al. (2012) Cancer genome scanning in plasma: detection of tumor-associated copy number aberrations, single-nucleotide variants, and tumoral heterogeneity by massively parallel sequencing(Exploración del genoma del cáncer en plasma: Detección de aberraciones en el número de copias asociadas a tumores, variantes de un solo nucleótido y heterogeneidad tumoral mediante secuenciación masiva en paralelo).Clin Chem 59: 211-224.
15. Swanton C (2012) Plasma-derived tumor DNA analysis at whole-genome resolution(Análisis de ADN tumoral derivado de plasma con resolución de genoma completo). Clin Chem. 59: 6-8.
16. Leung TY, Vogel I, Lau TK, Chong W, Hyett JA, et al. (2011) Identification of submicroscopic chromosomal aberrations in fetuses with increased nuchal translucency and apparently normal karyotype(Identificación de aberraciones cromosómicas submicroscópicas en fetos con translucidez nucal aumentada y cariotipo aparentemente normal).Ultrasound Obstet Gynecol 38: 314-319.
17. Chiu RWK, Poon LLM, Lau TK, Leung TN, Wong EM, et al. (2001) Effects of blood-processing protocols on fetal and total DNA quantification in maternal plasma(Efectos de los protocolos de procesamiento de sangre sobre la cuantificación de ADN fetal y total en plasma materno).Clin Chem 47: 1607-1613.
18. Tsui NBY, Jiang P, Chow KCK, Su X, Leung TY, et al. (2012) High resolution size analysis of fetal DNA in the urine of pregnant women by paired-end massively parallel sequencing(Análisis de tamaño de alta resolución del ADN fetal en la orina de mujeres embarazadas mediante secuenciación masiva en paralelo de extremos en pares).PLoS One 7: e48319.
19. Zheng YWL, Chan KCA, Sun H, Jiang P, Su X, et al. (2012) Nonhematopoietically derived DNA is shorter than hematopoietically derived DNA in plasma: a transplantation model(El ADN derivado no hematopoyéticamente es más corto que el ADN derivado hematopoyéticamente en plasma: Un modelo de trasplante). Clin Chem 58: 549-558.
20. Chen EZ, Chiu RWK, Sun H, Akolekar R, Chan KCA, et al. (2011) Noninvasive prenatal diagnosis of fetal trisomy 18 and trisomy 13 by maternal plasma DNA sequencing (Diagnóstico prenatal no invasivo de trisomía 18 y trisomía 13 fetal mediante secuenciación de ADN de plasma materno).PLoS One 6: e21791.
21. Krzywinski M, Schein J, Birol I, Connors J, Gascoyne_R, et al. (2009) Circos: an information aesthetic for comparative genomics(Circos: Una estética de la información para la genómica comparativa).Genome Res 19: 1639-1645.
22. Lun FMF, Tsui NBY, Chan KCA, Leung TY, Lau TK, et al. (2008) Noninvasive prenatal diagnosis of monogenic diseases by digital size selection and relative mutation dosage on DNA in maternal plasma (Diagnóstico prenatal no invasivo de enfermedades monogénicas mediante selección de tamaño digital y dosificación relativa de mutación en el ADN en plasma materno).Proc Natl Acad Sci U S A 105: 19920 19925.
23. Wapner RJ, Martin CL, Levy B, Ballif BC, Eng CM, et al. (2012) Chromosomal microarray versus karyotyping for prenatal diagnosis(Micromatrices cromosómicas versus cariotipado para el diagnóstico prenatal).N Engl J Med 367: 2175-2184.
24. Liao GJW, Lun FMF, Zheng YWL, Chan KCA, Leung TY, et al. (2011) Targeted massively parallel sequencing of maternal plasma DNA permits efficient and unbiased detection of fetal alíeles(La secuenciación masiva en paralelo dirigida del ADN de plasma materno permite una detección eficiente e imparcial de alelos fetales).Clin Chem 57: 92-101.
25. Lam KWG, Jiang P, Liao GJW, Chan KCA, Leung TY, et al. (2012) Noninvasive prenatal diagnosis of monogenic diseases by targeted massively parallel sequencing of maternal plasma: application to betathalassemia(Diagnóstico prenatal no invasivo de enfermedades monogénicas mediante secuenciación masiva en paralelo de plasma materno: Aplicación a la beta-talasemia).Clin Chem 58: 1467-1475.
26. van den Oever JM, Balkassmi S, Verweij EJ, van Iterson M, Adama van Scheltema PN, et al. (2012) Single molecule sequencing of free DNA from maternal plasma for noninvasive trisomy 21 detection(Secuenciación de molécula única de ADN libre del plasma materno para la detección no invasiva de trisomía 21).Clin Chem 58: 699-706.

Claims (15)

REIVINDICACIONES
1. Un procedimiento de identificación de microamplificaciones o microdeleciones en un genoma de un feto mediante el análisis de una muestra biológica obtenida de un sujeto femenino embarazado del feto, incluyendo la muestra biológica ADN libre de células del feto y del sujeto femenino, comprendiendo el procedimiento:
recibir una o más etiquetas de secuencia para cada uno de una pluralidad de fragmentos de ADN en la muestra biológica;
determinar posiciones genómicas para las etiquetas de secuencia;
para cada una de una pluralidad de regiones genómicas:
determinar, con un sistema informático, una cantidad respectiva de fragmentos de ADN dentro de la región genómica a partir de etiquetas de secuencia que tienen posiciones genómicas dentro de la región genómica;
normalizar la cantidad respectiva para obtener una densidad respectiva; y
comparar la densidad respectiva con una densidad de referencia para identificar si la densidad respectiva es estadísticamente diferente de la densidad de referencia;
determinar si cualquiera de las regiones genómicas identificadas por tener una densidad respectiva estadísticamente diferente de la densidad de referencia es consecutiva con otra región genómica identificada por tener una densidad respectiva estadísticamente diferente de la densidad de referencia;
cuando al menos N primeras regiones genómicas identificadas por tener densidades respectivas estadísticamente superiores a la densidad de referencia son consecutivas, identificar las primeras regiones genómicas consecutivas como una microamplificación, siendo N un número entero igual o mayor que tres;
cuando al menos N segundas regiones genómicas identificadas por tener densidades respectivas estadísticamente inferiores a las densidades de referencia son consecutivas, identificar las segundas regiones genómicas consecutivas como una microdeleción.
2. El procedimiento según la reivindicación 1, en el que la muestra biológica es sangre, plasma, suero, orina o saliva materna.
3. El procedimiento según la reivindicación 1 o 2, en el que las etiquetas de secuencia se obtienen mediante secuenciación masiva en paralelo.
4. El procedimiento según una cualquiera de las reivindicaciones precedentes, en el que las regiones genómicas no se superponen.
5. El procedimiento según una cualquiera de las reivindicaciones precedentes, en el que las regiones genómicas son contiguas.
6. El procedimiento según una cualquiera de las reivindicaciones precedentes, en el que las regiones genómicas son de igual tamaño.
7. El procedimiento según una cualquiera de las reivindicaciones precedentes, en el que el tamaño de cada región genómica es del orden de 100 kb, 200 kb, 500 kb, 1 Mb, 2 Mb, 5 Mb o 10 Mb.
8. El procedimiento según una cualquiera de las reivindicaciones 1 a 6, en el que el tamaño de cada región genómica es aproximadamente 1 Mb.
9. El procedimiento según una cualquiera de las reivindicaciones precedentes, en el que la densidad respectiva para una región genómica se obtiene dividiendo la cantidad respectiva de fragmentos de ADN para la región genómica por la cantidad total de fragmentos de ADN para múltiples regiones genómicas.
10. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que la densidad respectiva para una región genómica es igual a la cantidad respectiva de fragmentos de ADN para la región genómica.
11. El procedimiento según una cualquiera de las reivindicaciones precedentes, en el que la densidad de referencia para una región genómica es una media o mediana de una pluralidad de densidades respectivas determinadas a partir de una o más muestras biológicas que no exhiben microamplificaciones o microdeleciones en la región genómica.
12. El procedimiento según una cualquiera de las reivindicaciones 1 a 11, en el que la densidad de referencia para una región genómica es la media o mediana de una pluralidad de densidades respectivas obtenidas para otras regiones genómicas.
13. El procedimiento según una cualquiera de las reivindicaciones precedentes, que además comprende la etapa de determinar si una microamplificación o microdeleción se hereda por vía materna, en el que se determina que una microamplificación o microdeleción se hereda por vía materna si, para cada una de las regiones genómicas consecutivas correspondientes a la microamplificación o microdeleción, la diferencia entre la densidad respectiva y la densidad de referencia excede un límite particular, siendo el límite particular mayor que un límite utilizado para determinar si la densidad respectiva y la densidad de referencia son estadísticamente diferentes.
14. El procedimiento según una cualquiera de las reivindicaciones precedentes, que además comprende mostrar, mediante el sistema informático, la identificación de las primeras regiones genómicas consecutivas como una microamplificación o la identificación de las segundas regiones genómicas consecutivas como una microdeleción.
15. Un programa informático que comprende una pluralidad de instrucciones capaces de ser ejecutadas por un sistema informático que, cuando se ejecutan así, controlan el sistema informático para realizar el procedimiento de una cualquiera de las reivindicaciones precedentes.
ES14737956T 2013-01-10 2014-01-09 Cariotipado molecular prenatal no invasivo a partir de plasma materno Active ES2965274T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361751213P 2013-01-10 2013-01-10
US13/837,776 US10643738B2 (en) 2013-01-10 2013-03-15 Noninvasive prenatal molecular karyotyping from maternal plasma
PCT/AU2014/000012 WO2014107765A1 (en) 2013-01-10 2014-01-09 Noninvasive prenatal molecular karyotyping from maternal plasma

Publications (1)

Publication Number Publication Date
ES2965274T3 true ES2965274T3 (es) 2024-04-11

Family

ID=51061637

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14737956T Active ES2965274T3 (es) 2013-01-10 2014-01-09 Cariotipado molecular prenatal no invasivo a partir de plasma materno

Country Status (19)

Country Link
US (3) US10643738B2 (es)
EP (2) EP2943592B1 (es)
JP (4) JP6251289B2 (es)
KR (3) KR102038125B1 (es)
CN (3) CN114724626A (es)
AU (2) AU2014205038B2 (es)
CA (1) CA2895206A1 (es)
DK (1) DK2943592T3 (es)
ES (1) ES2965274T3 (es)
FI (1) FI2943592T3 (es)
HK (2) HK1210811A1 (es)
HR (1) HRP20231604T1 (es)
HU (1) HUE064628T2 (es)
LT (1) LT2943592T (es)
PL (1) PL2943592T3 (es)
PT (1) PT2943592T (es)
RS (1) RS65021B1 (es)
SG (2) SG11201504795PA (es)
WO (1) WO2014107765A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10643738B2 (en) * 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
US10319463B2 (en) 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
EP3347466B1 (en) 2015-09-08 2024-01-03 Cold Spring Harbor Laboratory Genetic copy number determination using high throughput multiplex sequencing of smashed nucleotides
AU2017218149B2 (en) * 2016-02-12 2020-09-03 Regeneron Pharmaceuticals, Inc. Methods and systems for detection of abnormal karyotypes
WO2017213470A1 (ko) * 2016-06-10 2017-12-14 이원다이애그노믹스(주) 다중 z-score에 기반한 비침습적 산전 검사 방법 및 장치
CA3049442A1 (en) * 2017-01-11 2018-07-19 Quest Diagnostics Investments Llc Method for non-invasive prenatal screening for aneuploidy
CN106778069B (zh) * 2017-02-17 2020-02-14 广州精科医学检验所有限公司 确定胎儿染色体中微缺失微重复的方法及设备
CN109280702A (zh) * 2017-07-21 2019-01-29 深圳华大基因研究院 确定个体染色体结构异常的方法和系统
US11646100B2 (en) 2017-08-04 2023-05-09 Billiontoone, Inc. Target-associated molecules for characterization associated with biological targets
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
BR112020002260A2 (pt) * 2017-08-04 2020-09-08 Billiontoone, Inc. método para facilitar o diagnóstico pré-natal de um distúrbio genético a partir de uma amostra materna associada a uma gestante, método para facilitação de caracterização de uma condição médica a partir de uma amostra compreendendo moléculas alvo e método para quantificação de alvo biológico a partir de uma amostra compreendendo moléculas alvo
CN107992719B (zh) * 2017-11-23 2021-08-06 南方医科大学 一种基于高通量测序的膀胱癌检测试剂盒
PT3735470T (pt) 2018-01-05 2024-01-31 Billiontoone Inc Modelos de controlo de qualidade para garantir a validade dos ensaios baseados em sequenciamento
KR102287096B1 (ko) * 2019-01-04 2021-08-09 테라젠지놈케어 주식회사 모체 시료 중 태아 분획을 결정하는 방법
EP4256565A1 (en) 2020-12-02 2023-10-11 Illumina Software, Inc. System and method for detection of genetic alterations
CN113699225B (zh) * 2021-08-06 2023-11-21 菁良科技(深圳)有限公司 无创产前筛查微缺失或微重复非配对参考品及其制备和应用

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US20020164816A1 (en) 2001-04-06 2002-11-07 California Institute Of Technology Microfluidic sample separation device
TR201910868T4 (tr) 2006-02-02 2019-08-21 Univ Leland Stanford Junior Dijital analizle invazif olmayan fetal genetik tarama.
CA3176319A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Analyzing tumor dna in a cell-free sample
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
EP2334812B1 (en) 2008-09-20 2016-12-21 The Board of Trustees of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
HUE034854T2 (en) 2009-11-05 2018-03-28 Univ Hong Kong Chinese Fetal genomic analysis from maternal biological samples
US20120270739A1 (en) * 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
EP2848703A1 (en) * 2010-01-19 2015-03-18 Verinata Health, Inc Simultaneous determination of aneuploidy and fetal fraction
US20120237928A1 (en) 2010-10-26 2012-09-20 Verinata Health, Inc. Method for determining copy number variations
NZ611599A (en) 2010-11-30 2015-05-29 Univ Hong Kong Chinese Detection of genetic or molecular aberrations associated with cancer
US10643738B2 (en) * 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma

Also Published As

Publication number Publication date
US10643738B2 (en) 2020-05-05
US20240170094A1 (en) 2024-05-23
AU2017228558A1 (en) 2017-10-05
EP2943592B1 (en) 2023-11-08
HRP20231604T1 (hr) 2024-03-15
JP2016511632A (ja) 2016-04-21
US20200176075A1 (en) 2020-06-04
FI2943592T3 (fi) 2023-12-18
WO2014107765A1 (en) 2014-07-17
JP6251289B2 (ja) 2017-12-20
SG11201504795PA (en) 2015-07-30
DK2943592T3 (da) 2024-01-02
KR20190019219A (ko) 2019-02-26
HK1213024A1 (zh) 2016-06-24
CN115132272A (zh) 2022-09-30
EP4280219A3 (en) 2024-02-21
JP2018075013A (ja) 2018-05-17
KR20150105314A (ko) 2015-09-16
JP2020058393A (ja) 2020-04-16
SG10201807047XA (en) 2018-09-27
HUE064628T2 (hu) 2024-04-28
AU2014205038A8 (en) 2015-08-13
LT2943592T (lt) 2024-01-10
AU2017228558B2 (en) 2019-05-30
KR20190122909A (ko) 2019-10-30
CN105051209A (zh) 2015-11-11
US11923046B2 (en) 2024-03-05
CA2895206A1 (en) 2014-07-17
KR102199322B1 (ko) 2021-01-06
JP6725481B2 (ja) 2020-07-22
HK1210811A1 (en) 2016-05-06
AU2014205038A1 (en) 2015-07-16
US20140195164A1 (en) 2014-07-10
KR102038125B1 (ko) 2019-10-29
EP2943592A4 (en) 2016-08-31
EP2943592A1 (en) 2015-11-18
PL2943592T3 (pl) 2024-03-11
AU2014205038B2 (en) 2017-07-27
PT2943592T (pt) 2023-12-22
KR102113896B1 (ko) 2020-05-21
AU2017228558C1 (en) 2019-10-03
JP2023014310A (ja) 2023-01-26
RS65021B1 (sr) 2024-01-31
EP4280219A2 (en) 2023-11-22
CN114724626A (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
ES2965274T3 (es) Cariotipado molecular prenatal no invasivo a partir de plasma materno
ES2792802T3 (es) Diagnóstico de cáncer utilizando la secuenciación genómica
ES2933028T3 (es) Métodos y sistemas para análisis genómico
US9121069B2 (en) Diagnosing cancer using genomic sequencing
ES2687847T3 (es) Análisis mutacional de ADN de plasma para la detección de cáncer
TWI675918B (zh) 基於單倍型之通用非侵入性單基因疾病產前檢測
Niehus et al. PopDel identifies medium-size deletions jointly in tens of thousands of genomes
Muñoz-Barrera et al. From Samples to Germline and Somatic Sequence Variation: A Focus on Next-Generation Sequencing in Melanoma Research
Juliá Analysing Genetic Variation in Ebolaviruses and Cancer Cell Lines
Toung RNA and DNA Sequence analysis of the human transcriptome
Robasky Enabling clinical genomics by reducing false discovery in next-generation sequencing data