ES2943669T3 - Cálculo de riesgo para la evaluación de aneuploidía fetal - Google Patents

Cálculo de riesgo para la evaluación de aneuploidía fetal Download PDF

Info

Publication number
ES2943669T3
ES2943669T3 ES19160381T ES19160381T ES2943669T3 ES 2943669 T3 ES2943669 T3 ES 2943669T3 ES 19160381 T ES19160381 T ES 19160381T ES 19160381 T ES19160381 T ES 19160381T ES 2943669 T3 ES2943669 T3 ES 2943669T3
Authority
ES
Spain
Prior art keywords
chromosome
fetal
maternal
risk
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19160381T
Other languages
English (en)
Inventor
Arnold Oliphant
Andrew Sparks
Eric Wang
Craig Struble
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/316,154 external-priority patent/US20120190557A1/en
Priority claimed from US13/338,963 external-priority patent/US8700338B2/en
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Application granted granted Critical
Publication of ES2943669T3 publication Critical patent/ES2943669T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

Se describen los procesos para determinar las probabilidades de riesgo precisas de aneuploidías fetales, incluida la evaluación no invasiva de las variaciones genómicas a través de la secuenciación selectiva de cromosomas y el análisis de datos de la fracción no huésped de las muestras maternas. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Cálculo de riesgo para la evaluación de aneuploidía fetal
Campo de la invención
La invención proporciona un procedimiento no invasivo para calcular el riesgo de variaciones en el número de copias genómicas fetales tales como aneuploidías usando muestras maternas que incluyen sangre, plasma y suero maternos.
Antecedentes de la invención
En el siguiente análisis, determinados artículos y procedimientos se describirán con propósitos de introducción y antecedentes. Nada contenido en el presente documento se ha de interpretar como una "admisión" de la técnica anterior. El solicitante se reserva expresamente el derecho a demostrar, cuando sea apropiado, que los artículos y procedimientos a los que se hace referencia en el presente documento no constituyen una técnica anterior conforme a las disposiciones legales aplicables.
El Congreso Estadounidense de Obstetras y Ginecólogos (ACOG, por sus siglas en inglés) recomienda que a las mujeres embarazadas se les ofrezca un cribado no invasivo de anomalías cromosómicas fetales. Como dichos procedimientos de cribado existentes presentan tasas de positivos y negativos falsos en el intervalo de un 5 % y un 10 % respectivamente, el ACOG también recomienda que a las pacientes clasificadas por cribado como de alto riesgo de aneuploidía fetal se les ofrezcan pruebas invasivas tales como la amniocentesis o biopsia de vellosidades coriónicas. Aunque estos procedimientos invasivos son altamente exactos, son costosos y conllevan un riesgo de pérdida del feto normal de aproximadamente un 0,5 %. Para hacer frente a estas limitaciones, se han desarrollado procedimientos no invasivos de detección de aneuploidía fetal.
En particular, los intentos más recientes para identificar aneuploidías han usado sangre materna como material de partida. Dichos esfuerzos han incluido el uso de ADN libre circulante (ADNlc) para detectar aneuploidía fetal en una muestra de una mujer embarazada, incluyendo el uso de secuenciación indiscriminada masiva en paralelo (SIMP) para cuantificar con precisión el incremento de fragmentos de ADNlc de los cromosomas trisómicos. Sin embargo, la dosificación cromosómica resultante de la aneuploidía fetal está directamente relacionada con la fracción de ADNlc fetal. La variación de la aportación de ácido nucleico fetal entre muestras puede, por tanto, complicar el análisis, ya que el nivel de aportación fetal a una muestra materna variará las cantidades necesarias que se van a detectar para calcular el riesgo de que un cromosoma fetal sea aneuploide.
Por ejemplo, una muestra de ADNlc que contenga un 4 % de ADN de un feto con trisomía 21 debería presentar un incremento de un 2 % en la proporción de lecturas del cromosoma 21 (cr. 21) en comparación con un feto normal. Distinguir una trisomía 21 de un feto normal con alta confianza usando una muestra materna con un porcentaje de ácido nucleico fetal de un 4 % requiere un gran número (>93K) de observaciones del cromosoma 21, lo que es complejo y no es rentable usando técnicas no selectivas como SIMP.
Fan H. C. et al. (PNAS, vol. 107, n.° 42, 21 de octubre de 2008, páginas 16266-16271) describe un procedimiento de detección de trisomía fetal por secuenciación indiscriminada de alto rendimiento de ADN libre circulante del plasma de mujeres embarazadas, y comparación de la densidad de marca de secuencia para cada cromosoma en embarazos normales y aneuploides. Chiu R. W. K. et al. (PNAS, vol. 105, n.° 51,23 de diciembre de 2008, páginas 20458-20463) describe el uso de secuenciación genómica masiva en paralelo para cuantificar las secuencias de ADN del plasma materno para la detección prenatal no invasiva de la trisomía 21 fetal. El procedimiento comprende contar el número de secuencias únicas asignadas a cada cromosoma en relación con el número de secuencias únicas generadas para la muestra, y calcular la puntuación z usando este valor y la media y la desviación estándar de este valor en una población de referencia. Chiu R. W. K. et al. (BMJ, vol. 342, n.° 1, 11 de enero de 2011, páginas 1-9) describe el uso del procedimiento anterior en una cohorte de pacientes.
Por tanto, los procedimientos mejorados para el cálculo del riesgo de variaciones en el número de copias genómicas fetales, por ejemplo, anomalías en la dosificación cromosómica tales como aneuploidías, serían de gran beneficio en la técnica.
Sumario de la invención
Por tanto, la presente divulgación describe un procedimiento implementado por ordenador para calcular un riesgo de aneuploidía fetal en una muestra materna que comprende estimar la dosificación de cromosomas para dos o más cromosomas fetales en la muestra materna; determinar una proporción de ácido nucleico fetal en la muestra materna; proporcionar datos sobre el riesgo anterior de aneuploidía para al menos un primer cromosoma fetal en base a las características extrínsecas; calcular un valor de una verosimilitud de que el primer cromosoma fetal sea aneuploide comparando la dosificación de cromosomas del primer cromosoma fetal con la dosificación de cromosomas de un segundo cromosoma fetal en vista de la proporción de ácido nucleico fetal en la muestra materna y el riesgo anterior de aneuploidía; calcular un valor de una verosimilitud de que el primer cromosoma fetal sea disómico comparando la dosificación de cromosomas del primer cromosoma fetal con la dosificación de cromosomas del segundo cromosoma fetal en vista de la proporción de ácido nucleico fetal en la muestra materna y el riesgo anterior de aneuploidía; computar un valor del riesgo de aneuploidía fetal para el primer cromosoma fetal en base al valor de la verosimilitud de que el cromosoma sea aneuploide, y el valor de la verosimilitud de que el cromosoma sea disómico.
En algunos casos, la muestra materna es una muestra materna sin células y, en algunos casos, la muestra materna sin células es plasma o suero materno. Aún en otros casos más, la muestra materna comprende células.
En algunos casos, los datos de riesgo anterior de aneuploidía comprenden información relacionada con la edad materna, y en algunos casos, los datos de riesgo anterior de aneuploidía comprenden información relacionada con la edad gestacional. Aún en otros casos, los datos sobre el riesgo anterior de aneuploidía comprenden información relacionada tanto con la edad materna como con la edad gestacional.
En algunos casos, la dosificación de cromosomas del primer y segundo cromosoma fetal se estima consultando uno o más locus en la muestra materna en cada cromosoma para los que se estima la dosificación de cromosomas; en algunos casos, la dosificación de cromosomas del primer y segundo cromosoma fetal se estima consultando al menos diez locus en cada cromosoma para los que se estima la dosificación de cromosomas y, en algunos casos, la dosificación de cromosomas del primer y segundo cromosoma fetal se estima consultando al menos cuarenta y ocho locus o al menos noventa y seis locus en cada cromosoma para los que se estima la dosificación de cromosomas.
En algunos casos, los locus consultados para la estimación de la dosificación de cromosomas del primer y segundo cromosoma fetal son locus no polimórficos.
En algunos casos, la determinación de la proporción de ácido nucleico fetal en la muestra materna se realiza consultando uno o más locus polimórficos en la muestra materna.
En algunos casos, el riesgo de aneuploidía fetal se informa como una razón de posibilidades, y en otros aspectos de la invención, el riesgo de aneuploidía fetal para el primer cromosoma fetal se basa en un valor de una verosimilitud de que el primer cromosoma fetal sea trisómico y un valor de la verosimilitud de que el primer cromosoma fetal sea disómico. En otros aspectos, el riesgo de aneuploidía fetal para el primer cromosoma fetal se basa en un valor de una verosimilitud de que el primer cromosoma fetal sea monosómico y un valor de la verosimilitud de que el primer cromosoma fetal sea disómico.
La invención proporciona un procedimiento implementado por ordenador para calcular un riesgo de aneuploidía fetal en una muestra materna que comprende: estimar la dosificación de cromosomas para dos o más cromosomas fetales en la muestra materna usando la información obtenida consultando uno o más locus en la muestra materna en cada cromosoma para los que se estima la dosificación de cromosomas; determinar una proporción de ácido nucleico fetal en la muestra materna usando la información obtenida consultando uno o más locus polimórficos en la muestra materna; calcular un valor de una verosimilitud de que un primer cromosoma fetal sea aneuploide comparando la dosificación de cromosomas del primer cromosoma fetal con la dosificación de cromosomas de un segundo cromosoma fetal en vista de la proporción de ácido nucleico fetal en la muestra materna; calcular un valor de una verosimilitud de que el primer cromosoma fetal sea disómico comparando la dosificación de cromosomas del primer cromosoma fetal con la dosificación de cromosomas del segundo cromosoma fetal en vista de la proporción de ácido nucleico fetal en la muestra materna; computar un valor del riesgo de aneuploidía fetal para el primer cromosoma fetal como una razón de posibilidades comparando el valor de la verosimilitud de que el cromosoma sea aneuploide y el valor de la verosimilitud de que el cromosoma sea disómico; proporcionar datos sobre el riesgo anterior de aneuploidía para al menos el primer cromosoma fetal en base a las características extrínsecas; y ajustar el valor del riesgo de aneuploidía fetal en base a los datos de riesgo anterior de aneuploidía.
En algunos aspectos de este modo de realización, la muestra materna es una muestra materna sin células y, en algunos modos de realización, la muestra materna sin células es plasma o suero materno. Aún en otros aspectos, la muestra materna comprende células.
En algunos aspectos de este modo de realización, los datos sobre el riesgo anterior de aneuploidía comprenden información relacionada con la edad materna y, en algunos aspectos, los datos sobre el riesgo anterior de aneuploidía comprenden información relacionada con la edad gestacional. Aún en otros modos de realización, los datos sobre el riesgo anterior de aneuploidía comprenden información relacionada tanto con la edad materna como con la edad gestacional.
En algunos aspectos de este modo de realización, la dosificación de cromosomas del primer y segundo cromosoma fetal se estima usando la información obtenida consultando al menos diez locus en cada cromosoma para los que se estima la dosificación de cromosomas, y en algunos modos de realización, la dosificación de cromosomas del primer y el segundo cromosoma fetal se estima usando la información obtenida consultando al menos cuarenta y ocho locus o al menos noventa y seis locus en cada cromosoma para los que se estima la dosificación de cromosomas.
En algunos aspectos de este modo de realización, los locus consultados para la estimación de la dosificación de cromosomas del primer y segundo cromosoma fetal son locus no polimórficos.
En algunos modos de realización, el riesgo de aneuploidía fetal para el primer cromosoma fetal se basa en un valor de una verosimilitud de que el primer cromosoma fetal sea trisómico y un valor de la verosimilitud de que el primer cromosoma fetal sea disómico. En otros modos de realización, el riesgo de aneuploidía fetal para el primer cromosoma fetal se basa en un valor de una verosimilitud de que el primer cromosoma fetal sea monosómico y un valor de la verosimilitud de que el primer cromosoma fetal sea disómico.
Se pueden usar numerosas maneras de determinar la proporción de ácido nucleico fetal, como se describe con más detalle en el presente documento. En determinados aspectos, la proporción de ácido nucleico fetal se determina para un único cromosoma fetal. En otros aspectos, la proporción de ácido nucleico fetal se determina para dos o más cromosomas fetales. Aún en otros aspectos, la proporción de ácido nucleico fetal refleja la proporción total de ácidos nucleicos fetales en la muestra materna.
Descripción de las figuras
La figura 1 es un diagrama de bloques que ilustra un entorno de sistema ejemplar.
La figura 2 es una tabla con datos demográficos de los sujetos de los que se obtuvieron y analizaron muestras maternas en los ejemplos.
Las figuras 3A y 3B son gráficos que ilustran las estadísticas Z de la cohorte frente a la proporción fetal. La estadística Z de proporción cromosómica se representa gráficamente para el cromosoma 18 (A) o el cromosoma 21 (B) frente a la fracción de ADN fetal para cada sujeto de la cohorte. Los sujetos disómicos se representan como rombos negros, los sujetos trisómicos como rombos grises.
Las figuras 4A y 4B son gráficos que ilustran las posibilidades de cálculo de riesgo de la cohorte frente a la proporción fetal. Las posibilidades computadas de riesgo de trisomía frente a disomía para el cromosoma 18 (A) o el cromosoma 21 (B) se representan gráficamente frente a la fracción de ADN fetal para cada sujeto de la cohorte. Los sujetos disómicos se representan como rombos negros, los sujetos trisómicos como rombos grises.
Las figuras 5A y 5B son gráficos que ilustran las posibilidades de cálculo de riesgo de la cohorte con enmascaramiento (segunda) de la presente invención frente a la proporción fetal. Las posibilidades computadas de riesgo de trisomía frente a disomía para el cromosoma 18 (A) o el cromosoma 21 (B) se representan gráficamente frente a la fracción de ADN fetal para cada sujeto de la cohorte con enmascaramiento (segunda). Los sujetos disómicos se representan como rombos negros, los sujetos trisómicos como rombos grises.
Descripción detallada de la invención
Los procedimientos descritos en el presente documento pueden emplear, a menos que se indique de otro modo, técnicas convencionales y descripciones de biología molecular (incluyendo técnicas recombinantes), genómica, bioquímica y tecnología de secuenciación, que están al alcance de los expertos en la técnica. Dichas técnicas convencionales incluyen hibridación y fijación de oligonucleótidos, secuenciación de segunda generación y detección de hibridación usando un marcador. Se pueden tener ilustraciones específicas de técnicas adecuadas por referencia a los ejemplos en el presente documento. Sin embargo, por supuesto, también se pueden usar procedimientos convencionales equivalentes. Dichas técnicas y descripciones convencionales se pueden encontrar en manuales de laboratorio estándar, tales como Green, et al., Eds., Genome Analysis: A Laboratory Manual Series (vols. I-IV) (1999); Weiner, et al., Eds., Genetic Variation: A Laboratory Manual (2007); Dieffenbach, Dveksler, Eds., PCR Primer: A Laboratory Manual (2003); Bowtell y Sambrook, DNA Microarrays: A Molecular Cloning Manual (2003); Mount, Bioinformatics: Sequence and Genome Analysis (2004); Sambrook y Russell, Condensed Protocols from Molecular Cloning: A Laboratory Manual (2006); y Sambrook y Russell, Molecular Cloning: A Laboratory Manual (2002) (todos de Cold Spring Harbor Laboratory Press); Stryer, L., Biochemistry (4.a ed.) W.H. Freeman, Nueva York (1995); Gait, "Oligonucleotide Synthesis: A Practical Approach" IRL Press, Londres (1984); Nelson y Cox, Lehninger, Principles of Biochemistry, 3.a ed., W. H. freeman Pub., Nueva York (2000); y Berg et al., Biochemistry, 5.a ed., W.H. freeman Pub., Nueva York (2002). Antes de que se describan las presentes composiciones, herramientas de investigación y procedimientos, se ha de entender que la presente invención no se limita a los procedimientos, composiciones, dianas y usos específicos descritos, ya que, por supuesto, dichos pueden variar.
Cabe destacar que como se usa en el presente documento y en las reivindicaciones adjuntas, las formas en singular "un", "una" y "el/la" incluyen referentes al plural a menos que el contexto lo indique claramente de otro modo. Por tanto, por ejemplo, la referencia a "una región de ácido nucleico" se refiere a una, más de una o mezclas de dichas regiones, y la referencia a "un ensayo" incluye la referencia a etapas y procedimientos equivalentes conocidos para los expertos en la técnica, etc.
Cuando se proporciona un intervalo de valores, se ha de entender que cada valor intermedio, entre el límite superior e inferior de ese intervalo y cualquier otro valor establecido o intermedio en ese intervalo establecido se engloba dentro de la invención. Cuando el intervalo establecido incluye los límites superior e inferior, los intervalos que excluyen cualquiera de esos límites incluidos también se incluyen en la invención.
A menos que se establezca expresamente, los términos usados en el presente documento están destinados a tener el significado simple y normal como se entiende por los expertos en la técnica. Las siguientes definiciones están destinadas a ayudar al lector a entender la presente invención, pero no están destinadas a variar o de otro modo limitar el significado de dichos términos a menos que se indique específicamente.
En la siguiente descripción se exponen numerosos detalles específicos para proporcionar un entendimiento más completo de la presente invención. Sin embargo, será evidente para un experto en la técnica que la presente invención se puede practicar sin uno o más de estos detalles específicos. En otros casos, no se han descrito rasgos característicos y procedimientos bien conocidos para los expertos en la técnica para evitar eclipsar la invención.
Definiciones
Los términos usados en el presente documento están destinados a tener el significado simple y normal como se entiende por los expertos en la técnica. Las siguientes definiciones están destinadas a ayudar al lector a entender la presente invención, pero no están destinadas a variar o de otro modo limitar el significado de dichos términos a menos que se indique específicamente.
El término "ácido nucleico amplificado" es cualquier molécula de ácido nucleico con una cantidad que se ha incrementado al menos dos veces por cualquier proceso de amplificación o replicación de ácido nucleico realizado in vitro en comparación con la cantidad de partida en una muestra materna.
El término "anomalía de dosificación cromosómica" se refiere a duplicaciones o deleciones de todo (aneuploidía) o parte de un cromosoma.
El término "herramienta de diagnóstico" como se usa en el presente documento se refiere a cualquier composición o ensayo de la invención usado en combinación como, por ejemplo, en un sistema para llevar a cabo una prueba o ensayo de diagnóstico en una muestra de paciente.
El término "región distintiva" se refiere a una región que es de forma mensurable diferente entre locus. Dichas diferencias incluyen, pero no se limitan a, polimorfismos mononucleotídicos (SNP), diferencias en el estado de metilación, mutaciones que incluyen mutaciones puntuales e inserciones-deleciones, repeticiones cortas en tándem, variantes del número de copias y similares.
El término "hibridación" quiere decir, en general, la reacción por la que se produce el emparejamiento de hebras complementarias de ácido nucleico. Normalmente el ADN es bicatenario, y cuando las hebras se separan, se rehibridarán en las condiciones apropiadas. Se pueden formar híbridos ADN-ADN, ADN-ARN o ARN-ARN. Se pueden formar entre una hebra corta y una hebra larga que contiene una región complementaria a la corta. También se pueden formar híbridos imperfectos, pero cuanto más imperfectos sean, menos estables serán (y menos probable que se formen).
El término "factor extrínseco" incluye cualquier información pertinente al cálculo de una razón de posibilidades que no se deriva empíricamente a través de la detección de un locus materno y fetal. Los ejemplos de dichos factores extrínsecos incluyen información relacionada con la edad materna, información relacionada con la edad gestacional, información relacionada con embarazos previos con un feto aneuploide, resultados de detección en suero previos y similares. En modos de realización preferentes, la etapa de ajustar la razón de posibilidades computada usa factores extrínsecos relacionados tanto con la edad materna como con la edad gestacional.
El término "locus" como se usa en el presente documento se refiere a una región de ácido nucleico de localización conocida en un genoma.
El término "locus informativo", como se usa en el presente documento, se refiere a un locus con una o más regiones distintivas que es homocigoto en una fuente y heterocigoto en otra fuente dentro de una muestra mixta.
El término "muestra materna", como se usa en el presente documento, se refiere a cualquier muestra tomada de un mamífero embarazado que comprende una fuente materna y una fuente fetal de ácidos nucleicos (por ejemplo, ARN o ADN).
Como se usa en el presente documento, "reacción en cadena de la polimerasa" o "PCR" se refiere a una técnica para replicar un fragmento específico de ADN diana in vitro, incluso en presencia de un exceso de ADN no específico. Se añaden cebadores al ADN diana, donde los cebadores inician la copia del ADN diana usando nucleótidos y, típicamente, Taq polimerasa o similares. Realizando ciclos de la temperatura, el ADN diana se desnaturaliza y copia repetidamente. Se puede amplificar una única copia del ADN diana, incluso si se mezcla con otro ADN aleatorio, para obtener mil millones de réplicas. La reacción en cadena de la polimerasa se puede usar para detectar y medir cantidades muy pequeñas de ADN y para crear fragmentos de ADN adaptados. En algunos casos, se pueden usar los procesos de amplificación lineal como alternativa a la PCR.
El término "polimorfismo", como se usa en el presente documento, se refiere a cualquier característica genética en un locus que pueda ser indicativa de ese locus en particular, incluyendo pero sin limitarse a polimorfismos mononucleotídicos (SNP), diferencias de metilación, repeticiones cortas en tándem (STR) y similares.
En general, un "cebador" es un oligonucleótido usado para, por ejemplo, cebar la extensión, fijación y/o síntesis de ADN, tal como en la etapa de síntesis de la reacción en cadena de la polimerasa o en las técnicas de extensión de cebador usadas en determinadas reacciones de secuenciación. También se puede usar un cebador en técnicas de hibridación como un medio para proporcionar complementariedad de una región de ácido nucleico a un oligonucleótido de captura para la detección de una región de ácido nucleico específica.
El término "herramienta de investigación" como se usa en el presente documento se refiere a cualquier composición o ensayo de la invención usado para investigación científica, de naturaleza académica o comercial, incluyendo el desarrollo de tratamientos farmacéuticos y/o biológicos. No se pretende que las herramientas de investigación de la invención sean terapéuticas o estén sujetas a autorización; en su lugar, se pretende que las herramientas de investigación de la invención faciliten la investigación y ayuden en dichas actividades de desarrollo, incluyendo cualquier actividad realizada con la intención de producir información para respaldar una presentación del expediente de registro.
El término "región de ácido nucleico seleccionada", como se usa en el presente documento, se refiere a una región de ácido nucleico correspondiente a una región genómica en un cromosoma individual. Dichas regiones de ácido nucleico seleccionadas se pueden aislar y enriquecer directamente a partir de la muestra para la detección, por ejemplo, en base a hibridación y/u otras técnicas basadas en secuencias, o se pueden amplificar usando la muestra como un molde antes de la detección de la secuencia. Las regiones de ácidos nucleicos para su uso en los sistemas de procesamiento de la presente invención se pueden seleccionar sobre la base de la variación del nivel de ADN entre individuos, en base a la especificidad por un cromosoma particular, en base al contenido de CG y/o las condiciones de amplificación requeridas de las regiones de ácido nucleico seleccionadas, u otras características que serán evidentes para un experto en la técnica tras leer la presente divulgación.
Los términos "secuenciación", "determinación de secuencia" y similares como se usan en el presente documento se refieren en general a cualquiera y todos los procedimientos bioquímicos que se pueden usar para determinar el orden de las bases nucleotídicas en un ácido nucleico.
El término "se une específicamente", "unión específica" y similares, como se usa en el presente documento, se refiere a una o más moléculas (por ejemplo, una sonda o cebador de ácido nucleico, anticuerpo, etc.) que se unen a otra molécula, dando como resultado la generación de una señal positiva estadísticamente significativa en las condiciones de ensayo designadas. Típicamente, la interacción dará posteriormente como resultado una señal detectable que es al menos dos veces la desviación estándar de cualquier señal generada como resultado de interacciones no deseadas (fondo).
El término "valor de la verosimilitud" se refiere a cualquier valor logrado calculando directamente la verosimilitud o cualquier valor que se pueda correlacionar con o de otro modo sea indicativo de una verosimilitud.
El término "valor de la probabilidad" se refiere a cualquier valor logrado calculando directamente la probabilidad o cualquier valor que se pueda correlacionar con o de otro modo sea indicativo de una probabilidad.
Determinación de la proporción de ADN fetal en una muestra materna
La dosificación cromosómica resultante de la aneuploidía fetal se puede detectar usando ácidos nucleicos de una muestra materna. Además de la determinación empírica de la frecuencia de ácidos nucleicos de un cromosoma particular, la proporción de ácidos nucleicos fetales en la muestra materna también es útil en la determinación del riesgo de aneuploidía fetal en base a la dosificación de cromosomas, ya que afectará el nivel de variación que es estadísticamente significativo en términos del cálculo del riesgo. La utilización de dicha información en el cálculo del riesgo de una aneuploidía en uno o más cromosomas fetales permite obtener un resultado más exacto que refleja las diferencias biológicas entre las muestras.
La proporción de ADN fetal en una muestra materna se usa como parte del cálculo de riesgo de la presente invención, ya que la proporción fetal proporciona información importante sobre la presencia estadística esperada de la dosificación cromosómica. La variación de la presencia estadística esperada puede ser indicativa de aneuploidía fetal, y en particular una trisomía o monosomía fetal de un cromosoma particular.
Se puede usar cualquier procedimiento conocido en la técnica para estimar el porcentaje de ADN fetal en una muestra materna, de los que algunos se describen a continuación. De acuerdo con la invención, la proporción de ácido nucleico fetal en una muestra materna se determina usando información obtenida consultando uno o más locus polimórficos en la muestra materna. El uso de la proporción fetal como un componente del cálculo de riesgo es en particular útil en circunstancias donde el nivel de ADN fetal en una muestra materna es bajo. Además, se puede usar el conocimiento del porcentaje de ADN fetal para determinar que si se puede realizar cualquier análisis adicional en la muestra, como puede ser el caso en un determinado límite inferior del porcentaje de ADN fetal, un sistema no puede realizar un análisis de forma fiable. En otros aspectos, determinar la proporción de ADN fetal en una muestra materna puede afectar adicionalmente al nivel de certeza o potencia en la detección de una aneuploidía fetal.
Aunque se describen los siguientes procedimientos para la determinación de una proporción total de contenido fetal en una muestra materna, la proporción también se puede determinar cromosoma por cromosoma. Por ejemplo, la información de frecuencia para el cromosoma fetal 21 se puede determinar en comparación con el cromosoma fetal 18. En otro ejemplo, se pueden usar dos o más cromosomas en la detección de una proporción fetal, por ejemplo, se puede usar la frecuencia de locus en los cromosomas 1 y 2. En determinados aspectos, el cromosoma usado para determinar la proporción fetal es el cromosoma consultado para detectar una posible aneuploidía. En otro aspecto, el/los cromosoma(s) usado(s) para determinar la proporción fetal específicamente no es/son el cromosoma consultado para detectar una posible aneuploidía.
Determinación del contenido de ADN fetal en una muestra materna usando secuencias específicas de Y
En circunstancias donde el feto es masculino, el porcentaje de ADN fetal en una muestra se puede determinar a través de la detección de ácidos nucleicos específicos de Y compararse con el contenido de ADN materno. Por ejemplo, se pueden determinar y comparar las cantidades de un ácido nucleico específico de Y amplificado tal como una región del gen Y de la región determinante del sexo (SRY), que se localiza en el cromosoma Y, por tanto, es representativa del ADN fetal en esta circunstancia, con una o más regiones genómicas amplificadas que están presentes tanto en el ADN materno como en el ADN fetal (regiones genómicas que preferentemente no son de un cromosoma que se cree que es potencialmente aneuploide en el feto, por ejemplo, una región autosómica que no está en el cromosoma 21, 18 o 13).
En otro ejemplo, la concentración de ADN fetal en una muestra se calcula usando procedimientos que tienen en cuenta el pequeño porcentaje de ADN materno de fondo que se puede identificar incorrectamente como originario del cromosoma Y. Específicamente, usando determinados algoritmos bioinformáticos, un pequeño número de moléculas de ADN se identifican incorrectamente como originarios del cromosoma Y en embarazos con fetos femeninos (véase Chiu, et al., PNAS USA, 105:20458-63 (2008)). El valor de % de croY en un embarazo con un feto masculino es, por tanto, una combinación de la cantidad de secuencias del cromosoma Y aportadas por el feto masculino y aquellas secuencias del ADN de fondo materno que se asignan incorrectamente al cromosoma Y. En consecuencia, en determinados aspectos, la concentración de ADN fetal se puede derivar más correctamente a partir de la ecuación: % de croY = 0,157F 0,007(1-F) (véase Chiu, et al., BMJ, 342:c7401 (2011)).
En un ejemplo preferente, el ADN amplificado a partir del ADN sin células se produce por la reacción en cadena de la polimerasa (PCR). Se pueden usar otros mecanismos para la amplificación también, como será evidente para un experto en la técnica tras leer la presente divulgación, incluyendo los descritos con más detalle en el presente documento. En ejemplos particulares, el porcentaje de ADN fetal sin células en la muestra materna se puede determinar por PCR usando ADN diluido en serie aislado de la muestra materna, que puede cuantificar con exactitud el número de genomas que comprenden los genes amplificados. Por ejemplo, si una muestra de sangre contiene un 100 % de ADN fetal masculino y se realizan diluciones en serie 1:2, entonces, en promedio, la señal SRY desaparecerá 1 dilución antes que una señal autosómica, puesto que existe 1 copia del gen SRY y 2 copias de un gen autosómico.
En un ejemplo específico, el porcentaje de ADN fetal sin células en el plasma materno se calcula usando la siguiente fórmula: porcentaje de ADN fetal sin células = (n.° de copias del gen SRY x 2 x 100)/(n.° de copias de genes autosómicos), donde el número de copias de cada gen se determina observando la dilución en serie más alta en la que se detectó el gen. La fórmula contiene un factor de multiplicación de 2, que se usa para normalizar el hecho de que en cada genoma, fetal o materno, solo existe 1 copia del gen SRY en comparación con dos copias del gen autosómico.
Determinación del contenido de ADN fetal en una muestra materna usando locus informativos autosómicos
El ADN de un feto tendrá aproximadamente un 50 % de sus locus heredados de la madre y aproximadamente un 50 % de sus locus heredados del padre. Determinar qué locus genéticos se aportan al feto a partir de fuentes no maternas (locus informativos) permite la estimación de la proporción de ADN fetal en una muestra materna y, por tanto, proporciona información usada para calcular diferencias estadísticamente significativas en dosificaciones cromosómicas para los cromosomas de interés.
En determinados aspectos, la determinación de polimorfismos fetales requiere SNP específico y/o análisis de mutaciones para identificar la presencia de ADN fetal en una muestra materna. En algunos aspectos, se puede usar el genotipado anterior del padre y/o la madre. Por ejemplo, los padres se pueden haber sometido a la determinación del genotipo para identificar marcadores de enfermedades, por ejemplo, marcadores de trastornos tales como fibrosis quística, distrofia muscular, atrofia muscular espinal o incluso el estado del gen RhD. Las diferencias en polimorfismos, variantes del número de copias o mutaciones se pueden usar para determinar el porcentaje de aportación fetal en una muestra materna.
En un aspecto preferente, el porcentaje de ADN sin células fetales en una muestra materna se puede cuantificar usando detección de SNP multiplexada sin conocimiento anterior del genotipo materno o paterno. En este aspecto, se usan dos o más regiones de ácido nucleico polimórficas seleccionadas con un SNP conocido en cada región. En un aspecto preferente, las regiones de ácido nucleico polimórficas seleccionadas se localizan en un cromosoma autosómico que es poco probable que sea aneuploide, por ejemplo, ni los cromosomas 21, 18 ni 13. Las regiones de ácido nucleico polimórficas seleccionadas de la muestra materna (por ejemplo, plasma) se amplifican. En un aspecto preferente, la amplificación es universal; y en un modo de realización preferente, las regiones de ácido nucleico polimórficas seleccionadas se amplifican en una reacción en un recipiente. Cada alelo de las regiones de ácido nucleico polimórficas seleccionadas en la muestra materna se determina y se cuantifica. En un aspecto preferente, se usa secuenciación de alto rendimiento para dicha determinación y cuantificación.
Por tanto se identifican locus donde los genotipos maternos y fetales son diferentes; por ejemplo, el genotipo materno es homocigoto y el genotipo fetal es heterocigoto. Esta identificación de locus informativos se logra observando una alta frecuencia de un alelo (>80 %) y una baja frecuencia (<20 % y >0,15 %) del otro alelo para una región de ácido nucleico seleccionada particular. El uso de múltiples locus es en particular ventajoso ya que reduce la cantidad de variación en la medición de la abundancia de los alelos entre locus. Se usan todos o un subconjunto de los locus que cumplen con este requisito para determinar la aportación fetal a través de análisis estadístico. En un aspecto, la aportación fetal se determina sumando los alelos de baja frecuencia de dos o más locus juntos, dividiendo entre la suma de los alelos de baja y alta frecuencia y multiplicando por dos.
Para muchos alelos, las secuencias maternas y fetales pueden ser homocigotas e idénticas, y como esta información, por lo tanto, no distingue entre ADN materno y fetal, no es útil en la determinación del porcentaje de ADN fetal en una muestra materna. La presente invención utiliza información alélica donde existe una diferencia distinguible entre el ADN fetal y materno (por ejemplo, un alelo fetal que contiene al menos un alelo que difiere del alelo materno) en los cálculos del porcentaje de ADN fetal. Los datos pertenecientes a las regiones alélicas que son iguales para el ADN materno y fetal, por tanto, no se seleccionan para el análisis o se retiran de los datos pertinentes antes de la determinación de la proporción de ADN fetal para no enmascarar los datos útiles. Se pueden encontrar procedimientos ejemplares adicionales para cuantificar el ADN fetal en plasma materno, por ejemplo, en Chu, et al., Prenat. Diagn., 30:1226-29 (2010).
En un aspecto, los datos de regiones de ácido nucleico seleccionadas se pueden excluir si los datos de la región parecen ser un valor atípico debido a error experimental o al sesgo genético idiopático dentro de una muestra particular. En otro aspecto, los datos seleccionados de determinadas regiones de ácido nucleico se pueden someter a ajustes estadísticos o matemáticos tales como normalización, estandarización, agrupación o transformación antes de la suma o el promedio. En otro aspecto, los datos de regiones de ácido nucleico seleccionadas se pueden someter tanto a normalización como a exclusión de errores experimentales de datos antes de la suma o el promedio.
En un aspecto preferente, se usan para el análisis datos de 12 o más regiones o locus de ácido nucleico. En otro aspecto preferente, se usan para el análisis datos de 24 o más regiones o locus de ácido nucleico. En otro aspecto preferente, se usan para el análisis datos de 48 o más locus. En otro aspecto, se usan uno o más índices para identificar la muestra, el locus, el alelo o la identificación del ácido nucleico. Dichos índices son como se describe en las solicitudes en tramitación junto con la presente 13/205.490 y 13/205.570.
En un aspecto preferente, la aportación fetal porcentual en una muestra materna se cuantifica usando la detección de SNP en tándem en los alelos maternos y fetales. Las técnicas para identificar SNP en tándem en ADN extraído de una muestra materna se divulgan en Mitchell et al., la patente de EE. UU. n.° 7.799.531 y las solicitudes de patente de EE. UU. n.os 12/581.070, 12/581.083, 12/689.924 y 12/850.588. Estas referencias describen la diferenciación de los locus fetales y maternos a través de la detección de al menos un polimorfismo mononucleotídico (SNP) en tándem en una muestra materna que tiene un haplotipo diferente entre el genoma fetal y materno. La identificación y cuantificación de estos haplotipos se puede realizar directamente en la muestra materna y usarse para determinar la proporción fetal de ácidos nucleicos en la muestra materna.
Determinación del contenido de ADN fetal en una muestra materna usando proporciones alélicas epigenéticas
Se ha identificado que determinados genes tienen diferencias epigenéticas entre el feto y la madre, y dichos genes son locus candidatos para marcadores de ADN fetal en una muestra materna. Véase, por ejemplo, Chim, et al., PNAS USA, 102:14753-58 (2005). Estos locus, que no están metilados en el feto pero están metilados en los glóbulos sanguíneos maternos, se pueden detectar fácilmente en el plasma materno. La comparación de productos de amplificación metilados y no metilados de una muestra materna se puede usar para cuantificar el porcentaje de aportación de ADN fetal a la muestra materna calculando la proporción alélica epigenética para una o más de dichas secuencias que se sabe que están metiladas diferencialmente en el ADN fetal en comparación con el ADN materno.
Para determinar el estado de metilación de los ácidos nucleicos en una muestra materna, los ácidos nucleicos de la muestra se someten a conversión con bisulfito. Los procedimientos convencionales para dicha conversión con bisulfito incluyen, pero no se limitan a, el uso de kits disponibles comercialmente, tal como el kit de modificación de ADN Methylamp™ (Epigentek, Brooklyn, NY). Las frecuencias alélicas y las proporciones se pueden calcular directamente y exportar a partir de los datos para determinar el porcentaje de ADN fetal en la muestra materna.
Estimación empírica de la dosificación de cromosomas
La dosificación de cromosomas fetales usada en el cálculo del riesgo de posibilidades se puede estimar usando una variedad de técnicas. Los procedimientos para la detección incluyen detección polimórfica, tal como detección de SNP de ácidos nucleicos específicos, o preferentemente detección no polimórfica en base a secuencias fetales y maternas, y preferentemente secuencias no polimórficas conservadas entre la madre y el feto. Estos procedimientos de detección pueden determinar tanto la dosificación de un cromosoma particular como la proporción global de ácidos nucleicos fetales en una muestra materna en relación con la aportación materna.
En la estimación de la dosificación de cromosomas, dichas mediciones de frecuencia son preferentemente frecuencias totales del ácido nucleico seleccionado en la muestra, independientemente de la fuente, y por tanto no se requiere que los ácidos nucleicos seleccionados se distingan como que provienen de una fuente materna o fetal antes del uso en el cálculo del riesgo de posibilidades.
En algunos aspectos, los ácidos nucleicos se pueden seleccionar de una muestra materna antes de la detección, es decir, aislarse selectivamente de una muestra materna antes de la detección usando técnicas de amplificación o captura tales como hibridación. En otro aspecto específico, los ácidos nucleicos usados en la estimación de la dosificación de cromosomas se pueden seleccionar después de la detección, por ejemplo, filtrando los datos de frecuencia generados a partir de técnicas tales como la secuenciación indiscriminada masiva en paralelo de ácidos nucleicos dentro de la muestra materna.
En algunos aspectos específicos, la estimación de la dosificación de cromosomas emplea procedimientos de secuenciación selectiva que consultan locus específicos de cromosoma, lo que posibilita una secuenciación altamente multiplexada de locus seleccionados de cromosomas de interés específicos. La secuenciación selectiva de cromosoma se puede usar para someter a ensayo simultáneamente locus polimórficos y no polimórficos en una única reacción, lo que posibilita la estimación tanto de la dosificación de cromosomas como de la proporción fetal de ácidos nucleicos fetales en la muestra materna. Posteriormente, se puede emplear un cálculo de riesgo novedoso de la invención, que aprovecha las estimaciones de dosificación de cromosomas y proporción fetal para computar la verosimilitud de aneuploidía fetal (por ejemplo, trisomía fetal) en cada sujeto.
En un aspecto, la presente invención utiliza el análisis de segmentos de ADN aleatorios, tales como el descrito, por ejemplo, en Quake et al., las patentes de EE. UU. n.os 8.008.018 y 7.888.017, y Shoemaker et al., para estimar la dosificación de cromosomas (aneuploidía). En resumen, la cantidad de ácidos nucleicos dentro de una muestra mixta, tal como una muestra materna, se puede detectar diferencialmente usando secuencias de ácido nucleico seleccionadas. Los ácidos nucleicos pueden ser ADN o ARN genómico, y preferentemente son ARNm. En el caso del ARNm, se pueden elegir secuencias diana correspondientes a genes que están altamente expresados en el feto. Los ácidos nucleicos de cada muestra se detectan con una o más sondas específicas de secuencia dirigidas a al menos una de dos secuencias diana de los ácidos nucleicos para obtener un producto de reacción detectable. Una sonda específica de un cromosoma consultado se combina con la muestra de reacción, junto con una sonda de control específica de otro cromosoma (por ejemplo, no consultado). En la mayoría de los casos, los productos de reacción serán de ácidos nucleicos maternos, pero un pequeño número de productos de reacción serán de ácidos nucleicos fetales. Para distinguir la variación aleatoria de los resultados fetales, se ejecuta un gran número de reacciones y se aplican procedimientos estadísticos a los resultados. El marcaje y la detección en el presente procedimiento se usan para distinguir la presencia o ausencia de una única secuencia diana, denominado "análisis digital", aunque se puede realizar con procedimientos de detección de ácidos nucleicos sensibles que distinguen entre una y más de una secuencia diana en una muestra discreta.
En otro ejemplo, se usa la secuenciación masiva en paralelo de ácidos nucleicos (por ejemplo, fragmentos de ADN seleccionados aleatoriamente de la muestra) para determinar la secuencia de los ácidos nucleicos en la muestra materna para determinar la frecuencia seleccionada de los ácidos nucleicos dentro de la muestra materna. Para la detección de una anomalía en la frecuencia cromosómica (por ejemplo, una trisomía), los ácidos nucleicos secuenciados se identifican como que provienen de un primer cromosoma, y las cantidades totales de ácidos nucleicos de al menos un primer cromosoma en la muestra materna se comparan con las cantidades totales de ácidos nucleicos de al menos un segundo cromosoma en la muestra materna. Las cantidades de ácido nucleico totales incluyen los ácidos nucleicos tanto del feto como de la madre en la muestra materna, y los ácidos nucleicos del feto no se diferencian de los maternos en la determinación de la frecuencia de los ácidos nucleicos correspondientes a la frecuencia cromosómica. Cuando se supone que un primer cromosoma es euploide y se sospecha que el segundo cromosoma es aneuploide, se comparan los números totales de ácidos nucleicos para los primer y segundo cromosomas para determinar la presencia o ausencia de dicha aneuploidía.
En aspectos más específicos, las muestras usadas para la secuenciación masiva en paralelo de ácidos nucleicos están enriquecidas en regiones polimórficas. Las técnicas ejemplares para realizar el enriquecimiento incluyen las divulgadas, por ejemplo, en los documentos WO2011091063, WO2011091046 y la solicitud de patente de EE. UU. n.° 20110230358. En resumen, una porción de una muestra materna que comprende ADN sin células se amplifica para aumentar el número de copias de la una o más secuencias polimórficas en la muestra, y las porciones amplificadas de ácidos nucleicos a continuación se vuelven a añadir a la muestra original para la secuenciación. De forma alternativa, la muestra se somete a la secuenciación del genoma completo para obtener una pluralidad de marcas de secuencia, y las secuencias de las marcas se comparan con la secuencia de múltiples polimorfismos de referencia.
En algunos aspectos, los ácidos nucleicos se secuencian usando procesos de hibridación basados en matrices, tales como los descritos en la publicación de patente de EE. UU. n.° 2011/0172111. En otros aspectos, las biomoléculas se detectan usando detección con tecnología de nanoporos, tales como las descritas en la publicación de patente de EE. UU. n.° 2011/0124518.
En otro aspecto, los ácidos nucleicos se secuencian y comparan usando polimorfismos que diferencian entre alelos maternos y fetales en una muestra, usando procedimientos tales como los descritos en las patentes de EE. UU. n.os 7.727.720, 7.718.370, 7.598.060, 7.442.506, 7.332.277, 7.208.274 y 6.977.162. En resumen, los procedimientos utilizan detección polimórfica para identificar anomalías cromosómicas. Las secuencias se determinan en alelos que son homocigotos en la madre y heterocigotos en el feto, y se determina una proporción de los alelos heterocigotos. La proporción de los alelos heterocigotos se usa para indicar la presencia o ausencia de una anomalía cromosómica.
Aún en otro aspecto, la estimación del riesgo de aneuploidías fetales utiliza la identificación de polimorfismos en tándem, tales como el descrito, por ejemplo, en la patente de EE. UU. n.° 7.799.531 y las publicaciones de EE. UU. n.os 2011/0117548, 2011/0059451,2010/0184044, 2010/184043 y 2008/0020390. En resumen, los SNP en tándem se detectan y usan para diferenciar los alelos maternos y fetales en una muestra materna para detectar anomalías cromosómicas fetales a través de la comparación del ADN materno con el ADN fetal.
En un aspecto preferente, la estimación de la dosificación cromosómica utiliza amplificación seleccionada de locus representativos. Dichas técnicas son conocidas en la técnica. Estas técnicas utilizan la detección de regiones genómicas usando oligonucleótidos de secuencia fija y uniendo los oligonucleótidos de secuencia fija por medio de fijación y/o extensión. Esto se puede lograr usando una combinación de fijación y amplificación, por ejemplo, la fijación de dos o más oligonucleótidos de secuencia fija y, opcionalmente, un oligonucleótido puente que es complementario a una región entre los oligonucleótidos de secuencia fija. En otro ejemplo, esto se puede lograr usando una combinación de extensión, fijación y amplificación.
En algunos aspectos, las estimaciones y variaciones de dosificación cromosómica para la población normal se determinan a partir de muestras normales que tienen una proporción similar de ADN fetal. Por ejemplo, se puede calcular una dosificación cromosómica esperada para la trisomía en una muestra de ADN con un porcentaje específico de ADN sin células fetales sumando el porcentaje de aportación del cromosoma aneuploide. A continuación, se puede comparar la dosificación cromosómica de la muestra con la dosificación cromosómica para un feto normal y con una dosificación cromosómica esperada si es triploide para determinar estadísticamente, usando la variación de la dosificación cromosómica, si la muestra es más probable que sea normal o triploide, y la probabilidad estadística de que sea uno u otro.
En un aspecto preferente, las regiones de ácido nucleico seleccionadas para el análisis en la muestra materna incluyen en una única reacción tanto regiones de ácido nucleico para la determinación del porcentaje de aportación fetal como regiones de ácido nucleico correspondientes a dos o más cromosomas usados para detectar una anomalía de dosificación cromosómica. El uso de una única reacción ayuda a minimizar el riesgo de contaminación o sesgo que se puede introducir usando reacciones separadas, que de otro modo podrían sesgar los resultados. De hecho, los procedimientos de la presente invención se realizan preferentemente como reacciones multiplexadas o incluso altamente multiplexadas, donde los locus tanto polimórficos como no polimórficos (para determinar el porcentaje de aportación fetal y la dosificación de cromosomas, respectivamente) se consultan en una única reacción para cada muestra. En modos de realización preferentes, se usan los ensayos de multiplexación descritos en las solicitudes de EE. UU. n.os 13/013.732, 13/205.490, 13/205.570 y 13/205.603, ya que estos ensayos consultan locus tanto polimórficos como no polimórficos en una muestra materna en una única reacción multiplexada.
En otros aspectos, se pueden consultar una o más regiones de ácido nucleico seleccionadas tanto para la determinación de la proporción de ácido nucleico fetal como para la detección de aneuploidías fetales. La utilización de las mismas regiones tanto para la aportación del porcentaje fetal como para la detección de aneuploidías fetales ayuda además a minimizar el sesgo debido a errores experimentales o contaminación.
Implementación informática de los procedimientos de la invención
La figura 1 es un diagrama de bloques que ilustra un entorno de sistema ejemplar en el que se pueden implementar los procedimientos de la presente invención para calcular los valores pertinentes. El sistema 10 incluye un servidor 14 y un ordenador 16. El ordenador 16 puede estar en comunicación con el servidor 14 a través de la misma o una red diferente.
De acuerdo con el modo de realización ejemplar, el ordenador 16 ejecuta un componente de programa informático 24 que calcula la proporción fetal y aplica esta información a los valores de la dosificación de regiones genómicas y/o cromosomas. En un modo de realización, el ordenador 16 puede comprender un ordenador personal, pero el ordenador 16 puede comprender cualquier tipo de máquina que incluya al menos un procesador y memoria.
La salida del componente informático 24 comprende un informe 26 con un valor de probabilidad de que una región genómica y/o un cromosoma tenga una anomalía de dosificación. En un aspecto preferente, este informe es una razón de posibilidades de un valor de la verosimilitud de que una región o cromosoma tenga dos copias (por ejemplo, sea disómico) y un valor de la verosimilitud de que una región o cromosoma tenga más copias (por ejemplo, sea trisómico) o menos copias (por ejemplo, sea monosómico). El informe 26 puede ser un documento que se imprime, o electrónico, que se puede visualizar en un monitor y/o comunicar electrónicamente a los usuarios por medio de correo electrónico, FTP, mensaje de texto, publicar en un servidor y similares.
Aunque el procedimiento de normalización de la invención se muestra como implementado como el programa informático 24, también se puede implementar como una combinación de soporte físico y programa informático. Además, el programa informático 24 para la normalización se puede implementar como múltiples componentes que funcionan en el mismo o en diferentes ordenadores.
Tanto el servidor 14 como el ordenador 16 pueden incluir componentes de soporte físico de dispositivos informáticos típicos (no mostrados), que incluyen un procesador, dispositivos de entrada (por ejemplo, teclado, dispositivo señalador, micrófono para comandos de voz, botones, pantalla táctil, etc.) y dispositivos de salida (por ejemplo, un dispositivo de pantalla, altavoces y similares). El servidor 14 y el ordenador 16 pueden incluir medios legibles por ordenador, por ejemplo, dispositivos de memoria y almacenamiento (por ejemplo, memoria flash, disco duro, unidad de disco óptico, unidad de disco magnético y similares) que contienen instrucciones informáticas que implementan la funcionalidad divulgada cuando se ejecutan por el procesador. El servidor 14 y el ordenador 16 pueden incluir además interfaces de comunicación de red por cable o inalámbrica para la comunicación.
Ejemplos
Los siguientes ejemplos se presentan para proporcionar a los expertos en la técnica una divulgación y descripción completas de cómo realizar y usar la presente invención, y no pretenden limitar el alcance de lo que los autores de la invención consideran su invención, ni pretenden representar o dar a entender que los experimentos a continuación son todos o los únicos experimentos realizados. Por lo tanto, los presentes aspectos se han de considerar en todos los aspectos como ilustrativos y no restrictivos.
La eficacia y exactitud de identificar aneuploidías usando el cálculo de la razón de posibilidades de la presente invención se demuestra en los ejemplos a continuación, donde en una
La eficacia y exactitud de identificar aneuploidías usando el cálculo de la razón de posibilidades de la presente invención se demuestra en los ejemplos a continuación, donde en una cohorte con enmascaramiento de 167 mujeres embarazadas, incluyendo 36 embarazos con T21 y 8 con T18, los procedimientos distinguieron correctamente todos los casos de T21 y T18 de los casos euploides.
Ejemplo 1: sujetos
Los sujetos se incluyeron prospectivamente tras proporcionar su consentimiento informado según los protocolos aprobados por las juntas de revisión institucionales. Se requería que los sujetos tuvieran al menos 18 años de edad, al menos 10 semanas de edad gestacional y que tuvieran embarazos únicos. Se seleccionó un subconjunto de sujetos incluidos, que consistía en 250 mujeres con embarazos disómicos, 72 mujeres con embarazos con trisomía 21 (T21) y 16 mujeres con embarazos con trisomía 18 (T18), para su inclusión en este estudio. Los sujetos se aleatorizaron en una primera cohorte que consistía en 127 embarazos disómicos, 36 embarazos con T21 y 8 embarazos con T18, y una segunda cohorte que consistía en 123 embarazos disómicos, 36 embarazos con T21 y 8 embarazos con T18. El estado de trisomía de cada embarazo se confirmó por pruebas invasivas (hibridación fluorescente in situ y/o análisis de cariotipo). El estado de trisomía de la primera cohorte se conocía en el momento del análisis; en la segunda cohorte, el estado de trisomía estuvo enmascarado hasta después del análisis de cálculo de riesgo.
La figura 2 es una tabla que describe los datos demográficos de las muestras analizadas en este estudio. La edad materna media de los sujetos disómicos, con T21 y con T18 fue de 34, 34 y 37 años, respectivamente. La edad gestacional media de los sujetos disómicos, con T21 y con T18 fue de 17,7, 19,6 y 17,0 semanas. Las edades maternas medias de los sujetos disómicos, con T21 y con T18 no fueron significativamente diferentes entre la primera y segunda cohortes (en todas pruebas de la t p>0,05). De forma similar, las edades gestacionales medias de los sujetos disómicos, con T21 y con T18 no fueron significativamente diferentes entre la primera y segunda cohortes (en todas pruebas de la t p>0,05).
Ejemplo 2: análisis de locus no polimórficos para estimar la dosificación de cromosomas
Para estimar la dosificación de cromosomas fetales, se diseñaron ensayos en relación con 576 locus no polimórficos en cada uno de los cromosomas 18 y 21, donde cada ensayo consistía en tres oligonucleótidos específicos de locus: un oligonucleótido izquierdo con una cola de amplificación universal en 5', un oligonucleótido medio fosforilado en 5' y un oligonucleótido derecho fosforilado en 5' con una cola de amplificación universal en 3'. Los locus seleccionados se usaron para computar una métrica de dosificación de cr. 21 y una métrica de dosificación de cr. 18 para cada muestra. Se analizaron las muestras de la primera cohorte para identificar 384 de los 576 locus en el cr. 21 y el cr. 18 que podían distinguir mejor T21 y T18 de muestras normales. En primer lugar, los recuentos de secuencias se normalizaron retirando sistemáticamente los sesgos de muestras y ensayos usando el pulido de la mediana (véase Tukey, Exploratory Data Analysis (Addison-Wesley, Reading MA, 1977) e Irzarry, et al., NAR, 31(4):el5 (2003)).
Seguidamente, se identificaron los 384 locus de cada cromosoma que presentaban la mayor diferencia residual entre las muestras normales y de trisomía usando estadísticas Z derivadas de locus individuales para el cromosoma de prueba y los 576 locus para el cromosoma de comparación. La media de recuentos de los 384 locus del cr. 21 que podían distinguir mejor T21 de las normales se dividió entre la suma del recuento medio de los 384 cr. 21 y el recuento medio de los 576 locus del cr. 18. Se calculó una métrica de proporción de cr. 18 de forma similar como la suma de los recuentos de los 384 locus del cr. 18 que podían distinguir mejor T18 de las normales dividida entre la suma del recuento medio de los 576 locus del cr. 21 y el recuento medio de los 384 locus del cr.
18.
Se usó una prueba Z estándar de proporciones para computar las estadísticas Z:
Figure imgf000012_0001
donde pj es la proporción observada para un cromosoma de interés dado en una muestra j dada, po es la proporción esperada para el cromosoma de prueba dado calculada como la mediana de pj, y nj es el denominador de la métrica de proporción. La estandarización de la estadística Z se realizó usando censura iterativa. En cada iteración, se retiraron las muestras que se encontraban fuera de tres desviaciones absolutas de la mediana. Después de diez iteraciones, la media y la desviación estándar se calcularon usando solo las muestras sin censura. A continuación, todas las muestras se estandarizaron en relación con esta media y desviación estándar. Se usaron la prueba de Kolmogorov-Smirnov (véase Conover, Practical Nonparametric Statistics, pp. 295-301 (John Wiley & Sons, New York, NY, 1971)) y la prueba de Shapiro-Wilk (véase Royston, Applied Statistics, 31:115-124 (1982)) para someter a prueba la normalidad de las estadísticas Z de las muestras normales.
Ejemplo 3: análisis de locus polimórficos para evaluar el porcentaje de aportación fetal
Para evaluar la proporción de ácido nucleico fetal en las muestras maternas, se diseñaron ensayos en relación con un conjunto de 192 locus que contenían SNP en los cromosomas 1 a 12, donde se usaron dos oligonucleótidos medios que diferían en una base para consultar cada SNP. Los SNP se optimizaron en cuanto a la frecuencia del alelo minoritario en el conjunto de datos HapMap 3. Duan, et al., Bioinformation, 3(3):139-41(2008); Epub del 9 de nov. de 2008.
Se diseñaron ensayos en relación con 576 locus no polimórficos en cada uno del cr. 18 y el cr. 21, donde cada ensayo consistía en tres oligonucleótidos específicos de locus: un oligonucleótido izquierdo con una cola de amplificación universal en 5', un oligonucleótido medio fosforilado en 5' y un oligonucleótido derecho fosforilado en 5' con una cola de amplificación universal en 3'. Para evaluar la fracción fetal, se diseñaron ensayos en relación con un conjunto de 192 locus que contenían SNP en cr. 1-12, donde se usaron dos oligonucleótidos medios, que diferían en una base, para consultar cada SNP. Los SNP se optimizaron en cuanto a la frecuencia del alelo minoritario en el conjunto de datos HapMap 3. Duan, et al., Bioinformation, 3(3):139-41(2008); Epub del 9 de nov. de 2008.
Los oligonucleótidos se sintetizaron por IDT y se agruparon para crear un único agolpamiento de ensayos multiplexados. Se generaron productos de PCR a partir de cada muestra de sujeto como se describe previamente. En resumen, se recogieron 8 ml de sangre por sujeto en un tubo de ADN sin células (Streck) y se almacenó a temperatura ambiente durante un máximo de 3 días. El plasma se aisló de la sangre por medio de doble centrifugación y se almacenó a menos 20 °C durante un máximo de un año. El ADNlc se aisló del plasma usando microesferas de purificación de ADN de AN vírico (Dynal), se biotiniló, se inmovilizó en microesferas de estreptavidina MyOne C1 (Dynal) y se hibridó con el agrupamiento de oligonucleótidos multiplexados. Los oligonucleótidos apropiadamente hibridados se catenaron con Taq ligasa, se eluyeron del ADNlc y se amplificaron usando cebadores de PCR universales. El producto de PCR de 96 muestras independientes se agrupó y se usó como molde para la amplificación de grupos en un único carril de un portaobjetos de flujo TruSeq v2 SR (Illumina). El portaobjetos se procesó en un Illumina HiSeq 2000 para producir una secuencia específica de locus de 56 bases y una secuencia de marca de muestra de 7 bases a partir de un promedio de 1,18 millones de grupos/muestra. Las lecturas específicas de locus se compararon con las secuencias de locus esperadas. Un promedio de 1,15 millones de lecturas (97 %) tuvo menos de 3 emparejamientos erróneos con las estructuras de ensayo esperadas, lo que resultó en un promedio de 854 lecturas/locus/muestra.
Los locus polimórficos informativos se definieron como locus donde los alelos fetales diferían de los alelos maternos. Debido a que el ensayo presenta especificidades de alelo superiores a un 99 %, los locus informativos se identificaron fácilmente cuando se midió que la proporción de alelos fetales de un locus estaba entre un 1 y un 20 %. Se estimó una verosimilitud máxima usando una distribución binomial, tal como la descrita en la solicitud en tramitación junto con la presente 61/509.188, para determinar la proporción fetal más probable en base a mediciones de varios locus informativos. Los resultados se correlacionaron bien (R2 > 0,99) con el enfoque de promedio ponderado presentado por Chu y sus compañeros (véase Chu, et al., Prenat. Diagn., 30:1226-29 (2010)).
Ejemplo 4: detección de aneuploidía usando cálculo de riesgo
El riesgo de aneuploidía se calculó usando una razón de posibilidades que compara un modelo que supone un cromosoma fetal disómico y un modelo que supone un cromosoma fetal trisómico. La distribución de las diferencias en las proporciones observadas y de referencia se evaluó usando distribuciones normales con una media de 0 y una desviación estándar estimada usando simulaciones de Monte Carlo que se extraen aleatoriamente de los datos observados. Para el modelo disómico, se usó p0 como la proporción de referencia esperada en las simulaciones. Para el modelo trisómico, p0 se ajustó por muestra con la proporción de referencia ajustada de proporción fetal pj, definida como
Figure imgf000013_0001
donde fj era la proporción fetal para la muestra j. Este ajuste tiene en cuenta la representación incrementada esperada de un cromosoma de prueba cuando el feto era trisómico. En las simulaciones, tanto p0 como fj se eligieron aleatoriamente de distribuciones normales usando sus estimaciones de media y error estándar para tener en cuenta las variaciones de medición.
Las simulaciones se ejecutan 100.000 veces. La puntuación de riesgo se definió como la razón de posibilidades media de trisomía frente a disomía obtenida de las simulaciones, ajustada multiplicando el riesgo de trisomía asociado con la edad materna y gestacional del sujeto.
Ejemplo 5: resultados
Determinación de estadísticas Z de proporción cromosómica. Para seleccionar los locus que se va a usar para la detección de aneuploidía, se evaluaron los sujetos de la primera cohorte puesto que se conocía su estado de aneuploidía. Seis muestras normales, una con T18 y una con T21 (8/171 o un 5 %) no cumplieron con los criterios de control de calidad (recuento bajo, proporción fetal <3 % y/o indicios de SNP de un embarazo no único) y se retiraron del conjunto de datos. Se computaron las estadísticas Z de proporción cromosómica en las muestras restantes para el cr. 18 y el cr. 21 (figuras 3A y 3B). 120/121 (un 99,2 %) muestras disómicas tenían estadísticas Z <3; una muestra disómica tenía una estadística Z del cr. 21 de 3,5. 35/35 (un 100 %) de las muestras con T21 y 7/7 (un 100 %) de las muestras con T18 tenían estadísticas Z de proporción cromosómica >3. Por tanto, usando el análisis de estadística Z, el sistema de ensayo utilizado en la presente invención presentó una especificidad de un 99,2 % y una sensibilidad de un 100 % para T21, y una especificidad de un 100 % y una sensibilidad de un 100 % para T18.
Para medir la proporción fetal de forma fiable, se incorporaron 192 ensayos dirigidos a SNP en un agrupamiento de ensayos multiplex. Midiendo la proporción fetal y la proporción cromosómica en la misma reacción, se garantizó que las estimaciones de la proporción fetal a partir de ensayos polimórficos representaran fielmente la proporción fetal en los ensayos no polimórficos usados para evaluar la proporción cromosómica. La proporción fetal presentó una fuerte correlación (R2 >0,90) con la estadística Z de proporción cromosómica en embarazos aneuploides (figuras 3A y 3B).
Es importante destacar que la estadística Z no fue sensible a la proporción fetal en embarazos normales, lo que refleja una limitación importante de la métrica de la estadística Z: las muestras con valores bajos de estadística Z surgen tanto de muestras euploides como de muestras aneuploides con una proporción fetal modesta. Se razonó que sería preferente una métrica que sea sensible a la proporción fetal en embarazos euploides así como aneuploides. Por tanto, se desarrolló un cálculo de riesgo que aprovecha la información de proporción fetal para (1) definir las dosificaciones de cromosomas esperadas para los cromosomas de prueba trisómicos frente a disómicos, y (2) computar las posibilidades de que una muestra pertenezca a uno u otro grupo.
Análisis de cohorte usando el cálculo del riesgo. El cálculo de riesgo se usó para computar las posibilidades de trisomía frente a disomía de cr. 18 y cr. 21 en cada muestra dentro de la primera cohorte (figuras 4A y 4B). Como se esperaba, las posibilidades de cálculo de riesgo de la presente invención demostraron una respuesta a la proporción fetal en muestras tanto trisómicas como disómicas, y la magnitud de la respuesta fue aproximadamente equivalente en los dos grupos. El cálculo de riesgo de la presente invención distinguió correctamente todas las muestras euploides de las aneuploides, y la diferencia entre las posibilidades aneuploides más bajas y las posibilidades euploides superaba 1012. Todas las muestras de aneuploidía tenían posibilidades >1010.
Segunda del análisis de cálculo de riesgo sobre una cohorte con enmascaramiento. Para someter a prueba el rendimiento del ensayo y el cálculo de riesgo de la presente invención en un conjunto independiente de sujetos, se sometió a ensayo una segunda cohorte con enmascaramiento que consistía en 123 embarazos normales, 36 con T21 y 8 con T18. Todas las muestras pasaron los criterios de control de calidad y se les asignaron puntuaciones de posibilidades de cálculo de riesgo para el cr. 18 y el cr. 21 (figuras 5A y 5B). Como anteriormente, el cálculo de riesgo de la presente invención distinguió correctamente todos los sujetos con trisomía de los sujetos con disomía. La diferencia entre las posibilidades aneuploides más bajas y las posibilidades euploides más altas fue de 103,9. Las 36 muestras con T21 y las 8 con T18 tenían posibilidades de trisomía superiores a 102,67 (>99,8 % de riesgo de trisomía).
Las pruebas de cribado de aneuploidías prenatales actuales emplean umbrales de riesgo de aproximadamente 1 en 300 (10-2,5) para la derivación a pruebas invasivas. Si este umbral se aplicara a las posibilidades de cálculo de riesgo para la cohorte con enmascaramiento, proporcionaría una especificidad de un 99,2 % y una sensibilidad de un 100 % para cada cromosoma. Esto se compara favorablemente con los procedimientos de cribado actuales, que pueden conllevar a una tasa de positivos falsos de un 5 % y de negativos falsos de un 10 %. Además, debido a que la diferencia mínima entre las posibilidades de cálculo de riesgo de los sujetos euploides y aneuploides fue de casi cuatro órdenes de magnitud para T21 y catorce órdenes de magnitud para T18, una variedad de umbrales producen sensibilidad y especificidad perfectas.
Generando un molde de secuenciación a partir de ensayos específicos de cromosoma y produciendo altas tasas de asignación, el ensayo selectivo de cromosoma empleado en el presente documento permite la detección de aneuploidía usando ~1 millón de lecturas sin procesar por sujeto, lo que posibilita el análisis de 96 sujetos por carril de secuenciación. Por el contrario, SIMP evalúa el genoma completo y requiere ~25 millones de lecturas sin procesar por sujeto, lo que limita el rendimiento de secuenciación a 4-6 muestras por carril. Por tanto, los procedimientos presentes que emplean ensayos selectivos de cromosomas y la consulta simultánea de locus polimórficos y no polimórficos en reacciones multiplexadas disfrutan de una ventaja de >20 veces sobre SIMP en cuanto a coste y rendimiento de secuenciación.
La capacidad del presente ensayo para genotipar locus polimórficos individuales permite la determinación simultánea de la proporción fetal y la proporción cromosómica. La información de la proporción fetal se aprovechó imponiendo un requisito de control de calidad de que cada muestra tuviera al menos un 3 % de ADN fetal, evitando de este modo llamadas de baja confianza que surgen de bajas proporciones de ADN fetal. Además, el algoritmo de cálculo de riesgo se desarrolló para producir una puntuación de riesgo dependiente de la proporción fetal que indica las posibilidades de que una muestra sea trisómica frente a disómica.
El análisis de cálculo de riesgo de la presente invención difiere del análisis estadístico Z de proporción cromosómica en varios aspectos importantes. En primer lugar, debido a que se procesan 96 muestras en un único lote/carril, el cálculo de riesgo aprovecha las variaciones observadas dentro y entre muestras en un carril, en lugar de estimar la variación en base a la información obtenida de un conjunto de datos de referencia analizado previamente. Por tanto, el cálculo de riesgo de la presente invención es menos susceptible a la desviación del procedimiento y no requiere muestras de referencia externas ni ajustes de normalización en base a información histórica.
En segundo lugar, el cálculo de riesgo empleado en el presente documento es sensible a la proporción fetal en el estado tanto trisómico como disómico, mientras que la estadística Z solo es sensible a la proporción fetal en el estado trisómico. Como consecuencia, el cálculo de riesgo de la presente invención produce una mejor separación global de las muestras trisómicas frente a las disómicas. Además, debido a que las muestras con baja proporción fetal proporcionan posibilidades con menores magnitudes en muestras tanto disómicas como trisómicas, el cálculo de riesgo de la presente invención comunica un entendimiento más exacto de la confianza con la que se realiza una llamada en muestras disómicas así como en muestras trisómicas.
En tercer lugar, debido a que el riesgo de aneuploidía varía significativamente con la edad materna y gestacional, y debido a que la incorporación de estos riesgos es una práctica estándar al informar de los resultados de cribado, el cálculo de riesgo de la presente invención está diseñado para adaptarse a la incorporación de riesgos relacionados con la edad. Específicamente, debido a que tanto el riesgo computado a partir del ensayo selectivo de cromosoma como el riesgo relacionado con la edad reflejan las posibilidades de trisomía frente a disomía de un sujeto, estos componentes de riesgo se combinan fácilmente. Por el contrario, la estadística Z refleja la verosimilitud de que una muestra sea disómica y, por lo tanto, no se combine fácilmente con los riesgos de trisomía frente a disomía relacionados con la edad. Una consecuencia de esta deficiencia es que la estadística Z presentará un rendimiento diferente dependiendo de la edad del sujeto. Por ejemplo, un sujeto de 18 años con 12 semanas de gestación y con una estadística Z de 3 tiene -38 veces más probabilidades de ser un positivo falso que un sujeto de 44 años con 12 semanas de gestación y con la misma puntuación.
Los ensayos selectivos de cromosoma usados en el presente documento posibilitan la secuenciación altamente multiplexada de locus polimórficos y no polimórficos de cromosomas de interés específicos en un máximo de 96 muestras simultáneamente. El cálculo de riesgo de la presente invención analiza la dosificación de cromosomas resultante y la información de proporción fetal para proporcionar una evaluación individualizada del riesgo de trisomía frente a disomía que se puede combinar con otra información de riesgo. En este estudio, los procedimientos de cálculo de riesgo de la invención distinguieron correctamente todos los casos con T21 y T18 de los casos euploides tanto en una primera cohorte como en una segunda cohorte con enmascaramiento.
Ejemplo 6: detección de aneuploidía
El algoritmo de cálculo de riesgo usado en el cálculo del riesgo estimado de aneuploidía usó una razón de posibilidades que comparaba un modelo matemático que suponía un cromosoma fetal disómico y un modelo matemático que suponía un cromosoma fetal trisómico. Cuando Xj = pj - po se usa para describir la diferencia de la proporción observada para la muestra j y la proporción de referencia estimada po, el algoritmo de cálculo de riesgo usado computó:
Figure imgf000015_0001
donde T era el modelo trisómico y D era el modelo disómico. El modelo disómico D era una distribución normal con media 0 y una desviación estándar específica de la muestra estimada por simulaciones de Monte Carlo como se describe a continuación. El modelo trisómico T también era una distribución normal con media 0, determinada transformando Xj en X> = p - p ., la diferencia entre la proporción observada y una proporción de referencia ajustada de fracción fetal como se define por:
Figure imgf000015_0002
donde fj era la fracción fetal de la muestra j. Este ajuste tiene en cuenta la representación incrementada esperada de un cromosoma fetal trisómico. Se usaron simulaciones de Monte Carlo para estimar las desviaciones estándar específicas de la muestra para modelos disómicos y trisómicos de diferencias de proporción. Las proporciones observadas para cada muestra se simularon por muestreo con reposición no paramétrico de locus y cálculo de medias, o muestreo paramétrico de una distribución normal usando las estimaciones de la media y el error estándar para cada cromosoma a partir de los recuentos de locus no polimórficos observados. De forma similar, la proporción de referencia p0 y la fracción fetal fj se simularon por muestreo no paramétrico de muestras y locus polimórficos respectivamente, o se eligieron de distribuciones normales usando sus estimaciones de la media y el error estándar para tener en cuenta las variaciones de medición. En este estudio se usó muestreo paramétrico. Las simulaciones se ejecutaron 100.000 veces y se computaron las diferencias de proporción para cada ejecución para construir las distribuciones. En base a los resultados de estas simulaciones, se descubrió que las distribuciones normales son buenos modelos de disomía y trisomía.
La puntuación de riesgo del algoritmo de cálculo de riesgo final se define como:
Figure imgf000016_0001
donde P(T) / P(D) es el riesgo anterior de trisomía frente a disomía. Los datos sobre el riesgo anterior de aneuploidía se tomaron de tablas bien establecidas que capturan el riesgo de trisomía asociado con la edad materna y gestacional del sujeto (Nicolaides, Ultrasound Obstet Gynecol, 21:313-321 (2003)).
Aunque la presente invención se cumple por los aspectos en muchas formas diferentes, como se describe en detalle en conexión con aspectos preferentes de la invención, se entiende que la presente divulgación se ha de considerar como ejemplar de los principios de la invención y no se pretende que limite la invención a los aspectos específicos ilustrados y descritos en el presente documento. Se pueden realizar numerosas variaciones por los expertos en la técnica sin apartarse del alcance de la invención que se define por las reivindicaciones adjuntas.

Claims (12)

REIVINDICACIONES
1. Un procedimiento implementado por ordenador para calcular un riesgo de aneuploidía fetal en una muestra materna que comprende:
estimar la dosificación de cromosomas para dos o más cromosomas fetales en la
muestra materna usando información obtenida consultando uno o más locus en la muestra materna en cada cromosoma para los que se estima la dosificación de cromosomas;
determinar una proporción de ácido nucleico fetal en la muestra materna usando información obtenida consultando uno o más locus polimórficos en la muestra materna;
calcular un valor de una verosimilitud de que un primer cromosoma fetal sea aneuploide comparando la dosificación de cromosomas del primer cromosoma fetal con la dosificación de cromosomas esperada para un cromosoma aneuploide en vista de la proporción de ácido nucleico fetal en la muestra materna;
calcular un valor de una verosimilitud de que el primer cromosoma fetal sea disómico comparando la dosificación de cromosomas del primer cromosoma fetal con la dosificación de cromosomas esperada para un cromosoma disómico en vista de la proporción de ácido nucleico fetal en la muestra materna;
computar un valor del riesgo de aneuploidía fetal para el primer cromosoma fetal como una razón de posibilidades comparando el valor de la verosimilitud de que el cromosoma sea aneuploide y el valor de la verosimilitud de que el cromosoma sea disómico;
proporcionar datos sobre el riesgo anterior de aneuploidía para al menos el primer cromosoma fetal en base a las características extrínsecas; y
ajustar el valor del riesgo de aneuploidía fetal en base a los datos de riesgo anterior de aneuploidía.
2. El procedimiento de la reivindicación 1, en el que la muestra materna es una muestra materna sin células.
3. El procedimiento de la reivindicación 2, en el que la muestra materna sin células es plasma o suero materno.
4. El procedimiento de la reivindicación 2, en el que la muestra materna comprende células.
5. El procedimiento de la reivindicación 1, en el que los datos sobre el riesgo anterior de aneuploidía comprenden información relacionada con la edad materna.
6. El procedimiento de la reivindicación 1, en el que los datos sobre el riesgo anterior de aneuploidía comprenden información relacionada con la edad gestacional.
7. El procedimiento de la reivindicación 1, en el que la dosificación de cromosomas del primer y segundo cromosoma fetal se estima usando la información obtenida consultando al menos diez locus en cada cromosoma para los que se estima la dosificación de cromosomas.
8. El procedimiento de la reivindicación 7, en el que la dosificación de cromosomas del primer y segundo cromosoma fetal se estima usando la información obtenida consultando al menos cuarenta y ocho locus en cada cromosoma para los que se estima la dosificación de cromosomas.
9. El procedimiento de la reivindicación 8, en el que la dosificación de cromosomas del primer y segundo cromosoma fetal se estima usando la información obtenida consultando al menos noventa y seis locus en cada cromosoma para los que se estima la dosificación de cromosomas.
10. El procedimiento de la reivindicación 9, en el que los locus consultados para la estimación de la dosificación de cromosomas del primer y segundo cromosoma fetal son locus no polimórficos.
11. El procedimiento de la reivindicación 1, en el que el riesgo de aneuploidía fetal para el primer cromosoma fetal se basa en un valor de una verosimilitud de que el cromosoma sea trisómico y un valor de la verosimilitud de que el cromosoma sea disómico.
12. El procedimiento de la reivindicación 1, en el que el riesgo de aneuploidía fetal para el primer cromosoma fetal se basa en un valor de una verosimilitud de que el cromosoma sea monosómico y un valor de la verosimilitud de que el cromosoma sea disómico.
ES19160381T 2011-01-25 2012-01-20 Cálculo de riesgo para la evaluación de aneuploidía fetal Active ES2943669T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161436135P 2011-01-25 2011-01-25
US13/316,154 US20120190557A1 (en) 2011-01-25 2011-12-09 Risk calculation for evaluation of fetal aneuploidy
US13/338,963 US8700338B2 (en) 2011-01-25 2011-12-28 Risk calculation for evaluation of fetal aneuploidy

Publications (1)

Publication Number Publication Date
ES2943669T3 true ES2943669T3 (es) 2023-06-15

Family

ID=48874616

Family Applications (2)

Application Number Title Priority Date Filing Date
ES19160381T Active ES2943669T3 (es) 2011-01-25 2012-01-20 Cálculo de riesgo para la evaluación de aneuploidía fetal
ES12738737T Active ES2728131T3 (es) 2011-01-25 2012-01-20 Cálculo del riesgo para la evaluación de la aneuploidia fetal

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES12738737T Active ES2728131T3 (es) 2011-01-25 2012-01-20 Cálculo del riesgo para la evaluación de la aneuploidia fetal

Country Status (6)

Country Link
EP (2) EP3546595B1 (es)
AU (1) AU2012209421B2 (es)
CA (1) CA2825029C (es)
ES (2) ES2943669T3 (es)
IL (1) IL227311A (es)
WO (1) WO2012102945A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US9994897B2 (en) * 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
EP3663414B1 (en) * 2013-06-13 2023-11-22 Roche Diagnostics GmbH Statistical analysis for non-invasive y chromosome aneuploidy determination
US20150004601A1 (en) * 2013-06-28 2015-01-01 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7803529B1 (en) 1995-04-11 2010-09-28 Sequenom, Inc. Solid phase sequencing of biopolymers
US5888740A (en) * 1997-09-19 1999-03-30 Genaco Biomedical Products, Inc. Detection of aneuploidy and gene deletion by PCR-based gene- dose co-amplification of chromosome specific sequences with synthetic sequences with synthetic internal controls
US20030054386A1 (en) * 2001-06-22 2003-03-20 Stylianos Antonarakis Method for detecting diseases caused by chromosomal imbalances
AU2003217826B2 (en) 2002-03-01 2008-07-31 Ravgen, Inc. Methods for detection of genetic disorders
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US7727720B2 (en) 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US7442506B2 (en) 2002-05-08 2008-10-28 Ravgen, Inc. Methods for detection of genetic disorders
US20070087345A1 (en) * 2003-07-10 2007-04-19 Third Wave Technologies, Inc. Assays for the direct measurement of gene dosage
AU2006224971B2 (en) * 2005-03-18 2009-07-02 Boston University A method for the detection of chromosomal aneuploidies
EP3591068A1 (en) 2006-02-02 2020-01-08 The Board of Trustees of the Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20100184043A1 (en) * 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
US20100184044A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
SI2351858T1 (sl) 2006-02-28 2015-06-30 University Of Louisville Research Foundation Med Center Three, Zaznavanje fetalnih kromosomskih nenormalnosti z uporabo tandema polimorfizmov posameznih nukleotidov
US8609338B2 (en) 2006-02-28 2013-12-17 University Of Louisville Research Foundation, Inc. Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
IL180095A0 (en) * 2006-12-14 2007-05-15 Ohad Birk Method for antenatal estimation of down syndrome risk
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
US8476013B2 (en) * 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US8574842B2 (en) * 2009-12-22 2013-11-05 The Board Of Trustees Of The Leland Stanford Junior University Direct molecular diagnosis of fetal aneuploidy
US10662474B2 (en) 2010-01-19 2020-05-26 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
CA2786565C (en) 2010-01-19 2017-04-25 Verinata Health, Inc. Partition defined detection methods

Also Published As

Publication number Publication date
AU2012209421B2 (en) 2016-02-11
WO2012102945A1 (en) 2012-08-02
ES2728131T3 (es) 2019-10-22
IL227311A (en) 2017-12-31
EP2668605B1 (en) 2019-03-06
EP2668605A1 (en) 2013-12-04
CA2825029A1 (en) 2012-08-02
AU2012209421A1 (en) 2013-08-01
EP2668605A4 (en) 2014-12-24
EP3546595A1 (en) 2019-10-02
CA2825029C (en) 2020-10-13
EP3546595B1 (en) 2023-02-15
IL227311A0 (en) 2013-09-30

Similar Documents

Publication Publication Date Title
US20210189493A1 (en) Risk calculation for evaluation of fetal aneuploidy
US20210343361A1 (en) Assay systems for determination of fetal copy number variation
ES2943669T3 (es) Cálculo de riesgo para la evaluación de aneuploidía fetal
JP6878631B2 (ja) 非侵襲的に胎児の性染色体異数性のリスクを計算する方法
US20220157400A1 (en) Statistical analysis for non-invasive sex chromosome aneuploidy determination
US20120190557A1 (en) Risk calculation for evaluation of fetal aneuploidy
TWI611186B (zh) 多重妊娠之分子檢驗
US8756020B2 (en) Enhanced risk probabilities using biomolecule estimations
US11404142B2 (en) Processes for calculating phased fetal genomic sequences
US11795508B2 (en) Non-invasive fetal sex determination