MX2012005214A

MX2012005214A - Analisis genomico fetal de muestra biologica materna.

Info

Publication number: MX2012005214A
Application number: MX2012005214A
Authority: MX
Inventors: Kwan Chee Chan; Yuk Ming Dennis Lo; Wai Kwun Rossa Chiu; Charles Cantor
Original assignee: Sequenom Inc
Priority date: 2009-11-05
Filing date: 2010-11-05
Publication date: 2012-09-21
Also published as: AU2010315037B2; BR112012010694B1; JP6023117B2; FI3783110T3; HK1222413A1; WO2011057094A1; ES2720282T3; EP3241914A1; EP2496717B1; IL219521A; DK3783110T3; JP5540105B2; EP4170043A1; JP2014193165A; JP6386494B2; EA201200690A1; PT2496717T; PL2496717T3; EP3498863A1; IL237175A

Abstract

Se proveen sistemas, métodos y aparatos para determinar por lo menos una porción de un genoma fetal. Fragmentos de ADN de una muestra materna (ADN materno y fetal) pueden ser analizados para identificar alelos en ciertos sitios. Las cantidades de fragmentos de ADN de los respectivos alelos en estos sitios pueden ser analizados conjuntamente para determinar cantidades relativas de los halotipos para estos sitios y determinar cuales halotipos han sido heredados de los genomas paternos. Los sitios en donde los padres son una combinación específica de homocigos y heterocigos pueden ser analizados para determinar regiones del genoma fetal. Los haplotipos de referencia comunes en la población pueden ser usados junto con el análisis de los fragmentos de ADN de la muestra materna para determinar los genomas maternos y paternos. La determinación de mutaciones, una concentración de ADN fetal fraccional en una muestra materna y una proporción de cobertura de una secuenciación de la muestra materna pueden también ser provistos.

Description

ANALISIS GENOMICO FETAL DE MUESTRA BIOLOGICA MATERNA ANTECEDENTES DE LA INVENCION La presente invención es concerniente en general con el análisis de un genoma fetal en base a una muestra materna y más en particular, con la determinación de todo o parte del genoma fetal en base a un análisis de los fragmentos genéticos en la muestra materna.

El descubrimiento de ácidos nucleicos fetales libres de células en el plasma materno en 1997 ha abierto nuevas posibilidades para la diagnosis prenatal no invasiva (Lo YMD et al Lance 1997; 350:485-487; y patente estadounidense 6, 258,540). Esta tecnología ha sido trasladada rápidamente a aplicaciones clínicas, con la detección de genes o secuencias paternalmente-heredadas fetal-derivadas , por ejemplo, para determinación del sexo fetal, determinación del estatus de RhD fetal y determinación de si el feto ha heredado una mutación paternalmente-heredadá (Amicucci P et al Clin Chem 2000; 46: 301-302; Saito H et al Lancet 2000; 356: 1170; y Chiu RWK et al Lancet 2002; 360: 998.1000). El avance reciente en el campo a permitido la diagnosis prenatal de aneuploidia cromosomales fetales, tales como trisomia 21, de análisis de acido nucleico plasma materno (Lo YMD et al Nat Med 2007; 13: 218-223; Tong YK et al Clin Chem 2006; 52:2194-2202; publicación de Patente estadounidense 2006/0252071; Lo YMD et al Proc Nati Acad Sci USA 2007; 104: 13116-13121;Chiu RWK et al Proc Nati Acad Sci USA 2008; 105: 20458-20463 ; Fan HC et al Proc Nati Acad Sci 2008; 105:16266-16271; publicación de Patente estadounidense 2007/0202525; y publicación de Patente estadounidense 2009/0029377).

Otra área de avance reciente significativo es el uso de métodos de conteo de una sola molécula, tales como PCR digital para la diagnosis prenatal no invasiva de enfermedades de un solo gen en las cuales la madre y padre portan ambos la misma mutación. Esto se ha obtenido mediante análisis de dosificación de mutación relativa (R D) en plasma materno (Solicitud de patente estadounidense 2009/0087847; Lun F F et al Proc Nati Acad Sci USA 2008; 105:19920-19925; y Chiu RWK et al.Trends Genet 2009; 25: 324-331).

Sin embargo, tales métodos utilizan conocimiento previo de mutaciones posibles para analizar partes especificas de un genoma y asi no pueden identificar mutaciones latentes o no comunes o enfermedades genéticas. Por consiguiente, es deseable proveer nuevos métodos, sistemas y aparatos, que puedan identificar todo o partes de un genoma fetal utilizando técnicas no invasivas.

BREVE DESCRIPCION DE LA INVENCION Ciertas modalidades de la presente invención pueden proveer métodos, sistemas y aparatos para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada. Un mapa genético de todo el genoma o para regiones genómicas seleccionadas puede ser construido del feto prenatalmente utilizando una muestra que contiene material genético fetal y materno (por ejemplo, de una muestra de sangre de la madre embarazada) . El mapa genético puede ser de secuencias que un feto a heredado tanto de su padre como madre o solo aquellas de uno de los padres. En base uno o varios de tales mapas genéticos, el riesgo de que el feto estaría sufriendo de una enfermedad genética o predisposición a enfermedades genéticas u otras enfermedades o un rasgo genético puede ser determinado. Otra aplicación de modalidades son también descritas en la presente.

En una modalidad, fragmentos de ADN de una muestra materna (que contiene ADN materno y ADN fetal) pueden ser analizados para identificar alelos en ciertos sitios especificados (marcas) . La cantidad de fragmentos de ADN de los alelos respectivos en estos sitios puede luego ser analizada con untamente para determinar las cantidades relativas de los haplotipos para estos sitios y determinar mediante esto cuales haplotipos han sido heredados por el feto a partir de los genomas materno y/o paterno. Al identificar los haplotipos fetales, el genotipo fetal en un sitio individual dentro de la región genómica correspondiente incluyendo los sitios especificados puede ser determinado. En varias modalidades, los sitios en donde los padres son una combinación especifica de homócigo y heterócigo pueden ser analizados de tal manera para determinar lesiones del genoma fetal. En una implementación, los haplotipos de referencia que son representativos de haplotipos comunes en la población son usados junto con el análisis de fragmentos de ADN de la muestra materna para determinar los genomas maternos y paternos. Otras modalidades son también provistas tales como determinar mutaciones, determinar una concentración fetal fraccional en una jmuestra materna y determinar una proporción de cobertura de una secuenciación de la muestra materna .

Otras modalidades de la invención son concernientes con sistemas, aparatos y medios que se pueden leer por computadora asociados con los métodos descritos en la presente. En una modalidad, el medio que se puede leer por computadora contiene instrucciones para recibir datos y analizar datos, pero no instrucciones para dirigir a una maquina para crear los datos (por ejemplo, secuenciación de moléculas de acido nucleico) . En otra modalidad, el medio que se puede leer por computadora contiene instrucciones para dirigir a una máquina a crear los datos. En una modalidad, un producto de programas de computadora comprende un medio que se puede leer por computadora que almacena una pluralidad de instrucciones para controlar un procesador para efectuar una operación para los métodos descritos en la presente. Las modalidades son también dirigidas con sistemas de computadora configurados para efectuar las etapas de cualquiera de los métodos descritos en la presente, potencialmente con diferentes componentes que efectúan una etapa respectiva o un grupo de tapas respectivo.

La referencia a las porciones restantes de la especificación, incluyendo las figuras y reivindicaciones, realizaran otros elementos y ventajas de las modalidades de la presente invención. Elementos y ventajas adicionales, también como la estructura y operación de varias modalidades de la presente invención, son descritos en detalle posteriormente en la presente con respecto a las figuras adjuntas. En las figuras, los números de referencia semejantes pueden indicar elementos idénticos o funcionalmente similares.

BREVE DESCRIPCION DE LAS FIGURAS La figura 1 es un diagrama de flujo de un método 100 para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada de acuerdo con modalidades déla presente invención.

La figura 2 muestra dos haplotipos para el padre y dos haplotipos para la madre para un segmento particular de sus respectivo código genético de acuerdo con modalidades déla presente invención.

La figura 3 muestra dos tipos de SNP en los haplotipos parentales de la figura 2 de acuerdo con modalidades déla presente invención.

Las figuras 4A y 4B muestran un análisis para determinar los haplotipos fetales para los dos tipos de SNP de acuerdo con modalidades déla presente invención.

Las figuras 5A y 5B muestran en análisis de comparar cantidades relativas (por ejemplo, conteos) de fragmentos para cada sitio y con un resultado de la comparación es para clasificar un haplotipo particular por ser heredado o no de acuerdo con modalidades déla presente invención .

La figura 6 ilustra el efecto de cambiar la proporción de probabilidad para clasificación de SPRT de acuerdo con modalidades de la presente invención.

La , figura 7 es un diagrama de flujo de un método 700 para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada heredado del padre de acuerdo con modalidades déla presente invención.

La figura 8 es un diagrama de flujo de un método 800 para determinar por lo menos una porción del genoma de un feto no nacido en una región en donde la madre y padre son heterócigos de acuerdo con modalidades déla presente invención.

La figura 9 muestra haplotipos de un padre y madre que son ambos heterócigos en una región genómica particular de acuerdo con modalidades déla presente invención.

La figura 10 es un diagrama de flujo que ilustra un método' 1000 para determinar la concentración fraccional de material fetal en una muestra materna de acuerdo con modalidades déla presente invención.

La figura 11 es un diagrama de flujo de un método para determinar si un sitio es informativo de acuerdo con modalidades déla presente invención.

Las figuras 12A y 12B muestran la distribución predicha de los conteos para el alelo T (el alelo menos abundante en escenarios (a) y (c) ) para los tres escenarios con una concentración de ADN fetal fraccional asumida de 20% y 5%, respectivamente, de acuerdo con modalidades déla presente invención.

Las figuras 13A, 13B y 14 muestran las distribuciones predichas para los conteos del alelo menos abundante para una concentración de ADN fetal fraccional de 20%, cada uno para diferentes conteos fetales de moléculas correspondientes a un SNP de acuerdo con modalidades déla presente invención.

Las figuras 15A Y 15B muestran ejemplos de haplotipos de referencia, haplotipos parentales tomados de los haplotipos de referencia y haplotipos resultantes de acuerdo con modalidades déla presente invención.

La figura 16 es un diagrama de flujo de un método 1600 para determinar por lo menos parte de un genoma fetal cuando un conjunto de haplotipos de referencia son conocidos, pero los haplotipos parentales no son conocidos, de acuerdo con modalidades déla presente invención.

La figura 17 muestra un ejemplo para determinar sitios informativos del análisis de fragmentos de ADN de una muestra materna de acuerdo con modalidades déla presente invención.

La figura 18 muestra los tres haplotipos de referencia (Hap A, Hap B y Hap C) y los alelos paternos.

La figura 19 muestra determinación del haplotipo parental a partir de los alelos parentales de acuerdo con modalidades de la presente invención.

La figura 20 muestra la deducción de los genotipos maternales a partir del análisis de muestra materna de acuerdo con modalidades déla presente invención.

La figura 21 muestra una modalidad para determinar los haplotipos maternales a partir de los genotipos maternales y los haplotipos de referencia de acuerdo con modalidades déla presente invención.

La figura 22 muestra los haplotipos maternales determinados y el haplotipo heredado paternalmente de acuerdo con modalidades déla presente invención.

La figura 23 muestra los tipos diferentes de sitios (Alfa (A) y beta (B) ) para los haplotipos maternales en relación con el haplotipo paternal de acuerdo con modalidades déla presente invención.

La figura 24 es un diagrama de flujo que ilustra un método 2400 para identificar una mutación de Novo en el genoma de un feto no nacido de una mujer embarazada.

La figura 25A muestra el número absoluto y los porcentajes de SNP que muestran diferentes combinaciones de genotipo para el padre, madre, y feto (CVS) de acuerdo con modalidades déla presente invención.

La figura 25B muestra una tabla que enlista las estadísticas de alineación para las primeras 20 celdas de flujo .

La figura 26 es una tabla que muestra las concentraciones fracciónales de ADN fetal calculadas para SNP vía dos métodos de acuerdo con modalidades déla presente invención .

La figura 27A muestra una gráfica que ilustra el porcentaje observado de SNP en este subconjunto en el cual un alelo fetal podría ser observado de los datos de secuenciación para las primeras 20 celdas de flujo analizadas, y la figura 27B muestra una gráfica de la cobertura versus el número de lecturas de acuerdo con modalidades déla presente invención.

Las figuras 28A y 28B muestran gráficas de la correlación entre las cobertura de alelos heredados paternalmente y el número de lecturas de frecuencia mapeables y el número de secuencias de células de flujo, respectivamente, de acuerdo con modalidades déla presente invención.

La figura 29A muestra la correlación entre . la proporción de positivos falsos y- el número de células de flujo secuenciadas, y la figura 29B muestra la correlación entre la proporción de positivos falsos y el número de células de flujo secuenciadas de acuerdo con modalidades déla presente invención.

La figura 30 muestra la cobertura de los SNP fetal-especificos para un número diferente de células de flujo analizadas de acuerdo con modalidades déla presente invención.

La figura 31 muestra la exactitud del análisis Tipo A cuando se usan datos de 10 celdas de flujo de acuerdo con modalidades déla presente invención.

La figura 32 muestra la exactitud del análisis Tipo B cuando se usan datos de 10 celdas de flujo de acuerdo con modalidades de la presente invención.

La figura 33 muestra la exactitud del análisis Tipo A cuando se usan datos de 20 celdas de flujo de acuerdo con modalidades déla presente invención.

La figura 34 muestra la exactitud del análisis Tipo B cuando se usan datos de 20 celdas de flujo de acuerdo con modalidades de la presente invención.

Las figuras 35A y 35B muestran lecturas con mutaciones y con una secuencia Tipo silvestre en los codones 41/42 de acuerdo con modalidades déla presente invención.

La figura 36 muestra una tabla de un análisis de RHDO Tipo A mientras que aquellos DEL análisis de RHDO Tipo B son mostradas en la figura 37 de acuerdo con modalidades déla presente invención.

Las figuras 38A y 38B muestran los resultados de clasificación de SPRT para el caso PW226 como un ejemplo.

La figura 39 muestra una tabla que resume los resultados de análisis de RHDO para los 5 casos de acuerdo con modalidades déla presente invención.

La figura 40 muestra una gráfica de la profundidad de secuenciación contra el número de celdas de flujo secuenciadas de acuerdo con modalidades déla presente invención .

La figura 41 muestra una gráfica de los tamaños de las secuencias fetales y totales para todo el genoma y las figuras 42A -42C muestran gráficas similares individualmente para cada cromosoma de acuerdo con modalidades déla presente invención .

La figura 43 muestra un diagrama de bloques de un sistema de computadora ejemplar 4300 utilizable con los sistemas y métodos de acuerdo con modalidades déla presente invención .

DEFINICIONES El término "muestra biológica" como se usa en la presente, se refiere a cualquier muestra que es tomada de un sujeto (por ejemplo, un humano tal como una mujer embarazada) y contiene una o mas moléculas de acido nucleico de interés.

El término "ácido nucleico" o "polinucleotido" se refiere a un acido desoxirribonucleico (ADN) o acido ribonucleico (ARN) y un polímero del mismo ya sea en forma de una sola hebra o en forma de doble hebra. A no ser que sea limitado específicamente, el término abarca ácidos nucleicos que contienen análogos conocidos del nucleótidos naturales que tienen propiedades de enlace similares como el acido nucleico de referencia y son metabolizados de una manera similar a los nucleótidos que se presentan naturalmente. A no ser que se indique de otra manera, una secuencia de acido nucleico particular también abarca implícitamente variantes modificadas conservadoramente de la misma (por ejemplo, sustituciones de codón degenerada) , alelos, ortólogos, SNP y secuencias complementarias, también como las secuencia indicada explícitamente. Específicamente, sustituciones de · codón degeneradas pueden ser obtenidas al generar secuencias en las cuales la tercera posición de uno o mas (o todos) los codones seleccionados es sustituida con residuos de base mezclada y/o residuos de desoxyinosina (Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al.,J. Biol. Chem. 260:2605-2608 (1985); y Rossolini et al., ol.Cell. Probes 8:91-98(1994)). El término acido nucleico es usado intercambiablemente con gen, Cadn, mARN, ARN sin codificación pequeño, micro ARN (miARN) , ARN Piwi-interactuante y ARN de orquilla corto (shARN) codificado por un gen o sitio.

El término "gen "significa el segmento de ADN involucrado en producir una cadena de polipetido o de un producto de ARN transcrito. Puede incluir regiones precedentes y que siguen a la región de codificación (delantero y trasero) también como secuencias intermedias (intrones) entre segmentos de codificación individuales (exones) .

El término "secuencia de acido nucleico clínicamente relevante" (también denominada como secuencia objetivo o cromosoma) como se usa en la presente, se pueden referir a una secuencia de polinucleotidos correspondiente a un segmento de una secuencia genómica mas grande cuyo desequilibrio potencial es probado o a la secuencia genómica mas grande misma. Un ejemplo es la secuencia de cromosoma 21. Otro ejemplos incluyen cromosoma 18, 13 X e Y. Todavía otros ejemplos incluyen secuencias genéticas mutadas o polimorfismos genéticos o variaciones del número de copia que un feto puede heredar de uno o ambos de sus padres o como una mutación del Novo en el feto. En algunas modalidades, secuencias de acido nucleico clínicamente relevantes múltiples o equivalentemente múltiples marcadores de la secuencia de acido nucleico clínicamente relevante, pueden ser usados para proveer datos para detectar el desequilibrio. Por ejemplo, datos de cinco secuencias no consecutivas ene el cromosoma 21 pueden ser usados de manera aditiva para determinación del desequilibrio cromosomal 21 posible, reduciendo efectivamente el volumen de muestras necesario a 1/5.

El término "basado" como se usa en la presente, significa "basado por lo menos en parte en" y se refiere a un valor (o resultado) que es usado en la determinación de otro valor, tal como ocurre en la relación de una entrada de un método y la salida de aquel método. El término "derivar" como se usa en la presente, también se refiere a la relación de una entrada de un método y la salida de aquel método, tal como ocurre cuando la derivación es el cálculo de una formula .

El término "parámetro" como se usa en la presente, significa un valor numérico que caracteriza un conjunto de datos cuantitativos y/o una relación numérica entre conjuntos de datos cuantitativos. POR EJEMPLO, una proporción (o función de una proporción) entre una primera cantidad de una primera secuencia de acido nucleico y una segunda cantidad de una segunda secuencia de acido nucleico es un parámetro.

Como se usa en la presente el término "sitio" o su forma plural "sitios" es una ubicación o dirección de cualquier longitud de nucleótidos (o pares de bases) que tiene una variación a través de genomas.

El término "desequilibrio de secuencia" como se usa en la presente, significa cualquier desviación significativa como es definida por al menos un valor de corte en una cantidad de la secuencia de acido nucleico clínicamente relevante de una cantidad de referencia. Un desequilibrio de secuencia puede incluir desequilibrio de dosificación de cromosomas, desequilibrio alélico, desequilibrio de dosificación de mutación, desequilibrio de dosificación de haplotipo y otros desequilibrios similares. Como un ejemplo, un desequilibrio alélico o desequilibrio de dosificación de mutación puede ocurrir cuando un feto tiene un genotipo diferente de la madre, creando mediante esto un desequilibrio en un sitio particular en la muestra.

El término "aneuploidia cromosoraal" como se usa en la presente, significa una variación en la cantidad cuantitativa de un cromosoma de aquella de un genoma diploide. La variación puede ser una ganancia o una perdida. Puede involucrar todo un cromosoma o una región de un cromosoma .

El término "haplotipo" como se usa en la presente, se refiere a una combinación de alelos en múltiples sitos que son transmitidos conjuntamente en el mismo cromosoma o región cromsomal. Un haplotipo se puede referir a tan pocos como un par de sitios o a una región cromosomal o todo un cromosoma. El término "alelos" se refiere a secuencias de ADN alterativas en el mismo sitio genómico físico, que pueden o pueden no dar como resultado rasgos genotípicos diferentes. En cualquier organismo diploide particular, con dos copias de cada cromosoma (excepto los cromosomas de sexo en un sujeto humano varón) , el genotipo para cada gen comprende el par de alelos presentes en aquel sitio, que son los mismos en homócigotos y diferentes en heterocigotos . Una población o especie de organismos incluyen comúnmente múltiples alelos en cada sitio entre varios individuos. Un sitio genómico en donde mas de un alelo es encontrado en la población es denominado un sitio polimórfico. La variación alélica en un sitio es mesurable como el número de alelos (esto es, el grado de polimorfismo) presentes o la proporción de heterocigotos (esto es, la proporción de heterócigocidad) entre la población. Como se usa en la presente, el término o "polimorfismo" se refiere a cualquier variación interindividuo en el genoma humano, sin consideración de su frecuencia. Ejemplos de tales variaciones incluyen pero están limitadas a polimorfismo de un solo nucleótido, polimorfismos de repetición en tándem simples, polimorfismo de inserción-cancelación, mutaciones (que pueden ser causa de la enfermedad) y variaciones de número de copias .

DESCRIPCION DETALLADA Una construcción de un mapa genético parcial o secuencia genómica completa de un feto no nacido puede ser provista en base a los haplotipos de secuencias polimórficas de sus padres. El término "haplotipo" como se usa en la presente, se refiere a una combinación de alelos en múltiples sitios que son permitidos conjuntamente en el mismo cromosoma o región cromosomal. Por ejemplo, modalidades pueden analizar fragmentos de ADN de una muestra materna (que contiene ADN materno y ADN' fetal) para identificar alelos en ciertos sitos especificados (marcas) . Las cantidades de fragmento de ADN de los respectivos alelos en estos sitios pueden luego ser analizadas conjuntamente para determinar las cantidades relativas de los haplotipos para estos sitios y determinar mediante esto cuales haplotipos han sido heredados por el feto de los genomas maternos y/o paternos. Al identificar los haplotipos fetales, el genotipo fetal en un sitio individual dentro de la región genómica correspondiente que incluye los sitios específicos puede ser determinado. En varias modalidades, los sitios en donde los padres son una combinación especifica de homócigo y heterócigo pueden ser analizados de una manera para determinar regiones del genoma fetal. En una implementación, los haplotipos de referencia que son representantes de haplotipos comunes en la población son usados junto con el análisis de fragmentos de ADN de la muestra materna para determinar los genomas maternos y paternos .

Un ejemplo de una aplicación de una modalidad para determinar por lo menos parte de un genoma fetal podría ser para prueba de paternidad al comparar el genotipo fetal deducido o haplotipo con el genotipo o haplotipo del padre supuesto. Otro ejemplo es detectar una o mas mutaciones del Novo de feto a adquirido o detectar eventos de recombinación meioticas que han ocurrido durante la producción de gametos a partir de sus padres. Estos son los gametos que han sido fertilizados y el cigoto resultante fue desarrollado al feto.

Además, algunas modalidades pueden también permitir que la secuencia genómica del feto no nacido sea determinada a cualquier distribución deseada. Por ejemplo, en ciertas aplicaciones, modalidades pueden permitir una secuencia genómica completa cercana a completa del feto sea determinada. En una modalidad, la resolución de la secuencia genómica fetal que puede ser determinada es dependiente de la resolución del conocimiento de genomas del padre y madre. En conjunción con información de secuenciación de la muestra biológica materna que contiene ácidos nucleicos fetales. En el caso de que las secuencias genómicas completas o cercanas a completas del padre y madre sean conocidas, las secuencias genómica completa o cercana a completa del feto no nacido podría ser deducida.

En otras modalidades, solamente la secuencia genómicas de regiones seleccionadas dentro del genoma son elucidadas, por ejemplo, para diagnosis prenatal de alteraciones genéticas, epigeneticas o cromosomales seleccionada (tales como alteraciones de impresión) . Ejemplos de alteraciones genéticas a las cuales una modalidad puede ser aplicada incluyen las hemoglobinopatías (tal como beta-talasemia, alfa-talasemia, anemia de célula falciforme, enfermedad de hemoglobina E) , fibrosis quística y alteraciones sexo-enlazadas (tales como hemofilia y distrofia muscular de Duchenne) . Ejemplos adicionales de mutaciones que pueden ser detectadas utilizando una modalidad se pueden encontrar del Online Mendelian Inheritance in Man (www . ncbi . nlm. nih . gov/omim/getmorbid . cgi ) .

Algunas modalidades también ser usadas para determinar una concentración fraccional de ADN fetal, que se puede hacer sin ningún conocimiento previo de los genomas específicos de los padres. Un análisis similar puede ser también usado para determinar la profundidad de cobertura necesaria para una determinación exacta del genoma fetal.

Asi, estas determinación de cobertura puede ser usada para estimar cuantos datos necesitan ser analizados para obtener resultados exactos.

I. INTRODUCCION Cuando se usa una muestra materna (por ejemplo, plasma o suero) como el material para elucidar el haplotipo fetal, pueden haber dos desafios principales. Un primer desafio es que el plasma o suero materno consiste de una mezcla de ADN fetal y maternal, el ADN fetal siendo la población menor. Se ha determinado que el ADN fetal representa un concentración media/mediana de algo del 5% al 10% del ADN total en plasma materno en los primeros dos trimestres de embarazo (Lo YMD et al Am J Hum Genet 1986; 62:768-775; Lun FMF et al Clin Chem 2008; 54:1664-1672). Ya que el ADN es liberado por glóbulos rojos sanguíneos maternos durante el proceso de coagulación de sangre, la concentración fraccional de ADN fetal en el suero materno puede ser aun mas baja que aquella en el plasma materno. Así, en algunas modalidades, el plasma materno es preferido con respecto al suero materno.

Un segundo reto es que el ADN fetal y el ADN materno en el plasma materno consisten de fragmentos cortos (Chan KCA'et al. Clin Chem 2004; 50: 88-92). Por supuesto, el ADN fetal-derivado es en general más corto que el ADN maternal-derivado en el plasma materno. La mayor parte del ADN fetal en el plasma materno es de menos de 200 pb de longitud. Utilizando tales fragmentos de ADN de plasma cortos solos, puede ser desafiante construir el haplotipo de polimorfismos genéticos en distancias genómicas largas. Los desafios mencionados anteriormente para el plasma materno y el suero también se aplican para la detección de ADN fetal en orina materna (Botezau I et al. Clin Chem 2000; 46: 1078-1084). El ADN fetal representa solamente una fracción menor del ADN en la orina de una mujer embarazada y el ADN fetal en la orina materna también consiste de fragmentos de ADN cortos.

A. SECUENCIACION Y ANALISIS DE MUESTRA MATERNA Un procedimiento que algunas modalidades han tomado para tratar el primer desafio es usar un método que permite el genotipado cuantitativo de ácidos nucleicos obtenidos de la muestra biológica materna con alta precisión. En una modalidad de estos procedimientos, la precisión es obtenida mediante análisis de un gran número (por ejemplo, millones o millones) de las moléculas de acido nucleico. Además, la precisión puede ser mejorada mediante análisis de moléculas de acido nucleico individuales o la amplificación clonal de moléculas de acido nucleico individuales. Una modalidad utiliza secuenciación de ADN masivamente paralela, tal como, pero no limitada a aquella efectuada por la plataforma de Analizador de Genoma de Ilumina (Bentley DR et al. Nature 2008; 456:53-59), la plataforma de Roche 454 (Margulies M et al. Nature 2005; 437:376-380), la plataforma ABI SOLiD (McKernan KJ et al. Genome Res 2009; 19:1527-1541), la plataforma de secuenciación de una sola molécula de Helicos (Harris TD et a. Science 2008; 320: 106-109), secuenciación en tiempo real utilizando moléculas de polimerasa individuales (Science 2009; 323 : 133-138) y secuenciación de nanoporo (Clarke Jet al Nat Nanotechnol. 2009;4:265-70) . EN UNA modalidad, secuenciación masivamente paralela es efectuada sobre un subconjunto aleatorio de moléculas de acido nucleico en la muestra biológica.

En algunas modalidades, puede ser benéfico obtener una lectura de secuencia tan larga de cada molécula como es posible. Una limitación de la longitud de las lecturas de secuenciación que puede ser obtenida es la naturaleza de las moléculas de acido nucleico en la muestra biológica materna. Por ejemplo, es conocido que la mayoría de las moléculas de ADN en plasma materno consisten de fragmentos cortos (Chan KCA et al. Clin Chem 2004; 50:88-92) . Además, la longitud de lectura tiene que ser equilibrada contra la fidelidad del sistema de secuenciación a longitudes de lectura largas. Para algunos de los sistemas mencionados anteriormente, podría ser preferible obtener secuencias de ambos extremos de la molécula, la llamada secuenciación de extremos apareados. Como una ilustración, un procedimiento es efectuar 50 pb de secuenciación de cada extremo de una molécula de ADN, dando como resultado asi un total de lOOpb de secuencia por molécula. En otra modalidad 75 pb de secuenciación de cada extremo de una molécula de ADN, dando como resultado asi un total de 150 pb de secuencia por molécula, se puede hacer. Después que las secuenciación es efectuada, la secuencias son luego alineadas otra vez a un genoma humano de referencia. Como algunas modalidades elucidas, las variaciones genómicas heredadas por un feto no nacido de sus padres, el algoritmo de alineación puede ser apto de tratar con variaciones de secuencia. Un ejemplo de tal paquete · de elementos de programación son los elementos de programación Efficient Large-Scale Alignment de Nucleotide Databases (ELAND) producido por Ilumina. Otro ejemplo de tal paquete de elementos de programación son los elementos de programación SOAP (programa de alineación de oligonucleótidos cortos) y SOAP2 (Li R et al. Bioinformatics 2008; 24:713-714; Li R et al. Bioinformatics 2009; 25:1966-1967).

La cantidad de secuenciación de ADN que puede necesitar ser efectuada puede depender de la resolución a la cual el mapa genético fetal o secuencia genómica fetal puede necesitar ser construida. En general, mientras más moléculas son secuenciadas mas alta es la resolución. Otro determinante de la resolución de 1 mapa genético fetal o secuencia genómica fetal a Un nivel o profundidad dado de secuenciación de ADN es la concentración fraccional de ADN fetal en la muestra biológica materna. En general, mientras mas alta es la concentración de ADN fetal fraccional, mas alta es la resolución del mapa genético fetal o secuencia genómica fetal que puede ser elucidada a un nivel dado de secuenciación de ADN. Ya que la concentración fraccional de ADN fetal en plasma materno es más alta que en el suero materno, el plasma materno es un tipo de muestra biológica materna mas preferido que el suero materno para algunas modalidades.

El rendimiento de los métodos a base de secuenciación mencionados anteriormente puede ser incrementado con el uso de graduación o código de barras. Asi, un índice de muestra o índice específico del paciente o código de barras, puedes ser agregado a fragmentos de acido nucleico en una biblioteca de secuenciación de acido nucleico particular. Luego, un número de tales bibliotecas, cada una con un índice especifico de muestra o especifico del paciente o código de barra, son mezclados conjuntamente y secuenciados conjuntamente. Enseguida de las reacciones de secuenciación los datos de secuenciación pueden ser consultados de cada muestra o paciente en base al código de barras o índice. Esta estrategia puede incrementar el rendimiento y así la efectividad del costo de modalidades de la presente invención .

En una modalidad, las moléculas de acido nucleico en la muestra biológica pueden ser seleccionadas o fraccionadas antes del genotipado cuantitativo (por ejemplo, secuenciación) . En una variante, las moléculas de acido •nucleico son tratadas con un dispositivo (por ejemplo, un micro arreglo) que puede preferiblemente enlazar moléculas de acido nucleico de sitios seleccionados en el genoma (por ejemplo, la región sobre el cromosoma 7 que contiene el gen de CFTR) . Luego, la secuenciación puede ser efectuada preferencialmente sobre moléculas de acido nucleico capturadas por el dispositivo. Este esquema permitirá apuntar la secuenciación hacia la región genómica de interés. En una modalidad de este esquema, se puede usar un sistema de captura de secuencia de Nimblegen (www . nimbleqen . com/products/seqcap/index . html ) o un Sistema de Enriquecimiento Objetivo SureSelect de Agilent (www.opengenomics.com/SureSelect Target Enrichment System) , o plataformas similares. En algunas modalidades, las moléculas de acido nucleico de las regiones seleccionadas del genoma son sometidas a secuenciación aleatoria.

En otra modalidad, la región genómica de interés en la muestra biológica puede ser primero amplificada por un conjunto o múltiples conjuntos de cebadores de amplificación.

Luego, el genotipado cuantitativo por ejemplo, secuenciación, puede ser efectuado sobre los productos amplificados. En una implementación de este sistema, se puede usar el sistema Rain Dance (www. raindancetech . com/technology/per-genomics-research . asp) . En algunas modalidades, las moléculas de acido nucleico amplificadas son sometidas a secuenciación aleatoria..

Una etapa de fraccionamiento de tamaño puede también ser efectuada sobre las moléculas de acido nucleico en la muestra biológica. Ya que se sabe que el ADN fetal es mas corto que el ADN materno en el plasma materno (Li et al Clin Chem 2004; 50:1002-1011; solicitud de patente estadounidense 20050164241; solicitud de patente estadounidense 20070202525) , la fracción de tamaño molecular mas pequeño puede ser cosechada y luego usada para el genotipado cuantitativo, por ejemplo, secuenciación. Tal fracción contendría una concentración fraccional mas alta de ADN fetal que en la muestra biológica original. Así, las secuenciación de una fracción enriquecida en ADN fetal puede permitir construir el mapa genético fetal o deducir la secuencia genómica fetal con una resolución mas alta a un nivel de análisis particular (por ejemplo, profundidad de secuenciación) que si una muestra no enriquecida hubiera sido usada. Esto puede por consiguiente hacer la tecnología mas efectiva en el costo. Como ejemplos de métodos para fraccionamiento por tamaño, se podría usar: i) electroforesis de gel seguida por la extracción de moléculas de acido nucleico de fracciones de gel especificas; ii) matriz de enlace de acido nucleico con afinidad diferencial por moléculas de acido nucleico de diferentes tamaños o iii) sistemas de filtración con retención diferencial por moléculas de acido nucleico de diferentes tamaños.

En todavía otra modalidad, se podría preferiblemente analizar moléculas de acido nucleico de un tamaño o intervalo de tamaño especifico enseguida de la secuenciación de acido nucleico. Por ejemplo, se podría efectuar la secuenciación de extremos apareados en la cual ambos extremos de una molécula de ADN son secuenciados . Luego, las coordenadas genómicas de ambos d estos extremos podrían ser mapeadas de regreso a un genoma humano de referencia. Luego se podría deducir el tamaño de la molécula al restar las coordenadas genómicas de ambos extremos. Una manera para efectuar tal secuenciación de extremos apareados es usada en el protocolo de secuenciación de extremos apareados del analizador de genoma de Ilumina. Otro método para deducir el tamaño de una molécula de ADN es secuenciar toda la molécula de ADN. Esto se hace mas fácilmente mediante plataforma de secuenciación con longitudes de lectura relativamente largas, tales como la plataforma de Roche 454 ( arguelis et al. Nature 2005;437:376-380) y la tecnología en tiempo real de una sola molécula (S RT ) de Pacific Bioscences (Eid et al Science 2009;3232:133-138). Enseguida de la deducción del tamaño de las moléculas de acido nucleico, se podría, escoger el focal de el análisis subsecuente sobre las moléculas de menos de un tamaño de corte particular, enriqueciendo mediante esto la concentración fraccional de ADN fetal. El análisis de este subconjunto de moléculas puede permitir que el mapa genético fetal o secuencias genómicas fetales sean deducidos con menos moléculas analizadas después de la selección de tamaño que si este procedimiento no hubiera sido realizado. En una modalidad, se usa un tamaño de corte de 300 pb.4 En todavía otras modalidades, se podría usar un tamaño de corte 250 pb, 200 pb, 180 pb, 150 pb, 125 pb, 100 pb o 75 pb.

B. USO DE GENOMAS PARE ALES COMO ANDAMIOS Para tratar el segundo desafío, algunas modalidades •pueden usar haplotipos de los cromosomas de la madre como "andamios". Los haplotipos de los cromosomas del padre pueden también ser usados como otro "andamio". Este andamio puede ser comparado contra información genética del feto obtenida de la muestra materna que contiene · ADN fetal. Esta información genética fetal puede ser usada para determinar como el andamio de la madre y/o padre ha sido electo en el genoma fetal usando mediante esto las partes componentes del andamio para determinar el genoma fetal resultante.

Los haplotipos parentales pueden ser construidos a partir de ADN genómico del padre y madre y de otros miembros de la familia, por ejemplo, un hermano del feto del embarazo actual. Es posible que la disponibilidad de los haplotipos parentales se puedan volver incrementadamente lugar común en vista de la reducción de los costos de secuenciación genómica. En un escenario, si uno o ambos padres ya tienen sus genomas secuenciados y sus haplotipos sobre una o mas regiones cromosomales han sido determinados entonces esta información puede ser usada como el andamio mencionado anteriormente .

Cualquier plataforma de genotipado conocida para aquellos de habilidad en el arte que pueda interrogar variaciones de secuencia en donde el genoma puede ser usada, incluyendo secuenciación de ADN, microarreglo, sondas de hibridizacion, técnicas a base de fluorescencia, técnicas ópticas, códigos de barra moleculares y representación d e imagen de una sola molécula (Geiss GK et al. Nat Biotechnol 2008/ 26:317-325), análisis de una sola molécula PCR , PCR digital, espectrometría de masas (tal como la plataforma de MassARRAY Sequenom) , etc. Como un ejemplo mas extremo, la secuencia de ADN del padre y madre puede ser determinada mediante secuenciación de ADN de todo el genoma utilizando un método de secuenciación masivamente paralelo (Bentley DR et al. Nature 2008; 456:53-59; McKernan KJ et al. Genome Res 2009; 19:1527-1541) . Un ejemplo de variaciones de secuencia que puede ser de interés son polimorfismos de un solo nucleótido (SNP) . Un método particularmente preferido para determinar los genotipos parentales es mediante análisis de microarreglo de SNP sobre una escala de genoma amplio o regiones genómicas seleccionadas, por ejemplo, aquellas que contienen genes cuyas mutaciones pueden provocar enfermedades genéticas (tales como genes en el grupo de beta-globina o el gen regulador de conductancia de transmembrana de fibrosis quistica (GFTR) ) . Aparte de variaciones de secuencia, también se pueden usar variaciones de número de copia. Variaciones de secuencia y variaciones de número de copia son ambas nominadas como elementos genéticos polimórficos (PMF) .

En un aspecto los genotipos maternales sobre los cromosomas o regiones cromosomales de interés pueden ser construidos en haplotipos. Una manera en la cual esto puede ser efectuado es mediante el análisis de otros miembros de la familia relacionados con la madre, por ejemplo, un hijo o hija de la madre, un padre, un hermano, etc. Otra manera en la cual los haplotipos pueden ser construidos es por medio de otros métodos bien conocidos para aquellos experimentados en el arte mencionado anteriormente.

La información de genotipo puede luego ser extendida a información de haplotipo de los padres mediante comparación con la información de genotipo de otros miembros de la familia, por ejemplo, un hermano del feto del embarazo actual o de los genotipos de los abuelos, etc. Haplotipos de los padres pueden también ser construidos mediante otros métodos bien conocidos para aquellos experimentados en el arte. Ejemplos de tales métodos incluyen métodos a base de análisis de una sola molécula, tal como PCR digital (Ding C y Cantor CR. Proc Nati Acad Sci USA 2003; 100:7449-7453; Ruano G et al. Proc Nati Acad Sci USA 1990;87:6296-6300), haplotipificacion de esperma (Lien S et al. Curr Protoc Hum Genet 2002;Chapet I:Unit 1.6) y técnicas de representación de imagen (Xiao et al. Hum Mutat 2007; 28:913-921) . Otros métodos incluyen aquellos basados sobre PCR especifica de alelo (Michalatos-Beloin S et al. Nucleic Acids Res 1996; 24:4841-4843; Lo YMD et al. Nucleic Acids Res 1991;Nucleic Acids Res 19 : 3561.3567 ), clonación y digestión de enzima de restricción (Smirnova AS et al. Immunogenetics 2007;59:93-8), etc. Todavía otros métodos están basados en la distribución y estructura de desequilibrio de enlace de bloques de haplotipo en la población que permite que el haplotipo materno sea impedido a- partir de determinaciones estadísticas (Clark AG. Mol Biol Evol 1990; 7:111-22,10:13-9;Salem RM et al Hum Genomics 2005;2:39-66) .

C. USO DE INFORMACION GENOMICA DE LA MUESTRA MATERNA PARA ENSAMBLAR EL ANDAMIO En una modalidad, para trabajar cuales délos cromosomas maternos se han hecho pasar al feto, se usa un método de dosificación de haplotipo relativo (RHDO) . Un principio general este procedimiento es como sigue para un ejemplo de en donde la madre es heteróciga para cada uno délos polimorfismos genéticos. Asi, hay dos haplotipos y la dosificación de haplotipo seria 1:1. Sin embargo, en la muestra materna, la presencia de una pequeña proporción de ADN fetal podría alterar la dosificación de haplotipo relativa. Esto es debido a que el feto habría heredado la mitad de su complemento de haplotipo de la madre y la otra mitad del padre. Además, para cada cromosoma, el feto podría haber heredado un "parche" de haplotipos que se han originado del uno o los otros cromosomas homólogos de cada padre, dependiendo de la ocurrencia de recombinación meiotica. Todos estos factores podrían desviar la dosificación de haplotipo relativa de la proporción 2:1 en el ADN constitucional materno. ASI, para un cromosoma o región cromosomal dados, los alelos consiguientes de estos haplotipos pueden ser buscados de datos analíticos (por ejemplo, datos de secuenciación) generados de la muestra materna.

Luego, se puede efectuar un procedimiento estadístico para determinar la dosificación de haplotipos relativa o si uno de estos haplotipos esta sobre representado sobre el otro haplotipo. El umbral de clasificación para este procedimiento estadístico puede ser ajustado dependiendo de la concentración de ADN fetal fraccional. En general, una concentración de ADN fetal fraccional mas alta puede permitir que el umbral sea alcanzado con menos moléculas. El umbral de clasificación puede también ser ajustado dependiendo di número de fragmentos clasificados exitosamente que se desea obtener a través del genoma o las regiones genómicas de interés. En una modalidad, se puede usar la prueba de proporción de probabilidad secuencial (SPRT) .

En una modalidad, se puede usar una dosificación de mutación relativa (RMD) , como se describe en la solicitud de patente estadounidense 2009/0087847 para determinar la cantidad relativa de un alelo en polimorfismos particulares de la madre. Estas cantidades relativas pueden ser usadas en la determinación de un haplotipo del feto (por ejemplo, cuando los polimorfismos están en sitios consecutivos o enlazados) . En una implementación de este procedimiento apuntado es el uso de la reacción en cadena de polimerasa (PCR) para amplificar secuencias específicas a partir de partes del genoma para el análisis de RMD. Para extender este procedimiento de RMD para determinar herencia fetal en una región genómica grande o todo el genoma, se cita un volumen grande de muestra materna.

En una modalidad que utiliza secuenciación aleatoria, las regiones genómicas de interés no son apuntadas específicamente. Así, el número de secuencias obtenidas en las regiones genómicas de interés pueden no ser tan numeroso como en un procedimiento apuntado (a no ser que se efectué secuenciación muy profunda) . Sin embargo, los conteos pueden ser acumulados a través de un número de polimorfismos enlazados para obtener el poder estadístico necesario para propósitos de diagnostico. Una implicación práctica de usar esta modalidad de secuenciación es que puede ahorrar costos al evitar la necesidad de secuenciación excesivamente profunda. También requiere una entrada de una cantidad menor de muestra materna que los procedimientos a base de PCR digitales.

Además, puede ser deseable efectuar tal análisis de RHDO en bloques. En otras palabras, cada cromosoma puede ser analizado en uno o preferiblemente más de un bloque. En un aspecto, el último puede permitir que la recombinación meiotica sea observada. Por ejemplo, un haplotipo de un segmento de un cromosoma particular del feto puede parecer haber tenido de uno de los cromosomas homólogos maternos mientras que otro segmento del mismo cromosoma fetal parece poseer el haplotipo del otro cromosoma homologo materno. Un análisis de SPRT puede permitir que esta segmentación sea efectuada.

Por ejemplo, el análisis de SPRT puede ser efectuado sobre SNP vecinos demostrando la configuración de genotipo parental requerida (esto es, el padre siendo homócigo y la madre siendo heteróciga) partiendo de un extremo de un cromosoma. Esto continuara hasta que el análisis de SPRT haya indicado que uno del haplotipo maternal es predominante en los datos analíticos del plasma materno (por ejemplo, datos de secuenciación) . Luego, el análisis de SPRT puede ser "restablecido" e iniciar de nuevo di siguiente SNP vecino que muestra la configuración de genotipo parental requerida. Esto puede otra vez continuar hasta que el análisis SPRT ha indicado una vez más que uno del haplotipo materno es predominante en los datos analíticos del plasma materno (por ejemplo, dátos de secuenciación) . Este proceso puede continuar hasta el último SNP seleccionado sobre dicho cromosoma. Luego, estos varios segmentos de haplotipo SPRT-determinados sobre el cromosoma pueden ser comparados con los haplotipos de los dos cromosomas homólogos en el genoma de la madre. Se observa una recombinación meiotica cuando los segmentos de haplotipo en el feto parecen haber cambiado de un cromosoma homologo materno a otro. Este sistema puede también funcionar a un si hay mas de una recombinación meiotica por cromosoma.

Como se describe posteriormente, el análisis de RHDO puede también ser llevado a cabo para regiones genómicas en las cuales el padre y madre son ambos heterócigos para los polimorfismos genéticos constituyentes. Este escenario es particularmente útil para situaciones cuando el padre y madre comparten una copia mutante del gen enfermo del mismo origen ancestral, tal como cuando son consanguíneos o cuando la mutación predominante por la enfermedad es debida á un efecto fundador grande (esto es, la mayoría de los individuos con la mutación ha heredado el mismo haplotipo de un fundador ancestral común de la población) . Así, los haplotipos del padre y madre en esta región pueden ser usados para deducir el haplotipo fetal.

II . CONSTRUCCION DE GENOMA FETAL A PARTIR DE GENOMA MATERNO Ahora se describe la construcción de un mapa genético fetal o que elucida la secuencia genómica fetal con conocimiento explícito de los genomas parentales.

A. METODO La figura 1 es un diagrama de flujo de un método 100 para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada. El feto tiene un padre y una madre que es la mujer embarazada. El padre tiene un genoma paternal con dos haplotipos y la madre tiene un genoma maternal con dos haplotipos. El método 100 analiza moléculas (fragmentos) de acido nucleico de una muestra biológica obtenida de la mujer embarazada para determinar el genoma del feto. EL método 100 es descrito principalmente para el ejemplo de cuando el padre es homócigo y la madre es heteróciga en una pluralidad de sitios, mientras que otros ejemplos describen otras modalidades.

El método 100 y cualquiera de los métodos descritos en la presente pueden ser efectuados total o parcialmente con un sistema de computadora que incluye un procesador que puede estar configurado para efectuar las etapas Asi, algunas modalidades son concernientes con sistemas de computadora configurados para efectuar lisa etapas de cualquiera de os métodos descritos en la presente, potencialmente con diferentes componentes que efectúan una etapa de un grupo de etapas respectivas. Aunque son" presentados como etapas numeradas, las etapas de los métodos en la presente pueden ser efectuadas aun mismo tiempo o en un orden diferente. Adicionalmente, porciones de estas etapas pueden ser usadas con porciones de otras etapas de otros métodos. También toda la etapa o porciones de una etapa pueden ser opcionales. Adicionalmente cualquiera de las etapas de cualquiera de los métodos pueden ser efectuadas con módulos, circuitos u otros medios para efectuar estas etapas.

En la etapa 110, una primera pluralidad de sitios son identificados en los cuales el genoma materno es heterócigo. En una modalidad esta determinación puede ser efectuada en parte de un genotipado del padre y madre a nivel genómico o en sitios genómicos seleccionados de interés. En otras modalidades, la determinación de la primera pluralidad de sitios se puede hacer durante un análisis de la muestra materna, que es descrito en secciones posteriores.

En etapa 120, cada uno de los dos haplotipos maternales que cubren la primera pluralidad de sitos son determinados. Como se menciona anteriormente, el genoma maternal podría ser obtenido de secuenciación directa. En otras modalidades, el genotipado se puede hacer en una pluralidad de sitios y luego usar un genoma mapeado de alguien que se espera que tenga un genoma similar, por ejemplo, de un miembro de la familia o de un genoma de referencia que es común en una misma población o población similar. En una modalidad, la etapa 120 puede ser efectuada primero para todo el genoma o partes del genoma materno y luego el genoma materno puede ser investigado para encontrar sitios en donde la madre es heteróciga.

En un aspecto, no es esencial construir los haplotipos de los cromosomas del padre. Sin embargo, si los haplotipos paternales pudieran ser construidos, entonces se podría obtener información adicional de los resultados de secuenciación. Una de tal información adicional incluye el hecho de que el análisis de dosificación de haplotipo relativa puede ser efectuado para regiones para las cuales ambos padres son heterócigos. Otra pieza de información adicional que puede ser obtenida si el haplotipo paternal esta disponible es información concerniente con recombinación meiotica que involucra uno o mas cromosomas paternales y determinar si alelos enfermos enlazados a tales polimorfismos se han hecho pasar al feto.

En la etapa 130, se determina un alelo por el feto del padre en cada uno de la primera pluralidad de sitios. Algunas modalidades utilizan sitios genómicos que son homócigos para el padre, pero heterócigos para la madre (como se menciona en la etapa 110) . Asi, si el padre es homócigo en los sitios, entonces el alelo que es heredado del padre es conocido. En el genotipado del padre para determinar sitios en los cuales el padre es homócigo puede ser determinado de cualquiera de las maneras descritas en la presente. En una modalidad, la determinación de la primera pluralidad de sitios puede ser determinado en base al genotipado del padre y madre con el fin de encontrar sitios en los cuales el padre es homócigo y en los cuales la madre es heterociga.

En otra modalidad, una segunda pluralidad de sitios del genoma paterno que son heterócigos pueden ser usados para determinar el haplotipo paterno heredado por el feto en la primera pluralidad de sitios en los cuales el padre es homócigo. Por ejemplo, si el genoma materno es homócigo en la segunda pluralidad de sitios, se pueden identificar alelos que están presentes en el genoma paterno en los sitios respectivos de la segunda pluralidad de sitios y ausentes en el genoma materno. El haplotipo paternal heredado puede luego ser identificado como el haplotipo con los alelos identificados y usarse para determinar el alelo heredado del padre en la primera pluralidad de sitios. Estos aspectos para determinar un haplotipo paterno son discutidos en mas detalle posteriormente en la presente.

En la etapa 140, una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada son analizadas. La muestra contiene una mezcla de acido nucleicos maternales y fetales. La muestra biológica materna puede luego ser llevada y luego recibida para el análisis. EN una modalidad, el plasma materno y suero son utilizados. En otras modalidades, sangre materna, orina materna, saliva materna, fluido de lavado uterino o células fetales obtenidos de células maternas pueden ser usados.

En una modalidad el análisis de una molécula de acido nucleico incluye identificar un sitio o ubicación de la molécula de acido nucleico en le genoma humano y determinar un alelo de la molécula de acido nucleico en el sitio individual. Asi, una modalidad, puede efectuar el genotipado cuantitativo utilizando los alelos determinados de las moléculas de acido nucleico del mismo sitio. Cualquier método que permitirá la determinación de la ubicación genómica y alelo (información en cuanto a genotipo) de moléculas de acido nucleico en la muestra biológica materna pueden ser usados. Algunos de tales métodos son descritos en la solicitudes de patente estadounidense 12/178,181 y 12/614350, y solicitud intitulada "Sized-Based Genomic Analysis".

En la etapa 150, en base a los alelos determinados de las moléculas de acido nucleico, se determinan cantidades de alelos respectivos en cada uno de las primera pluralidad de sitios. En una modalidad, las cantidades pueden ser el número de alelos de cada tipo en un primer sitio. Por ejemplo, seis A y cuatro T. En otra modalidad, una cantidad puede ser una distribución de tamaño de las moléculas de acido nucleico gue tienen un alelo particular. Por ejemplo, una cantidad relativa puede también incluir una distribución de tamaño de los fragmentos con un genotipo particular, gue puede transportar una cantidad relativa de fragmentos de ciertas longitudes. Tales cantidades relativas pueden también proveer información en cuanto a cual genotipo esta en el genoma fetal, puesto que los fragmentos fetales tienden a ser mas pequeños que los fragmentos maternales. Algunos ejemplos de cantidades y métodos son descritos en la solicitudes de patente estadounidense /178,181 y 12/614350 y solicitud intitulada "Sized-Based Genomic Analysis".

En una modalidad, las cantidades relativas de los alelos en un sitio pueden proveer información en cuanto a cual genotipo fue heredado por el feto (por ejemplo, después que un conjunto de datos ha alcanzado suficiente poder estadístico) . Por ejemplo, las cantidades relativas pueden ser usadas para determinar si se presente un desequilibrio de secuencia en relación con los genotipos de la madre en un sitio. La solicitudes de patente relacionadas citadas anteriormente proveen ejemplos de modalidades para detectar un desequilibrio de secuencia en un sitio o región particular.

En la etapa 160, cantidades relativas de los alelos respectivos de las moléculas de acido nucleico en mas de un sitio de la primera pluralidad de sitios son comparadas. En algunas modalidades, cantidades de cada alelo en cada sitio de la primera pluralidad de sitios que comprenden los haplotipos son agregadas antes de hacer una comparación. Las cantidades agregadas de los haplotipos parentales pueden luego ser comparadas para determinar si un haplotipo esta sobre representado, igualmente representado o sub-representado . En otra modalidades las cantidades para los alelos en un sitio son comparadas y se usan comparaciones en múltiples sitios. Por ejemplo, se' puede agregar un valor de separación (por ejemplo, una diferencia o una proporción) , que puede ser usada en una comparación con un valor de corte. Cada una de estas modalidades se puede aplicar a cualquiera de las etapas de comparación descritas en la presente.

En' varias modalidades, las cantidades relativas pueden ser un conteo de un número de cada fragmento con un alelo particular en un sitio particular, un conteo de un número de fragmento de cualquier sitio (o cualquier sitio en una región) sobre un haplotipo particular y un valor estadístico del conteo (por ejemplo, un promedio) en un sitio particular o sobre un haplotipo particular, asi, en una modalidad, la comparación puede ser una determinación de un valor de separación (por ejemplo, una diferencia o una proporción) de un alelo versus otro alelo en cada sitio.

En la etapa 170, en base a al comparación, el haplotipo que es heredado por el feto no nacido de la madre en la porción del genoma cubierto por la primera pluralidad de sitios puede ser determinado. En una modalidad, para trabajar cual de los cromosomas maternales se han hecho pasar al feto, se usa un método de dosificación de haplotipo reactivo (RHDO) , por ejemplo, como se menciona anteriormente. Ya que la madre es heteróciga para cada uno de los primeros sitios, los primeros sitios corresponden a dos haplotipos para la elección genómica de los primeros sitios. La dosificación relativa de estos haplotipos seria ul : 1 si la muestra fuera solo de la madre. Desviaciones o carencia de desviaciones de esta proporción pueden ser usadas para determinar el haplotipo del feto que es heredado de la madre (y el padre, que es tratado en mas detalle posteriormente en la presente) . Asi, para un cromosoma dado o región cromosomal dada, los alelos constituyentes de estos haplotipos pueden ser buscados de los datos analíticos (por ejemplo, datos de secuenciación) generados en la etapa 130.

Puesto que una pluralidad de sitios son analizados y comparados con el haplotipo de la madre la secuencias entre los sitios pueden ser atribuidas a un haplotipo particular. En una modalidad, si varios sitios coinciden con un haplotipo particular entonces los segmentos de secuencia entre los sitios pueden ser asumidos en los mismos como aquel del haplotipo materno. Debido a la presencia de recombinación meiotica, el haplotipo final heredado por el feto puede consistir de un parte de "segmento de haplotipo" que se originan de uno de estos dos cromosomas homólogos. Algunas modalidades pueden detectar tal recombinación.

La resolución en la cual se podría detectar tal recombinación es dependiente del número y distribución de los marcadores genéticos que han determinado en el ADN constitucional del padre y la madre y el umbral que se usa en el análisis bio informático subsecuente (utilizando por ejemplo el SPRT).Por ejemplo, si la comparación sugiere que el alelo heredado de la madre en el cual un primer conjunto de sitios consecutivos corresponden al primer haplotipo, entonces el primer haplotipo es determinado ser heredado para el sitio genómico correspondiente al primer conjunto des sitios. Si un segundo conjunto de sitios consecutivos sugieren gue el segundo haplotipo es heredado, entonces se determina que el segundo haplotipo es heredado para el sitio genómico correspondiente al segundo conjunto de sitios.

En una modalidad, ya que una pluralidad de sitios son analizados, el haplotipo puede ser determinado con mayor exactitud. Por ejemplo, los datos estadístico para un sitio pueden no ser determinantes, pero cuando son combinados con los datos estadísticos de otros sitios, se puede hacer una determinación de cual haplotipo es heredado. En otra modalidad, cada sitio puede ser analizado independientemente para hacer una clasificación y luego las clasificaciones pueden ser analizadas para proveer una determinación del cual haplotipo es heredado para una región dada.

En una modalidad, se puede efectuar un procedimiento estadístico para determinar la dosificación de haplotipo relativo (por ejemplo, si uno de estos haplotipos es sobre representado con respecto al otro haplotipo) . El umbral de clasificación para este procedimiento estadístico puede ser ajustado dependiendo de la concentración de ADN fetal fraccional. En general, una concentración de ADN fetal fraccional mas alta puede permitir que el umbral sea alcanzado con menos moléculas. El umbral de clasificación puede también ser ajustado dependiendo del número des segmento s clasificados exitosamente que se desea obtener a través del genoma o las regiones genómicas de interés.

Refiriéndose otra vez a la figura 1, en la etapa 180, el genoma fetal puede ser analizado en cuanto a mutaciones. Por ejemplo, se pueden usar modalidades para buscar un panel de mutaciones gue provocan enfermedades genéticas en una población particular. Ejemplos de mutaciones que pueden ser detectadas utilizando las modalidades se pueden encontrar del Online Mendelian Inheritance in Man (www . ncbi . nlm. nih . gov/omim/getmorbid. cgi ) . Estas mutaciones pueden ser buscadas durante las etapas 140-160 o como una etapa separada como se describe en la presente. Por ejemplo, en familias en las cuales el padre es un portador de una o mas mutaciones que están ausentes en la madre, entonces la (s) mutación (es) podría (n) ser buscada (s) de los datos analíticos (por ejemplo, datos de secuenciación) de la muestra ' biológica materna.

Aparte de detectar la mutación real, también se podría buscar marcadores genéticos polimórficos que están enlazados a 1 alelo mutante o Tipo Silvestre en el padre o madre. Por ejemplo, el análisis de RHDO puede revelar que el feto ha heredado el haplotipo de la madre que es conocido que porta una mutación por una enfermedad. Modalidades de la invención pueden también ser usadas para la diagnosis prenatal no invasiva de enfermedades provocadas por cancelaciones de regiones cromosomales, por ejemplo, la ' cancelación Asiática del Sureste que provoca alfa-talassemia . En el escenario en el cual tanto el padre como la madre son portadores de la cancelación, si el feto es homócigo para la cancelación y si se efectúa la secuenciación masivamente paralela en el ADN de plasma materno, entonces debe haber una reducción en las frecuencias de secuencias de ADN que se originan de la región cancelada en el plasma materno.

B . PLASMA Esta sección describe un ejemplo de modalidades (por ejemplo, del método 100) aplicadas al polimorfismo de un solo nucleótido (SNP) en el cual la madre es heteróciga. Los alelos de SNP sobre el mismo cromosoma forman un haplotipo, con la madre que tiene un par homologo de cada cromosoma y asi dos haplotipos. Para ilustrar como tal determinación es efectuada, considérese un segmento sobre cromosoma 3 por ejemplo, como se muestra en la figura 2.

La figura 2 muestra dos haplotipos para el padre y dos haplotipos para la madre para un segmento particular de su respectivo código genómico. Cinco SNP fueron encontrados dentro de este segmento en el cual el padre y la madre fueron homócigo y heterócigo, respectivamente para todos los cinco de estos SNP. Los dos cromosomas homólogos del padre poseían el mismo haplotipo (Hap) , esto es, A-G-A-A-G (de arriba abajo en la figura 2). Por simplicidad, los haplotipos paternales son llamados Hap I y Hap II, teniendo en mente que ambos de estos son idénticos para este conjunto de cinco SNP. Para la madre, se observaron dos haplotipos, es decir HAP III, A-A-A-G-G Y Hap IV, G-G-G-A-A.

Los SNP en este ejemplo podrían ser clasificados adicionalmente en dos Tipos. La figura 3 muestra los dos Tipos de SNP de acuerdo con modalidades de la presente invención. El Tipo A consiste de aquellos SNP en los cuales los alelos paternos fueron los mismos como aquello en el haplotipo materno III. El Tipo B consiste de aquellos SNP en los cuales los alelos paternos fueron los mismos como aquellos ene 1 haplotipo materno IV.

Estos dos Tipos de SNP pueden requerir una manipulación matemática ligeramente diferente. Así, en el escenario de Tipo A, la herencia fetal de haplotipo III daría como resultado la sobre representación del haplotipo III, en relación con el haplotipo IV en el plasma materno (figura 4 A) . Por ejemplo, mirando solo un SNP 410 por facilidad de discusión el alelo A es heredado del padre y si Hap III es heredado de la madre, entonces el feto estará contribuyendo a 2 alelos A la muestra, lo que provocara una sobre representación de A. Si el feto hubiera heredado el haplotipo IV entonces no se vería ninguna sobrerrepresentación puesto que el feto también seria heterocigo con A y G en el sitio.

Por otra parte, en el escenario Tipo B, la herencia fetal de haplotipo B daría como resultado una representación igual de haplotipo III y haplotipo IV en plasma materno (figura 4B) . Por ejemplo, mirando contra SNP 420, la herencia de G de 1 padre y A como parte de Hap III provocaría que el feto contribuya con cantidades iguales de A y G en el SNP 420 justo como la madre. Si el feto hubiera heredado el haplotipo IV entonces, se observaría la sobre representación como es evidente de la discusión anterior.

Las figuras °5 A Y5B muestran el análisis de comparar cantidades relativas (por ejemplo conteos) de fragmentos para cada sitio y si un resultado de la comparación es clasificar un haplotipo particular como siendo heredado o no. Cualquier sitio genómico en el cual hay un SNP que ajuste a una de estas configuraciones de genotipo del padre y madre (por ejemplo, escenarios Tipo A o Tipo B) puede ser usado para este ejemplo. De los datos de secuenciación de plasma materno se puede enfocar sobre ele número de moléculas secuenciadas correspondientes a un alelo particular de SNP se puede usar un análisis de SPRT (u otro método de comparación) para determinar si había algún desequilibrio alélico entre estos alelos (Lo YMD et al Proc Nati Acad Sci USA 2007; 104: 13116-1321) .

La figura 5 A muestra un análisis para SNP Tipo A. Como se muestra, para cada SNP, una comparación de SPRT de las cantidades relativas (por ejemplo, como son definidas por un valor de separación) con un valor de corte provee una clasificación. En una modalidad, si el umbral de clasificación para SPRT fuera buscado entonces, la herencia fetal de un haplotipo materno particular seria concluida. El conteo por el análisis de SPRT puede luego ser restablecido. Luego, el análisis se puede mover a un SNP vecino que ajusta con la configuración de genotipo requerida, ya se la dirección de telomerica a centromerica o viceversa y el nuevo análisis de SPRT puede con este siguiente SNP.

Por otra parte, en una modalidad, si la clasificación para SPRT no fuera alcanzada con el SNP, entonces también se puede mover sobre un SNP vecino de manera similar, excepto que los conteos para el siguiente SNP pueden ser agregados al previo y luego SPRT puede otra vez ser efectuado. Este proceso puede continuar hasta que sea alcanzado el umbral de clasificación. Las figuras 5 A Y 5B ilustran la operación de este proceso para análisis Tipo A y Tipo B. En una modalidad, las clasificaciones son analizadas conjuntamente para hacer una clasificación total para una regio. Por ejemplo, si una clasificación es obtenida para un primer grupo de SNP y para el grupo de SNP, la clasificación de los dos puede ser comparada para ver si la clasificación es consistente.

La figura 6 ilustra el efecto de cambiar la proporción de probabilidad para la clasificación de SPRT (Zhou W et al. Nat Biotechnol 2001; 19:78-81/ Karoui NE et al. Statis Med 2006; 25:3124-33). En general, una proporción de probabilidad más baja para clasificación, por ejemplo 8 puede permitir que la clasificación se haga más fácilmente. Esto puede dar como resultado un número más grande de regiones clasificadas dentro del genoma.

Sin embargo, un número de tales regiones se puede esperar que sean mal clasificadasv Por otra parte, una probabilidad mas alta para clasificación por ejemplo, 1200, puede solamente puede permitir clasificación cuando mas SNP han sido punteados. Esto puede dar como resultado un número mas pequeño de regiones clasificadas dentro del genoma. Se puede esperar que el número y proporción de regiones mal clasificadas sea mas bajo cuando se compara con situaciones cuando se usa un umbral de clasificación mas bajo.

En una modalidad, se hace una clasificación solamente si dos clasificaciones de SPRT consecutivas dan como resultado el mismo haplotipo (denominado como el algoritmo de "dos bloques consecutivos") . En un aspecto, el algoritmo de "dos bloques consecutivos" puede incrementar la exactitud de clasificación. En algunas modalidades, para cualquier tratamiento de secuencia, una modalidad puede primero efectuar un análisis de SPRT para SNP Tipo A y luego hacer otro análisis de SPRT para los SNP Tipo B. En una modalidad, se pueden considerar el escenario por un estiramiento de secuencia para el cual los SNP Tipo A y Tipo B forman dos grupos entrelazados de marcas genéticas (por ejemplo, SNP) . En modalidades que usan el algoritmo de "dos bloques consecutivos" los dos bloques pueden ser de Tipos diferentes .

Los resultados de SPRT de los análisis de Tipo A y Tipo B pueden permitir verificar concordancia o discordancia en sus resultados de clasificación. Para mejorar la exactitud de clasificación, una modalidad ("procedimiento de entrelazamiento) podría solamente hacer una clasificación si ambos análisis Tipo A y Tipo B para una región genómica dada pueden producir resultados consistentes. S i los dos análisis producen resultados discordantes, se puede mirar los resultados de clasificación de las dos regiones continuas de clasificación próximas a la región, uno en el extremo centromerico y el otro en el extremo telomerico. Si estas dos regiones contiguas producen resultados concordantes, entonces se pueden clasificar la primera región como un haplotipo continuo con estas dos regiones. Si estas dos regiones continuas no · producen resultados concordantes, se pueden mover a las siguientes dos regiones contiguas hasta que se observa concordancia. Una variante de este esquema es moverse en solo una dirección y tomar los resultados de clasificación de la siguiente primera o dos o aun más regiones contiguas como los resultados de la región original concernientes. El principio general es usar los resultados de clasificación de regiones genómicas adyacentes para confirmar los resultados de clasificación de una región particular.

III. DETERMINACION DE LOS ALELOS PATERNALES HEREDADOS POR EL FETO Las figura 7 es un diagrama de flujo de un método 700 para determinar por lo menos una porción el genoma de un feto no nacido de una mujer embarazada heredado del padre. El método 700 analiza las moléculas (fragmentos) de acido nucleico de una muestra biológica · obtenida de la mujer embarazada para determinar el genoma del feto. La muestra contiene una mezcla de ácidos nucleicos maternales y fetales.

En la etapa 710, cada una de una pluralidad de moléculas de acido nucleico de la muestra biológica son analizadas para identificar la ubicación de la molécula de acido nucleico en el genoma humano y determinar un Tipo de alelo de la molécula de acido nucleico. Asi, genotipos de las moléculas de acido nucleico en un sitio (sitio particular) pueden ser determinados en una modalidad. Cualquiera de los métodos descritos anteriormente y en cualquier parte en la presente pueden ser usados para este análisis.

En la etapa 720, una primera pluralidad de sitios son determinados en los cuales el genoma paterno es heterócigo y el genoma materno es homócigo. En una modalidad, la primera pluralidad de sitios son obtenidos al determinar los genomas paternales y maternales. Los genomas pueden ser denominados en cuanto a sitios genómicos en los cuales el padre es heterócigo y la madre es homociga.

En la etapa 730, el haplotipo que es heredado por el feto no nacido del padre en la porción del genoma cubierta por la primera pluralidad de sitios es determinado en base a los genotipos determinados en la primera pluralidad de sitios. En una modalidad, el alelo de cada uno de estos sitios que es poseído por el padre, pero ausente en el genoma de la madre, es buscado en los datos analíticos (por ejemplo, datos de secuenciación) . La combinación de estos alelos indicaría los haplotipos de los cromosomas que el feto ha heredado del padre.

En otra modalidad, si los haplotipos de cada uno de los cromosomas o las regiones cromosomales de interés en el genoma del padre son conocidos, entonces también se puede determinar en donde se ha presentado recombinación meiotica durante la espermatogénesis en el padre. De aquí, se observa recombinación meiotica paternal cuando el haplotipo de un estiramiento de ADN en un cromosoma heredado paternalmente difiere entre el feto y el padre. La inclusión de tal información recombinante puede ser útil cuando se usan los datos analíticos (por ejemplo, datos de secuenciación) para la diagnosis prenatal de una enfermedad genética mediante análisis de enlace a polimorfismos genéticos.

IV. EL PADRE Y LA MADRE SON HETERÓCIGOS PARA UNA REGION GENOMICA Algunas modalidades pueden tratar un escenario en el cual el padre y la madre son heterócigos para una región genómica . Este escenario puede ser particularmente relevante en familias en las cuales el padre y la madre son consanguíneos. Cuando una enfermedad es asociada con una mutación predominante que ha resultado de un efecto fundador grande puede también ser relevante. En tales circunstancias, se esperaría que si el padre y madre del feto no nacido son ambos portadores del gen mutante, entonces el haplotipo del cromosoma que porta la copia mutante del gen puede esencialmente ser idéntico, excepto' por la presencia de eventos de recombinación meioticos. Este Tipo de análisis puede ser especialmente útil para enfermedades recesivas autosomales tales como fibrosis quística, beta-talassemia, anema de células falciformes y enfermedad de hemoglobina E.

La figura 8 es un diagrama de flujo de un método 800 para determinar por lo menos una porción del genoma de un feto no nacido en una región en donde la madre y padre son heterócigos de acuerdo con modalidades de la presente invención .

En la etapa 810, una primera pluralidad d sitios son determinados en los cuales el padre y madre son ambos heterócigos. En una modalidad, el primer sitio puede ser determinado mediante cualquiera de los métodos mencionados en la presente. Por ejemplo, todo el genoma o regiones de los genomas parentales pueden ser secuenciados o diferentes partes genotipadas para encontrar los primeros sitios. Asi, cada uno de los dos haplotipos paternales y cada uno de los dos haplotipos maternales en la primera pluralidad de sitios pueden ser conocidos.

Como un ejemplo, la figura 9 muestra haplotipos de un padre y madre que son ambos heterócigos en una región genómica particular. Como se muestra ambos padres tienen un gen mutante (alelo) en la región 1. Específicamente, Hap I del padre y Hap III tienen el gen mutante. También como se muestra, el padre y madre pueden cada uno tener la otra copia del cromosoma que porta la copia Tipo Silvestre del gen. Específicamente Hap II del padre y Hap IV de la madre tienen el gen Tipo Silvestre. Así, este ejemplo tiene relevancia, en determinar si un feto ha heredado un gen mutante. Los cromosomas del padre y madre que portan el gen Tipo Silvestre tienen un haplotipo idéntico en la vecindad inmediata del gen, pero podrían tener haplotipos divergentes alejados del gen. Ya que este cromosoma probablemente tendría un origen ancestral diverso, este cromosoma improbablemente tendría haplotipos idénticos entre el padre y madre en todo el cromosoma.

En la etapa 820, una segunda pluralidad de sitios son determinados en los cuales el padre es heterócigo, pero en los cuales la madre es homóciga.- Como se muestra, las primeras y segundas pluralidades de sitios están en el mismo cromosoma. La región 2 muestra tales segundos sitios. La región 2 puede ser escogida de tal manera que el padre es heterócigo para uno o más SNP en esta región, mientras que la madre es homóciga en esta región.

En la etapa 830, fragmentos de una muestra de la mujer embarazada pueden ser analizados para identificar la ubicación en el genoma humano y un genotipo. La ubicación puede ser usada para determinar si un fragmento (molécula de ácido nucleico) incluye uno o más de los primeros sitios o uno o más de los segundos sitios. Esta información puede luego ser usada para determinar el haplotipo heredado del padre y el haplotipo heredado de la madre.

En la etapa 840, cual de los dos haplotipos paternos ha sido heredado por el feto es determinado al analizar los genotipos determinados de la pluralidad de moléculas de ácido nucleico de la muestra biológica en por lo menos uno de los segundos sitios. Por ejemplo, los alelos de SNP que están presentes de manera única en el genoma del padre, pero ausentes en el genoma de la madre, tales como el alelo T marcado por * y el alelo A marcado por + en la Figura 9,' pueden ser buscados de los datos analíticos (por ejemplo, ubicación y genotipo resultante de la etapa 710) de la muestra . biológica materna. Como se puede hacer para el método 700, si el alelo T marcado por * es detectado del plasma materno, significa gue el haplotipo II (Hap II) es heredado por el feto del padre. Inversamente, si el alelo A marcado por + es detectado del plasma materno, entonces significa que Hap I es heredado por el feto del padre.

En la etapa 850, la comparación de cantidades relativas de los genotipos determinados de moléculas de ácido nucleico en más de uno de la primera pluralidad de sitios. En una modalidad, cantidades en cada sitio son agregadas y las cantidades relativas de los haplotipos maternales son comparadas. Las cantidades relativas se pueden referir a números contados, distribuciones de tamaño y cualquier otro parámetro que pueda transportar información en cuanto a cual genotipo está en el genoma fetal en un sitio particular.

En la etapa 860, en base al haplotipo paternal determinado ser heredado por el feto y en base a la comparación de las cantidades relativas, la determinación del haplotipo que es heredado por el feto no nacido de la madre en la porción del genoma cubierta por la primera pluralidad de sitios. Asi, un análisis de RHDO (por ejemplo, como se describe anteriormente) de SNP en la Región 1 de los datos analíticos de la muestra biológica materna se pueden llevar a cabo para determinar cual de los dos haplotipos maternales ha sido heredado por el feto, tomando el haplotipo paternal heredado por el feto en' la Región 2 en consideración. En una modalidad, se supone que no hay ninguna recombinación entre las Regiones 1 y 2 cuando estas regiones se hacen pasar de los padres al feto.

Por ejemplo, considérese el escenario cuando se ha determinado que el feto ha heredado Hap I del padre por medio del análisis . de la Región 2. Entonces, la herencia fetal de Hap III (que es idéntico a Hap I en la Región 1) de la madre resultará en la sobrerepresentación de Hap III en relación con Hap IV en el plasma materno. Inversamente, si el feto ha heredado Hap IV de la madre, entonces se puede observar una representación igual de Hap III y Hap IV en- el plasma materno .

Como otro ejemplo, considérese el escenario cuando se ha determinado que el feto ha heredado Hap II del padre por medio del análisis de la Región 2. Entonces, la herencia fetal de Hap IV (que es idéntico a Hap II en la Región 1) de la madre dará como resultado en la sobrepresentación de Hap IV en relación con Hap III en el plasma materno. Inversamente, si el feto ha heredado Hap III de la madre, entonces se observará una representación igual de Hap III y Hap IV en el plasma materno.

En las secciones previas, se ha deducido el genoma fetal y la concentración de ADN fetal fraccional utilizando los datos obtenidos de la secuenciación del ADN de plasma materno, también como la información de genotipo de los padres del feto. En las siguientes secciones, se describen modalidades para deducir la concentración de ADN fetal fraccional y genotipo fetal sin información previa de los genotipos/haplotipos maternos y paternos.

V. DETERMINACIÓN DE CONCENTRACIÓN DE ADN FETAL FRACCIONAL En algunas modalidades, una etapa opcional es determinar la concentración de ADN fetal fraccional. En varios aspectos, esta concentración fraccional puede guia la cantidad de análisis (por ejemplo, cantidad de secuenciación requerida) o permitir estimar la exactitud del análisis para una cantidad de datos dada (por ejemplo, profundidad de cobertura de secuencia de genoma) . La determinación de la concentración de ADN fetal fraccional puede también ser útil para determinar un corte para determinar una clasificación de cual haplotipo y/o genotipo son heredados.

En una modalidad, la concentración de ADN fetal fraccional puede ser determinada al minar los datos analíticos (por ejemplo, como se pueden obtener en la etapa 140 y 710) para sitios que son homócigos para el padre y para la madre, pero con alelos diferentes. Por ejemplo, para un SNP con dos alelos, A y G; el padre puede ser AA y la madre puede ser GG y viceversa. Para tales sitios, el feto sería un heterocigoto obligado. En el ejemplo anterior, el genotipo fetal seria AG y una proporción de alelo A en la muestra materna puede ser usada para determinar la concentración de ADN fetal fraccional. En otra modalidad, se puede hacer un análisis estadístico para determinar un sitio en donde la madre es homóciga y el feto es heterócigo. De esta manera, no es necesaria ninguna información previa acerca del genoma de la madre o el genoma paternal.

Como alternativas a minar los datos analíticos, la concentración de ADN fetal fraccional puede también ser determinada por otro procedimiento, tal como el uso de análisis de PCR, análisis de PCR digitales o análisis basados en espectrometría de masas sobre un panel de marcadores genéticos polimórficos (Lun FMF et al Clin Chem 2008; 54: 1664-1672). Otra alternativa es usar uno o más sitios genómicos que exhiben diferente metilación de ADN entre el feto y madre (Poon LLM et al. Clin Chem 2002; 48: 35-41; Chan KCA et al. Clin Chem 2006; 52: 221 1-2218; patente estadounidense 6,927,028). Como todavía otra alternativa es usar una concentración de ADN fetal fraccional aproximada determinada de una población de referencia como por ejemplo a una edad de gestación similar. Sin embargo, ya que la concentración de ADN fetal fraccional podría variar de muestra a muestra, se puede esperar que este último procedimiento sea menos preciso que si la concentración es medida específicamente para la muestra que es probada.

A. Determinación de la Concentración Fraccional para el Heterocig-oto Obligado En modalidades en donde el feto es un heterocigoto obligado, se pueden determinar la concentración de ADN fetal fraccional utilizando la siguiente serie de cálculos (por ejemplo, utilizando secuenciación masivamente paralela). Sea p el conteo del alelo fetal que está ausente del genoma materno. Sea q los conteos del otro alelo, esto es, el alelo que es compartido por los genomas maternales y fetales. La concentración de ADN fetal fraccional 'es dada por la siguiente ecuación: En una implementacJ¾L este cálculo puede ser p + q efectuado sobre datos acumulativos a través de diferentes sitios genéticos polimórficos o elementos genéticos polimórficos que satisfacen la configuración de genotipo parental (por ejemplo, ambos padres siendo homócigos, pero para diferentes alelos) .

B. Determinación basada en SNP Informativo La concentración fraccional de ADN fetal puede también ser determinada para cualquier sitio en cual la madre es homóciga y el feto es heterócigo y no solo cuando la madre es homóciga para un alelo y el padre es homócigo para un alelo diferente. Ambos métodos proveen si un sitio es informativo. El término "SNP informativo" puede ser usado en diferentes contextos dependiendo de que información- es deseada. En un contexto, la información es un alelo en el genoma fetal en un sitio particular que no está presente en el genoma materno en aquel sitio. Asi, el subconjunto de SNP que la madre es homóciga y el feto es heterócigo puede ser denominado como "SNP informativos" para el contexto de determinar la concentración de ADN fetal. Instancias en donde la madre y el feto son ambos heterócigos, pero para por lo menos un alelo diferente, pueden también ser usadas como un SNP informativo. Sin embargo, los SNP trialélicos son relativamente no comunes en el genoma.

La Figura 10 es un diagrama de flujo que ilustra un método 1000 para determinar la concentración fraccional del material fetal en una muestra materna de acuerdo con modalidades de la presente invención. En la etapa 1010, fragmentos de una muestra de la mujer embarazada de ser analizados para identificar la ubicación en el genoma humano y un tipo de alelo (lo que puede conducir a una determinación de genotipo en el sitio) . En una modalidad, los fragmentos son analizados al secuenciar una pluralidad de moléculas de ácido nucleico de la muestra biológica obtenida de la mujer embarazada. En otras modalidades, se puede usar PCR en tiempo real o PCR digital.

En la etapa 1020, uno o más primeros sitios son determinados ser informativos. En algunas modalidades, el genoma materno es homócigo, pero un alelo no materno es detectado en la muestra en un sitio informativo. En una modalidad, el genoma fetal es heterócigo en cada primer sitio y el genoma materno es homócigo en cada primero sitio. Por ejemplo, el genoma fetal puede tener un respectivo primero y ségundo alelo (por ejemplo, TA) en un primer sitio y el genoma materno puede tener dos de los respectivos segundos alelos (por ejemplo, ??) en el primer sitio. Sin embargo, tales sitios pueden no ser conocidos a priori, por ejemplo, en situaciones en donde el feto no es un heterocigoto obligado .

En una modalidad para determinar un sitio informativo, los SNP en las cuales la madre es homóciga son considerados. Para SNP gue la madre es homóciga, el feto es ya sea homócigo para el mismo alelo o es heterócigo. Por ejemplo, si un SNP es polimorfico para A y T y la madre tiene un genotipo de AA, el genotipo del feto es ya sea AA o TA. En este caso, la presencia del alelo' T en la muestra de plasma materno indicaría el genotipo fetal es TA en lugar de AA. Ciertas modalidades pueden tratar cuanto de la presencia del alelo T indica un genotipo de TA al calcular un corte necesario, como es describe posteriormente en la presente.

En la etapa 1030, para por lo menos uno de los primeros sitios, un primer número p de conteos del respectivo primero alelo T y un segundo número q de conteos del respectivo segundo alelo son determinados. En una modalidad, los conteos de los alelos fetal-específieos (el alelo T) y los alelos compartidos (el alelo A) en el plasma materno pueden ser determinados mediante una variedad de métodos, por ejemplo, pero no limitado PCR en tiempo real, PCR digital y secuenciación masivamente paralela.

En la etapa 1040, la concentración fraccional es calculada en base a los primeros y segundos números. En una modalidad, en una mujer embarazada con genotipo AA y el genotipo de su feto siendo- TA, la .concentración de ADN fetal fraccional (f) puede ser calculada usando la ecuación: f = 2 x p / (p+q) en donde p representa los conteos para el alelofetal-especifico (alelo T) y q representa los conteos para el alelo compartido por la madre y el feto (alelo A) .

En otra modalidad, mediante el uso de múltiples SNP informativos, la concentración fraccional de ADN fetal en plasma materno puede ser estimada con exactitud incrementada. Para el uso de los conteos de alelo con múltiples SNP (un total de n SNP) , la concentración fraccional de ADN fetal (f) puede ser calculada usando la ecuación: en donde p¿ representa los conteos para el alelo fetal-especifico para el SNPi informativo; q± representa los conteos para el alelo compartido por la madre y el feto para el S Pi informativo; y n representa el número total de SNP informativos. El uso de los conteos de alelos de múltiples SNP puede incrementar la exactitud de la estimación de la concentración de ADN fetal fraccional.

C. Concentración Fraccional Sin Información Genética Explícita de los Padres Ahora se describe un método para determinar la concentración de ADN fetal fraccional en una muestra, de plasma materno que no requiere información previa con respecto a los genotipos del feto y la madre. En una modalidad, se hace la identificación de SNP informativos de los conteos de diferentes alelos en estos sitios de SNP en plasma materno. Asi, el método 1000 puede ser usado, junto con la determinación de los SNP informativos en base a modalidades descritas posteriormente en la presente. Primero, se provee una descripción de probabilidades para ayudar a entender el cálculo de un corte que es usado para identificar SNP informativos.

En una modalidad, la probabilidad de detectar el alelo fetal-especifico sigue la distribución Poisson. La probabilidad (P) para detectar el alelo fetal-especifico puede ser calculada utilizando la siguiente ecuación: P = 1 -exp (-f x N/2), en donde f representa la concentración fraccional de ADN fetal en la muestra de plasma materna, N representa el número total de moléculas correspondientes a este sitio de SNP particular que es analizado; y exp ( ) representa la función exponencial. En un aspecto, P puede ser considerada una distribución esperada ya que no es una •distribución resultante de medir una cantidad de moléculas a través de muchas muestras. En otras modalidades, se pueden usar otras distribuciones.

Suponiendo que la concentración fraccional de ADN fetal es 5% (un valor típico para el embarazo de primer trimestre) y 100 moléculas (maternales + fetales) correspondientes a este sitio de SNP son analizadas (equivalente a la cantidad contenida en 50 genomas diploides) , la probabilidad de detectar el alelo fetal-específico (el alelo T) es 1 - exp(-0.05 x 100/2) - 0.92. La probabilidad de detectar el alelo fetal-específico se incrementaría con la concentración de ADN fetal fraccional y el número de moléculas que son analizadas para el sitio de SNP. Por ejemplo, si la concentración de ADN fetal es 10% y 100 moléculas son analizadas, la probabilidad de detectar el alelo fetal-específico es 0.99.

Por consiguiente, en un sitio de SNP para el cual la madre es homóciga, la presencia de un alelo diferente del materno uno en plasma materno puede indicar que el SNP es "informativo" para el cálculo de la concentración de ADN fetal fraccional. La probabilidad de perder cualquier SNP informativo puede ser dependiente del número de moléculas analizadas. En otras palabras, para cualquier confianza deseada de detectar los SNP informativos, el número de moléculas que necesitan ser analizadas para obtener una exactitud deseada puede ser calculado de acuerdo con la función de probabilidad de Poisson.

Utilizando el análisis anterior, algunas modalidades pueden determinar si un sitio es informativo o no cuando el genotipo de la madre no es conocido. En una modalidad, sitios en los cuales dos alelos diferentes son detectados en la muestra de plasma materno son identificados. Por ejemplo, para un sitio de SNP con dos alelos posibles A y T, ambos de los alelos A y T son detectados en el plasma materno.

La Figura 11 es un diagrama de flujo de un método 1100 para determinar si un sitio es informativo de acuerdo con modalidades de la presente invención. En una modalidad, el método 1100 puede ser usado para implementar la etapa 1020 del método 1000. En otra modalidad, una etapa del método 1100 es determinar un valor de corte en base a una distribución estadística y otro usa el valor de corte . para determinar si un sitio (SNP) es informativo.

En la etapa 1110, se determina un valor de corte. para un número de conteos predichos del primer alelo respectivo en el sitio especifico. En una implementación, el valor de corte predice si el genoma maternal es homócigo y el genoma fetal es heterócigo. En una modalidad, el valor de corte es determinado en base a una distribución estadística de números de conteos para diferentes combinaciones de homocigosidad y heterocigosidad en el sitio específico. Por ejemplo, una distribución de frecuencia alélica puede ser predicha utilizando la función de distribución de Poisson.

En la etapa 1120, en base a un análisis de las moléculas de ácido nucleico de la muestra materna (por ejemplo, de la etapa 1010), un primero alelo y un segundo alelo son detectados en el sitio. Por ejemplo, un conjunto de fragmentos podrían ser mapeados al sitio que es analizado y el primer alelo o el segundo alelo fue detectado. El primer alelo puede corresponder a un respectivo de los primeros alelos de la etapa 1020 y el segundo alelo puede corresponder a uno de los respectivos segundos alelos. En una modalidad, si dos alelos diferentes no son detectados, entonces se sabe que el sitio no es informativo.

En la etapa 1130, se determina un número de conteos reales del primer alelo respectivo en el sitio en base al análisis de las moléculas de ácido nucleico. Por ejemplo, resultados de secuenciación de la pluralidad de moléculas de ácido nucleico pueden ser contados para determinar el número de veces que un fragmento que tiene un genotipo del primer alelo es mapeado al sitio.

En la etapa 1140, el sitio es identificado como uno de los primeros sitios en base a una comparación del número de conteos reales con el valor de corte. En un aspecto, un valor de corte puede ser usado para diferenciar entre tres posibilidades: (a) la madre es homóciga (AA) y el feto es heterócigo (A) ; (b) la madre es heteróciga (A) y el feto es heterócigo (?) ; y (c) la madre es heteróciga (A) y el feto es homócigo para (AA) o (TT) . Por propósito de ilustración, los ejemplos a continuación suponen que el genotipo fetal es AA en el escenario (c) . Sin embargo, el cálculo seria el mismo si el genotipo del feto es TT . Un sitio informativo tendría la posibilidad (a) .

En una modalidad, el sitio es identificado como uno de los primeros sitios cuando el número de conteos reales es menor que el valor de corte. En otra modalidad, también se puede usar un umbral más bajo para asegurar que no se presente un mapeo espurio.

Ahora se describe una modalidad para determinar el corte. En base a la" concentración de ADN fetal fraccional fisiológicamente posible (esta información está disponible de estudios previos) y el número total de moléculas correspondientes al sitio de SNP, la distribución de los conteos alélicos puede ser predicha para los tres escenarios anteriores posibles. En base a la distribución predicha, un valor de corte puede ser determinado para interpretar los conteos alélicos observados en plasma materno para determinar si un SNP es "informativo" (esto es, escenario (a)) o no.

La concentración fraccional de ADN fetal varia comúnmente de 5% a 20% en embarazo temprano y varia de 10% a 35% en embarazo tardío (Lun et al., Micro fluidics digital PCR reveáis a higher than expected fraction of fetal DNA in maternal plasma. Clin Chem 2008; 54: 1664-72) . Así, en una modalidad, se determinaron las distribuciones predichas de los conteos alélicos para 5% y 20% de concentración fraccional de ADN fetal.

La Figura 12A muestra la distribución predicha de los conteos para el lelo T (el alelo menos abundante en escenarios (a) y (c) ) para los tres escenarios con una concentración de ADN fetal fraccional asumida del 20%. La Figura 12B muestra la distribución predicha de los conteos para el alelo T (el alelo menos abundante para escenarios (a) y (c) ) para los tres escenarios con la suposición de ADN fetal de 5%. En ambos modelos predichos, se supone que un total de 200 moléculas son analizadas para el sitio de SNP.

Utilizando la presencia de 40 conteos para el alelo menos abundante (el alelo T) como corte, las tres posibilidades pueden ser discriminadas estadísticamente. En otras palabras, para cualquier sitio SNP con dos alelos detectados en el plasma materno y con un total de 200 moléculas que son analizadas, si la frecuencia alélica del alelo menor (el alelo · menos abundante) es menor de 40, el sitio de SNP puede ser considerado como "informativo". Para concentraciones de ADN fetal . fraccional de 5% y 20%, la. diferenciación de SNP "informativos" (escenario (a) ) de los SNP para los cuales la madre es heteróciga (escenarios (b) y (c) ) seria 100% exacta.

En la práctica, el número total de moléculas detectadas puede ser diferente para diferentes SNP. Para cada' sitio SNP, una curva de distribución predicha especifico puede ser construida al tomar en cuenta el número total de moléculas detectadas en la muestra de plasma materno que cubre el sitio de SNP. En otras palabras, el conteo de corte para determinar si un SNP es informativo o no puede variar entre SNP y depende del número de veces que el sitio SNP ha sido contado.

La siguiente tabla muestra los conteos de alelos de tres sitios de SNP en plasma materno para una muestra · de plasma materna que fue secuenciada. Para cada uno de los tres SNP, dos diferentes alelos son detectados en la muestra de plasma materno. Los números totales de conteos detectados en plasma materno correspondientes a estos tres SNP son diferentes .

Las distribuciones predichas para los conteos del alelo menos abundante para una concentración de ADN fetal fraccional de 20% y diferentes conteos totales de moléculas correspondientes a un SNP son mostradas en las Figuras 13 A, 13B y 14. Las distribuciones predichas fueron extraídas utilizando una concentración de ADN fetal supuesta de 20% debido a que este representa el limite más alto de concentración de ADN fetal en el primer trimestre. Mientras más alta es la concentración de ADN fetal, se espera más superposición o traslape entre las curvas de distribución del alelo menor para el cual la madre es homóciga para el alelo mayor contra aquella cuando la madre es heteróciga. Asi, es más especifico derivar cortes para los conteos de alelo menor utilizando una concentración de ADN fetal más alta para la predicción de SNP informativos.

La Figura 13A muestra una distribución predicha para los conteos del alelo menos abundante con un número total de 173 moléculas y concentración de ADN fetal fraccional de 20%. En una modalidad, en base a esta distribución, un criterio de corte de menos ' de 40 para los conteos del alelo menos abundante puede ser apropiado para identificar los SNP informativos. Ya que los conteos para el alelo A es 10, el sitio no. 1 de SNP es considerado como "informativo" para el cálculo de la concentración de ADN fetal fraccional.

La Figura 13B muestra una distribución predicha para los conteos del alelo menos abundante con un número total de 121 moléculas y concentración de ADN fetal fraccional de 20%. En una modalidad, en base a esta distribución, un valor de corte de menos de 26 para los conteos del alelo menos abundante puede ser apropiado para identificar los SNP informativos. Ya que el número de conteos para el alelo T es 9, el sitio no. 2 de SNP es considerado como "informativo" para el cálculo de la concentración de ADN fetal fraccional.

La Figura 12 muestra una distribución predicha para los conteos del alelo menos abundante con un número total de 134 moléculas y concentración de ADN fetal fraccional de 20%. En una modalidad, en base a esta distribución, un valor de corte de menos de 25 para los conteos del alelo menos abundante puede ser apropiado para identificar los SNP informativos. Ya que el número de conteos para el alelo T es 62, el sitio no. 3 de SNP es considerado como "no informativo" y no será usado para el cálculo de · concentración fraccional de ADN fetal.

En algunas modalidades, utilizando la ecuación f = 2 x p / (p+q) , la concentración fraccional de ADN fetal puede ser calculada utilizando los conteos de alelos para SNP 1 y 2 y combinados. Los resultados son mostrados a continuación.

D. Determinación de Cobertura de Profundidad del Genoma Fetal Además de obtener una concentración fraccional, algunas modalidades pueden determinar un porcentaje cobertura del genoma fetal que el procedimiento analítico (por ejemplo, secuenciación) en la etapa 1010 ha llevado a cabo. En algunas modalidades, los sitios informativos pueden ser usados para determinar el porcentaje de cobertura. Por ejemplo, cualquiera de los ejemplos anteriores pueden ser usados. En una modalidad, se pueden usar sitios en los cuales el feto es un heterocigoto obligado. En otra modalidad, los sitios en los cuales el feto es determinado como heterocigo y la madre es homóciga puede ser usado (por ejemplo, utilizando el método 1100) .

Los fragmentos que han sido mapeados a los sitios informativos pueden ser usados para determinar una proporción de cobertura. En una modalidad, una proporción de sitios de la primera pluralidad de sitios en los cuales un primer alelo respectivo es detectado de los resultados de secuenciación es determinado. Por ejemplo, si el feto es TA en un sitio y la madre es AA en el sitio, entonces el alelo T debe ser detectado en los resultados de secuenciación si aquel sitio ha sido secuenciado. Asi, la proporción del genoma fetal que ha sido secuenciado de la muestra biológica puede ser calculada en base a esta proporción. En una modalidad, la proporción de los primeros sitios en donde el alelo fetal-especifico es observado puede ser tomada como el porcentaje de cobertura del genoma fetal. En otras modalidades, la proporción puede ser modificada en base a en donde los sitios están. Por ejemplo, un porcentaje de cobertura puede ser determinado para cada cromosoma. Como otro ejemplo, el porcentaje puede ser estimado a menos de la proporción si los primeros sitios no forman una buena representación del genoma. Como otro ejemplo, un intervalo podría ser provisto en donde la proporción es un extremo del intervalo. Mientras que un alto porcentaje, esto es, que se aproxima a 100%, significa cercano a cobertura completa del genoma fetal, la mayoría de las enfermedades genéticas pueden ser diagnosticadas con mucho menos del 100% de cobertura, por ejemplo 80% o 50% o menos.

VI. NINGUNA INFORMACIÓN PREVIA DE GENOMA MATERNAL Y PATERNAL En secciones previas, algunas modalidades han determinado un mapa genético de un feto (o una porción de un genoma fetal) cuando los haplotipos de la madre y los genotipos del padre son conocidos. Otras modalidades han mostrado que la concentración de ADN fetal fraccional puede ser determinada al analizar el ADN de plasma materno sin conocimiento previo acerca de los genotipos de la madre, el padre o el feto. En todavía otras modalidades, se describe ahora un método para determinar el mapa genético de un feto (o una porción de un genoma fetal) utilizando análisis de RHDO sin información previa de los genotipos/haplotipos maternales y paternales.

En una modalidad, se usará la información de haplotipos de de referencia (por ejemplo, gomunes o conocidos) de la población en la cual los padres pertenecen. Esta información puede ser usada para deducir los haplotipos maternales y paternales. Un ejemplo es usado para ilustrar el principio de este método. La información concerniente con tales haplotipos de referencia puede ser obtenida, por ejemplo, del sitio web del International HapMap Project (hapmap . ncbi . nlm. nih . gov/ ) .

Como parte de un ejemplo ilustrativo, supóngase que tres haplotipos de referencia (Hap A, Hap B y Hap C como se muestra en la Figura 15A) están presentes en la población. Cada uno de estos tres haplotipos consisten de 14 sitios de SNP y, para cada sitio, hay dos alelos posibles. En este ejemplo, el padre posee Hap B y Hap C mientras que la madre posee Hap A y Hap B, como se muestra en la Figura 15B. Este ejemplo supone que el feto hereda Hap A de la madre y Hap C del padre. Por consiguiente, el feto posee Hap A y Hap C, como se muestra en la Figura 15B.

La Figura 16 es una tabla de flujo de un método 1600 para determinar por lo menos parte de un genoma fetal cuando un conjunto de haplotipos de referencia son conocidos, pero los haplotipos paternales no son conocidos, de acuerdo con modalidades de la presente invención.

En la etapa 1610, la muestra materna puede ser analizada para identificar SNP en los cuales la madre es homóciga y el feto es heterócigo. Esté análisis se puede hacer de manera similar como una determinación de en donde un sitio es informativo, como se describe anteriormente. Asi, en una modalidad, se pueden usar los métodos 1000 y/o 1100. En otras modalidades descritas anteriormente, los genomas maternal y paternal pueden ser analizados para determinar información para efectuar el mapeo de genoma fetal.

La Figura 17 muestra un ejemplo de para determinar sitios informativos a partir del análisis de fragmentos de ADN de una muestra materna. Para cada uno de los 14 sitios, los conteos de los dos alelos para cada sitio son determinados. Los conteos de estos alelos pueden ser determinados, por ejemplo pero no limitado a, usar PCR en tiempo real, PCR digital y secuenciación masivamente paralela. Para cada uno de estos sitios, dos alelos diferentes serian detectados en el plasma materno. En contraste con aquellos SNP en los cuales la madre es heteróciga, la proporción de los dos alelos seria significativamente diferente. El alelo feto-especifico (el alelo que el feto hereda del padre) seria mucho menos abundante en comparación con el alelo maternal. Los sitios informativos 1710 son marcados en la Figura 17.

En la etapa 1620, uno o más alelos del haplotipo paternal heredado por el feto son deducidos. En una modalidad, cada uno de los sitios 1710 pueden ser usados para determinar el haplotipo paternal heredado Por ejemplo, ' el alelo paternal que el feto ha heredado puede ser identificado como el alelo fetal-especifico para los sitios 1720 debido a que el alelo fetal-especifico es el alelo mucho menos abundante que el alelo maternal en la muestra materna.

En la etapa 1630, los alelos paternales son comparados con los haplotipos de referencia para determinar el haplotipo heredado del padre. En ciertas modalidades, un número de haplotipos fetales posibles pueden ser deducidos, cada uno con su propia probabilidad. Uno o más de los haplotipos fetales más probables pueden luego ser usados para el análisis subsecuente o para diagnosis clínica.

En el ejemplo mostrado en la Figura 18, hay tres haplotipos posibles (Hap A, Hap B y Hap C) en la población. Del análisis del plasma maternal, cuatro SNP han sido identificados por ser homócigos para la madre y heterócigos para el feto, representando así los alelos paternales que el feto hereda. Los genotipos en estos cuatro SNP ajustan al patrón de Hap C. Por consiguiente, el feto ha heredado Hap C del padre, como se muestra en la Figura 19. En otras palabras, para todos los SNP dentro del mismo bloque de haplotipo, los alelos paternales que el feto ha heredado pueden ser deducidos.

En la etapa 1640, se pueden determinar los sitios (por ejemplo, SNP) en los cuales la madre es heteróciga. En una modalidad, el análisis de la muestra materna puede proveer SNP que la madre es heteróciga. Por ejemplo, en cada uno de estos SNP, dos alelos diferentes pueden ser detectados en el plasma materno. En contraste con los SNP en que la madre es homóciga y el feto es heterócigo que el alelo fetal-específico solamente contribuye con una pequeña proporción de los alelos totales en plasma materno, los conteos de los dos alelos serían similares a SNP en donde la madre es heteróciga. Así, el genotipo maternal completo para todos los sitios de SNP dentro del bloque de haplotipo podría ser determinado a partir del análisis de plasma materno, por ejemplo, como se muestra en la Figura 20.

En la etapa 1650, los haplotipos maternales son deducidos a partir de genotipos maternales de la etapa 1640 ¦ al comparar los genotipos en el sitio con la información de haplotipo de la población relevante. La Figura 21 muestra una modalidad para determinar los haplotipos maternales de los genotipos maternales y los haplotipos de referencia. En el ejemplo que es usado, la madre es homóciga para el alelo G en el .tercer sitio de SNP. Ya que solamente Hap A y Hap B satisfacen este criterio, esto indica que la madre tiene una de las tres combinaciones de haplotipo, es decir Hap A/HapA, Hap A/Hap B o Hap B/HapB. Además, ya que la madre es heteróciga para A y C para el primer SNP, se puede deducir que la madre tiene la combinación de haplotipo de Hap A/Hap B. En una modalidad, más de una posibilidad podría resultar y cada posibilidad podría ser probada en la etapa siguiente. A partir de los análisis anteriores, los haplotipos de la madre y el haplotipo que el feto hereda del padre han sido determinados. La Figura 22 muestra los haplotipos maternales determinados y el haplotipo heredado paternalmente.

En la etapa 1660-, el haplotipo maternal heredado por el feto es determinado a partir de los haplotipos maternales identific.ados en la etapa 1650 y el haplotipo heredado paternalmente identificado en la etapa 1630. Utilizando esta información, una modalidad puede usar el análisis de RHDO para determinar cual haplotipo maternal se hace pasar al feto. Un análisis de RHDO puede ser efectuado de acuerdo con cualquier modalidad descrita en la presente.

En una modalidad, para el análisis de RHDO el SNP, en los cuales la madre es heteróciga pueden ser divididos en dos tipos, es decir, Tipo Alfa y Tipo Beta (por ejemplo, como se muestra en la figura 23 y como se describe anteriormente) . Los SNP Tipo Alfa se refieren a aquellos sitios en donde el alelo paterno que se hace pasar al feto es idéntico al alelo materno ubicado en Hap A. Para SNP tipo Alfa, si el feto hereda Hap A de la madre, el alelo en Hap A seria sobre representado en el plasma materno. Por otra parte, si el feto hereda Hap de la madre los dos alelos maternales serian representados igualmente en el plasma materno.

Los SNP Tipo Beta se refieren a aquellos sitios en donde el alelo paterno que se hizo pasar al feto es idéntico al alelo maternal ubicado en Hap B. Para SNP Tipo Beta, si el feto hereda Hap de la madre, el alelo en Hap seria sobre representado en el plasma materno. Sin embargo, si el feto hereda Hap A de la madre, los dos alelos maternales serian representados igualmente en el plasma materno. Las sobre representación potencial de los alelos Hap o Hap B puede ser determinada utilizando análisis de RHDO.

En algunas modalidades, para aplicar el análisis de RHDO sobre una región particular sin información previa de los haplotipos maternales y genotipos paternales, una cobertura debe ser relativamente alta de los SNP dentro del bloque de haplotipo puede ser requerida, por ejemplo 200 moléculas correspondientes a un sitio de SNP pueden necesitar ser analizadas en una modalidad. Esta información puede ser obtenida mediante, por ejemplo pero no limitado a, PCR en tiempo real, PCR digital y secuenciación masivamente paralela. En una 'modalidad, secuenciación apuntada (por ejemplo, mediante una combinación de enriquecimiento objetivo y secuenciación masivamente paralela) puede ser usada para obtener información representativa e información cuantitativa no paralelizada de diferentes alelos dentro de la región apuntada. Un ejemplo a continuación describe la secuenciación apuntada. Por consiguiente este análisis de RHDO puede ser aplicado a datos de secuenciación apuntados mediante ADN de plasma materno para determinar cuales alelos/haplotipos maternales se hacen pasar al feto sin previa información con respecto a los genotipos/haplotipos parentales.

VII. DETECCION DE MUTACION DE NOVO Algunas modalidades pueden detectar una mutación que el feto ha adquirido. Una mutación del novo es una mutación que no se lleva a cabo por el padre o la madre, sino que es producida, por ejemplo, durante la gametogénesis ya sea del padre o la madre o ambos. Tal detección tiene utilidad clínica debido a que las mutaciones del novo juegan un papel significativo en provocar un número de enfermedades genéticas, por ejemplo, hemofilia A y acondroplasia .

La figura 24 es un diagrama de flujo que ilustra un método 2400 ' para identificar una mutación del novo en el genoma de un feto no nacido de una mujer embarazada. El feto tiene un padre y una madre que es la mujer embarazada y el padre tiene un genoma paternal con dos haplotipos y la madre tiene un genoma maternal con dos haplotipos, el .método comprende : En la etapa 2410, una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada son secuenciadas . Nótese que la muestra contiene una mezcla de ácidos nucleicos maternales y fetales.

En la etapa 2420, se identifica la ubicación de cada una de las moléculas de acido nucleico secuenciadas en el genoma humano. En una modalidad, el mapeo de las secuencias puede ser efectuada mediante secuenciación de un solo extremo o secuenciación de extremos apareados. En un aspecto, el mapeo al genoma humano para encontrar una ubicación no requiere una coincidencia exacta de cada uno de los nucleótidos para que un sitio sea encontrado.

En la etapa 2430, para cada uno de por lo menos una porción de los sitios, una secuencia materna y una secuencia paterna son determinadas en el sitio en cuestión. Por ejemplo, si 100 sitios son determinados en la etapa 2420 entonces los genomas maternales y paternales en estos 100 sitios pueden ser determinados. En una modalidad, la secuencias paternales son determinadas de una muestra del padre en contraposición a usar haplotipos de referencia como se describe anteriormente. Asi, una mutación no en un genoma de referencia podría todavía ser detectada. En varias modalidades, las secuencias maternales pueden ser obtenidas de una muestra que solamente incluye ADN maternal o pueden también ser obtenidas de la muestra biológica, por ejemplo, utilizando métodos descritos en la presente.

En la etapa 2440, se identifica una primera secuencia en la pluralidad de moléculas de acido nucleico que no esta presente en las secuencias maternales o paternales determinadas. En' una modalidad, una comparación de la primera secuencia con laS secuencias maternales o paternales determinadas requiere una coincidencia exacta. Así, si la coincidencia no es exacta, entonces se considera que la primera secuencia no esta presente en las secuencias maternales o paternales determinadas. De esta manera, aun mutaciones de novo ligeras pueden ser identificadas puesto que una mutación del novo puede ser solo un cambio de nucleótido individual. En otra modalidad, un cierto número de fragmentos de ADN que muestran la secuencia no maternal y no paternal son requeridos para que la secuencia sea considerada como mutación de novo. Por ejemplo, un corte de tres fragmentos de ADN podría ser usado para determinar si una secuencia, esto es, la mutación del novo, esta presente o no.

En la etapa 2450, se determina una primera concentración fraccional de la primera secuencia en la muestra biológica. Por ejemplo, el número de fragmentos de ADN que exhiben la primera secuencia podría ser expresado como una proporción de todos los fragmentos d e ADN detectados de aquel sitio.

En la etapa 2640·, se determina una segunda concentración fraccional de ácidos nucleicos fetales en las muestras biológicas utilizando una molécula de acido nucleico que el feto ha heredado de su padre y que esta presente en el genoma paternal, pero que no esta presente en el genoma maternal. Tal molécula de acido nucleico podría contener un primer alelo en un sitio en donde el padre es homócigo y la madre es también homociga pero para un alelo diferente y así el feto es un heterocigoto obligado. Sitios informativos como se describe anteriormente pueden ser usados para determinar la molécula de acido nucleico a usar para determinar la segunda concentración fraccional.

En otras modalidades, las segundas concentración fraccional puede ser determinada utilizando otros procedimientos, tales como el uso de análisis de PCR, análisis de PCR digital o análisis basados en espectrometría de masa, sobre el cromosoma . Y, un panel de polimorfismos genéticos, esto es, polimorfismos de un solo nucleótido o polimorfismos de inserción-cancelación (Lun FMF et al Clin Chem 2008; 54: 1664-1672) . Otra alternativa es usar uno o mas sitios genómicos que exhiben diferente metilación de ADN entre el feto y la madre (Poon LLM et al. Clin Chem 2002; 48:35-41; Chan KCA et al. Clin Chem 2006; 52:2211-2218; Patente estadounidense 6, 927,028).

En una modalidad, el estatus epigenetico diferente es reflejado por diferentes patrones de metilación de ADN. Los patrones de metilación de ADN diferentes pueden involucrar la familia del dominio de asociación de RAS ÍA(RASSFIA) o el gen de holocarboxilasa sintetasa (biotina -(propionil-coenzima-A-carboxilasa (ATP hidrolizante) ) ligasa) (HLCS) . La cantidad de fragmentos de ADN con el perfil de metilación de ADN fetal-especifico puede ser expresada como una proporción de todos los fragmentos de ADN que se originan del sitio metilado diferencialmente .

En la etapa 2470, la primera secuencia es clasificada como una mutación de novo si las primeras y segundas concentraciones fracciónales son aproximadamente las mismas. Una secuencia no maternal y no paternal que se originan errores en el proceso de análisis, por ejemplo, errores de secuenciación, es un evento aleatorio y tiene baja probabilidad de recurrencia. Por consiguiente, múltiples fragmentos de ADN que exhiben la misma secuencia no maternal y no paternal a cantidades similares con la concentración de ADN fraccional medida para la muestra son probables que sean una mutación de novo presente en el genoma fetal mas bien de haber surgido de error de secuenciación. En una modalidad, un valor de corte puede ser usado para determinar si las concentraciones fracciónales son las mismas. Por ejemplo, si las concentraciones están dentro de un valor especificado entre si, entonces la primera secuencia es clasificada como una mutación del novo. En varias modalidades, el valor especificado puede ser 5%, 10% o 15%.

EJEMPLOS I. EJEMPLO 1 Para ilustrar modalidades de la presente invención, el siguiente caso fue analizado. Una pareja, que acude a una clínica de obstetricia para la diagnosis prenatal de beta-talasemia fue reclutada. El padre era portador de la cancelación de 4 pb-CTTT de los codones 41/42 del gen de beta-globina humano. La madre embarazada era portadora de la mutación A—>G en el nucleótido -28 del gen de beta-globina humano. Muestras de sangre fueron tomadas del padre y la madre. Para la madre, la muestra de sangre fue tomada previo a la toma de muestras de Villus corionico (CVS) a doce semanas de gestación. Enseguida de la CVS, una porción fue almacenada para el experimento. EL objetivo de el experimentó era construir un mapa genético genoma amplio o determinar la secuencia genómica parcial o completa del feto mediante la secuenciación masivamente paralela de ADN de plasma materno. 1. Determinación de los geno-tipos párenteles El ADN fue extraído de los recubrimientos amarillos del padre y la madre y la muestra de CVS, . Estas muestras de ADN fueron sometidas a análisis mediante el sistema Affymetrix Genome-Wide Human SNP Array 6.0. Este sistema comprende 1.8 millones de marcadores genéticos, incluyendo ~900,000 polimorfismos de un solo nucleótido (SNP) y mas de ~950,000 sondas para la detección de variaciones del número de copia. El número absoluto y los porcentajes de SNP que muestran diferentes combinaciones de genotipo para el padre, madre y feto (CVS) son mostrados en la tabla de la figura 25 A.

Aunque el sistema Affymetrix fue usado en este ejemplo, en la práctica cualquier plataforma de genotipado conocida para aquellos de habilidad en el arte podrían ser usadas. Por supuesto, además del genotipado, el ADN de recubrimiento amarillo del padre y madre puede también ser sometido a secuenciación, ya sea en una base de genoma entero o para regiones genómicas seleccionadas. Además, cualquier fuente de ADN constitucional (por ejemplo, ADN de células bocal, ADN de folículo velloso, etc.) del padre y madre podría ser usado estableciendo los genotipos parentales.

La muestra de CVS fue analizada para proveer un estándar para comparación con el mapa genético fetal deducido del análisis de plasma materno. Además, para este experimento, el genotipo de la muestra de CVS puede también ser usado para construir el haplotipo de la madre para el análisis de RHDO. En este escenario, el uso del genotipo de CVS para tal propósito de construcción de haplotipo fue solamente usado por propósitos de ilustración. En una aplicación clínica de modalidades, el haplotipo materno puede ser construido por medio del análisis de otros individuos en la familia, por ejemplo, un brote previo, un hermano, los padres u otros parientes de la madre. Los haplotipos maternales de las regiones cromosomales de interés pueden también ser construidos mediante otros métodos bien conocidos para aquellos experimentados en el arte, algunos de los cuales son mencionados en la presente.

Para modalidades seleccionadas, el haplotipo del padre del feto no nacido a ser analizado podría también ser determinado. Esta información puede ser particularmente útil para dosificación de haplotipo relativa para regiones cromosomales en las cuales tanto el padre como la madre son heterócigos. 2. Secuenciacion Masivamente Paralela de ADN de plasma materno El ADN del plasma obtenido de la madre fue sometido a secuenciacion masivamente paralela utilizando la plataforma de analizador de genoma de Ilumina. La secuenciacion de extremos apareados de las moléculas de ADN del plasma fue efectuada. Cada molécula fue secuenciada en cada extremo por 50 pb, totalizando así 100 pb por molécula. Los dos extremos de cada secuencia fueron alineados al genoma humano de repetición-sin enmascarar (Hgl8 NCBI.36 downloaded from USCS http: //genome. ucsc.edu) using the SOAP2 program from the Beijing Genomics Institute at Shenzhen (soap.genomics.org.cn) (Lit R et al. Bioinformatics 2009, 25 (15) : 1996-7 ) . La tabla de la figura 25B, enlista la estadísticas de alineación de las primeras 20 celdas de flujo. Así, con 20 celdas de flujo, mas de 3, 932 billones de lectura fueron alineadas con el genoma humano de referencia. 1. Cálculo de las concentraciones de ADN fetal fraccional Como se menciona anteriormente la concentración fraccional de ADN fetal de la muestra de plasma materno puede ser calculada a partir de los datos- de secuenciación . Una manera fue administrar los SNP en los cuales el padre y madre fueron ambos homócigos, pero para diferentes alelos entre si. Para tales SNP, el feto seria un heterocigoto obligado para el alelo paternalmente-heredado y un alelo maternalmente-heredado. En una modalidad, cualquiera de los métodos de cálculo descritos en la sección V pueden ser usados. En este ejemplo, los cálculos fueron efectuados sobre los datos acumulativos a través de diferentes sitios genéticos polimórficos que sastisfacieron la configuración de genotipo parental (esto es, ambos padres siendo homócigos, pero para diferentes alelos) en diferentes cromosomas. Las concentraciones fracciónales de ADN fetal calculadas para SNP ubicados en diferentes cromosomas son enlistadas en la columna mas a la derecha de la figura 26. Como se puede ver de la tabla, las concentraciones fracciónales determinadas para SNP ubicados en diferentes cromosomas se correlacionan muy estrechamente entre si.

Como experimento de control de calidad, los SNP en los cuales la madre era homociga y el padre era heterócigo fueron también- investigados del análisis de Affymetrix SNP 6.0 de las muestras de cubiertas amarilla (columna media de la figura 26) . Se puede ver que a profundidad suficiente de secuenciación de ADN, las concentraciones de ADN fetal fracciónales medidas de este análisis fueron muy similares a aquellas medidas para SNP en los cuales tanto el padre como la madre fueron homócigos pero para diferentes alelos.

En una implementación, cuando se observo concordancia cercana de las concentraciones de ADN fetal fraccional de estos dos tipos de SNP, se podría concluir que se estaba cerca de completar la cobertura de secuenciación del genoma fetal. En un aspecto, a una profundidad menor de cobertura, las concentraciones de ADN fetal fraccional medidas para SNP en los cuales la madre era homociga y el padre era heterócigo serian mas altas que aquellas medidas para SNP en los cuales tanto el padre como la madre eran homócigos, pero para alelos diferentes. A tal profundidad de cobertura menor, la ausencia de un alelo parentalmente único de los resultados de secuenciación puede tener dos causas posibles: i) que el feto no haya heredado este alelo del padre y/o ii) que el feto haya heredado este alelo del padre, pero cuando este alelo estaba faltante de los resultados de secuenciación debido a que la profundidad de secuenciación no fue suficiente. 4A. Calculo del porcentaje de cobertura del genoma fetal También, como se menciona anteriormente, el porcentaje del genoma fetal que ha sido analizado mediante secuenciación de ADN de plasma materno podría ser determinado al mirar en el subconjunto de SNP en los cuales la madre y el padre eran ambos homócigos, pero para alelos diferentes. En esta familia, 45,900 SNP del arreglo de SNP 6.0 de Affymetrix pertenecían a este subconjunto. El porcentaje de cobertura del genoma fetal podría ser deducido al analizar los datos de secuenciación de ADN del plasma para ver en que porcentaje de este subconjunto de SNP podría un alelo fetal ser detectado mediante secuenciación.

La gráfica en la figura 27 A ilustra el porcentaje observado de SNP en este subconjunto en el cual un alelo fetal podría ser visto de los datos de secuenciación para la primeras 20 celdas de flujo analizadas. Así, un alelo fetal podría ser observado en 24 % de tales SNP. Este grado de secuenciación correspondía a más de 3,932 billones de lectura, cada una con 100 pb de secuencias. La gráfica en la figura 27 B muestra la cobertura versus el número de lecturas, en lugar de número de celdas de flujo. Con el incremento en el rendimiento de diferentes plataformas de secuenciación, se espera que el número de celdas de flujo o corridas que serian usadas o retenidas para generar este número de lecturas de secuencia o longitud de secuencias disminuiría en el futuro.

En algunas modalidades, ya que múltiples SNP fueron detectados en cada región cromosomal o cromosomas, la cobertura del genoma fetal podría ser mucho mas bajo que 94% mientras que todavía provee un mapeo de genomas exacto. Por ejemplo, supóngase que hay 30 SNP informativos en una región cromosomal, pero un alelo fetal es detectado para solamente 20 SNP de 30 SNP. Sin embargo, la región cromosomal puede todavía ser identificada exactamente con los 20 SNP. Así, en una modalidad, se puede obtener exactitud equivalente con una cobertura del menos del 94%. 4b. Cobertura de mapa genético de alelos que el feto ha heredado de su padre .

Este análisis ilustrativo se enfoca en alelos de SNP en los cuales el padre era heterócigo y la madre era homociga. En esta familia, 131, 037 SNP en la plataforma Affymetrix SNP 6.0 pertenecían a esta categoría. Un subconjunto de estos SNP consistían de los 65,875 SNP en los cuales la madre era homociga mientras que el padre y el feto eran ambos heterócigos. Con el uso de 20 celdas de flujo, los alelos heredados paternalmente podrían ser observados en 61,875 de estos SNP, indicando una cobertura del 93.9%. Este ultimo porcentaje se ajusta bien con los datos de porcentaje de cobertura deducidos en el párrafo previo. La correlación entre las coberturas de alelos heredados paternalmente y los números de secuencia mapeables y. el número de secuencias de celdas de flujo son mostrados en las figuras 28 A Y 28 B, respectivamente .

Para elucidar la especificidad de este procedimiento para detectar alelos fetales heredados paternalmente genuinos, los 65,162 (esto es, 131,037-65,785) SNP en los cuales el feto ha heredado alelos que fueron los mismos como aquellos poseídos por la madre fueron analizados. Para tales SNP, la detección aparente de alelos diferentes de aquellos poseídos por la madre representaría un positivo falso. Así, entre los 65,162 SNP, solamente 3,225 positivo falsos (4.95%) fueron observados cuando 20 celdas de flujo fueron analizadas. Estos positivos falsos pueden ser el resultado de errores de secuenciación o errores de genotipado del ADN del padre o madre o de mutaciones de novo en el feto. La correlación entre la proporción de positivos falsos y número dé celdas de flujo secuenciadas es mostrada en la figura 29 A.

Las proporciones de positivos falsos pueden también ser estimadas al considerar el subconjunto de SNP que tanto el padre y la madre eran homócigos y con el mismo alelo. La presencia de cualquier alelo alternativo en el sitio particular fue considerada a ser un positivo falso. Estos positivos falsos pueden ser el resultado de errores de secuenciación o errores de genotipado del ADN del padre o la madre o de mutaciones de novo en el feto. Habían 500, 673 SNP en este subconjunto. Con los datos de secuencia de 20 celdas de flujo, resultados positivos falsos fueron detectados en 48,396 SNP (9.67%). La correlación entre la proporción de positivos falsos y el número de celdas de flujos secuenciadas es mostrada en la figura 29 B. Esta proporción de positivos falsos fue mas alta que la estimación que utiliza el subconjunto de SNP que la madre y el feto eran homócigos y el padre era heterócigo. Esto es debido a que, en el ultimo subconjunto de SNP, solamente la presencia del alelo heredado paternalmente en plasma materno es considerado ser un positivo falso, mientras que en el subconjunto anterior, cualquier alelo diferente al alelo común compartido por el padre y madre es considerado como un resultado positivo falso .

La figura 30 muestra la cobertura de los SNP fetal-especificos para diferentes números de celdas de flujo analizadas. Los SNP que tanto el padre como la madre eran homócigos, pero con alelos diferentes, son incluidos en este análisis. El eje X son las veces de cobertura de los SNP fetal-especificos y el eje Y es el porcentaje de SNP con las veces de cobertura especificadas. Con el incremento en el número de celdas de flujo que son analizadas, el número promedio de veces de cobertura para los SNP fetal-especificos se incrementa. Por ejemplo, cuando una celda de flujo fue analizada, la cobertura promedio de SNP puede ser de 0.23 veces. El promedio de cobertura se incremento a 4.52 veces cuando 20 celdas de flujo fueron analizadas. 5. Exactitud de un mapa genético heredado de su madre La figura 31 muestra la exactitud del análisis tipo A cuando datos de 10 celdas de flujo fueron usados. La sección IIB describe modalidades de un análisis Tipo A y Tipo B (también denominado como alfa y beta) . La exactitud es por la determinación correcta de haplotipo que fue heredado de la madre. La exactitud es presentada separadamente para cada cromosoma .

Utilizando una proporción de probabilidad de 1,200 para el análisis de SPRT (Zhou et al.' Nat Biotechnol 2001; 19:78-81; Karoui NE et al. Statist ed 2006; 25:3124-33), la exactitud vario de 96% a 100%. Como se muestra, a un con tal alta proporción de probabilidad para clasificación de SPRT, un total de 2,760 segmentos a través de el genoma podrían ser clasificados. Este grado de resolución es eficiente para la mayoría de los propósitos, cuando se considera que recombinaciones meioticas toman lugar a la frecuencia de una a un número de dígitos individuales bajos por brazo de cromosoma por generación. Además, se podría ver que todas las malas clasificaciones podrían ser impedidas cuando se uso el procedimiento de entrelazamientos (lado derecho de la figura 31) . , Como se describe anteriormente, el procedimiento de entrelazamiento usa ambos análisis Tipo A y Tipo B.

La figura 32 muestra la exactitud del análisis Tipo B cuando datos de 10 celdas de flujo fueron usados. Utilizando una proporción de probabilidad de 1,200 para el análisis de SPRT, la exactitud vario de 94.1% a 100%. Todas las malas clasificaciones podrían ser impedidas cuando el procedimiento de entrelazamiento fue usado (lado derecho de la figura 32), como se observa en la figura 31.

La figura 33 muestra la exactitud del análisis Tipo A cuando se usaron datos de 20 celdas de flujo. Utilizando una proporción de probabilidad de 1,200 para el análisis de SPRT y el algoritmo de "dos bloques consecutivos", un total de 3,780 clasificaciones se hicieron y solamente 3 (0.01 %) clasificaciones fueron incorrectas.

La figura 34 muestra la exactitud de análisis Tipo B cuando se usaron los datos de 20 celdas de flujo. Utilizando una proporción de probabilidad de 1,200 para el análisis de SPRT y el algoritmo de "dos bloques consecutivos", hicieron un total de 3,355 clasificaciones y solamente -6 (0.2%) clasificaciones fueron incorrectas. En estos ejemplos, el SPRT es efectuado a través de un número de marcadores genéticos, tales como SNP.

II. DETERMINACION PRENATAL DE RIESGO DE BETA-TALASSEMI En una modalidad, para determinar el riesgo de que el feto tenga beta-talassemia (una enfermedad recesiva autosomal) se puede determinar si el feto ha heredado alelos mutantes portados por su padre y madre. En este caso mencionado anteriormente el padre es portador de la cancelación de 4 pb de -CTTT de los codones 41/42 del gen de beta-globina humano. La madre embarazada era portadora de la mutación A—»G en el nucleótido -28 del gen de beta-globina humano .

Para determinar si el feto ha heredado la mutación 41/42 de codones paternales, los datos de secuenciación del ADN de plasma materno, utilizando las primeras 10 celdas de flujo, fueron buscados en cuanto a esta mutación. Se encontraron un total de 10 lecturas con esta mutación (figura 35 A) . De aqui, el feto ha . heredado la mutación paternal. Además, se encontró que 62 lecturas contienen la secuencia tipo silvestre en los codones 41/42 (figura 35 B) . Asi, el porcentaje de las lecturas en esta región que contiene la mutación es de 0.01389. Esta cifra es muy cercana a la concentración de ADN fetal fraccional determinada en la figura 26. En una modalidad, el riesgo de que el feto herede la mutación paternal puede también ser determinado al elucidar su herencia de polimorfismos genéticos enlazados a mutación paternal.

En una modalidad, para determinar el riesgo de que el feto haya heredado la mutación -28 maternal se efectuó el análisis de RHDO. En esta familia la mutación -28 estaba localizada en el haplotipo IV mientras que el alelo Tipo Silvestre estaba localizado en el haplotipo III. Los resultados del análisis de RHDO Tipo A son . mostrados en la figura 36, mientras que aquellos del análisis de RHDO Tipo B son mostrados en la figura 37. En ambos tipos de análisis, la herencia fetal de haplotipo III de la madre fue deducida. En otras palabras, el feto ha heredado el alelo Tipo Silvestre de la madre. La diagnosis final del feto de que ha heredado la mutación 41/42 de codones del padre y un alelo tipo silvestre de la madre. Así, el feto es un portador heterócigo de beta-talassemia y asi debe ser clínicamente saludable.

III. ENRIQUECIMIENTO OBJETIVO Y SECUENCIACION Apuntada Como se discute en la secciones previas, la precisión de la estimación de la concentración de ADN fetal fraccional y la distribución del mapa genético deducido del análisis del ADN de plasma materno, puede depender de la profundidad de cobertura de los sitios de interés. Poe ejemplo, se ha demostrado que un total de 200 moléculas correspondientes a un sitio de SNP podrían ser requeridas para determinar, con alta exactitud, la concentración de ADN fetal fraccional sin información previa del genotipo materno. Los conteos' de alelos para un SNP en plasma materno pueden ser obtenidos por ejemplo pero no limitado a, PCR en tiempo real, PCR digital y secuenciación masivamente paralela.

Ya que la secuenciación masivamente paralela del ADN de plasma materno puede determinar simultáneamente conteos de alelos para millones de SNP a través de todo el genoma, es una plataforma ideal para el análisis de genoma a través de diferentes sitios. El formato básico de secuenciación masivamente paralela permite que diferentes-regiones dentro del genoma sean cubiertas a profundidades similares. Sin embargo, con el fin de secuenciar una región de interés particular a alta profundidad de secuenciación utilizando secuenciación masivamente paralela aleatoria. Las partes restantes del genoma (que no pretenden ser analizadas) tienen que ser secuenciadas a la misma extensión. Asi, este procedimiento podría ser costoso. Para mejorar la efectividad en el costo del procedimiento de secuenciación masivamente paralela, una manera es enriquecer la región objetivo antes de proceder a la secuenciación. La secuenciad apuntada puede ser efectuada mediante captura en fase de solución (Gnirke A, et al. Solution hybrid selection with ultra-long oligonucleótides for massively parallel targeted sequencing. NatBiotechnol 2009; 27:182-9), captura de microarreglo (por ejemplo utilizando la plataforma NimbleGen) o amplificación apuntada (Tewhey R et al. icrodroplet-based PCR enrichment for large-scale targeted sequencing. Nat Biotechnol 2009; 27:1025-31) .

La secuenciacion apuntada fue aplicada inicialmente para detectar variantes genéticas de población, por ejemplo para estudios de asociación genética. Por consiguiente, su aplicación- actual en investigación genómica esta apuntada a resolver problemas cualitativos (por ejemplo, genotipado o detección de mutación) . Sin embargo, la aplicación de secuenciacion apuntada en ADN de plasma materno para los propósitos de diagnosis prenatal no invasivo que involucra conciliaciones cuantitativas. La factibilidad de los cuales no ha sido clara. Por ejemplo, el uso de secuenciacion apuntada podría introducir polarización cuantitativa en la detección de ADN fetal maternal en el plasma materno. Además, los trabajos previos han demostrado que el ADN fetal es mas corto que el ADN maternal (Chan KCA et al. Size distributions of maternal and fetal DNA in maternal plasma. Clin Chem 2004; 50:88-92). Esta diferencia de tamaño podría también introducir polarización cuantitativa o eficiencia diferencial en la captura de ADN fetal y maternal en el plasma materno. Tampoco se tenía la seguridad acerca de la eficiencia mediante la cual tales moléculas de ADN fragmentadas podrían ser capturadas. En la siguiente descripción, se demuestra que la secuenciacion apuntada puede ser obtenida mediante enriquecimiento objetivo seguido por secuenciacion masivamente paralela. También se muestra que el enriquecimiento objetivo es una manera eficiente de estimar o la concentración de ADN fetal fraccional en comparación con la secuenciación de todo el genoma .

A. Determinación de Concentración Fraccional Utilizando Enriquecimiento Objetivo 1. Materiales y Métodos 'Cuatro mujeres embarazadas (M6011, M6028, M6029 y M6043) con fetos femeninos de singleton fueron reclutadas. Muestras de sangre periférica materna fueron recolectadas con tubos de sangre de EDTA antes de la sección de cesárea electiva en el tercer trimestre, mientras que las muestras de placenta fueron recolectadas después de sección de cesárea electiva. Después de la centrifugación, el ADN de las células de sangre periférica fue extraído utilizando el Mini Kit Blood (Qiagen) . El ADN de 2.4 mi de plasma fue extraído mediante el Mini Kit de sangre de ADN de DSP (Qiagen) . El ADN genómico maternal fue extraído de la cubierta o recubrimiento amarillo y el ADN genómico fetal fue extraído de tejidos placentales. Las muestras del tercer trimestre fueron usadas en este ejemplo por propósitos de ilustración solamente. Muestras de primero y segundo trimestre pueden igualmente ser usadas.

Los genotipos maternales y fetales fueron determinados mediante el Arreglo 6.0 de SNP Humano de Genoma Amplio (Affymetrix) . 5-30 ng de ADN de plasma para cada caso se usaron para la construcción de biblioteca de ADN mediante el kit de preparación de muestras de extremos apareados (Illumina) de acuerdo con el protocolo del fabricante de la preparación de muestra de Secuenciación por Inmunoprecipitación de Cromatina. El ADN adaptador-ligado fue purificado directamente utilizando columnas de centrifugación provistas en un kit de purificación de PCR QIAquick (Qiagen) , sin selección de tamaño adicional. El ADN adaptador-ligado fue luego amplificado utilizando una PCR de 15 ciclos con cebadores estándar. Los cebadores fueron cebador de PCR PE 1.0 y 2.0 de Illumina. Las bibliotecas de ADN fueron cuantificadas utilizando un espectrofotómetro NanoDrop ND-1000 (NanoDrop Technologies) y se hicieron correr en un bioanalizador 2100, utilizando un kit de ADN 1000 (Agilent) , para verificar la distribución de tamaño. 0.6-1 µg de la biblioteca de ADN de plasma amplificado fueron generados para cada muestra en un tamaño promedio de aproximadamente 290 bp. La biblioteca de captura fue obtenida de Agilent y cubrió 85% de los exones sobre el chrX humano (número de catálogo: 5190-1993) . Para todos los cuatro casos en este estudio, 500 ng de la biblioteca de ADN de plasma amplificado de cada caso fue incubado con las sondas de captura por 24 horas a 65 °C, de acuerdo con las instrucciones del fabricante. Después de la hibridización, los objetivos capturados fueron seleccionados al jalar hacia abajo los híbridos de sonda/objetivo biotinilados al utilizar perlas magnéticas recubiertas con estreptavidina (Dynal DynaMag-2 Invitrogen) y purificados con el kit de purificad de PCR inElute (Qiagen) . Finalmente, las bibliotecas de ADN apuntadas fueron enriquecidas mediante amplificación de PCR de 12 ciclos con cebadores PE de SureSelect GA de Agilent. Los productos de PCR fueron purificados mediante, el kit de purificación de PCR QIAquick (Qiagen) . Las bibliotecas de ADN preparadas con o sin enriquecimiento objetivo fueron luego sometidas a secuenciación masivamente paralela aleatoria utilizando el Illumina Genome Analyzer IIx. Un carril de secuenciación sobre una celda de flujo estándar fue usado para secuenciar cada biblioteca de ADN. 2. Concentración fraccional de ADN fetal sin enriquecimiento objetivo La concentración de ADN fetal fraccional puede ser calculada en base a los conteos de alelos de los SNP informativos (esto es, SNP que la madre es homóciga y el feto es heterócigo) . La tabla a continuación muestra que 120184, 1 10730, 107362 y 110321 SNP informativos fueron identificados en todo el genoma para los cuatro casos, mientras que 63, 61, 69 y 65 (respectivamente en el mismo orden de caso) cayeron dentro de la región apuntada sobre el cromosoma X. Sin el enriquecimiento objetivo, las concentración de ADN fetal fraccional fueron 33.4%, 31.3%, 29.2% y 34.4% en base a los datos de todos los SNP informativos en el genoma . 3. Comparación de muestras con y sin enriquecimiento ob etivo En algunas modalidades, la profundidad de cobertura de secuencia representó el número promedio de veces que cada base habría sido secuenciada en una región particular. En esta modalidad, se calculó la profundidad de secuencia de la región apuntada al dividir el número total de bases secuenciadas dentro de la región objetivo por la longitud de la región apuntada (3.05 b) . Para las regiones cubiertas por el kit de enriquecimiento, la cobertura de secuencia media fue 0.19 veces para las muestras no enriquecidas y 54.9 veces para las muestras enriquecidas, indicando una media de enriquecimiento de 289 veces. A esta profundidad de secuenciación, solamente el 4.0% de los alelos fetal-específicos dentro de la región apuntada fueron detectados antes del enriquecimiento objetivo (véase tabla posteriormente en la presente). En comparación, 95.8% de ellos se volvieron detectables después del enriquecimiento objetivo (véase tabla a continuación). Por consiguiente, el enriquecimiento objetivo incrementó extensamente la proporción de detección de alelos fetal-específieos dentro de la región apuntada.

Luego, se compararon las concentraciones de ADN fetal fraccional en base a los conteos de lectura de todos los SNP informativos dentro de la región apuntada para cada muestra, con y sin enriquecimiento. Sin enriquecimiento objetivo, el número de lecturas fetal-específicas varió de 0 a 6 para las cuatro muestras (véase tabla a continuación) . Debido a la baja cobertura de secuencia, una toma de muestras inapropiada de las moléculas de ADN fetal impediría una estimación exacta de la concentración de ADN fetal fraccional. Con enriquecimiento objetivo, un número mucho más grande de conteos de alelos fetal-específieos (511-776) y conteos de alelos compartidos (2570-3922) dentro de la región apuntada fueron observados (véase tabla a continuación) . Los porcentajes de ADN fetal fueron calculados como 35.4%, 33.2%, 26.1% y 33.0%, consistentes con los porcentajes de ADN fetal estimados por los datos de todo el genoma en las muestras no enriquecidas (véase tabla a continuación) . Estos resultados indican que las moléculas de ADN maternales y fetales fueron enriquecidas a una extensión similar dentro de la región apuntada .

B. Determinación de Genoma Fetal Utilizando Enriquecimiento Objetivo Una aplicación del método de RHDO es para la detección prenatal no invasiva de enfermedades genéticas heredadas maternalmente . Utilizando secuenciación masivamente paralela de plasma materno sin enriquecimiento objetivo, el análisis de RHDO puede determinar exactamente cual haplotipo maternal se hace pasar al feto con un promedio de 17 SNP cuando la profundidad de secuenciación del ADN de plasma materno es aproximadamente 65 veces la cobertura del genoma humano. Para mejorar the efectividad en el costo de este procedimiento, dirigir selectivamente la secuenciación a regiones especificas de interés dentro del genoma y luego aplicar un análisis de RHDO a los datos de secuenciación puede ser efectuado. Como un ejemplo, se demuestra el concepto utilizando la secuenciación apuntada y análisis de RHDO sobre el cromosoma X. Sin embargo, la secuenciación apuntada y análisis de RHDO pueden también ser aplicados a todos los cromosomas, por ejemplo los autosomas. En una modalidad, un análisis de RHDO como se describe anteriormente puede ser usado para las modalidades apuntadas.

Cinco mujeres embarazadas (PW226, PW263, PW316, PW370 y PW421) con fetos masculinos de singleton fueron reclutadas. Muestras de sangre periférica materna fueron recolectadas- en tubos de sangre de EDTA antes de la sobremuestra de villus coriónico en el primer trimestre. Después de la centrifugación, el ADN de las células de sangre periférica fue extraído utilizando el Mini Kit Blood (Qiagen) . El ADN de 3.2 mi de plasma fue extraído mediante el Mini Kit de sangre de ADN de DSP (Qiagen) . El ADN genómico maternal fue extraído de la cubierta amarilla y el y ADN genómico fetal fue extraído del vellos coriónicos. -Las muestras fueron preparadas, y analizadas como se describe anteriormente. Cada muestra fue luego secuenciada aleatoriamente utilizando un carril sobre una celda de flujo de Illumina.

En este ejemplo, se usó el genotipo fetal, junto con información de secuenciación de ácidos nucleicos de la madre, para deducir los haplotipos maternales de cromosoma X y deducir cual haplotipo fue heredado de la madre. Para cada SNP en el cromosoma X que la madre era heteróciga (esto es, un SNP informativo) , el alelo que fue heredado por el feto es definido como procedente del haplotipo 1 materno (Hap I) mientras que el alelo maternal que no se hizo pasar sobre el feto fue definido como procedente del haplotipo materno 2 (Hap II) . En algunas modalidades, para aplicaciones clínicas, el genotipo fetal puede no estar disponible de antemano y los haplotipos maternales pueden ser determinados o inferidos mediante métodos bien conocidos para aquellos experimentados en el arte y métodos descritos en la presente. El cromosoma X es usado en la presente por propósitos de ilustración solamente. Otros cromosomas, por ejemplo los autosomas, pueden también ser usados en tales análisis.

Para los cinco casos descritos en la presente, todos ellos eran portadores de un feto masculino de singleton. Ya que un feto masculino solamente hereda un cromosoma X de la madre pero ningún cromosoma X del padre, el cromosoma materno X que se hizo pasar al feto estaría sobrerepresentado en el plasma materno. El análisis de RHDO se llevó a cabo del pter a qter del cromosoma X. Partiendo con el SNP más cercano al pter del cromosoma X, el análisis de SPRT puede determinar si el alelo sobre Hap I o Hap II sobrerepresentado estadísticamente de manera significativa en el plasma materno. Si ninguno de los dos haplotipos fue significativamente sobrerepresentado estadísticamente, los conteos alélicos para el siguiente SNP pueden ser combinados para el análisis de SOPORTE adicional. SNP adicionales fueron combinados para análisis hasta que el proceso de SPRT identificó uno de los haplotipos como significativamente sobrerepresentado estadísticamente. El proceso de clasificación puede luego ser reiniciado en el siguiente SNP.

Las Figuras 38A y 38B muestran los resultados de clasificación de SPRT para el caso PW226 como ejemplo. Hubieron un total de nueve clasificaciones de SOPORTE exitosas tales como cromosoma X en este caso. Para cada clasificación de SPRT, los alelos sobre Hap I mostraron ser sobrerrepresentados en la muestra de plasma materno, indicando que el feto había heredado Hap I de la madre. Ya que se define que Hap I es el haplotipo que contiene los alelos que se hacen pasar al feto, los resultados de toda esta clasificación de SPRT fueron correctos.

Los resultados del análisis de RHDO para los cinco casos son resumidos en la Figura 39. El número de clasificaciones de SPRT exitosas vario de 1 a 9. Todas las clasificaciones de SPRT fueron correctas. Una concentración de ADN fetal fraccional más alta fue asociada con un número más alto de clasificaciones. Esto es debido a que el desequilibrio alélico debido a la presencia de ADN fetal puede ser detectado más fácilmente cuando la concentración fraccional de ADN fetal es más alta. Por consiguiente, menos SNP pueden ser necesarios para alcanzar una clasificación de RHDO exitosa. La(s) región (es) cromosomal definida (s) puede (n) asi ser dividida (s) en más bloques de RHDO. Los resultados confirman que el análisis de RHDO puede ser efectuado sobre los datos de secuenciación masivamente que son obtenidos después del enriquecimiento objetivo.

Los datos muestran adicionalmente que el procedimiento apuntado es una manera más efectiva en el costo para efectuar el análisis de RHDO. Sin enriquecimiento objetivo, para muestrás con concentraciones de ADN fetal similares, la secuenciación por aproximadamente 5 celdas de flujo (esto es 40 carriles de secuenciación) fue requerido (Figura 40) para alcanzar la profundidad promedio obtenida por las muestras mostradas en la Figura 39. Aquí se demuestra que con enriquecimiento objetivo, la secuenciación mediante solamente un carril ya alcanza la profundidad de secuenciación promedio de. algunas 15 a 19 veces para la clasificación de RHDO exitosa.

Alternativamente, un nivel de veces aún más alto de cobertura de secuenciación podría ser obtenido con relativamente poco costo adicional cuando se usa enriquecimiento objetivo. El nivel más alto de cobertura de secuenciación puede reducir efectivamente el tamaño de la región genómica requerida para la clasificación' de RHDO exitosa y de aquí mejora la resolución del análisis.

IV. ENRIQUECIMIENTO OBJETIVO Se ha sabido desde 2004 que las moléculas de ADN fetal circulantes son en general más cortas que el ADN maternal en el plasma materno (Chan KCA et al Clin Chem 2004; 50: 88-92; Li et al Clin Chem 2004). Sin embargo, la base molecular de esta observación sigue siendo sin resolver. En el estudio actual, se generaron 3.931xl09 lecturas en la muestra de plasma de estudio y se usaron ++++ 1-bp bines en nuestro análisis bioinformático . El tamaño de cada molécula de ADN de plasma secuenciada fue deducido de las coordenadas del genoma de los extremos de las lecturas de extremos apareados .

Para este análisis, se enfocó sobre polimorfismos de un solo nucleótido (SNP) .en los cuales el padre y madre fueron ambos homócigos, pero para un alelo diferente. Para tales SNP, el feto fue un heterocigoto obligado. El alelo para cada SNP que el feto habia heredado del padre podría ser usado como marcador fetal-especí fico . Los tamaños de las secuencias fetales (utilizando los alelos fetal-específieos heredados paternalmente) y secuencias totales fueron determinados para todo el genoma (Figura 41) e individualmente para cada cromosoma (Figura 42A-42C) .

Se observó que las diferencias más significativas entre el ADN fetal y maternal en el plasma materno es la reducción en el pico de 166 pares de bases, en relación con el pico de 143 pares de bases (Figura 41) . Las secuencias totales más abundantes (predominantemente maternales) fueron de 166 pares de bases de longitud. La diferencia más significativa en la distribución de tamaño entre el ADN fetal y total fue que el ADN fetal exhibió una reducción en el pico de 166 pares de bases (Figura 41) y una prominencia relativa del pico de 143 pares de bases. Los último probablemente correspondió al recorte de un fragmento de enlazador de -20 pares de bases de un nucleosoma a su partícula de núcleo de -146 pares de bases (Lewin B, en Gen IX, Jones and Bartlett, Sudbury, 2008, pp. 757-795) .

De aproximadamente 143 pb y menor, las distribuciones tanto de ADN fetal como de ADN total demostraron una periodicidad de 10 pb reminiscentes de los nucleosomas nucleasa-escindidos . Estos datos sugieren que los fragmentos de ADN del plasma son derivados del procesamiento enzimático apoptotico en contraste el análisis de tamaño de lecturas que se mapearon al genoma mitocondrial no enlazado a histonas no mostraron este patrón nucleosomal (figura 41) . Estos resultados proveen una explicación molecular previamente desconocida por la diferencia de tamaño conocidas entre el ADN fetal y ADN maternal utilizando cromosoma Y y marcadores genéticos polimórficos seleccionados (Chan KCA et al Clin Chem 2004; 50:88-92; Li et al Clin CHem 2004; 50:1002-1011; solicitud de patente estadounidense 20050164241; solicitud de patente estadounidense 20070202525) y muestran que tales diferencias de tamaño existen en todo el genoma. La explicación mas probable de esta diferencia es que las moléculas de ADN fetales circulantes consisten de mas moléculas en las cuales el fragmento de enlazador de ~20 pb ha sido reportado de un nucleosoma.

Dadas estas observaciones, hay un número de maneras en las cuales la muestra pude ser enriquecida por ADN fetal. En una modalidad se pueden usar reactivos que se enlazarían preferiblemente al fragmento de enlazador. Se esperaría que tales reactivos de enlace preferiblemente al ADN maternal-derivado, cuando se compara con el ADN fetal-derivado en plasma materno. Un ejemplo de tales reactivos es un anticuerpo. Un objetivo de tal anticuerpo es uno que se enlaza a histona Hl. Se sabe que histona Hl se enlaza al fragmento de enlazador. Una aplicación de tal anticuerpo es para efectuar enriquecimiento de ADN fetal mediante selección negativa, esto es, vía la inmunoprecipitacion preferencial del ADN maternalmente-derivado en plasma materno que contiene el enlazador, de fragmento que contiene histona Hl. Además, se sabe que Hl tiene un número de variantes, algunas de ellas exhiben variación tejido-específica en expresión (Sancho M et al PLoS Genet 2008; 4:el000227). Estas variantes podrían ser aprovechadas adicionalmente para diferenciar el ADN fetal (predominantemente placental) y maternal (predominantemente hematopoietico) (Lui YYN et al Clin Chem 2002:48:421-427). Por ejemplo, se puede apuntar a una variante de histona 1 que es predominantemente expresada mediante células trofoblasticas para preferible y positivamente seleccionar ADN fetal-derivado en plasma' materno. Esta estrategia puede ser aplicada para otras proteínas de histona u otras proteínas nucleosomales que exhiben patrones de expresión tejido-especifico, especialmente trofoblasto-especifico.

Dado el pico agudo de 166 pb para el ADN maternal, otra posibilidad para enriquecer ADN fetal es diseñar un sistema para la selección negativa de fragmentos de ADN que son de 166 ± pb de longitud. Por ejemplo, un sistema basado en electroforesis capilar o cromatografía liquida de alto desempeño podría permitir la medición de tamaño precisa y separación de moléculas de ADN. Otra manera para l selección negativa es hacer esto in silico durante el análisis bioinformatico de los datos de secuenciación .

Como otra especie de ADN en plasma, por ejemplo, ADN de tumor (Vlassov VV et al. Curr Mol Med 2010; 10:142-165) y ADN de órgano trasplantado (Lo YMD et al Lancet 1998; 351:1329-1330), también se espera que compartan tales elementos con ADN fetal en plasma materno, la estrategias enlistadas en (1) y (2) anteriores podría ser también usadas para el enriquecimiento de estas especies de ADN.

De acuerdo con una modalidad, un método para el enriquecimiento diferencial de especies de ADN en plasma humano b suero por medio de apuntamiento del fragmento de enlazador de nucleosomas es provisto. En una modalidad, el enriquecimiento se hace a remover uno de los siguientes: ADN maternalmente-derivado o ADN derivado de células hematopoieticas . En otra modalidad, el apuntamiento involucra un reactivo (tal como un anticuerpo u otra porción u otro tipo de proteínas) que se enlazaría presumiblemente a una proteína o componente de acido nucleico del fragmento de enlazador del nucleosoma. En otra modalidad, el reactivo de apuntamiento se enlazara selectivamente a histona Hl u otra proteína que se enlaza al fragmento de enlazador de nucleosoma. En otra modalidad, el reactivo de apuntamiento se enlazara a las variantes maternales o hematológicas de histona Hl u otra proteína que se enlaza al fragmento de enlazador del. nucleosoma. En una modalidad, la , remoción de ADN se lleva a cabo mediante inmunoprecipitacion o enlace a una superficie solida.

De acuerdo con otra modalidad, un método para el enriquecimiento diferencial de ADN fetal en plasma materno o suero incluye: a) el uso de un anticuerpo que se enlazaría a uno o mas componentes del fragmento de enlazador del nucleosoma; b) remover la fracción enlazada mediante inmunoprecipitacion o captura a una superficie solida; c) cosecha de la fracción sin enlazar que contiene una concentración fraccional incrementada de ADN fetal. Cualquiera de los componentes o funciones e elementos de programación descritos en esta solicitud pueden ser implementados como códigos de elementos de programación para ser ejecutados por un procesador utilizando cualquier lenguaje de computadora apropiado, tal como, por ejemplo Java, C++ o Perl, por ejemplo técnicas convencionales o técnicas orientada al objeto. Los códigos de elementos d programación pueden ser almacenados como una serie de instrucciones o comandos en un medio que se puede leer por computadora para almacenamiento y lo transmisión.

Medios apropiados incluyen memoria de acceso aleatorio (RAM) , memoria de solo lectura (ROM) medio magnético tal como una unidad de disco o un disco flexible o un medio óptico tal como un disco compacto (CD o DVD (Disco versátil digital )) memoria instantánea y los semejantes. El medio que se puede leer por computadora puede ser cualquier combinación de tales dispositivos de almacenamiento o transmisión.

Tales programas pueden también ser codificados y transmitidos utilizando señales portadoras aptas para la transmisión vía redes cableadas, ópticas y /o inalámbricas que se conforman a una. variedad de protocolos, incluyendo internet. Como tal, el medio que se puede leer por computadora de acuerdo con una modalidad de la presente invención, puede ser creado utilizando una señal de datos codificada con tales programas. Los medios que se puede leer por computadora codificados con los códigos del programa pueden ser empacados con un dispositivo compatible o provisto separadamente de otros dispositivos (por ejemplo, vía descarga de internet) . Cualquiera de tales medios que se pueden leer por computadora pueden recibir sobre o dentro de un solo producto de programa de computadora (por ejemplo una unidad de disco o todo un sistema de computadora) y puede estar presente sobre o dentro de diferentes productos de programa de computadora dentro de un sistema o red. Un sistema de computadora puede incluir un monitor, impresora u otra pantalla apropiada para proveer cualquiera de los mencionados en la presente a un usuario.

Un ejemplo de un sistema de computadora es mostrado en la figura 43. Los subsistemas mostrados en la figuras 43 son interconectados vía una linea principal de distribución del sistema 4375. Subsistemas adicionales tales como una impresora 4374, teclado 4378, disco fijo 4379, monitor 4376 que es acoplado al adaptador de pantalla 4382 y otros son mostrados. Dispositivos periféricos y dispositivos de entrada/salida (1/0) que acoplan al controlador de 1/0 4371, pueden ser conectados al sistema de computadora mediante cualquier número de medios conocidos en el arte, tal como el puerto serial 4377. Por ejemplo, el puerto serial 4377 o interface externa 4381 puede ser usado para conectar el aparato de computadora a una rede de área amplia tal como internet, un dispositivo de entrada de ratón o un escáner. La interconexión vía línea principal de sustitución del sistema permite que el procesador central 4373 se comunique con cada subsistema y controle la ejecución de instrucciones de memoria de sistema 4372 o el disco fijo 4379, también como el intercambio de información entre subsistemas. La memoria del sistema 4372 y/o en disco fijo 4379 pueden comprender un medio que se puede leer por computadora. Cualquiera de los valores mencionados en la presente pueden ser emitidos de un componente a otro componente y pueden ser emitidos al usuario.

Un sistema de computador puede incluir una pluralidad de los mismos componentes o subsistemas, por ejemplo conectados conjuntamente mediante la interface externa 4381 o mediante una interface interna. En algunas modalidades, los sistemas, subsistemas o aparatos de computadora se pueden comunicar en una red. En tales instancias, una computadora puede ser considerada un cliente y otra computadora un servidor, en donde cada una puede ser parte de un mismo sistema de computadora. Cada uno de un cliente y un servidor pueden incluir múltiples sistemas, subsistemas o componentes.

Los detalles específicos de modalidades particulares pueden ser combinados de cualquier manera apropiada o hacerse variar de aquellos mostrados y descritos en la presente sin desviarse del espíritu y alcance de las modalidades de la invención.

La descripción anterior de modalidades ejemplares de la invención se ha presentado por propósitos de ilustración y descripción. No pretende ser exhaustiva o limitar la invención a la forma precisa descrita y muchas modificaciones y variaciones son posibles a la luz de las enseñanzas' anteriores. Las modalidades fueron escogidas y descritas con el fin de explicar mejor los principios de la invención y sus aplicaciones practicas, para permitir mediante esto que otros experimentado s en el arte utilicen mejor la invención en varias modalidades y con varias modificaciones como sea apropiado al uso particular contemplado.

Todas las publicaciones, patentes y solicitudes de patente citadas en la presente son incorporadas en la presente para referencia en su totalidad para todos los propósitos.

Claims

REIVINDICACIONES :

1. Un método para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada, el feto tiene un padre y una madre que es la mujer embarazada y el padre tiene un genoma paternal con haplotipos paternales y la madre tiene un genoma maternal con haplotipos maternales, el método esta caracterizado porque comprende : analizar una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales y en donde el análisis de una molécula de acido nucleico incluye: identificar una ubicación de la molécula de acido nucleico en el genoma humano y determinar un alelo respectivo de la molécula de acido nucleico; determinar un alelo paterno heredado por el feto del padre en cada uno de una primera pluralidad de sitios, en donde el genoma maternal es heterócigo en la primera pluralidad de sitios; determinar cada uno de dos haplotipos maternales de la primera pluralidad de sitios; en base a los alelos determinados de las moléculas de acido nucleico, un sistema de computadora determina cantidades de alelos respectivos en cada uno de la primera pluralidad de sitios; comparar cantidades relativas de los respectivos alelos de las moléculas de acido nucleico en mas de un sitio de la primera pluralidad de sitios y en base a la comparación, determinar cual de los dos haplotipos maternales es heredado por el feto no nacido de la madre en la porción del genoma cubierta por la primera pluralidad de sitios.

2. El método de la reivindicación 1, caracterizado porque las cantidades relativas, incluyen la distribución de tamaño de las moléculas de acido nucleico.

3. El método de la reivindicación 1, caracterizado porque la determinación de cada uno de los dos haplotipos maternales de la primera pluralidad de sitios esta basada en el análisis de la pluralidad de moléculas de acido nucleico de una muestra biológica.

4. El método de la reivindicación 1, caracterizado porque la determinación del alelo heredado del padre en el cada uno de la primera pluralidad de sitos incluye: determinar una segunda pluralidad de sitios del genoma paternal que son heterócigos y en donde el genoma maternal es homócigo en la segunda pluralidad de sitios; identificar, en la pluralidad de moléculas de acido nucleico, alelos que están presentes en el genoma paternal en sitios respectivos de la segunda pluralidad de sitios y ausentes en el genoma materno; identificar el haplotipo paternal heredado como el haplotipo con los alelos identificados y · usar el haplotipo paternal heredado para determinar el alelo heredado del padre en la primera pluralidad de sitios.

5. El método de la reivindicación 1, caracterizado porque la determinación de cada uno de los dos haplotipos maternales de la primera pluralidad de sitios incluye: identificar los alelos del genoma maternal en uno o mas de la primera pluralidad de sitios en base a las cantidades de los alelos respectivos determinados de las moléculas de acido nucleico en un sitio respectivo; identificar una pluralidad de haplotipos de referencia y comparar los alelos identificados del genoma maternal con los alelos en los sitios correspondientes de la pluralidad de haplotipos de referencia para identificar los dos haplotipos maternales.

6. El método de la reivindicación 5, caracterizado porque la determinación de cada uno de los dos haplotipos maternales de la primera pluralidad de sitios incluye además: comparar respectivamente un alelo identificado del genoma maternal con la pluralidad de haplotipos de referencia hasta que cada uno de los dos haplotipos maternales son identificados de manera única.

7. El método de la reivindicación 1, caracterizado porque la determinación del alelo heredado del padre en cada uno de la primera pluralidad de sitios esta basada, en el análisis de la pluralidad de moléculas de acido nucleico de una muestra biológica y en donde la determinación del alelo heredado del padre en cada uno de la primera pluralidad de sitios incluye: determinar una segunda pluralidad de sitios en los cuales el genoma fetal es heterocigo y el genoma maternal es homócigo; determinar el alelo heredado del padre en cada uno de la segunda pluralidad de sitios al: determinar las cantidades relativas de los alelos respectivos determinados de las moléculas de acido nucleico en el sitio respectivo de la segunda pluralidad y identificar el alelo que tiene la cantidad relativa misma como siendo el alelo heredado en el sitio respectivo; identificar una pluralidad de haplotipos de referencia; utilizando los alelos heredados del padre en cada uno de la segunda pluralidad de sitios para determinar cual de los haplotipos de referencia es heredado del padre, el haplotipo determinado que incluye la primera pluralidad de sitios y determinar los alelos heredados del padre en la primera pluralidad de sitios del haplotipo determinado por ser heredado del padre.

8. El método de la reivindicación 7, caracterizado porque la determinación de cual de los haplotipos de referencia es heredado del padre incluye: comparar respectivamente los alelos determinados por ser heredados del padre en cada uno de la segunda pluralidad de sitios con los alelos en los sitios correspondientes de la pluralidad de haplotipos de referencia hasta que el haplotipo de referencia heredado del padre es identificado de manera única.

9. El método de la reivindicación 1, caracterizado porque la determinación de un sitio especifico por ser uno de la segunda pluralidad de sitios en los cuales el genoma fetal es heterocigo y el genoma maternal es homócigo incluye: determinar un valor de corte para un número de conteos predichos de alelos en el sitio especifico, el valor de corte predice si el genoma maternal es homócigo y el genoma fetal es heterocigo, en donde el valor de corte es determinado en base a una distribución estadística de números de conteos para diferentes combinaciones de homócigocidad y heterócigocidad en el sitio especifico. en base al análisis de las moléculas de acido nucleico de la muestra biológica, detectar un primer alelo y un segundo alelo de un sitio especifico; determinar un número de conteos reales del primer alelo en base a la secuenciación de la pluralidad de moléculas de acido nucleico de la muestra biológica y determinar que el genoma fetal es heterócigo para el primer alelo y un segundo alelo y el genoma maternal es hoomocigo para el segundo alelo cuando el número de conteos reales es menor que el valor de corte.

10. El método de la reivindicación 9, caracterizado porque la distribución estadística es dependiente de la concentración fraccional de moléculas de acido nucleico de la muestra de la que son derivados del feto.

11. El método de la reivindicación 10, caracterizado porque la distribución estadística es dependiente además del número de la pluralidad de moléculas de acido nucleico correspondientes a la pluralidad de un sitio especifico.

12. El método de la reivindicación 1, caracterizado porque la determinación del alelo heredado del padre en cada uno de la primera pluralidad de sitios incluye: determinar una segunda pluralidad de sitios del genoma paternal que son homócigos al analizar el genoma paternal, en donde la primera pluralidad de sitios es la segunda pluralidad de sitios; determinar el alelo del genoma paternal en cada uno de la primera pluralidad de sitios y asignar a los alelos respectivos en la primera pluralidad de sitios por ser alelos heredados del padre.

13. El método de la reivindicación 1, caracterizado porque el análisis de una molécula de acido nucleico incluye implementar sobre por lo menos una porción de las moléculas de acido nucleico por lo menos una técnica seleccionada del grupo que consiste de secuenciación masivamente paralela, micro arreglo, hibridizacion, PCR, PCR digital y espectrometría de masas.

14. El método de la reivindicación 1, caracterizado porque comprende además: para cada uno de un primer subconjunto de sitios vecinos de la primera pluralidad de sitios, determinar cual haplotipo es heredado por el feto no nacido de la madre para una primera sección genómica que incluye el primer subconjunto de sitios vecinos, en donde la determinación de cual haplotipo incluye: a) determinar una primera cantidad de alelos respectivos determinados de las moléculas de acido nucleico que coinciden con uno de los dos haplotipos maternales para determinar el subconjunto de sitios consecutivos; b) determinar una segunda cantidad de alelos respectivos determinados de las moléculas de acido nucleico que coinciden con el otro de los dos haplotipos maternales para el primer subconjunto de sitios consecutivos y c) determinar el haplotipo heredado para la primera sección genómica en base a una comparación de la primera cantidad con la segunda cantidad.

15. El método de la reivindicación 14, caracterizado porque la comparación de la primera cantidad con la segunda cantidad utiliza una prueba de proporción de probabilidad secuencial.

16. El método de la reivindicación 14, caracterizado porque la determinación de la primera cantidad y la segunda cantidad son ambas efectuadas secuencialmente con respecto las ubicaciones del primer subconjunto de sitios vecinos .

17. El método de la -reivindicación 14, caracterizado porque el primer subconjunto de sitios vecinos es dividido además en dos subgrupos, en don el primer subgrupo consiste de sitios para los cuales los genotipos del padre coinciden los genotipos constituyentes de un haplotipo de la madre y el segundo subgrupo consiste de sitios para los cuales los genotipos del padre coinciden los genotipos constituyentes de un segundo haplotipo de la madre y en donde (a) (c) son efectuadas individualmente para los dos subgrupos, el método comprende además : determinar el haplotipo heredado para la primera sección genómica en base a los resultados de (c) para estos dos subgrupos.

18. El método de la reivindicación 1, caracterizado porque comprende además: determinar que el feto ha heredado una mutación de la madre al: analizar el haplotipo de la madre que fue heredado por el feto y identificar la mutación en el haplotipo heredado.

19. El método de la reivindicación 1, caracterizado porque el análisis de una pluralidad de moléculas de acido nucleico de la muestra biológica incluye: enriquecer la muestra biológica por acido nucleicos en una región objetivo de un genoma -y/o preferiblemente secuenciar ácidos nucleicos en la región objetivo y en donde una primera pluralidad de sitios están en la región objetivo.

20. El método de la reivindicación 19, caracterizado porque la región objetivo es identificada por contener un alto número de sitios informativos.

21. El método de la reivindicación 19, caracterizado porque la secuenciación solamente secuencia ácidos nucleicos en la región objetivo.

22. Un método para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada, el feto tiene una padre y una madre que es la mujer embarazada y el padre tiene un genoma paternal con haplotipos paternales y la madre tiene un genoma maternal con haplotipos maternales, el método esta caracterizado porque comprende: analizar una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales y en donde el análisis de una molécula de acido nucleico incluye: identificar una ubicación de la molécula de acido nucleico en el genoma humano y determinar un alelo respectivo de la molécula de acido nucleico; determinar una primera pluralidad de sitios del genoma paternal que son heterócigos, en donde el genoma paternal es obtenido del padre del feto no nacido y en donde el genoma maternal es homócigo en la primera pluralidad de sitios y en base a los alelos respectivos determinados en la primer pluralidad de sitios, un sistema de computadora que determina el haplotipo que es heredado por el feto no nacido del padre en la porción del genoma cubierto por la primera pluralidad de sitios.

23. El método de la reivindicación 22, caracterizado porque la determinación del haplotipo que es heredado por el feto no nacido del padre incluye: identificar en la pluralidad de moléculas de ácidos nucleicos alelos que están presentes en el genoma paternal en respectivos sitios de la primera pluralidad de sitios y ausentes en el genoma maternal y identificar el haplotipo paternal heredado como el haplotipo con los alelos identificados.

24. El método de la reivindicación 1, caracterizado porque comprende además: determinar que el feto ha heredado una mutación del padre al : analizar el haplotipo del padre que fue heredado por el feto y identificar la mutación en el haplotipo heredado.

25. Un método para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazad, el feto tiene un padre y una madre que es la mujer embarazada y el padre tiene un genoma paternal con haplotipos paternales y la madre tiene un genoma maternal con haplotipos maternales, el método esta caracterizado porque comprende: determinar una primera pluralidad de sitios del genoma paternal que son heterócigos, en donde el genoma paternal es obtenido del padre del feto no nacido y en donde el genoma maternal obtenido de la madre del feto no nacido es también heterócigo en la primera pluralidad de sitios y en donde cada uno de dos haplotipos paternales y cada uno de dos haplotipos maternales en la primera pluralidad de sitios son conocidos ; determinar uno o mas segundos sitios del genoma paternal que son heterócigos, en donde el genoma maternal es homócigo en los segundos sitios y en donde la primera pluralidad de sitios y los segundos sitios están en el mismo cromosoma; analizar una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales y en donde el análisis de una molécula de acido nucleico incluye: identificar una ubicación de la molécula de acido nucleico en el genoma humano y determinar un alelo respectivo de la molécula de acido nucleico; determinar cual de los dos haplotipos paternales ha sido heredado por el feto al analizar los alelos respectivos determinados de la pluralidad de moléculas de acido nucleico de la muestra biológica en por lo menos uno de los segundos sitios; un sistema de computadora que compara cantidades relativas de los · alelos respectivos determinados de las moléculas de acido nucleico en mas de un sitio de la primera pluralidad de sitos y en base al haplotipo paternal determinado por ser heredado por el feto y en base a la comparación de las cantidades relativas, determinar el haplotipo que es heredado por el feto no nacido de la madre como la porción del genoma cubierta por la primera pluralidad de sitios.

26. Un método para determinar por lo menos una porción del genoma de un feto no nacido de una mujer embarazada, el feto tiene un padre y una madre que es la mujer embarazada y el padre tiene un genoma paternal con haplotipos paternales y la madre tiene un genoma maternal con haplotipos maternales, el método esta caracterizado porque comprende : Analizar una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales y en donde el análisis de una molécula de acido nucleico incluye: identificar una ubicación de la molécula de acido nucleico en el genoma humano y determinar un alelo respectivo de la molécula de acido nucleico; determinar una primera pluralidad de sitios en los cuales el genoma fetal es heterócigo y el genoma maternal es homócigo; un sistema de computadora que determina un alelo heredado del padre en cada uno de la primera pluralidad de sitios al: determinar cantidades relativa del alelo respectivo determinado de las moléculas de acido nucleico en el respectivo sitio de la segunda pluralidad y identificar el alelo que tiene la cantidad relativa mínima como siendo el alelo heredado en el sitio respectivo; identificar una pluralidad de haplotipos de referencia y usar los alelos heredados del padre en cada uno de la primera pluralidad de sitios para determinar cual de los haplotipos de referencia es heredado del padre en la porción del genoma cubierta por la primera pluralidad de sitios.

27. El método de la reivindicación 26, caracterizado porque la determinación de cual de los haplotipos de referencia es heredado del padre incluye: Comparar repetidamente los alelos determinados por ser heredados del padre en cada uno de las segundas pluralidad de sitios con los alelos en los sitios correspondientes de la pluralidad de haplotipos de referencia hasta que el haplotipo de referencia heredado del padre es identificado de manera única.

28. El método de la reivindicación 26, caracterizado porque la determinación de un sitio especifico por ser uno de la primera pluralidad de sitios en los cuales del genoma fetal es heterócigo y el genoma maternal es homócigo incluye: determinar un valor de corte para un número de conteos predichos de un alelo en el sitio especifico, el valor de corte predice si el genoma maternal es homócigo y el genoma fetal es heterócigo, en donde el valor de corte es determinado en base a una distribución estadística de números de conteos para diferentes combinaciones de homócigocidad y heterócigocidad en el sitio especifico; en base al análisis de las moléculas de acido nucleico de la muestra biológica, detectar un primer alelo y un segundo alelo en el sitio especifico; determinar un número de conteos reales de un primer alelo en base a la secuenciación de la pluralidad de moléculas de acido nucleico de la muestra biológica y determinar que el genoma fetal es heterócigo para el primer alelo y un segundo alelo y el genoma maternal es homócigo para el segundo alelo cuando el número de conteos reales es menor que el valor de corte.

29. Un método para identificar una mutación de novo en el genoma de un feto no nacido de una mujer embarazada, el feto tiene un padre y una madre que es la mujer embarazada, el método esta caracterizado porque comprende: recibir resultados de secuenciación de una secuenciación de una pluralidad de moléculas de acido nucleico de una muestra biológica obtenida de la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales; identificar la ubicación de cada una de las moléculas de acido nucleico secuenciadas por él genoma humano; para cada una de por lo menos una porción de los sitios, determinar una secuencia maternal y una secuencia paternal en el sitio; un sistema de computadora que identifica una primera secuencia en la pluralidad de moléculas de acido nucleico que no esta presente en las secuencias maternales o paternales determinadas; determinar una primera concentración fraccional de la primera secuencia en la muestra "biológica; determinar una segunda concentración fraccional de ácidos nucleicos fetales en la muestra biológica utilizando una segunda secuencia que el feto ha heredado de su padre y que esta presente en el genoma paternal pero que no esta presente en el genoma maternal y clasificar la primera secuencia como una mutación de novo si las primeras y segunda concentraciones fracciónales son aproximadamente la misma.

30. El método de la reivindicación 29, caracterizado porque el segundo está presente en el cromosoma Y o es un polimorfismo genético o es un polimorfismo de un solo nucleótido o es un polimorfismo de inserción-cancelación.

31. Un método para identificar una mutación de novo en el genoma de un feto no nacido de una mujer embarazada, el feto tiene un re y una madre que es la mujer embarazada, el método está caracterizado porque comprende: recibir resultados de secuenciación de una secuenciación de una pluralidad de moléculas de ácido nucleico de una muestra biológica obtenida de la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales; identificar un sitio de cada molécula de ácido nucleico secuenciada en el genoma humano; para cada uno de por lo menos una porción de los sitios, determinar una secuencia maternal y una secuencia paternal en el sit.io; un sistema de computadora que identifica una primera secuencia en la pluralidad de moléculas de ácido nucleico que no están presentes en las secuencias maternales o paternales determinadas; determinar una primera concentración fraccional de la primera secuencia en la muestra biológica; . determinar una segunda concentración fraccional de ácidos nucleicos fetales en la muestra biológica utilizando una molécula de ácido nucleico que exhibe un estatus epigenético diferente entre los ácidos nucleicos fetal— derivados y maternal-derivados en la muestra biológica; y clasificar la primera secuencia como una mutación de novo si las primeras y segundas concentraciones fracciónales son aproximadamente las mismas.

32. El método de la reivindicación .31, caracterizado porque el estatus epigenético diferente es reflejado por diferentes patrones de metilación de ADN.

33. El método de la reivindicación 32, caracterizado porque los diferentes patrones- de metilación de ADN involucran la familia 1A del dominio de asociación de RAS (RASSF1A) o el gen de holocarboxilasa sintetasa (biotina-(propionil-coenzima A-carboxilasa (ATP-hidrólisis) ) ligasa (HLCS) .

34. Un método para determinar la concentración fraccional de ADN fetal en una muestra biológica tomada de una mujer embarazada, el feto tiene . un padre y una madre que es la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales, el método está caracterizado porque comprende: analizar una pluralidad de moléculas de ácido nucleico de la muestra biológica, en donde el análisis de una molécula de ácido nucleico incluye: identificar una ubicación de la molécula de ácido nucleico en el genoma humano; y determinar un alelo respectivo de la molécula de ácido nucleico; un sistema de computadora que determina uno o más primeros sitios, en donde el · genoma fetal es heterócigo en cada .primer sitio, de tal manera que el genoma fetal tiene un respectivo primero y segundo alelo en aquel primer sitio y en donde un genoma maternal es homócigo en cada primer sitio, de tal manera que el genoma maternal tiene dos de los segundos alelos respectivos en aquel primer sitio, el primer alelo es diferente que el segundo alelo, en donde la determinación de un sitio especifico por ser el uno o más primeros sitios incluye: determinar un valor- de corte para un número de conteos predichos del primer alelo respectivo en el sitio especifico, el valor de corte predice si el genoma maternal es homócigo y el genoma fetal es heterócigo, en donde el valor de corte es' determinado en base a la distribución estadística de números de conteos para diferentes combinaciones de homócigocidad y heterocigosidad en el sitio específico; en base al análisis de la pluralidad de moléculas de ácido nucleico, detectar el respectivo primer alelo y el respectivo segundo alelo en el sitio especifico; determinar un número de conteos reales del primer alelo respectivo en base al análisis de la pluralidad de moléculas de ácido nucleico de la muestra biológica; y determinar que el sitio especifico es uno de los primeros sitios cuando el número de conteos reales es menor que el valor de corte; para por lo menos uno de los primeros sitios: determinar un primer número P de conteos del primer alelo respectivo y un segundo número Q de conteos del segundo alelo respectivo; y calcular la concentración fraccional en base a los primeros y segundos números.

35. El método de la reivindicación 34, caracterizado porque la concentración fraccional es determinada como 2xp/ (p+q) .

36. El método de la reivindicación 34, caracterizado porque P y Q son determinados para una pluralidad de primeros sitios y en donde la concentración fraccional f es determinada como en donde pi es el primer número del i-ésimo primer sitio y qi es el segundo número para el i-ésimo primer sitio.

37. El método de la reivindicación 34, caracterizado porque la determinación del valor de corte incluye determinar una distribución estadística para una concentración fraccional máxima y una concentración fraccional mínima.

38. Un método para determinar una proporción de un genoma fetal que ha sido secuenciado de una muestra biológica tomada de una mujer embarazada, el feto tiene un padre y una madre que es la mujer embarazada, en donde la muestra contiene una mezcla de ácidos nucleicos maternales y fetales, el método está caracterizado porque comprende: recibir resultados de secuenciación de una secuenciación de una pluralidad de moléculas de ácido nucleico de la muestra biológica obtenida de la mujer embarazada; analizar los resultados de secuenciación, el análisis para una molécula de ácido nucleico incluye: identificar la ubicación de la molécula de ácido nucleico en el genoma humano; y determinar un alelo respectivo de la molécula de ácido nucleico; determinar una primera pluralidad de sitios, en donde el genoma fetal es heterócigo en cada sitios de la primera pluralidad, de tal manera que el genoma fetal tiene un respectivo primero y segundo alelo en aquellos sitios y en donde el genoma maternal es homócigo en cada sitio de la primera pluralidad de tal manera que el genoma maternal tiene dos de los respectivos segundos alelo en aquel sitio, el primer alelo es diferente del segundo alelo; un sistema de computadora que determina una proporción de sitios de la primera pluralidad de sitios en los cuales un respectivo primer alelo es detectado de los resultados de secuenciación; y en base a esta proporción, determinar la proporción del genoma fetal que ha sido secuenciado de la muestra biológica.

39. El método de la reivindicación 38, caracterizado porque la determinación de la primera pluralidad de sitios incluye: determinar que el genoma paternal es homócigo para el respectivo primer alelo en cada sitio de la primera pluralidad y determinar que el genoma maternal es homócigo para el segundo alelo respectivo en el mismo sitio.

40. El método de la reivindicación 38, caracterizado porque la determinación de un sitio especifico por ser uno de la primera pluralidad de sitios incluye: determinar un valor de corte para un número de conteos predichos del. primer alelo respectivo en el sitio especifico, el valor de corte predice si el genoma maternal es homócigo y el genoma fetal es heterócigo, en donde el valor de corte es determinado en base a una distribución esperada de números de conteos para diferentes combinaciones de homócigocidad y heterocigosidad en el sitio especifico; en base al análisis de los resultados de secuenciación, detectar los respectivos primeros y segundos alelos en el sitio especifico; determinar un número de conteos reales del respectivo primer alelo en base a la secuenciación de la pluralidad de moléculas de ácido nucleico de la muestra biológica; y determinar que el genoma fetal es heterócigo para los respectivos primeros y segundos alelos y el genoma maternal es homócigo para el respectivo segundo alelo cuando el número de conteos reales es menor que el valor de corte.

41. El método de la reivindicación 38, caracterizado porque el primer alelo de por lo menos dos sitios son diferentes entre si.

42. Un método para determinar la concentración fraccional de ADN fetal en una muestra biológica tomada de una mujer embarazada, el feto tiene un padre y una madre que es la mujer embarazada, en donde la muestra biológica contiene una mezcla de ácidos nucleicos maternales y fetales, el método está caracterizado porque comprende: enriquecer la muestra biológica obtenida de la mujer embarazada por moléculas de ácido nucleico en una región objetivo; secuenciar una pluralidad de moléculas de ácido nucleico de la muestra biológica enriquecida, la secuenciación es especifica a la región objetivo, en donde los resultados de secuenciación son analizados para: identificar un sitio de la molécula de ácido nucleico en la región objetivo del genoma humano; y determinar un alelo respectivo de la molécula de ácido nucleico; determinar uno o más primeros sitios, en donde el genoma fetal es heterócigo en cada primero sitio, de tal manera que el genoma fetal tiene un respectivo primero y segundo alelo en aquel primer sitio y en donde un genoma maternal es homócigo en cada primer sitio, de tal manera que el genoma maternal tiene dos de los respectivos segundos alelos en aquel primer sitio, el primer alelo es diferente del segundo alelo; para por lo menos uno de los primeros sitios: determinar un primer número P de conteos del respectivo . primer alelo y un segundo número Q de conteos del respectivo segundo alelo; y determinar la concentración fraccional en base a los primeros y segundos números.

43. El método de la reivindicación 42, caracterizado porque la determinación de los uno o más primeros sitios incluye: determinar que el genoma paternal es homócigo para el respectivo primer alelo T en cada sitio de la primera pluralidad y determinar que el genoma maternal es homócigo para el segundo alelo respectivo en el mismo sitio.

44. El método de la reivindicación 42, caracterizado porque la determinación que un alelo especifico es el uno o más primeros sitios incluye: determinar un valor de corte para un número de conteos predichos del respectivo primer alelo en el sitio especifico, el valor de corte predice si el genoma maternal es homócigo y el genoma fetal es heterócigo, en donde el valor de corte es determinado en base a una distribución estadística de números de conteos para diferentes combinaciones de homócigocidad y heterocigosidad en el sitio especifico; en base al análisis de los resultados de secuenciación, detectar el respectivo primero y segundo alelo en el sitio especifico; determinar un número de conteos reales del respectivo primer alelo en base a la secuenciación de la pluralidad de moléculas de ácido nucleico de la muestra biológica; y determinar el sitio especifico es uno de los primeros sitios cuando el número de conteos reales es menor que el valor de corte.