ES2930180T3 - Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica - Google Patents

Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica Download PDF

Info

Publication number
ES2930180T3
ES2930180T3 ES20170556T ES20170556T ES2930180T3 ES 2930180 T3 ES2930180 T3 ES 2930180T3 ES 20170556 T ES20170556 T ES 20170556T ES 20170556 T ES20170556 T ES 20170556T ES 2930180 T3 ES2930180 T3 ES 2930180T3
Authority
ES
Spain
Prior art keywords
nucleic acid
histone
sample
fetal
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20170556T
Other languages
English (en)
Inventor
Charles Cantor
Grace Desantis
Reinhold Mueller
Mathias Ehrich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sequenom Inc
Original Assignee
Sequenom Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47884590&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2930180(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sequenom Inc filed Critical Sequenom Inc
Application granted granted Critical
Publication of ES2930180T3 publication Critical patent/ES2930180T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

La presente invención se refiere a un método para enriquecer el ácido nucleico del cáncer, que comprende: (a) obtener ácido nucleico de muestra circulante libre de células a partir de una muestra biológica que comprende células cancerosas del sujeto, cuyo ácido nucleico de muestra comprende una primera especie de ácido nucleico asociado a histonas y una segunda especie de ácido nucleico asociado a histonas; y (b) separar algunas o sustancialmente todas las primeras especies de ácidos nucleicos asociadas a histonas de las segundas especies de ácidos nucleicos asociadas a histonas, generando así un producto de separación enriquecido para la segunda especie de ácidos nucleicos asociados a histonas, en el que el ácido nucleico del cáncer en la el producto de separación se enriquece en relación con el ácido nucleico del cáncer en el ácido nucleico de la muestra. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica
Campo
La tecnología proporcionada en el presente documento se refiere, en parte, a métodos, a procedimientos y a aparatos para la evaluación no invasiva de variaciones genéticas.
Antecedentes
La información genética de organismos vivos (por ejemplo, animales, plantas y microorganismos) y otras formas de información genética replicante (por ejemplo, virus) está codificada en ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN). La información genética es una sucesión de nucleótidos o nucleótidos modificados que representan la estructura primaria de ácidos nucleicos químicos o hipotéticos. En seres humanos, el genoma completo contiene aproximadamente 30.000 genes ubicados en veinticuatro (24) cromosomas (véase The Human Genome, T. Strachan, BIOS Scientific Publishers, 1992). Cada gen codifica para una proteína específica que, después de la expresión a través de transcripción y traducción, cumple una función bioquímica específica dentro de una célula viva.
Muchas afecciones médicas están provocadas por una o más variaciones genéticas. Determinadas variaciones genéticas provocan afecciones médicas que incluyen, por ejemplo, hemofilia, talasemia, distrofia muscular de Duchenne (DMD), enfermedad de Huntington (EH), enfermedad de Alzheimer y fibrosis quística (FQ) (Human Genome Mutations, D. N. Cooper y M. Krawczak, BIOS Publishers, 1993). Tales enfermedades genéticas pueden ser el resultado de una adición, sustitución o deleción de un solo nucleótido en el ADN de un gen particular. Determinados defectos congénitos están provocados por una anomalía cromosómica, también denominada aneuploidía, tal como trisomía 21 (síndrome de Down), trisomía 13 (síndrome de Patau), trisomía 18 (síndrome de Edward), monosomía X (síndrome de Turner) y determinadas aneuploidías de cromosomas sexuales tales como síndrome de Klinefelter (XXY), por ejemplo. Otra variación genética es el sexo fetal, que a menudo puede determinarse basándose en los cromosomas sexuales X e Y. Algunas variaciones genéticas pueden predisponer a un individuo a, o provocar, cualquiera de varias enfermedades tales como, por ejemplo, diabetes, arterioesclerosis, obesidad, diversas enfermedades autoinmunitarias y cáncer (por ejemplo, colorrectal, de mama, de ovario, de pulmón).
Identificar una o más diferencias o variaciones genéticas puede conducir al diagnóstico de o la determinación de la predisposición a una afección médica particular. Identificar una diferencia genética puede dar como resultado facilitar una decisión médica y/o emplear un procedimiento médico útil. La identificación de una o más diferencias o variaciones genéticas implica algunas veces el análisis de ADN libre de células.
El ADN libre de células (ADNlc) se compone de fragmentos de ADN procedentes de la muerte celular y que circulan en sangre periférica. Altas concentraciones de ADNlc pueden ser indicativas de determinados estados clínicos tales como cáncer, traumatismo, quemaduras, infarto de miocardio, accidente cerebrovascular, septicemia, infección y otras afecciones. Además, el ADN fetal libre de células (ADNflc) puede detectarse en el torrente circulatorio materno y usarse para diversas pruebas diagnósticas prenatales no invasivas.
La presencia de ácido nucleico fetal en el plasma materno permite el diagnóstico prenatal no invasivo a través del análisis de una muestra de sangre materna. Por ejemplo, las anomalías cuantitativas de ADN fetal en el plasma materno pueden estar asociadas con varios trastornos asociados al embarazo, incluyendo preeclampsia, parto prematuro, hemorragia prenatal, placentación invasiva, síndrome de Down fetal y otras aneuploidías cromosómicas fetales. Por tanto, el análisis de ácidos nucleicos fetales en el plasma materno puede ser un mecanismo útil para la monitorización del bienestar fetomaterno.
La detección temprana de estados relacionados con el embarazo, incluyendo complicaciones durante el embarazo y defectos genéticos del feto, es importante, ya que permite la intervención médica temprana necesaria para la seguridad tanto de la madre como del feto. Tradicionalmente, el diagnóstico prenatal se ha llevado a cabo usando células aisladas del feto a través de procedimientos tales como biopsia de vellosidades coriónicas (CVS) o amniocentesis. Sin embargo, estos métodos convencionales son invasivos y presentan un riesgo apreciable tanto para la madre como para el feto. En la actualidad, el Servicio Nacional de Salud cita una tasa de aborto espontáneo de entre el 1 y el 2% tras las pruebas invasivas de amniocentesis y biopsia de vellosidades coriónicas (CVS). El uso de técnicas de detección no invasivas que utilizan ADNflc circulante puede ser una alternativa a estos enfoques invasivos. Se considera que las siguientes referencias son técnica anterior relevante: U. DELIGEZER ET AL.: “Sequence-Specific Histone Methylation Is Detectable on Circulating Nucleosomes in Plasma”, CLINICAL CHEMISTRY, vol. 54, n.° 7, 1 de julio de 2008 (01-07-2008), S. HOLDENRIEDER ET AL.: “Circulating Nucleosomes Predict the Response to Chemotherapy in Patients with Advanced Non-Small Cell Lung Cancer”, CLINICAL CANCER RESEARCH, vol. 10, n.° 18, 15 de septiembre de 2004 (15-09-2004) y el documento WO 03/070894 A2 (UNIV VIRGINIA [EE.UU.]; CHROMA THERAPEUTICS LTD [GB] ET AL.) 28 de agosto de 2003 (28-08-2003).
Sumario
En algunos aspectos se proporcionan métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica que comprende células cancerosas de un sujeto, en el que el ácido nucleico de muestra comprende una primera especie de ácido nucleico asociado con histona y una segunda especie de ácido nucleico asociado con histona, comprendiendo el método separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona a partir de la segunda especie de ácido nucleico asociado con histona, generando de ese modo un producto de separación enriquecido en la segunda especie de ácido nucleico asociado con histona, en el que el ácido nucleico canceroso en el producto de separación está enriquecido en relación con el ácido nucleico canceroso en el ácido nucleico de muestra, en el que separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona a partir de la segunda especie de ácido nucleico asociado con histona comprende: a) poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con la primera especie de ácido nucleico asociado con histona, en el que la histona es una histona H1; o b) poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con la segunda especie de ácido nucleico asociado con histona, en el que la histona es H3.
En algunas realizaciones, separar parte o sustancialmente la totalidad del ácido nucleico vesicular a partir del ácido nucleico de muestra comprende filtrar el ácido nucleico de muestra y algunas veces comprende centrifugar el ácido nucleico de muestra y algunas veces comprende el uso de ultracentrifugación. En algunas realizaciones, separar parte o sustancialmente la totalidad del ácido nucleico vesicular a partir del ácido nucleico de muestra comprende poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a vesículas que comprenden el ácido nucleico vesicular. En algunas realizaciones, el agente es un anticuerpo. En algunas realizaciones, el agente se une específicamente a vesículas de tejido hematopoyético. En algunas realizaciones, el agente se une específicamente a vesículas de glóbulos rojos. En algunos casos, el agente se une específicamente a CD235a. En algunas realizaciones, el agente se une específicamente a vesículas de leucocitos. En algunos casos, el agente se une específicamente a CD45. En algunas realizaciones, el agente se une específicamente a vesículas de linfocitos. En algunos casos, el agente se une específicamente a un componente vesicular elegido de CD4, CD8 y CD20. En algunas realizaciones, el agente se une específicamente a vesículas de granulocitos. En algunos casos, el agente se une específicamente a CD66b. En algunas realizaciones, el agente se une específicamente a vesículas de monocitos. En algunos casos, el agente se une específicamente a CD14. En algunas realizaciones, el agente se une específicamente a vesículas de plaquetas. En algunos casos, el agente se une específicamente a un componente vesicular elegido de CD31, CD41, CD41a, CD42a, CD42b, CD61 y CD62P. En algunas realizaciones, el agente se une específicamente a vesículas de células endoteliales. En algunos casos, el agente se une específicamente a un componente vesicular elegido de CD31, CD34, CD54, CD62E, CD51, CD105, CD106, CD144 y CD146.
En algunas realizaciones, generar el producto de separación comprende separar componentes unidos por el agente a partir del ácido nucleico de muestra. En algunas realizaciones, separar parte o sustancialmente la totalidad del ácido nucleico vesicular a partir del ácido nucleico de muestra comprende además poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con ácido nucleico libre de vesículas. En algunos casos, el agente se une específicamente a histona H3.3. En algunos casos, el agente se une específicamente a histona H1. En algunos casos, la histona H1 no está metilada.
En algunas realizaciones, el ácido nucleico vesicular está dentro de una vesícula que tiene un diámetro de menos de aproximadamente 1 micrómetro. En algunos casos, el diámetro es de aproximadamente 10 nanómetros a aproximadamente 600 nanómetros. En algunos casos, el diámetro es de aproximadamente 40 nanómetros a aproximadamente 100 nanómetros.
En algunas realizaciones, un método comprende (c) analizar el ácido nucleico en el producto de separación. En algunas realizaciones, separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona a partir de la segunda especie de ácido nucleico asociado con histona comprende poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con la primera especie de ácido nucleico asociado con histona. En algunas realizaciones, separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona a partir de la segunda especie de ácido nucleico asociado con histona comprende poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con la segunda especie de ácido nucleico asociado con histona.
En algunas realizaciones, el agente se une específicamente a histona H1 que es H1.0 o H1b.
En algunas realizaciones, generar el producto de separación comprende separar componentes unidos por el agente a partir del ácido nucleico de muestra. En algunas realizaciones, la histona H3 está metilada y/o la histona H1 no está metilada. En algunas realizaciones, la histona H3 se selecciona del grupo que consiste en H3.1, H3.2 o H3t. En algunas realizaciones, el ácido nucleico de muestra es de plasma sanguíneo, y en algunas realizaciones, el ácido nucleico de muestra es de suero sanguíneo. En algunas realizaciones, obtener el ácido nucleico de muestra comprende someter la muestra biológica a un procedimiento in vitro que aísla la muestra.
En algunas realizaciones, las células cancerosas son de un cáncer de mama, un cáncer colorrectal, un cáncer gastrointestinal, un cáncer hepatocelular, un cáncer de pulmón, melanoma, linterna no Hodgkin, leucemia, mieloma múltiple, un cáncer de vejiga, hepatoma, un cáncer de cuello uterino, un cáncer de esófago, un cáncer de páncreas o un cáncer de próstata.
Breve descripción de los dibujos
Los dibujos ilustran aspectos de la tecnología y no son limitativos. Para mayor claridad y facilidad de ilustración, los dibujos no se realizan a escala y, en algunos casos, diversos aspectos pueden mostrarse exagerados o ampliados para facilitar la comprensión de realizaciones particulares.
La figura 1 muestra un diagrama de centrifugación.
La figura 2 muestra los números de copias fetales obtenidos para determinadas condiciones de centrifugación. La figura 3 muestra los números de copias totales obtenidos para determinadas condiciones de centrifugación. La figura 4 muestra las fracciones fetales obtenidas para determinadas condiciones de centrifugación.
La figura 5 presenta una tabla que muestra una distribución de ADN circulante.
La figura 6 presenta una tabla que muestra una distribución de ADN circulante.
Descripción detallada
En el presente documento se proporcionan métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica que comprende células cancerosas de un sujeto.
Muestras
En el presente documento se proporcionan métodos y composiciones para analizar un ácido nucleico. En algunas realizaciones, se analizan fragmentos de ácido nucleico en una mezcla de fragmentos de ácido nucleico. Una mezcla de ácidos nucleicos puede comprender dos o más especies de fragmento de ácido nucleico que tienen secuencias de nucleótidos diferentes, longitudes de fragmento diferentes, orígenes diferentes (por ejemplo, orígenes genómicos, orígenes fetales frente a maternos, orígenes celulares o tisulares, orígenes de muestra, orígenes de sujeto, y similares), o combinaciones de los mismos.
A menudo, el ácido nucleico o una mezcla de ácidos nucleicos utilizado en los métodos y aparatos descritos en el presente documento se aísla a partir de una muestra obtenida de un sujeto. Un sujeto puede ser cualquier organismo vivo o no vivo, incluyendo, pero sin limitarse a, un ser humano, un animal no humano, una planta, una bacteria, un hongo o un protista. Puede seleccionarse cualquier animal humano o no humano, incluyendo, pero sin limitarse a, mamífero, reptil, ave, anfibio, pez, ungulado, rumiante, bovino (por ejemplo, ganado), equino (por ejemplo, caballo), caprino y ovino (por ejemplo, oveja, cabra), porcino (por ejemplo, cerdo), camélido (por ejemplo, camello, llama, alpaca), mono, simio (por ejemplo, gorila, chimpancé), úrsido (por ejemplo, oso), ave de corral, perro, gato, ratón, rata, delfín, ballena y tiburón. Un sujeto puede ser un macho o una hembra (por ejemplo, una mujer). El ácido nucleico puede aislarse a partir de cualquier tipo de espécimen o muestra biológica adecuada (por ejemplo, una muestra de prueba). Una muestra o muestra de prueba puede ser cualquier espécimen que se aísle u obtenga de un sujeto (por ejemplo, un sujeto humano, una hembra preñada). Los ejemplos no limitativos de especímenes incluyen líquido o tejido de un sujeto, incluyendo, sin limitación, sangre de cordón umbilical, vellosidades coriónicas, líquido amniótico, líquido cefalorraquídeo, líquido raquídeo, líquido de lavado (por ejemplo, broncoalveolar, gástrico, peritoneal, ductal, del oído, artroscópico), muestra de biopsia (por ejemplo, de embrión previo a la implantación), muestra de celocentesis, células nucleadas fetales o restos celulares fetales, lavados del aparato reproductor femenino, orina, heces, esputo, saliva, moco nasal, líquido prostático, lavado, semen, líquido linfático, bilis, lágrimas, sudor, leche materna, líquido mamario, células embrionarias y células fetales (por ejemplo, células placentarias). En algunas realizaciones, una muestra biológica es un hisopado de cuello uterino de un sujeto. En algunas realizaciones, una muestra biológica puede ser sangre y algunas veces plasma o suero. Tal como se usa en el presente documento, el término “sangre” abarca sangre completa o cualquier fracción de sangre, tal como suero y plasma tal como se definen convencionalmente, por ejemplo. A menudo, la sangre o las fracciones de la misma comprenden nucleosomas (por ejemplo, nucleosomas maternos y/o fetales). Los nucleosomas comprenden ácidos nucleicos y algunas veces están libres de células o son intracelulares. La sangre también comprende capas leucoplaquetarias. Algunas veces, las capas leucoplaquetarias se aíslan utilizando un gradiente de Ficoll. Las capas leucoplaquetarias pueden comprender glóbulos blancos (por ejemplo, leucocitos, células T, células B, plaquetas, y similares). En determinados casos, las capas leucoplaquetarias comprenden ácido nucleico materno y/o fetal. El plasma sanguíneo se refiere a la fracción de sangre completa que es el resultado de la centrifugación de sangre tratada con anticoagulantes. El suero sanguíneo se refiere a la porción acuosa de líquido restante después de que se haya coagulado una muestra de sangre. A menudo, las muestras de líquido o tejido se recogen según protocolos convencionales que generalmente siguen los hospitales o las clínicas. A menudo, para la sangre, se recoge una cantidad apropiada de sangre periférica (por ejemplo, entre 3 y 40 mililitros) y puede almacenarse según procedimientos convencionales antes o después de la preparación. Una muestra de líquido o tejido a partir de la cual se extrae el ácido nucleico puede ser acelular (por ejemplo, libre de células). En algunas realizaciones, una muestra de líquido o tejido puede contener elementos celulares o restos celulares. En algunas realizaciones, pueden incluirse células fetales o células cancerosas en la muestra.
A menudo, una muestra es heterogénea, lo que significa que está presente más de un tipo de especies de ácido nucleico en la muestra. Por ejemplo, un ácido nucleico heterogéneo puede incluir, pero no se limita a, (i) ácido nucleico de origen fetal y de origen materno, (ii) ácido nucleico canceroso y no canceroso, (iii) ácido nucleico patógeno y huésped, y más generalmente, (iv) ácido nucleico mutado y de tipo natural. Una muestra puede ser heterogénea porque está presente más de un tipo de células, tal como una célula fetal y una célula materna, una célula cancerosa y no cancerosa, o una célula patógena y huésped. En algunas realizaciones, está presente una especie de ácido nucleico minoritaria y una especie de ácido nucleico mayoritaria.
Para aplicaciones prenatales de la tecnología descrita en el presente documento, una muestra de líquido o tejido puede recogerse de una hembra en edad gestacional adecuada para las pruebas, o de una hembra que está sometiéndose a prueba para determinar un posible embarazo. La edad gestacional adecuada puede variar dependiendo de la prueba prenatal que esté realizándose. En determinadas realizaciones, un sujeto hembra preñada se encuentra algunas veces en el primer trimestre de embarazo, algunas veces en el segundo trimestre de embarazo o algunas veces en el tercer trimestre de embarazo. En determinadas realizaciones, un líquido o tejido se recoge de una hembra preñada de entre aproximadamente 1 y aproximadamente 45 semanas de gestación fetal (por ejemplo, a las 1-4, 4-8, 8-12, 12-16, 16-20, 20-24, 24-28, 28-32, 32-36, 36-40 ó 40-44 semanas de gestación fetal), y algunas veces de entre aproximadamente 5 y aproximadamente 28 semanas de gestación fetal (por ejemplo, a las 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 ó 27 semanas de gestación fetal). En algunas realizaciones, una muestra de líquido o tejido se recoge de una hembra preñada durante o justo después (por ejemplo, de 0 a 72 horas después) del parto (por ejemplo, parto vaginal o no vaginal (por ejemplo, parto quirúrgico)).
Aislamiento y procesamiento del ácido nucleico
El ácido nucleico puede derivarse de una o más fuentes (por ejemplo, células, suero, plasma, capa leucoplaquetaria, líquido linfático, piel, desechos, y similares) mediante métodos conocidos en la técnica. Los reactivos y procedimientos de lisis celular se conocen en la técnica y pueden realizarse generalmente mediante métodos de lisis químicos (por ejemplo, detergente, disoluciones hipotónicas, procedimientos enzimáticos, y similares, o una combinación de los mismos), físicos (por ejemplo, prensa francesa, ultrasonidos, y similares) o electrolíticos. Puede utilizarse cualquier procedimiento de lisis adecuado. Por ejemplo, los métodos químicos emplean generalmente agentes de lisis para romper las células y extraer los ácidos nucleicos de las células, seguido del tratamiento con sales caotrópicas. También son útiles métodos físicos tales como congelación/descongelación seguido de trituración, el uso de prensas celulares, y similares. También se usan habitualmente procedimientos de lisis con alto contenido en sales. Por ejemplo, puede utilizarse un procedimiento de lisis alcalina. Tradicionalmente, este último procedimiento incorpora el uso de disoluciones de fenol-cloroformo, y puede utilizarse un procedimiento alternativo sin fenol-cloroformo que implica tres disoluciones. En estos últimos procedimientos, una disolución puede contener Tris 15 mM, pH 8,0; EDTA 10 mM y ARNasa A 100 ug/ml; una segunda disolución puede contener NaOH 0,2 N y SDS al 1%; y una tercera disolución puede contener KOAc 3 M, pH 5,5. Estos procedimientos pueden hallarse en Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 6.3.1-6.3.6 (1989).
Los términos “ácido nucleico” y “molécula de ácido nucleico” se usan de manera intercambiable. Los términos se refieren a ácidos nucleicos de cualquier forma de composición, tal como ácido desoxirribonucleico (ADN, por ejemplo, ADN complementario (ADNc), ADN genómico (ADNg), y similares), ácido ribonucleico (ARN, por ejemplo, ARN mensajero (ARNm), ARN inhibidor pequeño (ARNip), ARN ribosómico (ARNr), ARN de transferencia (ARNt), microARN, ARN altamente expresado por el feto o la placenta, y similares) y/o análogos de ADN o ARN (por ejemplo, que contienen análogos de bases, análogos de azúcares y/o una estructura principal no nativa, y similares), híbridos de ARN/ADN y ácidos nucleicos poliamídicos (ANP), todos los cuales pueden estar en forma monocatenaria o bicatenaria. A menos que se limite de otro modo, un ácido nucleico puede comprender análogos conocidos de nucleótidos naturales, algunos de los cuales pueden funcionar de una manera similar a los nucleótidos que se producen de manera natural. Un ácido nucleico puede estar en cualquier forma útil para llevar a cabo procedimientos en el presente documento (por ejemplo, lineal, circular, superenrollado, monocatenaria, bicatenaria, y similares). Un ácido nucleico puede ser, o puede proceder de, un plásmido, un fago, una secuencia autorreplicante (ARS), un centrómero, un cromosoma artificial, un cromosoma u otro ácido nucleico que pueda replicar o replicarse in vitro o en una célula huésped, una célula, un núcleo celular o un citoplasma de una célula en determinadas realizaciones. En algunas realizaciones, un ácido nucleico puede proceder de un solo cromosoma o un fragmento del mismo (por ejemplo, una muestra de ácido nucleico puede proceder de un cromosoma de una muestra obtenida de un organismo diploide). Algunas veces, los ácidos nucleicos comprenden nucleosomas, fragmentos o partes de nucleosomas o estructuras similares a nucleosomas. Algunas veces, los ácidos nucleicos comprenden proteína (por ejemplo, histonas, proteínas de unión a ADN, y similares). Algunas veces, los ácidos nucleicos analizados mediante los procedimientos descritos en el presente documento están sustancialmente aislados y no están sustancialmente asociados con proteína u otras moléculas. Los ácidos nucleicos también incluyen derivados, variantes y análogos de ARN o ADN sintetizados, replicados o amplificados a partir de polinucleótidos monocatenarios (“sentido” o “antisentido”, cadena “positiva” o cadena “negativa”, marco de lectura “directo” o marco de lectura “inverso”) y bicatenarios. Los desoxirribonucleótidos incluyen desoxiadenosina, desoxicitidina, desoxiguanosina y desoxitimidina. Para el ARN, la base citosina se reemplaza por uracilo y la posición 2' del azúcar incluye un resto hidroxilo. Un ácido nucleico puede prepararse usando un ácido nucleico obtenido de un sujeto como molde.
El ácido nucleico puede aislarse en un punto de tiempo diferente en comparación con otro ácido nucleico, donde cada una de las muestras es de la misma fuente o de una fuente diferente. Un ácido nucleico puede proceder de una biblioteca de ácidos nucleicos, tal como una biblioteca de ADNc o ARN, por ejemplo. Un ácido nucleico puede ser un resultado de la purificación del ácido nucleico o del aislamiento y/o la amplificación de moléculas de ácido nucleico a partir de la muestra. El ácido nucleico proporcionado para los procedimientos descritos en el presente documento puede contener ácido nucleico de una muestra o de dos o más muestras (por ejemplo, de 1 o más, 2 o más, 3 o más, 4 o más, 5 o más, 6 o más, 7 o más, 8 o más, 9 o más, 10 o más, 11 o más, 12 o más, 13 o más, 14 o más, 15 o más, 16 o más, 17 o más, 18 o más, 19 o más, o 20 o más muestras).
Los ácidos nucleicos pueden incluir ácido nucleico extracelular en determinadas realizaciones. El término “ácido nucleico extracelular” tal como se usa en el presente documento puede referirse un ácido nucleico aislado de una fuente que no tiene sustancialmente ninguna célula y también se denomina ácido nucleico “libre de células” y/o ácido nucleico “circulante libre de células”. El ácido nucleico extracelular puede estar presente en y obtenerse a partir de sangre (por ejemplo, a partir de la sangre de una hembra preñada). A menudo, el ácido nucleico extracelular no incluye células detectables y puede contener elementos celulares o restos celulares. Ejemplos no limitativos de fuentes acelulares para el ácido nucleico extracelular son sangre, plasma sanguíneo, suero sanguíneo y orina. Tal como se usa en el presente documento, el término “obtener ácido nucleico de muestra circulante libre de células” incluye obtener una muestra directamente (por ejemplo, recoger una muestra, por ejemplo, una muestra de prueba) u obtener una muestra de otro que ha recogido una muestra. Sin estar limitados por la teoría, el ácido nucleico extracelular puede ser un producto de apoptosis celular y descomposición celular, que proporciona la base para el ácido nucleico extracelular que a menudo tiene una serie de longitudes a lo largo de un espectro (por ejemplo, una “escalera”).
El ácido nucleico extracelular puede incluir diferentes especies de ácido nucleico y, por tanto, se denomina en el presente documento “heterogéneo” en determinadas realizaciones. Por ejemplo, el suero o plasma sanguíneo de una persona que padece cáncer puede incluir ácido nucleico de células cancerosas y ácido nucleico de células no cancerosas. En otro ejemplo, el suero o plasma sanguíneo de una hembra preñada puede incluir ácido nucleico materno y ácido nucleico fetal. En algunos casos, el ácido nucleico fetal es algunas veces de aproximadamente el 5% a aproximadamente el 50% del ácido nucleico global (por ejemplo, aproximadamente el 4, el 5, el 6, el 7, el 8, el 9, el 10, el 11, el 12, el 13, el 14, el 15, el 16, el 17, el 18, el 19, el 20, el 21, el 22, el 23, el 24, el 25, el 26, el 27, el 28, el 29, el 30, el 31, el 32, el 33, el 34, el 35, el 36, el 37, el 38, el 39, el 40, el 41, el 42, el 43, el 44, el 45, el 46, el 47, el 48 o el 49% del ácido nucleico total es ácido nucleico fetal). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 500 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 500 pares de bases o menos). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 250 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 250 pares de bases o menos). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 200 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 200 pares de bases o menos). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 150 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 150 pares de bases o menos). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 100 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 100 pares de bases o menos). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 50 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 50 pares de bases o menos). En algunas realizaciones, la mayor parte del ácido nucleico fetal en el ácido nucleico tiene una longitud de aproximadamente 25 pares de bases o menos (por ejemplo, aproximadamente el 80, el 85, el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98, el 99 o el 100% del ácido nucleico fetal tiene una longitud de aproximadamente 25 pares de bases o menos).
El ácido nucleico puede proporcionarse para llevar a cabo los métodos descritos en el presente documento sin el procesamiento de la(s) muestra(s) que contiene(n) el ácido nucleico, en determinadas realizaciones. En algunas realizaciones, el ácido nucleico se proporciona para llevar a cabo los métodos descritos en el presente documento después del procesamiento de la(s) muestra(s) que contiene(n) el ácido nucleico. Por ejemplo, un ácido nucleico puede extraerse, aislarse, purificarse, purificarse parcialmente o amplificarse a partir de la(s) muestra(s). El término “aislado” tal como se usa en el presente documento se refiere a un ácido nucleico retirado de su entorno original (por ejemplo, el entorno natural si se produce de manera natural, o una célula huésped si se expresa de manera exógena), y por tanto se altera mediante intervención humana (por ejemplo, “por la mano del hombre”) de su entorno original. El término “ácido nucleico aislado” tal como se usa en el presente documento puede referirse a un ácido nucleico retirado de un sujeto (por ejemplo, un sujeto humano). Un ácido nucleico aislado puede proporcionarse con menos componentes distintos de ácido nucleico (por ejemplo, proteína, lípido) que la cantidad de componentes presentes en una muestra fuente. Una composición que comprende ácido nucleico aislado puede estar de aproximadamente el 50% a más del 99% libre de componentes distintos de ácido nucleico. Una composición que comprende ácido nucleico aislado puede estar aproximadamente el 90%, el 91%, el 92%, el 93%, el 94%, el 95%, el 96%, el 97%, el 98%, el 99% o más del 99% libre de componentes distintos de ácido nucleico. El término “purificado” tal como se usa en el presente documento puede referirse a un ácido nucleico siempre que contenga menos componentes distintos de ácido nucleico (por ejemplo, proteína, lípido, hidrato de carbono) que la cantidad de componentes distintos de ácido nucleico presentes antes de someter el ácido nucleico a un procedimiento de purificación. Una composición que comprende ácido nucleico purificado puede estar aproximadamente el 80%, el 81%, el 82%, el 83%, el 84%, el 85%, el 86%, el 87%, el 88%, el 89%, el 90%, el 91%, el 92%, el 93%, el 94%, el 95%, el 96%, el 97%, el 98%, el 99% o más del 99% libre de otros componentes distintos de ácido nucleico. El término “purificado” tal como se usa en el presente documento puede referirse a un ácido nucleico siempre que contenga menos especies de ácido nucleico que en la fuente de muestra a partir de la cual se deriva el ácido nucleico. Una composición que comprende ácido nucleico purificado puede estar aproximadamente el 90%, el 91%, el 92%, el 93%, el 94%, el 95%, el 96%, el 97%, el 98%, el 99% o más del 99% libre de otras especies de ácido nucleico. Por ejemplo, el ácido nucleico fetal puede purificarse a partir de una mezcla que comprende ácido nucleico materno y fetal. En determinados ejemplos, los nucleosomas que comprenden fragmentos pequeños de ácido nucleico fetal pueden purificarse a partir de una mezcla de complejos de nucleosomas más grandes que comprenden fragmentos más grandes de ácido nucleico materno.
El término “amplificado” tal como se usa en el presente documento se refiere a someter un ácido nucleico diana en una muestra a un procedimiento que genera de manera lineal o exponencial ácidos nucleicos de amplicón que tienen la misma o sustancialmente la misma secuencia de nucleótidos que el ácido nucleico diana, o un segmento del mismo. El término “amplificado” tal como se usa en el presente documento puede referirse a someter un ácido nucleico diana (por ejemplo, en una muestra que comprende otros ácidos nucleicos) a un procedimiento que genera de manera selectiva y de manera lineal o exponencial ácidos nucleicos de amplicón que tienen la misma o sustancialmente la misma secuencia de nucleótidos que el ácido nucleico diana, o un segmento del mismo. El término “amplificado” tal como se usa en el presente documento puede referirse a someter una población de ácidos nucleicos a un procedimiento que genera de manera no selectiva y de manera lineal o exponencial ácidos nucleicos de amplicón que tienen la misma o sustancialmente la misma secuencia de nucleótidos que ácidos nucleicos, o porciones de los mismos, que estaban presentes en la muestra antes de la amplificación. En algunas realizaciones, el término “amplificado” se refiere a un método que comprende una reacción en cadena de la polimerasa (PCR).
El ácido nucleico también puede procesarse sometiendo el ácido nucleico a un método que genera fragmentos de ácido nucleico, en determinadas realizaciones, antes de proporcionar el ácido nucleico para un procedimiento descrito en el presente documento. En algunas realizaciones, el ácido nucleico sometido a fragmentación o escisión puede tener una longitud nominal, promedio o media de aproximadamente 5 a aproximadamente 10.000 pares de bases, de aproximadamente 100 a aproximadamente 1.000 pares de bases, de aproximadamente 100 a aproximadamente 500 pares de bases, o de aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 ó 9000 pares de bases. Los fragmentos pueden generarse mediante un método adecuado conocido en la técnica, y la longitud nominal, promedio o media de los fragmentos de ácido nucleico puede controlarse seleccionando un procedimiento de generación de fragmentos apropiado. En determinadas realizaciones, puede utilizarse un ácido nucleico de una longitud relativamente más corta para analizar secuencias que contienen poca variación de secuencia y/o contienen cantidades relativamente grandes de información de secuencia de nucleótidos conocida. En algunas realizaciones, puede utilizarse un ácido nucleico de una longitud relativamente más larga para analizar secuencias que contienen una mayor variación de secuencia y/o contienen cantidades relativamente pequeñas de información de secuencia de nucleótidos.
Los fragmentos de ácido nucleico pueden contener secuencias de nucleótidos solapantes, y tales secuencias solapantes pueden facilitar la construcción de una secuencia de nucleótidos del ácido nucleico homólogo no fragmentado, o un segmento del mismo. Por ejemplo, un fragmento puede tener las subsecuencias x e y otro fragmento puede tener las subsecuencias y z, donde x, y z son secuencias de nucleótidos que pueden ser de 5 nucleótidos de longitud o mayores. La secuencia solapante y puede utilizarse para facilitar la construcción de la secuencia de nucleótidos x-y-z en un ácido nucleico a partir de una muestra en determinadas realizaciones. El ácido nucleico puede estar parcialmente fragmentado (por ejemplo, a partir de una reacción de escisión específica incompleta o terminada) o totalmente fragmentado en determinadas realizaciones.
El ácido nucleico puede fragmentarse mediante diversos métodos conocidos en la técnica, que incluyen, sin limitación, procedimientos físicos, químicos y enzimáticos. Los ejemplos no limitativos de tales procedimientos se describen en la publicación de solicitud de patente estadounidense n.° 20050112590 (publicada el 26 de mayo de 2005, titulada “Fragmentation-based methods and systems for sequence variation detection and discovery”, a nombre de Van Den Boom et al.). Pueden seleccionarse determinados procedimientos para generar fragmentos inespecíficamente escindidos o fragmentos específicamente escindidos. Los ejemplos no limitativos de procedimientos que pueden generar ácido nucleico de fragmentos inespecíficamente escindidos incluyen, sin limitación, poner en contacto el ácido nucleico con un aparato que expone el ácido nucleico a fuerza de cizalladura (por ejemplo, haciendo pasar el ácido nucleico a través de una aguja de jeringa; el uso de una prensa francesa); exponer el ácido nucleico a irradiación (por ejemplo, gamma, rayos X, irradiación UV; los tamaños de fragmento pueden controlarse mediante la intensidad de irradiación); sometiendo a ebullición el ácido nucleico en agua (por ejemplo, que produce fragmentos de aproximadamente 500 pares de bases) y exponiendo el ácido nucleico a un procedimiento de hidrólisis con ácido y base.
Tal como se usa en el presente documento, “fragmentación” o “escisión” se refiere a un procedimiento o a condiciones en las que una molécula de ácido nucleico, tal como una molécula génica de molde de ácido nucleico o un producto amplificado de la misma, puede dividirse en dos o más moléculas de ácido nucleico más pequeñas. Tal fragmentación o escisión puede ser específica de secuencia, específica de base o inespecífica, y puede lograrse mediante cualquiera de una variedad de métodos, reactivos o condiciones, incluyendo, por ejemplo, fragmentación química, enzimática, física.
Tal como se usa en el presente documento, “fragmentos”, “productos de escisión”, “productos escindidos” o variantes gramaticales de los mismos, se refiere a moléculas de ácido nucleico resultantes de una fragmentación o escisión de una molécula génica de molde de ácido nucleico o un producto amplificado de la misma. Si bien tales fragmentos o productos escindidos pueden referirse a todas las moléculas de ácido nucleico resultantes de una reacción de escisión, normalmente tales fragmentos o productos escindidos se refieren únicamente a moléculas de ácido nucleico resultantes de una fragmentación o escisión de una molécula génica de molde de ácido nucleico o el segmento de un producto amplificado de la misma que contiene la secuencia de nucleótidos correspondiente de una molécula génica de molde de ácido nucleico. Por ejemplo, un producto amplificado puede contener uno o más nucleótidos más que la región de nucleótido amplificado de una secuencia de molde de ácido nucleico (por ejemplo, un cebador puede contener nucleótidos “extra” tales como una secuencia de inicio de transcripción, además de nucleótidos complementarios a una molécula génica de molde de ácido nucleico, lo que da como resultado un producto amplificado que contiene nucleótidos “extra” o nucleótidos no correspondientes con la región de nucleótido amplificada de la molécula génica de molde de ácido nucleico). Por consiguiente, los fragmentos pueden incluir fragmentos procedentes de porciones de moléculas de ácido nucleico amplificado que contienen, al menos en parte, información de secuencia de nucleótidos de o basada en la molécula de molde de ácido nucleico representativa.
Tal como se usa en el presente documento, el término “reacciones de escisión complementarias” se refiere a reacciones de escisión que se llevan a cabo en el mismo ácido nucleico usando reactivos de escisión diferentes o alterando la especificidad de escisión del mismo reactivo de escisión de tal manera que se generan patrones de escisión alternos del mismo ácido nucleico o proteína diana o de referencia. En determinadas realizaciones, el ácido nucleico puede tratarse con uno o más agentes de escisión específicos (por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más agentes de escisión específicos) en uno o más recipientes de reacción (por ejemplo, el ácido nucleico se trata con cada agente de escisión específico en un recipiente independiente).
El ácido nucleico puede escindirse específicamente o escindirse inespecíficamente poniendo en contacto el ácido nucleico con uno o más agentes de escisión enzimática (por ejemplo, nucleasas, enzimas de restricción). El término “agente de escisión específico” tal como se usa en el presente documento se refiere a un agente, algunas veces una sustancia química o una enzima que puede escindir un ácido nucleico en uno o más sitios específicos. Los agentes de escisión específicos a menudo escinden específicamente según una secuencia de nucleótidos particular en un sitio particular. Los agentes de escisión inespecíficos a menudo escinden ácidos nucleicos en sitios inespecíficos o degradan los ácidos nucleicos. Los agentes de escisión inespecíficos a menudo degradan los ácidos nucleicos mediante la retirada de nucleótidos del extremo (o bien del extremo 5' o bien del extremo 3', o de ambos) de una cadena de ácido nucleico.
Puede usarse cualquier agente de escisión enzimática inespecífico o específico adecuado para escindir o fragmentar ácidos nucleicos. Puede usarse una enzima de restricción adecuada para escindir ácidos nucleicos, en algunas realizaciones. Los ejemplos de agentes de escisión enzimática incluyen, sin limitación, endonucleasas (por ejemplo, ADNasa (por ejemplo, ADNasa I, II); ARNasa (por ejemplo, ARNasa E, F, H, P); enzima Cleavase™; ADN polimerasa Taq; a Dn polimerasa I de E. coli y endonucleasas específicas de estructuras eucariotas; endonucleasas FEN-1 murinas; endonucleasas de restricción de tipo I, II o III tales como Acc I, Afl III, Alu I, Alw44 I, Apa I, Asn I, Ava I, Ava II, BamH I, Ban II, Bcl I, Bgl I. Bgl II, Bin I, Bsm I, BssH II, BstE II, Cfo I, Cla I, Dde I, Dpn I, Dra I, EclX I, EcoR I, EcoR II, EcoR V, Hae II, Hae II, Hind II, Hind III, Hpa I, Hpa II, Kpn I, Ksp I, Mlu I, MluN I, Msp I, Nci I, Nco I, Nde I, Nde II, Nhe I, Not I, Nru I, Nsi I, Pst I, Pvu I, Pvu II, Rsa I, Sac I, Sal I, Sau3A I, Sca I, ScrF I, Sfi I, Sma I, Spe I, Sph I, Ssp I, Stu I, Sty I, Swa I, Taq I, Xba I, Xho I; glicosilasas (por ejemplo, uracil-ADN glicosilasa (UDG), 3-metiladenina ADN glicosilasa, 3-metiladenina ADN glicosilasa II, pirimidina hidrato-ADN glicosilasa, FaPy-ADN glicosilasa, timina-ADN glicosilasa de apareamiento erróneo, hipoxantina-ADN glicosilasa, 5-hidroximetiluracil ADN glicosilasa (HmUDG), 5-hidroximetilcitosina ADN glicosilasa o 1,N6-eteno-adenina ADN glicosilasa); exonucleasas (por ejemplo, exonucleasa III); ribozimas y ADNzimas. El ácido nucleico puede tratarse con un agente químico, y el ácido nucleico modificado puede escindirse. En los ejemplos no limitativos, el ácido nucleico puede tratarse con (i) agentes alquilantes tales como metilnitrosourea que generan varias bases alquiladas, incluyendo N3-metiladenina y N3-metilguanina, que son reconocidas y escindidas por alquilpurina ADN glicosilasa; (ii) bisulfito de sodio, que provoca la desaminación de residuos de citosina en ADN para formar residuos de uracilo que pueden ser escindidos por uracil N-glicosilasa; y (iii) un agente químico que convierte guanina en su forma oxidada, 8-hidroxiguanina, que puede ser escindida por formamidopirimidina ADN N-glicosilasa. Los ejemplos de procedimientos de escisión químicos incluyen, sin limitación, alquilación (por ejemplo, alquilación de ácido nucleico modificado con fosforotioato); escisión de la labilidad ácida de ácido nucleico que contiene P3'-N5'-fosforoamidato; y tratamiento de ácido nucleico con tetróxido de osmio y piperidina.
El ácido nucleico también puede exponerse a un procedimiento que modifica determinados nucleótidos en el ácido nucleico antes de proporcionar el ácido nucleico para un método descrito en el presente documento. Un procedimiento que modifica selectivamente el ácido nucleico basándose en el estado de metilación de los nucleótidos en el mismo puede aplicarse al ácido nucleico, por ejemplo. Además, condiciones tales como alta temperatura, radiación ultravioleta, radiación con rayos X, pueden inducir cambios en la secuencia de una molécula de ácido nucleico. El ácido nucleico puede proporcionarse en cualquier forma útil para llevar a cabo un análisis de secuencia o un procedimiento de fabricación descrito en el presente documento, tal como una forma sólida o líquida, por ejemplo. En determinadas realizaciones, el ácido nucleico puede proporcionarse en una forma líquida que comprende opcionalmente uno o más de otros componentes, incluyendo, sin limitación, uno o más tampones o sales.
El ácido nucleico puede ser monocatenario o bicatenario. El ADN monocatenario, por ejemplo, puede generarse desnaturalizando ADN bicatenario mediante calentamiento o mediante tratamiento con álcali, por ejemplo. Algunas veces, el ácido nucleico tiene una estructura de bucle en D, formada por la invasión de cadena de una molécula de ADN bicatenario por un oligonucleótido o una molécula similar a ADN tal como un ácido nucleico peptídico (ANP). La formación de bucle en D puede facilitarse mediante la adición de proteína RecA de E. coli y/o mediante la alteración de la concentración de sales, por ejemplo, usando métodos conocidos en la técnica.
Enriquecimiento de subpoblación de ácido nucleico libre de células
En algunas realizaciones, el ácido nucleico de muestra se procesa de tal manera que una subpoblación de ácido nucleico libre de células se enriquece en el ácido nucleico de muestra. En algunas realizaciones, el enriquecimiento se logra retirando o agotando específicamente otra subpoblación de ácido nucleico libre de células. Este método se denomina algunas veces en el presente documento “enriquecimiento negativo”. Tales métodos de enriquecimiento negativo pueden aprovechar las diferencias en determinadas características de subpoblaciones de ácido nucleico en una muestra que comprende ácido nucleico libre de células. Por ejemplo, en algunos casos, el ácido nucleico libre de células es una mezcla de ácido nucleico vesicular y libre de vesículas. Agotando selectivamente un ácido nucleico de muestra de ácido nucleico vesicular, por ejemplo, la muestra se enriquece en el ácido nucleico libre de vesículas, y viceversa. En algunos casos, el ácido nucleico libre de células es una mezcla de diferentes especies de ácido nucleico vesicular (por ejemplo, ácido nucleico vesicular que se ha originado a partir de diferentes tipos de tejido). Agotando selectivamente un ácido nucleico de muestra de una determinada especie de ácido nucleico vesicular, por ejemplo, la muestra se enriquece en una especie de ácido nucleico vesicular diferente.
En algunas realizaciones, el enriquecimiento se logra seleccionando como diana específicamente una subpoblación deseada de ácido nucleico libre de células. Este método se denomina algunas veces en el presente documento “enriquecimiento positivo”. Tales métodos de enriquecimiento positivo pueden aprovechar las diferencias en determinadas características de subpoblaciones de ácido nucleico en una muestra que comprende ácido nucleico libre de células. Tal como se mencionó anteriormente, en algunos casos, el ácido nucleico libre de células es una mezcla de diferentes especies de ácido nucleico vesicular (por ejemplo, ácido nucleico vesicular que se ha originado a partir de diferentes tipos de tejido). Seleccionando como diana selectivamente un ácido nucleico de muestra de una determinada especie de ácido nucleico vesicular, por ejemplo, la muestra se enriquece en tal especie de nucleico vesicular.
En otro ejemplo, el ácido nucleico libre de células a menudo está presente en forma de nucleosoma. Las histonas y variantes de histona particulares asociadas con tal ácido nucleico libre de células nucleosómico pueden variar dependiendo del origen celular del ácido nucleico. Por tanto, determinadas subpoblaciones de ácido nucleico libre de células pueden distinguirse entre sí basándose en el tipo de histona y/o variante de histona con la que se asocia. Agotando o seleccionando como diana selectivamente un ácido nucleico de muestra de ácido nucleico asociado con un tipo de histona o variante de histona, el ácido nucleico de muestra puede enriquecerse en un ácido nucleico asociado con una histona o variante de histona diferente. Los ejemplos no limitativos de enriquecimiento positivo y negativo de ácido nucleico libre de células se describen con mayor detalle a continuación.
Agotamiento de ácido nucleico vesicular
El ácido nucleico libre de células a menudo comprende una mezcla de ácido nucleico vesicular y ácido nucleico libre de vesículas. El ácido nucleico vesicular es ácido nucleico ubicado en y/o asociado con una vesícula o un fragmento de vesícula. Tal como se usa en el presente documento, una vesícula es un cuerpo encerrado en membrana pequeño que puede almacenar o transportar material. A menudo, la membrana que encierra la vesícula es similar a la de la membrana plasmática celular y comprende al menos una bicapa fosfolipídica. Las vesículas a menudo se forman mediante un proceso en el que una porción de una membrana celular se separa de la célula. Las vesículas también pueden denominarse microvesículas, nanovesículas, vesículas intraluminales, vesículas similares a endosomas, vesículas exocitosadas, micropartículas, cuerpos apoptóticos, apocuerpos, ampolla, cuerpo ampolloso, exosomas, dexosomas y prostasomas. Las vesículas algunas veces son un subproducto de la muerte celular (por ejemplo, cuerpos apoptóticos, apocuerpos). Las vesículas pueden incluir cualquier partícula unida a membrana desprendida que se deriva de la membrana plasmática o una membrana interna. Las vesículas también pueden incluir una o más estructuras derivadas de células rodeadas por una membrana de bicapa lipídica. Las vesículas también pueden incluir fragmentos de membrana.
Las vesículas pueden liberarse al entorno extracelular a partir de varias células diferentes tales como, pero sin limitarse a, células endoteliales, células hematopoyéticas y células que han experimentado variaciones o alteraciones genéticas, ambientales y/o de cualquier otro tipo (por ejemplo, células tumorales). Las vesículas pueden tener, por ejemplo, un diámetro de menos de 1 micrómetro. En algunos casos, las vesículas pueden tener un diámetro que es de aproximadamente 10 nanómetros a aproximadamente 600 nanómetros. En algunos casos, las vesículas pueden tener un diámetro de aproximadamente 40 nanómetros a aproximadamente 100 nanómetros. Las vesículas pueden tener, por ejemplo, un diámetro de aproximadamente 45, 50, 55, 60, 65, 70, 75, 80, 85, 90 ó 95 nanómetros. Determinadas vesículas pueden tener un diámetro de aproximadamente 100 nanómetros o mayor.
Por ejemplo, determinadas vesículas pueden tener un diámetro de aproximadamente 200 nanómetros, 300 nanómetros, 400 nanómetros, 500 nanómetros, 600 nanómetros, 700 nanómetros, 800 nanómetros, 900 nanómetros, 1000 nanómetros, 1100 nanómetros, 1200 nanómetros, 1300 nanómetros, 1400 nanómetros, 1500 nanómetros o mayor.
Los orígenes del ácido nucleico vesicular y el ácido nucleico libre de vesículas en una muestra de ácido nucleico libre de células pueden diferir. Por ejemplo, una muestra de ácido nucleico libre de células de una hembra preñada puede comprender ácido nucleico vesicular de origen materno y fetal y ácido nucleico libre de vesículas de origen materno y fetal. Las proporciones relativas de ácido nucleico vesicular y ácido nucleico libre de vesículas pueden ser diferentes para el ácido nucleico libre de células de origen materno y el ácido nucleico libre de células de origen fetal. En algunos casos, por ejemplo, la mayor parte del ácido nucleico libre de células de origen materno puede ser vesicular y la mayor parte del ácido nucleico libre de células de origen detal puede estar libre de vesículas. En otro ejemplo, el ácido nucleico libre de células derivado de tumores o trasplantes de órganos sólidos puede estar sustancialmente libre de vesículas y el ácido nucleico libre de células derivado de tejido normal o huésped puede ser sustancialmente vesicular. Sin estar limitados por la teoría, tales características relacionadas con la presencia o ausencia de ácido nucleico vesicular pueden representar diferencias de tamaño (es decir, longitud de secuencia de nucleótidos) observadas para determinadas poblaciones de ácido nucleico libre de células. Por ejemplo, el ADN libre de células derivado de fuentes fetales, de trasplante o tumorales puede estar enriquecido en una subpoblación más pequeña de ADN en comparación con el ADN libre de células derivado de fuentes maternas, huésped o normales, respectivamente, tal como se describe, por ejemplo, en Chan et al. (2004) Clin Chem 50:88-92; Diehl et al. (2005) Proc Natl Acad Sci 102:16368-73; Lo et al. (2010) Sci Transl Med 2:61ra91; Zheng et al. (2011) Clin Chem 169318; y Mouliere et al. (2011) PLoS One 6:9 e23418. En algunos casos, por ejemplo, el ADN libre de células fetal puede incluir fragmentos de ADN de menos de 166 pb de tamaño y fragmentos de ADN de más de 143 pb de tamaño en comparación con el ADN libre de células materno. En algunos casos, los fragmentos más grandes pueden estar presentes como ADN vesicular y, por tanto, pueden ser menos sensibles a las nucleasas circulantes, por ejemplo, y los fragmentos más pequeños pueden estar presentes como ADN libre de vesículas y, por tanto, pueden ser más sensibles a las nucleasas circulantes, por ejemplo.
El ácido nucleico vesicular y algunas veces determinadas especies de ácido nucleico vesicular (por ejemplo, ácido nucleico vesicular de origen materno) pueden agotarse a partir de una muestra usando cualquier método conocido en la técnica para separar material biológico. Los métodos de separación no limitativos incluyen separación física (por ejemplo, filtración, centrifugación, diálisis, y similares) y métodos que emplean un agente de unión. Los métodos de filtración incluyen generalmente métodos mediante los cuales el ácido nucleico vesicular se absorbe por una membrana o barrera y el ácido nucleico libre de vesículas se retiene en la muestra. En la técnica se conocen diversos métodos de filtración e incluyen, sin limitación, microfiltración, filtración en gel y filtración magnética. Los métodos de centrifugación incluyen generalmente métodos mediante los cuales se logra la separación de componentes de muestra aplicando fuerza centrífuga. En la técnica se conocen diversos métodos de centrifugación e incluyen, sin limitación, ultracentrifugación, centrifugación diferencial, centrifugación por gradiente de densidad en equilibrio y centrifugación zonal.
Los métodos de separación que emplean un agente de unión también pueden usarse para agotar el ácido nucleico vesicular o una determinada especie de ácido nucleico vesicular en una muestra. En tales métodos, se separan los componentes (es decir, las vesículas) unidos por el agente a partir de la muestra. Un agente de unión es un agente que se une específicamente a un componente de vesícula, tal como un biomarcador. Un agente “se une específicamente” a un componente de vesícula si el agente de unión se une preferentemente al componente, y, por ejemplo, tiene menos de aproximadamente el 30%, el 20%, el 10%, el 5% o el 1% de reactividad cruzada con otra molécula. Los métodos para unir un agente a una vesícula se describen, por ejemplo, en las publicaciones de solicitud de patente estadounidense n.os 2011/0151460, 2010/0203529 y 2010/0184046. Los agentes de unión pueden ser anticuerpos monoclonales, anticuerpos policlonales, Fab, Fab', anticuerpos monocatenarios, anticuerpos sintéticos, ADN, ARN, aptámeros (ADN/ARN), peptoides, ADNz, ácidos nucleicos peptídicos (ANP), ácidos nucleicos bloqueados (LNA), lectinas, compuestos químicos sintéticos o que se producen de manera natural (incluyendo, pero sin limitarse a, fármacos, reactivos de marcaje), dendrímeros, o combinaciones de los mismos. Por ejemplo, el agente de unión puede ser un anticuerpo de captura. Tales agentes de unión pueden acoplarse directa o indirectamente a un sustrato o soporte sólido. A menudo, el sustrato o soporte sólido se usa para separar la vesícula a partir de la muestra. Algunos métodos implican parejas de unión en las que una pareja se asocia con la vesícula (por ejemplo, se conjuga con un agente de unión a vesícula) y la otra pareja se asocia con un soporte sólido. En algunos casos, puede emplearse un único agente de unión para el agotamiento de ácido nucleico vesicular. En algunos casos, puede emplearse una combinación de agentes de unión diferentes para el agotamiento de ácido nucleico vesicular. Por ejemplo, pueden usarse al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 50, 75 ó 100 agentes de unión diferentes para retirar ácido nucleico vesicular a partir de una muestra.
En algunas realizaciones, un agente de unión es específico de un componente asociado con una vesícula. Tales componentes pueden incluir, por ejemplo, marcadores de superficie celular, proteínas de membrana, factores secretados o cualquier otra molécula que pueda llegar a asociarse con una vesícula. En algunas realizaciones, el agente de unión es específico de un componente en la superficie de una vesícula. En algunas realizaciones, el agente de unión es específico de un componente en una vesícula que se origina a partir de una célula materna. En algunas realizaciones, el agente de unión es específico de un componente en una vesícula que se origina a partir de una célula no cancerosa. En algunas realizaciones, el agente de unión es específico de un componente en una vesícula que se origina a partir de una célula huésped.
En algunas realizaciones, el agente se une específicamente a vesículas de tejido hematopoyético. En algunas realizaciones, el agente se une específicamente a vesículas de glóbulos rojos. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD235a (glicoforina A), acetilcolinesterasa, AMP desaminasa, Band 3 (cdb3), BGP1, CD36, CD47, CD71 (receptor de transferrina), cromo 51, creatina eritrocitaria, globina, glicoforina B, hemoglobina, MBHb (hemoglobina unida a membrana), polipéptidos de Rh, ácido N-acetil-9-O-acetilneuramínico, secuestrina, Ter119, trombospondina (TSP) y VLA4. En algunas realizaciones, el agente se une específicamente a vesículas de leucocitos. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD45, 8-OHdG (8-hidroxidesoxiguanosina), ATPasa (adenosina trifosfatasa), integrinas leucocitarias beta2 (CD11/CD18), catepsina G, CD15 (leuM1), CD18 (MHM23), CD43 (leucosialina, leu-22), CD53 (Ox-44), CD68 (KPI, macrosialina), CD95 (fas), CD166, diyodotirosina (DIT), EFCC, lactoferrina fecal, glucosa-6-fosfatasa (G-6-Pasa), HLA (antígeno leucocitario humano), HLE (elastasa leucocitaria humana), ICAM-1, IL-8 (interleucina-8), L1, lactoferrina, LAM-1 (molécula de adhesión de leucocitos 1), LAP (fosfatasa alcalina leucocitaria), lectinas, L-selectina, LSP1 (proteína 1 específica de leucocitos), Ly-9, M6 (antígeno de activación de leucocitos), Mac-1, MPO (mieloperoxidasa) y VIP (polipéptido intestinal vasoactivo). En algunas realizaciones, el agente se une específicamente a vesículas de linfocitos. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD1a, CD1d, CD2, CD3, CD4, CD5, CD7, CD8, CD11b (Mac-1), CD16 (Leu 11b), CD19, CD20 (L26), CD21, CD22, CD24, CD25 (receptor alfa de interleucina 2), CD27, CD33, CD38, CD45, CD45RO, CD56, CD57, CD57/HNK1, CD69, CD72, CD79a, CD79b, CD86, CD90 (Thy-1), CD107a, CD134 (OX40), CD150, CD161, CD244 (2B4), BAT, ART2, CRTAM, CS1, DPIV (dipeptidil peptidasa IV), GM-1, H25, H366, HNK-1 (Leu 7), receptor de HP (Helix pomatia), LAT (ligador para la activación de células T), Ly24 (Pgp-1), NKH1 (N901), protocadherina 15 (PCDH15), sialil SSEA-1, FOXP3, HLA-DR, HML-1, Leu-22, Ly-2, Ly-m22, MICG, MRC OX-8, MRC OX-22, PD-1, RT6, D8/17, FMC7, M17, MUM-1, Pax-5 (BSAP), PC47H, B220, BLAST-2 (EBVCS), Bu-1, TSA-2 (Ag-2 compartido tímico), CMH de clase II, TCR alfa-beta y TCR gamma-delta. En algunas realizaciones, el agente se une específicamente a vesículas de granulocitos. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD11b, CD15, CD16, CD18, CD24, CD32, CD34, CD45, CD66b, 3C4, 8C5, fosfatasa alcalina, calprotectina, CEACAM8 (molécula de adhesión celular 8 relacionada con el antígeno carcinoembrionario), DH59B, EMR3, proteína catiónica eosinófila (ECP), factor de granulocitos (GF), GMP, Gr-1 (Ly-6G), elastasa de granulocitos, HIS48, interleucina-8 (IL-8), LAP (fosfatasa alcalina leucocitaria), LRG, Mac-1, mieloperoxidasa (MPO), NKH1, poli(ADP-ribosa), VEP8 y VEP9. En algunas realizaciones, el agente se une específicamente a vesículas de monocitos. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD11a (LFA-1 alfa), CD11b, CD14, CD15, CD54, CD62L (L-selectina), CD163, citidina desaminasa (CDD), receptores de Fc, 125I-WVH-1, 63D3, adipofilina, enzima convertidora de angiotensina, CB12, FLT-1, HLA-DR, hMGL, Ki-M1p, fosfatasa ácida resistente al tartrato leucocitaria (FATRE), Leu-7, lisozima, receptores de manosilo, aglutinina de cacahuete (PNA), tromboplastina, timidina fosforilasa (TP), TNF (factor de necrosis tumoral), urocinasa (UK), VEP8 y VEP9. En algunas realizaciones, el agente se une específicamente a vesículas de plaquetas. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD31, CD36, CD41, CD41a, CD42a, CD42b, CD49b,CD61, CD62, CD62P (P-selectina), CD63 (glicoproteína-53), AK (adenilato cinasa), anexina V, BTG (beta-tromboglobulina), glicocalicina (GC), GMP-140 (proteína de membrana de gránulos alfa plaquetarios), GPV (glicoproteína V), receptores de imidazolina (IR-1), LAMP2 (proteína de membrana asociada a lisosomas 2), PAC-1, PDMP (micropartículas derivadas de plaquetas), factor XIIIa asociado con plaquetas, factor 4 de plaquetas (PF4), S12, serotonina (5-HT), trombospondina (TSP) y tromboxano B2.
En algunas realizaciones, el agente se une específicamente a vesículas de células endoteliales. En algunas realizaciones, el agente se une específicamente a un componente vesicular elegido de CD31 (PECAM-1), CD34, CD54 (ICAM-1), CD62E, CD62P (p-selectina GMP140), CD51, CD105 (endoglina), CD106 (VCAM-1, molécula de adhesión celular vascular 1), CD144 (VE-cadherina), CD146 (P1H12), antígeno 7B4, ACE (enzima convertidora de angiotensina), BNH9/BNF13, D2-40, E-selectina, EN4, Endocan (ESM-1), Endoglyx-1, Endomuci, endosialina (TEM-1, FB5), eotaxina-3, EPAS1, antígeno relacionado con el factor VIII, FB21, Flk-1 (VEGFR-2), Flt-1 (VEGFR-1), GBP-1 (proteína de unión a guanilato 1), GRO-alfa, Hex, ICAM-2 (molécula de adhesión intercelular 2), LYVE-1, MECA-32, MECA-79, MRB (ROBO4), nucleolina, PAL-E (el anticuerpo pathologische anatomie Leiden-endothelium), RPTPmu (fosfatasa de proteína tirosina receptora mu), RTK, t EM1 (marcador endotelial tumoral 1), TEM5 (marcador endotelial tumoral 5), TEM7 (marcador endotelial tumoral 7), TEM8 (marcador endotelial tumoral 8), trombomodulina (TM, CD141), VEGF (factor de crecimiento endotelial vascular) y vWF (factor de von Willebrand).
En algunas realizaciones, el agente de unión es un anticuerpo. Por ejemplo, una vesícula (por ejemplo, una vesícula que comprende ácido nucleico) puede retirarse a partir de una muestra usando uno o más anticuerpos específicos de uno o más antígenos presentes en la vesícula. Los anticuerpos pueden ser moléculas de inmunoglobulina o porciones inmunológicamente activas de moléculas de inmunoglobulina, es decir, moléculas que contienen un sitio de unión a antígeno que se une específicamente a un antígeno. Varios anticuerpos y fragmentos de anticuerpo están disponibles para, y pueden generarse por, el experto para su uso como agente de unión específico. Los anticuerpos algunas veces son IgG, IgM, IgA, IgE o un isotipo de las mismas (por ejemplo, IgG1, IgG2a, IgG2b o IgG3), algunas veces son policlonales o monoclonales, y algunas veces son versiones quiméricas, humanizadas o biespecíficas de tales anticuerpos. Los anticuerpos policlonales y monoclonales que se unen a antígenos específicos están disponibles comercialmente, y se conocen métodos para generar tales anticuerpos. El agente de unión también puede ser un polipéptido o péptido. El término polipéptido se usa en el presente documento en su sentido más amplio y puede incluir una secuencia de aminoácidos, análogos de aminoácido o peptidomiméticos, normalmente unidos mediante enlaces peptídicos. Los polipéptidos pueden producirse de manera natural, ser formas procesadas de polipéptidos que se producen de manera natural (tal como mediante digestión enzimática), sintetizarse químicamente o expresarse de manera recombinante. Los polipéptidos para su uso en los métodos en el presente documento pueden sintetizarse químicamente usando técnicas convencionales. Los polipéptidos pueden comprender D-aminoácidos (que son resistentes a las proteasas específicas de L-aminoácidos), una combinación de D-aminoácidos y L-aminoácidos, beta-aminoácidos, o diversos otros aminoácidos diseñados o que no se producen de manera natural (por ejemplo, beta-metil-aminoácidos, C-alfa-metil-aminoácidos, N-alfa-metil-aminoácidos, y similares) para transmitir propiedades especiales. Los aminoácidos sintéticos pueden incluir ornitina para lisina y norleucina para leucina o isoleucina. En algunos casos, los polipéptidos pueden tener enlaces peptidomiméticos, tales como enlaces éster, para preparar polipéptidos con propiedades novedosas. Los polipéptidos también pueden incluir peptoides (glicinas sustituidas en N), en los que las cadenas laterales se unen a los átomos de nitrógeno a lo largo de la estructura principal de la molécula, en lugar de a los carbonos alfa como en los aminoácidos.
En algunas realizaciones, un agente de unión puede unirse directa o indirectamente a un soporte o sustrato sólido. En algunas realizaciones, las vesículas se asocian con un soporte sólido, tal como los soportes sólidos descritos a continuación, mediante uno o más agentes de unión, tales como los agentes de unión descritos en el presente documento. Un soporte o sustrato sólido puede ser cualquier sólido físicamente separable al que puede unirse directa o indirectamente un agente de unión, incluyendo, pero sin limitarse a, superficies proporcionadas por micromatrices y pocillos, y partículas tales como perlas (por ejemplo, perlas paramagnéticas, perlas magnéticas, microperlas, nanoperlas), micropartículas y nanopartículas. Los soportes sólidos también pueden incluir, por ejemplo, chips, columnas, fibras ópticas, toallitas, filtros (por ejemplo, filtros de superficie plana), uno o más capilares, vidrio y vidrio modificado o funcionalizado (por ejemplo, vidrio de tamaño de poro controlado (CPG)), cuarzo, mica, membranas diazotizadas (papel o nailon), poliformaldehído, celulosa, acetato de celulosa, papel, materiales cerámicos, metales, metaloides, materiales semiconductores, puntos cuánticos, perlas o partículas recubiertas, otros materiales cromatográficos, partículas magnéticas; plásticos (incluyendo compuestos acrílicos, poliestireno, copolímeros de estireno u otros materiales, polibutileno, poliuretanos, TEFLON™, polietileno, polipropileno, poliamida, poliéster, poli(difluoruro de vinilideno) (PVDF), y similares), polisacáridos, nailon o nitrocelulosa, resinas, sílice o materiales a base de sílice incluyendo silicio, gel de sílice y silicio modificado, Sephadex®, Sepharose®, carbono, metales (por ejemplo, acero, oro, plata, aluminio, silicio y cobre), vidrios inorgánicos, polímeros conductores (incluyendo polímeros tales como polipirrol y poliindol); superficies microestructuradas y nanoestructuradas tales como matrices de mosaico de ácido nucleico, nanotubos, nanohilos o superficie decoradas con nanopartículas; o geles o superficies porosas tales como metacrilatos, acrilamidas, polímeros de azúcares, celulosa, silicatos u otros polímeros fibrosos o trenzados. En algunos casos, el soporte o sustrato sólido puede estar recubierto usando recubrimientos pasivos o químicamente derivatizados con cualquiera de varios materiales, incluyendo polímeros, tales como dextranos, acrilamidas, gelatinas o agarosa. Las perlas y/o partículas pueden estar libres o en conexión unas con otras (por ejemplo, sinterizadas). En algunas realizaciones, la fase sólida puede ser una colección de partículas. En determinadas realizaciones, las partículas pueden comprender sílice, y la sílice puede comprender dióxido de sílice. En algunas realizaciones, la sílice puede ser porosa, y en determinadas realizaciones la sílice puede ser no porosa. En algunas realizaciones, las partículas comprenden además un agente que confiere una propiedad paramagnética a las partículas. En determinadas realizaciones, el agente comprende un metal, y en determinadas realizaciones el agente es un óxido de metal (por ejemplo, hierro u óxidos de hierro, en el que el óxido de hierro contiene una mezcla de Fe2+ y Fe3+).
Usando los métodos descritos en el presente documento, pueden separarse las vesículas (y el ácido nucleico en las mismas) a partir de un ácido nucleico de muestra, generando de ese modo un producto de separación. Los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular. Tal como se usa en el presente documento, el término “parcial o sustancialmente libre” se refiere a un producto de separación para el que se ha agotado de al menos aproximadamente el 50% a aproximadamente el 100% del ácido nucleico vesicular. Por ejemplo, un producto de separación que está parcial o sustancialmente libre de ácido nucleico vesicular se ha agotado al menos aproximadamente el 60%, el 70%, el 80%, el 90%, el 95%, el 96%, el 97%, el 98%, el 99% o el 99,9% del ácido nucleico vesicular. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de células maternas. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de células huésped. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de células no cancerosas. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de células endoteliales. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de células hematopoyéticas. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de glóbulos rojos. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de leucocitos. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de linfocitos. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de granulocitos. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de monocitos. En determinadas realizaciones, los productos de separación pueden estar parcial o sustancialmente libres de ácido nucleico vesicular procedente de plaquetas.
Selección de ácido nucleico vesicular
En algunas realizaciones, una especie de ácido nucleico vesicular se enriquece usando un enfoque de enriquecimiento positivo. Por ejemplo, en algunas realizaciones, una especie de ácido nucleico vesicular de origen fetal se enriquece seleccionando como diana selectivamente una característica específica (por ejemplo, un biomarcador) de la vesícula de origen fetal, tal como se describió anteriormente. En algunas realizaciones, una vesícula de origen fetal es un cuerpo apoptótico. En algunas realizaciones, una especie de ácido nucleico vesicular de origen fetal se enriquece usando un método de centrifugación. Los métodos de centrifugación incluyen generalmente métodos mediante los cuales se logra la separación de componentes de muestra aplicando fuerza centrífuga. En la técnica se conocen diversos métodos de centrifugación e incluyen, sin limitación, ultracentrifugación, centrifugación diferencial, centrifugación por gradiente de densidad en equilibrio y centrifugación zonal.
En algunos casos, la centrifugación puede separar componentes de una muestra (por ejemplo, micropartículas, cuerpos apoptóticos) y, por tanto, enriquecer una subpoblación de ácido nucleico asociado con tales componentes. Por tanto, sin estar limitados por la teoría, si una proporción más grande de ácido nucleico fetal se asocia con un determinado componente de muestra (por ejemplo, cuerpos apoptóticos) que el ácido nucleico materno, entonces el enriquecimiento del componente de muestra usando centrifugación puede enriquecer el ácido nucleico fetal. En algunos casos, sin estar limitados por la teoría, si una proporción más grande de ácido nucleico materno se asocia con un determinado componente de muestra (por ejemplo, cuerpos apoptóticos) que el ácido nucleico fetal, entonces el agotamiento del componente de muestra usando centrifugación puede enriquecer el ácido nucleico fetal. En algunas realizaciones, la centrifugación comprende el uso de ultracentrifugación (por ejemplo, centrifugación a alta velocidad). Un procedimiento de centrifugación genera normalmente un sobrenadante y un sedimento, o zonas dentro de un gradiente (por ejemplo, gradiente de densidad), en determinados casos. En algunas realizaciones, el ácido nucleico fetal se enriquece en el sobrenadante. En algunas realizaciones, el ácido nucleico fetal se enriquece en el sedimento. En algunas realizaciones, el ácido nucleico fetal se enriquece en una o más zonas dentro de un gradiente. En algunas realizaciones, el sobrenadante se somete a una o más centrifugaciones adicionales. En algunas realizaciones, el sedimento se somete a una o más centrifugaciones adicionales.
Para lograr una separación deseada de componentes de muestra, pueden ajustarse una o más de la velocidad, la duración y la cantidad de centrifugación. En algunas realizaciones, se usa una velocidad de centrifugación de aproximadamente 1000 g o mayor. Por ejemplo, puede usarse una velocidad de centrifugación de aproximadamente 1200 g, 1300 g, 1400 g, 1500 g, 1600 g, 1800 g, 2000 g, 2200 g, 2400 g, 2500 g, 2600 g, 2800 g o 3000 g o mayor. En algunas realizaciones, se usa una velocidad de centrifugación de aproximadamente 1600 g. En algunas realizaciones, se usa una velocidad de centrifugación de aproximadamente 2500 g. En algunas realizaciones, se usa una velocidad de centrifugación de aproximadamente 20,000 g o mayor. Por ejemplo, puede usarse una velocidad de centrifugación de aproximadamente 21.000 g, 22.000 g, 23.000 g, 24.000 g, 25.000 g, 26.000 g, 27.000 g, 28.000 g, 29.000 g o 30.000 g o mayor. En algunas realizaciones, se usa una velocidad de centrifugación de aproximadamente 25.000 g. En algunas realizaciones, se usa una velocidad de centrifugación de aproximadamente 80.000 g o mayor. Por ejemplo, puede usarse una velocidad de centrifugación de aproximadamente 80.000 g, 90.000 g, 95.000 g, 96.000 g, 97.000 g, 98.000 g, 99.000 g, 100.000 g, 101.000 g, 102.000 g, 103.000 g, 104.000 g, 105.000 g, 110.000 g o mayor. En algunas realizaciones, se usa una velocidad de aproximadamente 100.000 g.
En algunas realizaciones, se usa una duración de centrifugación de aproximadamente 1 minuto o mayor. Por ejemplo, puede usarse una duración de centrifugación de aproximadamente 5 minutos, 10 minutos, 15 minutos, 20 minutos, 30 minutos, 40 minutos, 50 minutos, 60 minutos, 90 minutos o 120 minutos o mayor. En algunas realizaciones, se usa una duración de centrifugación de aproximadamente 10 minutos. En algunas realizaciones, se usa una duración de centrifugación de aproximadamente 15 minutos. En algunas realizaciones, se usa una duración de centrifugación de aproximadamente 60 minutos.
Agotamiento de una especie de ácido nucleico asociado con histona
En el presente documento se proporcionan métodos para enriquecer una subpoblación de ácido nucleico libre de células en una muestra separando una subpoblación diferente de ácido nucleico libre de células asociada con una determinada histona o variante de histona a partir de la muestra. Las histonas son proteínas nucleares que constituyen la estructura de nucleosoma de la fibra cromosómica en eucariotas. Generalmente, los nucleosomas comprenden aproximadamente 146 pares de bases de ADN envueltos alrededor de un octámero de histona que incluye pares de cada una de las cuatro histonas principales (H2A, H2B, H3 y H4). La fibra de cromatina puede compactarse adicionalmente a través de la interacción de una histona ligadora, H1, con el ADN entre los nucleosomas para formar estructuras de cromatina de orden superior. La metilación de residuos de lisina específicos de posición en los extremo N-terminales de histona puede ayudar a regular transiciones epigenéticas en la cromatina. Determinados residuos de lisina pueden existir en un estado monometilado, dimetilado o trimetilado. Los residuos de arginina también pueden ser monometilados o dimetilados.
Tal como se usa en el presente documento, “variante de histona” se refiere a diversas modificaciones de histona posteriores a la traducción (por ejemplo, metilación, acetilación, fosforilación, y similares) e isoformas, epítopos o subtipos de histona. Por ejemplo, la clase H3 de histonas incluye cuatro subtipos diferentes: los tipos principales, H3.1 y H3.2; el tipo de reemplazo, H3.3; y la variante específica de testículo, H3t. H3.1 y H3.2 están estrechamente relacionadas, difiriendo únicamente en Ser96. H3.1 difiere de H3.3 en al menos 5 posiciones de aminoácido. En otro ejemplo, la histona ligadora H1 incluye varios subtipos incluyendo H1a, H1b, H1c, H1d, H1e, H1m y H1(0), cada una de las cuales comprende diversas diferencias de secuencia de aminoácidos.
Las diferencias en las histonas y/o variantes de histona pueden aprovecharse para la separación de determinadas subpoblaciones de ácido nucleico libre de células a partir de una muestra, enriqueciendo de ese modo otra subpoblación de ácido nucleico libre de células. Por ejemplo, un ácido nucleico de muestra circulante libre de células a partir de una muestra biológica puede comprender una primera especie de ácido nucleico asociado con histona y una segunda especie de ácido nucleico asociado con histona. Parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona puede separarse a partir del ácido nucleico de muestra, generando de ese modo un producto de separación enriquecido en la segunda especie de ácido nucleico asociado con histona.
Las diferencias en las histonas y/o variantes de histona también pueden aprovecharse para el enriquecimiento de ácido nucleico fetal en el ácido nucleico de muestra que incluye ácido nucleico fetal y ácido nucleico materno. En algunos casos, un ácido nucleico de muestra circulante libre de células a partir de una muestra biológica de una hembra preñada comprende una primera especie de ácido nucleico asociado con histona y una segunda especie de ácido nucleico asociado con histona. Parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona puede separarse a partir del ácido nucleico de muestra, generando de ese modo un producto de separación enriquecido en la segunda especie de ácido nucleico asociado con histona, donde el ácido nucleico fetal en el producto de separación está enriquecido en relación con el ácido nucleico fetal en el ácido nucleico de muestra.
En un ejemplo, la histona H3.1 puede enriquecerse en mayor medida en el hígado fetal, en comparación con los niveles de histona H3.1 en tejidos adultos incluyendo hígado, riñón y corazón. En tejido adulto, la variante H3.3 puede ser más abundante que la variante H3.1 (véanse, por ejemplo, las publicaciones de solicitud de patente estadounidense n.os 2007/0243549 y 2010/0240054). Por tanto, una primera especie de ácido nucleico asociado con histona puede ser un ácido nucleico asociado con histona H3.3 y una segunda especie de ácido nucleico asociado con histona puede ser un ácido nucleico asociado con histona H3.1. Dado que la histona H3.1 puede enriquecerse en tejido fetal, separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona (es decir, ácido nucleico asociado con histona H3.3) a partir del ácido nucleico de muestra puede agotar una proporción de ácido nucleico materno y generar un producto de separación enriquecido en el ácido nucleico fetal en relación con el ácido nucleico fetal en el ácido nucleico de muestra. En algunos casos, la estructura conformacional del ADN fetal en nucleosomas es de tal manera que la histona H3.1 está más expuesta en el ADN fetal que en el ADN materno. Una diferencia de este tipo también puede aprovecharse para seleccionar como diana la histona H3.1.
En otro ejemplo, la histona H1a puede enriquecerse en la retina fetal, en comparación con los niveles de histona H1a en retina adulta, que puede tener niveles relativamente mayores de histona H1b y H1(0) (véase Perkins y Young (1987) Jpn J Ophthalmol. 31(4):590-7). Por tanto, una primera especie de ácido nucleico asociado con histona puede ser un ácido nucleico asociado con histona H1b y/o H1(0) y una segunda especie de ácido nucleico asociado con histona puede ser un ácido nucleico asociado con histona H1a. Dado que la histona H1a puede enriquecerse en un determinado tejido fetal, separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona (es decir, ácido nucleico asociado con histona H1b y/o H1(0)) a partir del ácido nucleico de muestra puede agotar una proporción de ácido nucleico materno y generar un producto de separación enriquecido en el ácido nucleico fetal en relación con el ácido nucleico fetal en el ácido nucleico de muestra.
En otro ejemplo, determinadas subpoblaciones de ácido nucleico libre de células pueden estar asociadas con histonas que comprenden una o más modificaciones posteriores a la traducción tales como metilación, acetilación, fosforilación, y similares. Por ejemplo, el ácido nucleico fetal puede estar asociado con una histona metilada, tal como, por ejemplo, una histona H1 o H3 (por ejemplo, H3.1) metilada, y el ácido nucleico materno puede estar asociado con una histona no metilada, tal como, por ejemplo, una histona H1 o H3 (por ejemplo, H3.1) no metilada. Por tanto, una primera especie de ácido nucleico asociado con histona puede ser un ácido nucleico asociado con una histona no modificada y una segunda especie de ácido nucleico asociado con histona puede ser un ácido nucleico asociado con una histona modificada de manera posterior a la traducción. Dado que el tejido fetal puede enriquecerse en histonas que comprenden determinadas modificaciones posteriores a la traducción, separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona (es decir, ácido nucleico asociado con una histona no modificada) a partir del ácido nucleico de muestra puede agotar una proporción de ácido nucleico materno y generar un producto de separación enriquecido en el ácido nucleico fetal en relación con el ácido nucleico fetal en el ácido nucleico de muestra.
Pueden usarse métodos de separación que emplean un agente de unión, por ejemplo, para agotar un ácido nucleico asociado con histona particular en una muestra. En tales métodos, las proteínas histona (y el ácido nucleico asociado con histona) unidos por el agente se separan a partir de la muestra. Un agente de unión es un agente que se une específicamente a una histona o variante de histona particular. Un agente “se une específicamente” a una histona o variante de histona si el agente de unión se une preferentemente a la histona o variante de histona y tiene, por ejemplo, menos de aproximadamente el 30%, el 20%, el 10%, el 5% o el 1% de reactividad cruzada con otra molécula. Los métodos para unir un agente a una histona o variante de histona se describen, por ejemplo, en las publicaciones de solicitud de patente estadounidense n.os 2007/0243549 y 2010/0240054. Los agentes de unión pueden ser cualquier agente de unión conocido en la técnica o descrito en el presente documento, tales como anticuerpos tal como se describió anteriormente. En algunas realizaciones, el agente de unión (por ejemplo, anticuerpo) se acopla a un soporte sólido tal como se describió anteriormente. Tales métodos de separación pueden incluir una etapa de lisis para liberar el ácido nucleico contenido en vesículas, en algunas realizaciones. En la técnica se conocen métodos de lisis de vesículas e incluyen generalmente el uso de un tampón de lisis disponible comercialmente.
En algunas realizaciones, el agente de unión es específico de una histona o variante de histona particular. Tales histonas o variantes de histona pueden incluir, por ejemplo, cualquier proteína, subtipo, epítopo o isoforma de histona descritos en el presente documento o conocidos en la técnica, cada uno de los cuales puede incluir cualquiera de las modificaciones posteriores a la traducción descritas en el presente documento o conocidas en la técnica o puede no estar modificado. En algunas realizaciones, el agente de unión es específico de una histona procedente de una célula materna. En algunas realizaciones, el agente de unión es específico de una histona modificada. En algunas realizaciones, el agente de unión es específico de una histona modificada que comprende una determinada cantidad y/o combinación de modificaciones posteriores a la traducción, tales como, por ejemplo, metilación, fosforilación y/o acetilación. En algunas realizaciones, el agente de unión es específico de una histona metilada. En algunas realizaciones, el agente de unión es específico de una histona acetilada. En algunas realizaciones, el agente de unión es específico de una histona fosforilada. En algunas realizaciones, el agente de unión es específico de una histona no modificada. En algunas realizaciones, el agente de unión es específico de una histona no metilada. En algunas realizaciones, el agente de unión es específico de una histona no acetilada. En algunas realizaciones, el agente de unión es específico de una histona no fosforilada. En algunas realizaciones, el agente de unión es específico de histona H3.3. En algunas realizaciones, el agente de unión es específico de histona H1b y/o H1(0).
En algunas realizaciones, una muestra puede enriquecerse en una subpoblación de ácido nucleico libre de células mediante el agotamiento de ácido nucleico asociado con una histona o variante de histona particular. Por ejemplo, un ácido nucleico de muestra circulante libre de células a partir de una muestra biológica puede comprender una primera especie de ácido nucleico asociado con histona y una segunda especie de ácido nucleico asociado con histona. Parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona puede separarse a partir del ácido nucleico de muestra, generando de ese modo un producto de separación enriquecido en la segunda especie de ácido nucleico asociado con histona. En algunas realizaciones, el producto de separación comprende aproximadamente el 50% o mayor de una segunda especie de ácido nucleico asociado con histona. Por ejemplo, el producto de separación puede comprender aproximadamente el 55%, el 60%, el 65%, el 70%, el 75%, el 80%, el 85%, el 90%, el 95% o el 100% de una segunda especie de ácido nucleico asociado con histona. En algunas realizaciones, el ácido nucleico fetal en el producto de separación está enriquecido en relación con el ácido nucleico fetal en el ácido nucleico de muestra. En algunas realizaciones, el ácido nucleico fetal en el producto de separación puede enriquecerse de aproximadamente 1,5 veces a aproximadamente 20 veces en relación con el ácido nucleico fetal en el ácido nucleico de muestra. Por ejemplo, el ácido nucleico fetal puede enriquecerse aproximadamente 2, 3, 4, 5, 6, 7, 8, 9, 10 ó 15 veces.
Separación de especies de ácido nucleico asociado con histona
En algunas realizaciones, un método comprende separar parte o sustancialmente la totalidad de una primera especie de ácido nucleico asociado con histona a partir de una segunda especie de ácido nucleico asociado con histona, generando de ese modo un producto de separación enriquecido en la segunda especie de ácido nucleico asociado con histona. En algunas realizaciones, el ácido nucleico fetal en el producto de separación está enriquecido en relación con el ácido nucleico fetal en el ácido nucleico de muestra. En determinados casos, el ADN fetal libre de células circulante puede estar asociado con micropartículas y nucleosomas (por ejemplo, unido a histona) que se derivan de tejido fetal. En determinados casos, el ADN materno libre de células circulante puede estar asociado con micropartículas y nucleosomas (por ejemplo, unido a histona) que se derivan de tejido materno. Por tanto, en algunas realizaciones, la utilización de agentes de unión específicos de fuente fetal (por ejemplo, anticuerpos) para seleccionar como diana micropartículas y/o nucleosomas de origen fetal puede enriquecer el ADN fetal. En algunas realizaciones, la utilización de agentes de unión específicos de fuente materna (por ejemplo, anticuerpos) para seleccionar como diana micropartículas y/o nucleosomas de origen materno puede enriquecer el ADN fetal.
El ADN de nucleosoma está asociado normalmente con un octámero de ocho histonas principales: H2A (2), H2B (2), H3 (2) y H4 (2); y una histona ligadora H1. En sangre y plasma clarificado maternos, el ADNlcc fetal puede tener una menor ocupación de H1 (es decir, un porcentaje más pequeño del ADN de nucleosoma de origen fetal puede tener H1 unida, en relación con el porcentaje de ADNlcc materno que tiene H1 unida). Sin estar limitados por la teoría, la distribución de tamaño típica de ADNlcc fetal frente a ADNlcc materno es según este concepto, puesto que el ADN de nucleosoma sin H1 unida puede ser más susceptible a digestión con endonucleasas, dando como resultado de ese modo fragmentos más cortos.
En algunas realizaciones, un agente que se une a histona H1 (por ejemplo, sin especificidad particular por subtipos o fuentes de H1) se usa como herramienta para un enfoque de selección negativa para enriquecer el ADN fetal. El tratamiento de plasma con un agente de este tipo (por ejemplo, anticuerpo), por ejemplo, en un protocolo de inmunoprecipitación (por ejemplo, inmunoprecipitación de cromatina (CHIP)) puede agotar el ADNlcc materno a partir de la muestra, aumentando de ese modo la fracción de ADNlcc fetal en la muestra residual.
En algunas realizaciones, se usan anticuerpos contra histonas fetales específicas (por ejemplo, H1.1, H1.3, H1.5) para enriquecer el ADNlcc fetal en determinados enfoques de selección positiva. En algunas realizaciones, se usan anticuerpos contra histonas maternas específicas (por ejemplo, H1, H1.0) para enriquecer el ADNlcc fetal en determinados protocolos de enriquecimiento basado en agotamiento (es decir, selección negativa). En algunas realizaciones, se usan anticuerpos contra histona H1M (expresada en embriones de Xenopus) y/o contra H1FOO (que se expresan en ovocitos) para enriquecer el ADNlcc fetal en determinados enfoques de selección positiva. Estos enfoques pueden incluir cualquier método de separación adecuado descrito en el presente documento o conocido en la técnica, tal como los enfoques de inmunoprecipitación convencional y de inmunoprecipitación de cromatina (CHIP), por ejemplo.
Existen aproximadamente once variantes de H1, algunas de las cuales pueden ser específicas de (o mostrar una unión preferente a) ADNlcc de origen fetal. Además, pueden aprovecharse diversas diferencias maternas frente a fetales en el subtipo de histona H3 para enriquecer la fracción fetal. Por ejemplo, pueden usarse anticuerpos que reconocen diferencias de exposición conformacional para la histona H3.1 (por ejemplo, diferencias entre H3.1 fetal y materna) para el enriquecimiento de ADN fetal a partir de plasma tratado con tales anticuerpos, en determinadas realizaciones. Por ejemplo, pueden aprovecharse la variación de secuencia (por ejemplo, 10 aminoácidos extra en el extremo C-terminal de la H3.1 fetal) y la metilación particular de H3.1 en fetal frente a materno para el enriquecimiento de ADN fetal, en determinadas realizaciones.
Los métodos para identificar determinados anticuerpos (por ejemplo, selectivos para histonas y/o nucleosomas de origen fetal frente a histonas y/o nucleosomas de origen materno) a partir de poblaciones comerciales u obtenidas de anticuerpos, fragmentos de anticuerpo o aptámeros se describen en el ejemplo 1.
Enriquecimiento de una subpoblación de ácido nucleico
Los métodos proporcionados en el presente documento pueden generar productos de separación que están enriquecidos en una subpoblación de ácido nucleico (por ejemplo, enriquecidos en una subpoblación de ácido nucleico libre de células). En determinadas realizaciones, los productos de separación pueden enriquecerse en el ácido nucleico libre de vesículas mediante el agotamiento de ácido nucleico vesicular. En algunas realizaciones, un producto de separación comprende aproximadamente el 50% o mayor de ácido nucleico libre de vesículas. Por ejemplo, un producto de separación puede comprender aproximadamente el 55%, el 60%, el 65%, el 70%, el 75%, el 80%, el 85%, el 90%, el 95% o el 100% de ácido nucleico libre de vesículas. En algunas realizaciones, parte o sustancialmente la totalidad de ácido nucleico vesicular se separa a partir del ácido nucleico de muestra, generando de ese modo un producto de separación enriquecido en el ácido nucleico libre de vesículas.
En determinadas realizaciones, un producto de separación puede enriquecerse en el ácido nucleico libre de histonas mediante el agotamiento de ácido nucleico asociado con histona. En algunas realizaciones, un producto de separación comprende aproximadamente el 50% o mayor de ácido nucleico libre de histonas. Por ejemplo, un producto de separación puede comprender aproximadamente el 55%, el 60%, el 65%, el 70%, el 75%, el 80%, el 85%, el 90%, el 95% o el 100% de ácido nucleico libre de histonas. En algunas realizaciones, parte o sustancialmente la totalidad de ácido nucleico asociado con histona se separa a partir del ácido nucleico de muestra, generando de ese modo un producto de separación enriquecido en el ácido nucleico libre de histonas.
En algunas realizaciones, un producto de separación está enriquecido en el ácido nucleico asociado con una especie de histona o un grupo de especies de histona particular. El ácido nucleico asociado con una especie de histona o un grupo de especies de histona particular puede separarse a partir de histonas, y en consecuencia, un producto de separación algunas veces está enriquecido en el ácido nucleico que estaba asociado con una especie de histona o un grupo de especies de histona particular. En determinadas realizaciones, un producto de separación puede enriquecerse en el ácido nucleico asociado con histona poniendo en contacto el ácido nucleico de muestra con un agente de unión que se une específicamente a una especie de histona o a un grupo de especies de histona particular y separando el ácido nucleico asociado con el agente (por ejemplo, ácido nucleico unido al agente, o ácido nucleico en un complejo unido al agente) a partir del ácido nucleico no unido al agente. En algunas realizaciones, un producto de separación comprende aproximadamente el 50% o mayor de ácido nucleico asociado con histona, o aproximadamente el 50% o mayor de ácido nucleico que estaba en asociación con una especie de histona o un grupo de especies de histona particular. Por ejemplo, un producto de separación puede comprender aproximadamente el 55%, el 60%, el 65%, el 70%, el 75%, el 80%, el 85%, el 90%, el 95% o el 100% de ácido nucleico asociado con histona o ácido nucleico que estaba en asociación con una especie de histona o un grupo de especies de histona particular. En algunas realizaciones, parte o sustancialmente la totalidad de ácido nucleico no asociado con una especie de histona o un grupo de especies de histona particular se separa a partir del ácido nucleico asociado con, o que estaba asociado con, la especie de histona o el grupo de especies de histona particular, generando de ese modo un producto de separación enriquecido en el ácido nucleico asociado con histona o en el ácido nucleico que estaba asociado con la histona o el grupo de histonas.
En algunas realizaciones, el ácido nucleico fetal en un producto de separación está enriquecido en relación con el ácido nucleico fetal en el ácido nucleico de muestra. En determinadas realizaciones, la proporción relativa de (i) ácido nucleico fetal con respecto a (ii) ácido nucleico no fetal es mayor en el producto de separación que en el ácido nucleico de muestra.
Para determinar una proporción de este tipo, el ácido nucleico no fetal algunas veces es ácido nucleico materno, ácido nucleico asociado con histona total, ácido nucleico asociado con vesículas total o ácido nucleico total (por ejemplo, ácido nucleico asociado con histona y ácido nucleico no asociado con histona; ácido nucleico asociado con vesículas y ácido nucleico no asociado con vesículas). El ácido nucleico fetal en un producto de separación algunas veces está enriquecido de 1,5 veces a 1.000 veces en relación con el ácido nucleico fetal en el ácido nucleico de muestra (por ejemplo, enriquecido 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800 ó 900 veces). En algunas realizaciones, el ácido nucleico fetal en el producto de separación puede enriquecerse de aproximadamente 1,5 veces a aproximadamente 20 veces en relación con el ácido nucleico fetal en el ácido nucleico de muestra. Por ejemplo, el ácido nucleico fetal puede enriquecerse aproximadamente 2, 3, 4, 5, 6, 7, 8, 9, 10 ó 15 veces. En algunas realizaciones, el ácido nucleico de origen tumoral en un producto de separación está enriquecido en relación con el ácido nucleico de origen tumoral en el ácido nucleico de muestra. En algunas realizaciones, el ácido nucleico derivado de trasplantes de órganos sólidos en un producto de separación está enriquecido en relación con el ácido nucleico derivado de trasplantes de órganos sólidos en el ácido nucleico de muestra.
En algunas realizaciones, una muestra de ácido nucleico puede enriquecerse adicionalmente en una subpoblación particular de ácido nucleico libre de células mediante un método conocido en la técnica o descrito en el presente documento. Por ejemplo, una muestra de ácido nucleico puede enriquecerse adicionalmente en una subpoblación particular de ácido nucleico libre de células poniendo en contacto el ácido nucleico que está sustancialmente libre de vesículas con un agente que se une específicamente a una histona asociada con el ácido nucleico libre de vesículas. En determinadas realizaciones, la histona está asociada con una subpoblación de ácido nucleico libre de células que es diferente de la subpoblación enriquecida de ácido nucleico libre de células. Por ejemplo, la histona puede estar asociada con ácido nucleico libre de células materno. Los métodos para enriquecer en una subpoblación de ácido nucleico libre de células usando agentes de unión a histona se describen con mayor detalle en el presente documento.
Un producto de separación que contiene ácido nucleico fetal a menudo contiene fragmentos de ácido nucleico fetal. Los fragmentos de ácido nucleico fetal en un producto de separación a menudo oscilan en cuanto a tamaño desde aproximadamente 50 pares de bases hasta aproximadamente 200 pares de bases. Todo el genoma fetal o una fracción significativa del genoma fetal (por ejemplo, el 70% o más del genoma fetal) algunas veces está representado en un producto de separación. Los fragmentos de ácido nucleico fetal que tienen la misma longitud (por ejemplo, una longitud de fragmento de 149 pares de bases o una longitud de fragmento de 150 pares de bases) en un producto de separación a menudo representan un gran número de secuencias. A menudo existen muchos fragmentos de ácido nucleico fetal que tienen la misma longitud pero secuencias diferentes en un producto de separación. En algunas realizaciones, aproximadamente 1/15 del genoma fetal está representado por fragmentos de ácido nucleico fetal que tienen la misma longitud (por ejemplo, de 1/12 a 1/18 (por ejemplo, 1/13, 1/14, 1/16, 1/17, 1/18)). Los fragmentos de ácido nucleico fetal que tienen una longitud particular en un producto de separación a menudo son de regiones múltiples y distintas del genoma. Parte o la totalidad de los fragmentos de ácido nucleico fetal en un producto de separación a menudo tienen tamaños separados por un par de bases (1 pb), donde cada fragmento es 1 pb más grande que el siguiente fragmento más corto.
Enriquecimiento adicional de ácido nucleico libre de células
En algunas realizaciones, el ácido nucleico (por ejemplo, ácido nucleico extracelular) se enriquece o se enriquece relativamente en una subpoblación o especie de ácido nucleico usando un método descrito en el presente documento y uno o más métodos de enriquecimiento adicionales. Las subpoblaciones de ácido nucleico pueden incluir, por ejemplo, ácido nucleico fetal, ácido nucleico materno, ácido nucleico que comprende fragmentos de una longitud o un intervalo de longitudes particular, o ácido nucleico a partir de una región genómica particular (por ejemplo, cromosoma único, conjunto de cromosomas y/o determinadas regiones cromosómicas). Tales muestras enriquecidas pueden usarse junto con un método proporcionado en el presente documento. Por tanto, en determinadas realizaciones, los métodos de la tecnología comprenden una etapa adicional de enriquecer una subpoblación de ácido nucleico en una muestra, tal como, por ejemplo, ácido nucleico fetal. En algunas realizaciones, también pueden usarse determinados métodos para determinar la fracción fetal descritos a continuación para enriquecer el ácido nucleico fetal. En determinadas realizaciones, el ácido nucleico materno se retira selectivamente (de manera parcial, sustancial, casi completa o completa) a partir de la muestra. En algunas realizaciones, el enriquecimiento de una especie de ácido nucleico de bajo número de copias particular (por ejemplo, ácido nucleico fetal) puede mejorar la sensibilidad cuantitativa. Los métodos para enriquecer una especie de ácido nucleico particular de una muestra se describen, por ejemplo, en la patente estadounidense n.° 6.927.028, la publicación de solicitud de patente internacional n.° WO2007/140417, la publicación de solicitud de patente internacional n.° WO2007/147063, la publicación de solicitud de patente internacional n.° WO2009/032779, la publicación de solicitud de patente internacional n.° WO2009/032781, la publicación de solicitud de patente internacional n.° WO2010/033639, la publicación de solicitud de patente internacional n.° WO2011/034631, la publicación de solicitud de patente internacional n.° WO2006/056480 y la publicación de solicitud de patente internacional n.° WO2011/143659.
En algunas realizaciones, el ácido nucleico está enriquecido en determinadas especies de fragmento diana y/o especies de fragmento de referencia. En algunas realizaciones, el ácido nucleico está enriquecido en una longitud de fragmento o un intervalo de longitudes de fragmento de ácido nucleico específicos usando uno o más métodos de separación basada en longitud descritos a continuación. En algunas realizaciones, el ácido nucleico está enriquecido en fragmentos a partir de una región genómica seleccionada (por ejemplo, un cromosoma) usando uno o más métodos de separación basada en secuencia descritos en el presente documento y/o conocidos en la técnica. Determinados métodos para enriquecer en una subpoblación de ácido nucleico (por ejemplo, ácido nucleico fetal) en una muestra se describe con detalle a continuación.
Algunos métodos para enriquecer una subpoblación de ácido nucleico (por ejemplo, ácido nucleico fetal) que pueden usarse con un método descrito en el presente documento incluyen métodos que aprovechan diferencias epigenéticas entre ácido nucleico materno y fetal. Por ejemplo, el ácido nucleico fetal puede diferenciarse y separarse a partir del ácido nucleico materno basándose en diferencias de metilación. Los métodos de enriquecimiento de ácido nucleico fetal basados en metilación se describen en la publicación de solicitud de patente estadounidense n.° 2010/0105049. Tales métodos algunas veces implican unir un ácido nucleico de muestra a un agente de unión específico de metilación (proteína de unión a metil-CpG (MBD), anticuerpos específicos de metilación, y similares) y separar el ácido nucleico unido a partir del ácido nucleico no unido basándose en el estado de metilación diferencial. Tales métodos también pueden incluir el uso de enzimas de restricción sensibles a la metilación (tal como se describió anteriormente; por ejemplo, Hhal y Hpall), que permiten el enriquecimiento de regiones de ácido nucleico fetal en una muestra materna mediante la digestión selectiva del ácido nucleico a partir de la muestra materna con una enzima que digiere de manera selectiva y de manera completa o sustancial el ácido nucleico materno para enriquecer al menos una región de ácido nucleico fetal de la muestra.
Otro método para enriquecer una subpoblación de ácido nucleico (por ejemplo, ácido nucleico fetal) que puede usarse con un método descrito en el presente documento es un enfoque de secuencia polimórfica potenciada por endonucleasa de restricción, tal como un método descrito en la publicación de solicitud de patente estadounidense n.° 2009/0317818. Tales métodos incluyen la escisión del ácido nucleico que comprende un alelo inespecífico con una endonucleasa de restricción que reconoce el ácido nucleico que comprende el alelo inespecífico pero no el alelo diana; y la amplificación del ácido nucleico no escindido pero no del ácido nucleico escindido, en los que el ácido nucleico amplificado no escindido representa el ácido nucleico diana enriquecido (por ejemplo, ácido nucleico fetal) en relación con el ácido nucleico inespecífico (por ejemplo, ácido nucleico materno). En algunas realizaciones, el ácido nucleico puede seleccionarse de tal manera que comprende un alelo que tiene un sitio polimórfico que es susceptible a la digestión selectiva por un agente de escisión, por ejemplo.
Algunos métodos para enriquecer una subpoblación de ácido nucleico (por ejemplo, ácido nucleico fetal) que pueden usarse con un método descrito en el presente documento incluyen enfoques de degradación enzimática selectiva. Tales métodos implican proteger las secuencias diana de la digestión con exonucleasa facilitando de ese modo la eliminación de secuencias no deseadas (por ejemplo, ADN materno) en una muestra. Por ejemplo, en un enfoque, el ácido nucleico de muestra se desnaturaliza para generar ácido nucleico monocatenario, se pone en contacto el ácido nucleico monocatenario con al menos un par de cebadores específicos de diana en condiciones de hibridación adecuadas, se extienden los cebadores hibridados mediante polimerización de nucleótidos generando secuencias diana bicatenarias, y se digiere el ácido nucleico monocatenario usando una nucleasa que digiere el ácido nucleico monocatenario (es decir, inespecífico). En algunas realizaciones, el método puede repetirse durante al menos un ciclo adicional. En algunas realizaciones, se usa el mismo par de cebadores específicos de diana para cebar cada uno de los ciclos de extensión primero y segundo, y en algunas realizaciones, se usan pares de cebadores específicos de diana diferentes para los ciclos primero y segundo.
Algunos métodos para enriquecer una subpoblación de ácido nucleico (por ejemplo, ácido nucleico fetal) que pueden usarse con un método descrito en el presente documento incluyen enfoques de secuenciación de firma en paralelo de manera masiva (MPSS). La MPSS es normalmente un método en fase sólida que usa ligación de adaptador (es decir, etiqueta), seguido de la decodificación del adaptador y la lectura de la secuencia de ácido nucleico en pequeños incrementos. Los productos de PCR etiquetados se amplifican normalmente de tal manera que cada ácido nucleico genera un producto de PCR con una etiqueta única. Las etiquetas se usan a menudo para unir los productos de PCR a microperlas. Después de varias rondas de determinación de secuencias basada en ligación, por ejemplo, puede identificarse una firma de secuencia a partir de cada perla. Se analiza cada secuencia de firma (etiqueta de MPSS) en un conjunto de datos de MPSS, se compara con todas las demás firmas y se cuentan todas las firmas idénticas.
En algunas realizaciones, determinados métodos de enriquecimiento basados en MPSS pueden incluir enfoques basados en amplificación (por ejemplo, en PCR). En algunas realizaciones, pueden usarse métodos de amplificación específicos de locus (por ejemplo, usando cebadores de amplificación específicos de locus). En algunas realizaciones, puede usarse un enfoque de PCR de múltiples alelos de SNP. En algunas realizaciones, puede usarse un enfoque de PCR de múltiples alelos de SNP en combinación con secuenciación uniplex. Por ejemplo, un enfoque de este tipo puede implicar el uso de PCR múltiple (por ejemplo, sistema MASSARRAY) y la incorporación de secuencias de sonda de captura en los amplicones seguido de secuenciación usando, por ejemplo, el sistema de MPSS de Illumina. En algunas realizaciones, puede usarse un enfoque de PCR de múltiples alelos de SNP en combinación con un sistema de tres cebadores y secuenciación indexada. Por ejemplo, un enfoque de este tipo puede implicar el uso de PCR múltiple (por ejemplo, sistema MASSARRAY) con cebadores que tienen una primera sonda de captura incorporada en determinados cebadores de PCR directos específicos de locus y secuencias de adaptador incorporadas en cebadores de PCR inversos específicos de locus, para generar de ese modo amplicones, seguido de una PCR secundaria para incorporar secuencias de captura inversa y códigos de barras de índice molecular para la secuenciación usando, por ejemplo, el sistema de MPSS de Illumina. En algunas realizaciones, puede usarse un enfoque de PCR de múltiples alelos de SNP en combinación con un sistema de cuatro cebadores y secuenciación indexada. Por ejemplo, un enfoque de este tipo puede implicar el uso de PCR múltiple (por ejemplo, sistema MASSARRAY) con cebadores que tienen secuencias de adaptador incorporadas tanto en cebadores de PCR directos específicos de locus como en cebadores de PCR inversos específicos de locus, seguido de una PCR secundaria para incorporar secuencias de captura tanto directa como inversa y códigos de barras de índice molecular para la secuenciación usando, por ejemplo, el sistema de MPSS de Illumina. En algunas realizaciones, puede usarse un enfoque microfluídico. En algunas realizaciones, puede usarse un enfoque microfluídico basado en matrices. Por ejemplo, un enfoque de este tipo puede implicar el uso de una matriz microfluídica (por ejemplo, Fluidigm) para la amplificación a bajo plex y la incorporación de sondas de índice y de captura, seguido de secuenciación. En algunas realizaciones, puede usarse un enfoque microfluídico en emulsión, tal como, por ejemplo, PCR digital en gotas.
En algunas realizaciones, pueden usarse métodos de amplificación universales (por ejemplo, usando cebadores de amplificación universales o inespecíficos de locus). En algunas realizaciones, pueden usarse métodos de amplificación universales en combinación con enfoques de precipitación (pull-down). En algunas realizaciones, un método puede incluir la precipitación de ultrámero biotinilado (por ejemplo, ensayos de precipitación biotinilado de Agilent o IDT) a partir de una biblioteca de secuenciación amplificada de manera universal. Por ejemplo, un enfoque de este tipo puede implicar la preparación de una biblioteca patrón, el enriquecimiento en regiones seleccionadas mediante un ensayo de precipitación, y una etapa de amplificación universal secundaria. En algunas realizaciones, pueden usarse enfoques de precipitación en combinación con métodos basados en ligación. En algunas realizaciones, un método puede incluir la precipitación de ultrámero biotinilado con ligación de adaptador específica de secuencia (por ejemplo, HALOPLEX PCR, Halo Genomics). Por ejemplo, un enfoque de este tipo puede implicar el uso de sondas selectoras para capturar fragmentos digeridos por enzimas de restricción, seguido de ligación de productos capturados a un adaptador y amplificación universal seguida de secuenciación. En algunas realizaciones, pueden usarse enfoques de precipitación en combinación con métodos basados en extensión y ligación. En algunas realizaciones, un método puede incluir extensión y ligación de sondas de inversión molecular (MIP). Por ejemplo, un enfoque de este tipo puede implicar el uso de sondas de inversión molecular en combinación con adaptadores de secuencia seguido de la amplificación universal y la secuenciación. En algunas realizaciones, el ADN complementario puede sintetizarse y secuenciarse sin amplificación.
En algunas realizaciones, pueden realizarse enfoques de extensión y ligación sin un componente de precipitación. En algunas realizaciones, un método puede incluir hibridación, extensión y ligación de cebadores directos e inversos específicos de locus. Tales métodos pueden incluir además amplificación universal o síntesis de ADN complementario sin amplificación, seguida de secuenciación. Tales métodos pueden reducir o excluir las secuencias de fondo durante el análisis, en algunas realizaciones.
En algunas realizaciones, pueden usarse enfoques de precipitación con un componente de amplificación opcional o sin un componente de amplificación. En algunas realizaciones, un método puede incluir un ensayo de precipitación modificado y ligación con la completa incorporación de sondas de captura sin amplificación universal. Por ejemplo, un enfoque de este tipo puede implicar el uso de sondas selectoras modificadas para capturar fragmentos digeridos por enzimas de restricción, seguido de ligación de productos capturados a un adaptador, amplificación opcional y secuenciación. En algunas realizaciones, un método puede incluir un ensayo de precipitación biotinilado con extensión y ligación de secuencia de adaptador en combinación con ligación monocatenaria circular. Por ejemplo, un enfoque de este tipo puede implicar el uso de sondas selectoras para capturar regiones de interés (es decir, secuencias diana), extensión de las sondas, ligación del adaptador, ligación circular monocatenaria, amplificación opcional y secuenciación. En algunas realizaciones, el análisis del resultado de secuenciación puede separar secuencias diana a partir del fondo.
En algunas realizaciones, el ácido nucleico está enriquecido en fragmentos a partir de una región genómica seleccionada (por ejemplo, un cromosoma) usando uno o más métodos de separación basada en secuencia descritos en el presente documento. La separación basada en secuencia se basa generalmente en secuencias de nucleótidos presentes en los fragmentos de interés (por ejemplo, fragmentos diana y/o de referencia) y sustancialmente no presentes en otros fragmentos de la muestra o presentes en una cantidad insustancial de los demás fragmentos (por ejemplo, el 5% o menos). En algunas realizaciones, la separación basada en secuencia puede generar fragmentos diana separados y/o fragmentos de referencia separados. Los fragmentos diana separados y/o los fragmentos de referencia separados normalmente se aíslan a partir de los fragmentos restantes en la muestra de ácido nucleico. En algunas realizaciones, los fragmentos diana separados y los fragmentos de referencia separados también se aíslan unos a partir de otros (por ejemplo, se aíslan en compartimentos de ensayo separados). En algunas realizaciones, los fragmentos diana separados y los fragmentos de referencia separados se aíslan juntos (por ejemplo, se aíslan en el mismo compartimento de ensayo). En algunas realizaciones, los fragmentos no unidos pueden eliminarse o degradarse o digerirse de manera diferencial.
En algunas realizaciones, se usa un procedimiento de captura selectiva de ácido nucleico para separar fragmentos diana y/o de referencia a partir de la muestra de ácido nucleico. Los sistemas de captura de ácido nucleico disponibles comercialmente incluyen, por ejemplo, el sistema de captura de secuencias de Nimblegen (Roche NimbleGen, Madison, WI); la plataforma BeADARRAY de Illumina (Illumina, San Diego, CA); la plataforma GENECHIP de Affymetrix (Affymetrix, Santa Clara, CA); el sistema de enriquecimiento de dianas SureSelect de Agilent (Agilent Technologies, Santa Clara, CA); y plataformas relacionadas. Tales métodos implican normalmente la hibridación de un oligonucleótido de captura con un segmento o la totalidad de la secuencia de nucleótidos de un fragmento diana o de referencia y pueden incluir el uso de una plataforma basada en fase sólida (por ejemplo, una matriz en fase sólida) y/o disolución. Los oligonucleótidos de captura (algunas veces denominados “cebo”) pueden seleccionarse o diseñarse de tal manera que se hibridan preferentemente con fragmentos de ácido nucleico a partir de locus o regiones genómicas seleccionadas (por ejemplo, uno de los cromosomas 21, 18, 13, X o Y, o un cromosoma de referencia).
En algunas realizaciones, el ácido nucleico está enriquecido en una longitud de fragmento de ácido nucleico particular, un intervalo de longitudes, o longitudes por debajo o por encima de un umbral o valor de corte particular usando uno o más métodos de separación basada en longitud. Por ejemplo, un ácido nucleico libre de células aislado que tiene longitudes de fragmento de aproximadamente 300 pares de bases o menos, aproximadamente 200 pares de bases o menos, o aproximadamente 150 pares de bases o menos, puede enriquecerse en el ácido nucleico fetal, en determinados casos. La longitud de fragmento de ácido nucleico se refiere normalmente al número de nucleótidos en el fragmento. La longitud de fragmento de ácido nucleico también se denomina algunas veces tamaño de fragmento de ácido nucleico. En algunas realizaciones, se realiza un método de separación basada en longitud sin medir las longitudes de fragmentos individuales. En algunas realizaciones, se realiza un método de separación basada en longitud junto con un método para determinar la longitud de fragmentos individuales. En algunas realizaciones, separación basada en longitud se refiere a un procedimiento de fraccionamiento por tamaño en el que la totalidad o parte del conjunto fraccionado puede aislarse (por ejemplo, retenerse) y/o analizarse. En la técnica se conocen procedimientos de fraccionamiento por tamaño (por ejemplo, separación sobre una matriz, separación mediante un tamiz molecular, separación mediante electroforesis en gel, separación mediante cromatografía en columna (por ejemplo, columnas de exclusión molecular) y enfoques basados en microfluidos). En algunas realizaciones, los enfoques de separación basada en longitud pueden incluir circularización de fragmentos, tratamiento químico (por ejemplo, con formaldehído, polietilenglicol (PEG)), espectrometría de masas y/o amplificación de ácido nucleico específica de tamaño, por ejemplo.
Determinados métodos de separación basada en longitud que pueden usarse con los métodos descritos en el presente documento emplean un enfoque de etiquetado selectivo de secuencias, por ejemplo. El término “etiquetado de secuencias” se refiere a la incorporación de una secuencia reconocible y distinta en un ácido nucleico o una población de ácidos nucleicos. El término “etiquetado de secuencias” tal como se usa en el presente documento tiene un significado diferente del término “etiqueta de secuencia” descrito más adelante en el presente documento. En tales métodos de etiquetado de secuencias, se someten especies de ácido nucleico de un tamaño de fragmento (por ejemplo, fragmentos cortos) a etiquetado selectivo de secuencias en una muestra que incluye ácidos nucleicos largos y cortos. Tales métodos implican normalmente realizar una reacción de amplificación de ácido nucleico usando un conjunto de cebadores anidados que incluyen cebadores internos y cebadores externos. En algunas realizaciones, pueden etiquetarse uno o ambos de los internos para introducir de ese modo una etiqueta sobre el producto de amplificación diana. Los cebadores externos generalmente no se hibridan con los fragmentos cortos que portan la secuencia diana (interna). Los cebadores internos pueden hibridarse con los fragmentos cortos y generan un producto de amplificación que porta una etiqueta y la secuencia diana. Normalmente, el etiquetado de los fragmentos largos se inhibe a través de una combinación de mecanismos que incluyen, por ejemplo, extensión bloqueada de los cebadores internos por la hibridación previa y extensión de los cebadores externos. El enriquecimiento en fragmentos etiquetados puede lograrse mediante una variedad de métodos, incluyendo, por ejemplo, digestión con exonucleasas de ácido nucleico monocatenario y amplificación de los fragmentos etiquetados usando cebadores de amplificación específicos de al menos una etiqueta.
Otro método de separación basada en longitud que puede usarse con los métodos descritos en el presente documento implica someter una muestra de ácido nucleico a precipitación con polietilenglicol (PEG). Los ejemplos de métodos incluyen los descritos en las publicaciones de solicitud de patente internacional n.os WO2007/140417 y WO2010/115016. En general, este método implica poner en contacto una muestra de ácido nucleico con PEG en presencia de una o más sales monovalentes en condiciones suficientes para precipitar sustancialmente ácidos nucleicos grandes sin precipitar sustancialmente ácidos nucleicos pequeños (por ejemplo, de menos de 300 nucleótidos).
Otro método de enriquecimiento basado en tamaño que puede usarse con los métodos descritos en el presente documento implica la circularización mediante ligación, por ejemplo, usando circligasa. Los fragmentos de ácido nucleico cortos normalmente pueden someterse a circularización con mayor eficiencia que los fragmentos largos. Las secuencias no sometidas a circularización pueden separarse a partir de las secuencias sometidas a circularización, y pueden usarse los fragmentos cortos enriquecidos para el análisis posterior.
Determinación del contenido de ácido nucleico fetal
La cantidad de ácido nucleico fetal (por ejemplo, concentración, cantidad relativa, cantidad absoluta, número de copias, y similares) en el ácido nucleico se determina en algunas realizaciones. En algunas realizaciones, la cantidad de ácido nucleico fetal en una muestra se denomina “fracción fetal”. En algunas realizaciones, “fracción fetal” se refiere a la fracción de ácido nucleico fetal en el ácido nucleico libre de células circulante en una muestra (por ejemplo, una muestra de sangre, una muestra de suero, una muestra de plasma) obtenida de una hembra preñada. En algunas realizaciones, un método en el que se determina una variación genética también puede comprender determinar la fracción fetal. Determinar la fracción fetal puede realizarse de una manera adecuada, cuyos ejemplos no limitativos incluyen los métodos descritos a continuación.
En algunas realizaciones, la cantidad de ácido nucleico fetal se determina según marcadores específicos de un feto masculino (por ejemplo, marcadores de STR de cromosoma Y (por ejemplo, marcadores DYS 19, DYS 385, DYS 392); marcador de RhD en hembras negativas para RhD), razones alélicas de secuencias polimórficas, o según uno o más marcadores específicos de ácido nucleico fetal y no de ácido nucleico materno (por ejemplo, biomarcadores epigenéticos diferenciales (por ejemplo, metilación; descrita con mayor detalle a continuación) entre la madre y el feto, o marcadores de a Rn fetal en plasma sanguíneo materno (véase, por ejemplo, Lo, 2005, Journal of Histochemistry and Cytochemistry 53 (3): 293-296)).
La determinación del contenido de ácido nucleico fetal (por ejemplo, fracción fetal) algunas veces se realiza usando un ensayo cuantificador fetal (FQA) tal como se describe, por ejemplo, en la publicación de solicitud de patente estadounidense n.° 2010/0105049. Este tipo de ensayo permite la detección y cuantificación de ácido nucleico fetal en una muestra materna basándose en el estado de metilación del ácido nucleico en la muestra. La cantidad de ácido nucleico fetal a partir de una muestra materna algunas veces puede determinarse en relación con la cantidad total de ácido nucleico presente, proporcionando de ese modo el porcentaje de ácido nucleico fetal en la muestra. El número de copias de ácido nucleico fetal algunas veces puede determinarse en una muestra materna. La cantidad de ácido nucleico fetal algunas veces puede determinarse de una manera específica de secuencia (o específica de locus) y algunas veces con suficiente sensibilidad como para permitir un análisis preciso de dosificación cromosómica (por ejemplo, para detectar la presencia o ausencia de una aneuploidía fetal u otra variación genética).
Un ensayo cuantificador fetal (FQA) puede realizarse junto con cualquier método descrito en el presente documento. Un ensayo de este tipo puede realizarse mediante cualquier método conocido en la técnica y/o descrito en la publicación de solicitud de patente estadounidense n.° 2010/0105049, tal como, por ejemplo, mediante un método que puede distinguir entre ADN materno y fetal basándose en el estado de metilación diferencial, y cuantificar (es decir, determinar la cantidad de) el ADN fetal. Los métodos para diferenciar ácido nucleico basándose en el estado de metilación incluyen, pero no se limitan a, captura sensible a la metilación, por ejemplo, usando un fragmento MBD2-Fc en el que el dominio de unión a metilo de MBD2 se fusiona con el fragmento Fc de un anticuerpo (MBD-FC) (Gebhard et al. (2006) Cancer Res. 66(12):6118-28); anticuerpos específicos de metilación; métodos de conversión de bisulfito, por ejemplo, MSP (PCR sensible a la metilación), COBRA, extensión de cebadores de nucleótido único sensibles a la metilación (Ms-SNuPE) o la tecnología MassCLEAVE™ de Sequenom; y el uso de enzimas de restricción sensibles a la metilación (por ejemplo, digestión de ADN materno en una muestra materna usando una o más enzimas de restricción sensibles a la metilación enriqueciendo de ese modo el ADN fetal). También pueden usarse enzimas sensibles a metilo para diferenciar ácido nucleico basándose en el estado de metilación, que, por ejemplo, puede escindir o digerir de manera preferente o sustancial en su secuencia de reconocimiento de ADN si esta última no está metilada. Por tanto, una muestra de ADN no metilado se dividirá en fragmentos más pequeños que una muestra de ADN metilado y una muestra de ADN hipermetilado no se escindirá. Excepto cuando se indique de manera explícita, puede usarse cualquier método para diferenciar ácido nucleico basándose en el estado de metilación con las composiciones y los métodos de la tecnología en el presente documento. La cantidad de ADN fetal puede determinarse, por ejemplo, introduciendo uno o más competidores en concentraciones conocidas durante una reacción de amplificación. Determinar la cantidad de ADN fetal también puede realizarse, por ejemplo, mediante RT-PCR, extensión de cebadores, secuenciación y/o recuento. En determinados casos, la cantidad de ácido nucleico puede determinarse usando la tecnología BEAMing tal como se describe en la publicación de solicitud de patente estadounidense n.° 2007/0065823. En algunas realizaciones, puede determinarse la eficiencia de restricción y se usa la tasa de eficiencia para determinar adicionalmente la cantidad de ADN fetal.
Algunas veces puede usarse un ensayo cuantificador fetal (FQA) para determinar la concentración de ADN fetal en una muestra materna, por ejemplo, mediante el siguiente método: a) determinar la cantidad total de ADN presente en una muestra materna; b) digerir selectivamente el ADN materno en una muestra materna usando una o más enzimas de restricción sensibles a la metilación enriqueciendo de ese modo el ADN fetal; c) determinar la cantidad de ADN fetal a partir de la etapa b); y d) comparar la cantidad de ADN fetal a partir de la etapa c) con la cantidad total de ADN a partir de la etapa a), determinando de ese modo la concentración de ADN fetal en la muestra materna. El número de copias absoluto de ácido nucleico fetal en una muestra materna algunas veces puede determinarse, por ejemplo, usando espectrometría de masas y/o un sistema que usa un enfoque de PCR competitiva para las mediciones del número de copias absoluto. Véase, por ejemplo, Ding y Cantor (2003) Proc.Natl.Acad.Sci. USA 100:3059-3064 y la publicación de solicitud de patente estadounidense n.° 2004/0081993.
La fracción fetal algunas veces puede determinarse basándose en razones alélicas de secuencias polimórficas (por ejemplo, polimorfismos de un solo nucleótido (SNP)), tal como, por ejemplo, usando un método descrito en la publicación de solicitud de patente estadounidense n.° 2011/0224087. En un método de este tipo, se obtienen lecturas de secuencia de nucleótidos para una muestra materna y se determina la fracción fetal comparando el número total de lecturas de secuencia de nucleótidos que se mapean con un primer alelo y el número total de lecturas de secuencia de nucleótidos que se mapean con un segundo alelo en un sitio polimórfico informativo (por ejemplo, SNP) en un genoma de referencia. Los alelos fetales pueden identificarse, por ejemplo, por su contribución minoritaria relativa a la mezcla de ácidos nucleicos fetales y maternos en la muestra cuando se compara con la contribución mayoritaria de los ácidos nucleicos maternos a la mezcla. Por consiguiente, la abundancia relativa de ácido nucleico fetal en una muestra materna puede determinarse como un parámetro del número total de lecturas de secuencia únicas que se mapean con una secuencia de ácido nucleico diana en un genoma de referencia para cada uno de los dos alelos de un sitio polimórfico.
La cantidad de ácido nucleico fetal en el ácido nucleico extracelular puede cuantificarse y usarse junto con un método proporcionado en el presente documento. Por tanto, en determinadas realizaciones, los métodos de la tecnología descrita en el presente documento comprenden una etapa adicional de determinar la cantidad de ácido nucleico fetal. La cantidad de ácido nucleico fetal puede determinarse en una muestra de ácido nucleico de un sujeto antes o después del procesamiento para preparar ácido nucleico de muestra. En determinadas realizaciones, la cantidad de ácido nucleico fetal se determina en una muestra después de procesar y preparar el ácido nucleico de muestra, cantidad que se utiliza para la evaluación adicional. En algunas realizaciones, un resultado comprende factorizar la fracción de ácido nucleico fetal en el ácido nucleico de muestra (por ejemplo, ajustar cuentas, retirar muestras, tomar una decisión o no tomar una decisión).
La etapa de determinación puede realizarse antes de, durante, en un punto cualquiera en un método descrito en el presente documento o después de determinados métodos (por ejemplo, detección de aneuploidía) descritos en el presente documento. Por ejemplo, para lograr un método de determinación de aneuploidía con una sensibilidad o especificidad dada, un método de cuantificación de ácido nucleico fetal puede implementarse antes de, durante o después de la determinación de aneuploidía para identificar aquellas muestras con más de aproximadamente el 2%, el 3%, el 4%, el 5%, el 6%, el 7%, el 8%, el 9%, el 10%, el 11%, el 12%, el 13%, el 14%, el 15%, el 16%, el 17%, el 18%, el 19%, el 20%, el 21%, el 22%, el 23%, el 24%, el 25% o más de ácido nucleico fetal. En algunas realizaciones, las muestras que se determina que tienen una determinada cantidad umbral de ácido nucleico fetal (por ejemplo, aproximadamente el 15% o más de ácido nucleico fetal; aproximadamente el 4% o más de ácido nucleico fetal) se analizan adicionalmente para determinar la presencia o ausencia de aneuploidía o variación genética, por ejemplo. En determinadas realizaciones, las determinaciones de, por ejemplo, la presencia o ausencia de aneuploidía se seleccionan (por ejemplo, se seleccionan y se comunican a un paciente) sólo para muestras que tienen una determinada cantidad umbral de ácido nucleico fetal (por ejemplo, aproximadamente el 15% o más de ácido nucleico fetal; aproximadamente el 4% o más de ácido nucleico fetal).
En algunas realizaciones, la determinación de la fracción fetal o la determinación de la cantidad de ácido nucleico fetal no se requiere o no es necesaria para identificar la presencia o ausencia de una aneuploidía cromosómica. En algunas realizaciones, identificar la presencia o ausencia de una aneuploidía cromosómica no requiere la diferenciación de secuencia de ADN fetal frente a materno. Esto es porque se analiza la contribución sumada de secuencias tanto maternas como fetales en un cromosoma particular, una porción de cromosoma o un segmento del mismo, en algunas realizaciones. En algunas realizaciones, identificar la presencia o ausencia de una aneuploidía cromosómica no se basa en información de secuencia a priori que distinguiría el ADN fetal del ADN materno.
Obtención de lecturas de secuencia
Las lecturas de secuencia pueden obtenerse a partir de muestras enriquecidas. La secuenciación, el mapeo y métodos analíticos relacionados se conocen en la técnica (por ejemplo, la publicación de solicitud de patente estadounidense US2009/0029377). A continuación se describen determinados aspectos de tales procedimientos. Tal como se usa en el presente documento, “lecturas” son secuencias de nucleótidos cortas producidas mediante cualquier procedimiento de secuenciación descrito en el presente documento o conocido en la técnica. Las lecturas pueden generarse a partir de un extremo de fragmentos de ácido nucleico (“lecturas de extremo único”), y algunas veces se generan a partir de ambos extremos de ácidos nucleicos (“lecturas de doble extremo”). En determinadas realizaciones, “obtener” lecturas de secuencia de ácido nucleico de una muestra de un sujeto y/u “obtener” lecturas de secuencia de ácido nucleico de un espécimen biológico a partir de una o más personas de referencia puede implicar secuenciar directamente ácido nucleico para obtener la información de secuencia. En algunas realizaciones, “obtener” puede implicar recibir información de secuencia obtenida directamente a partir de un ácido nucleico por otro.
En algunas realizaciones, se secuencia una muestra de ácido nucleico a partir de un individuo. En determinadas realizaciones, se agrupan las muestras de ácido nucleico a partir de dos o más muestras biológicas, en las que cada muestra biológica es de un individuo o de dos o más individuos, y se secuencia el grupo. En estas últimas realizaciones, a menudo se identifica una muestra de ácido nucleico a partir de cada muestra biológica mediante una o más etiquetas de identificación únicas.
En algunas realizaciones, se secuencia una fracción del genoma, que algunas veces se expresa en la cantidad del genoma cubierta por las secuencias de nucleótidos determinadas (por ejemplo, cobertura “en veces” menor de 1). Cuando se secuencia un genoma con una cobertura de aproximadamente 1 vez, aproximadamente el 100% de la secuencia de nucleótidos del genoma se representa mediante lecturas. Un genoma también puede secuenciarse con redundancia, en la que una región dada del genoma puede estar cubierta por dos o más lecturas o lecturas solapantes (por ejemplo, cobertura “en veces” mayor de 1). En algunas realizaciones, un genoma se secuencia con una cobertura de aproximadamente 0,1 veces a aproximadamente 100 veces, una cobertura de aproximadamente 0,2 veces a 20 veces, o una cobertura de aproximadamente 0,2 veces a aproximadamente 1 vez (por ejemplo, una cobertura de aproximadamente 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 veces).
En determinadas realizaciones, una fracción de un grupo de ácidos nucleicos que se secuencia en una ejecución se subselecciona adicionalmente antes de la secuenciación. En determinadas realizaciones, pueden usarse técnicas basadas en hibridación (por ejemplo, usando matrices de oligonucleótidos) para subseleccionar en primer lugar secuencias de ácido nucleico a partir de determinados cromosomas (por ejemplo, un cromosoma con posibles aneuploidías y otro(s) cromosoma(s) no implicado(s) en la aneuploidía sometida a prueba). En algunas realizaciones, el ácido nucleico puede fraccionarse por tamaño (por ejemplo, mediante electroforesis en gel, cromatografía de exclusión molecular o mediante enfoques basados en microfluidos), y en determinados casos, el ácido nucleico fetal puede enriquecerse seleccionando ácido nucleico que tiene un menor peso molecular (por ejemplo, menos de 300 pares de bases, menos de 200 pares de bases, menos de 150 pares de bases, menos de 100 pares de bases). En algunas realizaciones, el ácido nucleico fetal puede enriquecerse suprimiendo el ácido nucleico de fondo materno, tal como mediante la adición de formaldehído. En algunas realizaciones, una porción o un subconjunto de un grupo preseleccionado de ácidos nucleicos se secuencia al azar. En algunas realizaciones, el ácido nucleico se amplifica antes de la secuenciación. En algunas realizaciones, una porción o un subconjunto del ácido nucleico se amplifica antes de la secuenciación.
Puede utilizarse cualquier método de secuenciación adecuado para llevar a cabo los métodos descritos en el presente documento. En algunas realizaciones, se usa un método de secuenciación de alto rendimiento. Los métodos de secuenciación de alto rendimiento implican generalmente moldes de ADN clonalmente amplificados o moléculas de ADN individuales que se secuencian de manera masivamente paralela dentro de una celda de flujo (por ejemplo, tal como se describe en Metzker M Nature Rev 11:31-46 (2010); Volkerding et al. Clin Chem 55:641-658 (2009)). Tales métodos de secuenciación también pueden proporcionar información cuantitativa digital, en los que cada lectura de secuencia es un “etiqueta de secuencia” que puede contarse que representa un molde de ADN clonal individual o una molécula de ADN individual. Las tecnologías de secuenciación de alto rendimiento incluyen, por ejemplo, secuenciación mediante síntesis con terminadores de colorantes reversibles, secuenciación mediante ligación de sondas oligonucleotídicas, pirosecuenciación y secuenciación en tiempo real.
Los sistemas utilizados para los métodos de secuenciación de alto rendimiento están disponibles comercialmente e incluyen, por ejemplo, la plataforma 454 de Roche, la plataforma SOLID de Applied Biosystems, la tecnología de secuenciación de ADN de molécula única verdadera de Helicos, la plataforma de secuenciación mediante hibridación de Affymetrix Inc., la tecnología en tiempo real de molécula única (SMRT) de Pacific Biosciences, las plataformas de secuenciación mediante síntesis 454 de Life Sciences, Illumina/Solexa y Helicos Biosciences, y la plataforma de secuenciación mediante ligación de Applied Biosystems. También pueden usarse la tecnología ION TORRENT de Life technologies y la secuenciación por nanoporos en enfoques de secuenciación de alto rendimiento.
En algunas realizaciones, puede usarse tecnología de primera generación, tal como, por ejemplo, secuenciación de Sanger incluyendo la secuenciación de Sanger automática, en los métodos proporcionados en el presente documento. También se contemplan en el presente documento tecnologías de secuenciación adicionales que incluyen el uso de tecnologías de obtención de imágenes de ácido nucleico en desarrollo (por ejemplo, microscopía electrónica de transmisión (TEM) y microscopía de fuerza atómica (AFM)). A continuación se describen ejemplos de diversas tecnologías de secuenciación.
Una tecnología de secuenciación de ácido nucleico que puede usarse en los métodos descritos en el presente documento es secuenciación mediante síntesis y secuenciación basada en terminador reversible (por ejemplo, Genome Analyzer y Genome Analyzer II de Illumina). Con esta tecnología, pueden secuenciarse en paralelo millones de fragmentos de ácido nucleico (por ejemplo, ADN). En un ejemplo de este tipo de tecnología de secuenciación, se usa una celda de flujo que contiene un portaobjetos ópticamente transparente con 8 carriles individuales en cuyas superficies se unen anclas oligonucleotídicas. El ADN de molde a menudo se fragmenta en longitudes de varios cientos de pares de bases y se repara en los extremos para generar extremos romos fosforilados en 5' y luego se añade una única base de adenina (A) al extremo 3' de los fragmentos de ADN fosforilados romos. Esta adición prepara los fragmentos de ADN para la ligación a adaptadores oligonucleotídicos, que tienen una proyección de una única base de timina (T) en su extremo 3' para aumentar la eficiencia de ligación. Los oligonucleótidos adaptadores son complementarios a las anclas de la celda de flujo. En condiciones de dilución limitativa, se añade ADN molde monocatenario, modificado con adaptador, a la celda de flujo y se inmoviliza mediante hibridación a las anclas. A diferencia de la PCR en emulsión, los moldes de ADN se amplifican en la celda de flujo mediante amplificación “en puente”, que se basa en cadenas de ADN capturadas “se arquean” sobre y se hibridan con un oligonucleótido de ancla adyacente. Múltiples ciclos de amplificación convierten el molde de ADN de molécula única en una “agrupación” arqueada clonalmente amplificada, conteniendo cada agrupación aproximadamente 1000 moléculas clonales. Pueden generarse aproximadamente 50 * 106 agrupaciones independientes por celda de flujo. Para la secuenciación, se desnaturalizan las agrupaciones, y una reacción de escisión química y un lavado posteriores dejan sólo cadenas directas para la secuenciación de extremo único. La secuenciación de las cadenas directas se inicia mediante la hibridación de un cebador complementario a las secuencias de adaptador, a lo que le sigue la adición de polimerasa y una mezcla de cuatro terminadores de colorantes fluorescentes de diferentes colores. Los terminadores se incorporan según la complementariedad de secuencia en cada cadena en una agrupación clonal. Después de la incorporación, se elimina por lavado el exceso de reactivos, se exploran ópticamente las agrupaciones y se registra la fluorescencia. Con etapas químicas sucesivas, se desbloquean los terminadores de colorantes reversibles, se escinden y eliminan por lavado los marcadores fluorescentes y se realiza el siguiente ciclo de secuenciación. Este procedimiento iterativo de secuenciación mediante síntesis algunas veces requiere aproximadamente 2,5 días para generar longitudes de lectura de 36 bases. Con 50 * 106 agrupaciones por celda de flujo, la producción global de secuencia puede ser mayor de 1 mil millones de pares de bases (Gb) por ejecución analítica.
Otra tecnología de secuenciación de ácido nucleico que puede usarse con los métodos descritos en el presente documento es la secuenciación 454 (Roche). La secuenciación 454 usa un sistema de pirosecuenciación paralela a gran escala que puede secuenciar aproximadamente 400-600 megabases de ADN por ejecución. El procedimiento normalmente implica dos etapas. En la prima etapa, el ácido nucleico de muestra (por ejemplo, ADN) se fracciona algunas veces en fragmentos más pequeños (300-800 pares de bases) y se pule (se vuelve romo en cada extremo). Luego se ligan adaptadores cortos en los extremos de los fragmentos. Estos adaptadores proporcionan secuencias de cebado tanto para la amplificación como para la secuenciación de los fragmentos de biblioteca de muestras. Un adaptador (adaptador B) contiene una etiqueta de biotina en el extremo 5' para la inmovilización de la biblioteca de ADN sobre perlas recubiertas de estreptavidina. Después de la reparación por mella, se libera la cadena no biotinilada y se usa como biblioteca de ADN molde monocatenario (ADNmmc). La biblioteca de ADNmmc se evalúa para determinar su calidad y se determina la cantidad óptima (copias de ADN por perla) necesaria para la emPCR mediante titulación. La biblioteca de ADNmmc se inmoviliza sobre perlas. Las perlas que contienen un fragmento de biblioteca portan una única molécula de ADNmmc. Se emulsiona la biblioteca unida a perlas con los reactivos de amplificación en una mezcla de agua en aceite. Cada perla se captura dentro de su propio microrreactor en el que se produce la amplificación por PCR. Esto da como resultado fragmentos de ADN clonalmente amplificados inmovilizados en perlas.
En la segunda etapa de la secuenciación 454, se añaden perlas de biblioteca de ADN de molde monocatenario a una mezcla de incubación que contiene ADN polimerasa y se estratifican con perlas que contienen sulfurilasa y luciferasa sobre un dispositivo que contiene pocillos con un tamaño de picolitros. Se realiza pirosecuenciación sobre cada fragmento de ADN en paralelo. La adición de uno o más nucleótidos genera una señal lumínica que se registra mediante una cámara CCD en un instrumento de secuenciación. La intensidad de señal es proporcional al número de nucleótidos incorporados. La pirosecuenciación aprovecha la liberación de pirofosfato (PPi) tras la adición de nucleótidos. El PPi se convierte en ATP mediante ATP sulfurilasa en presencia de 5'-fosfosulfato de adenosina. La luciferasa usa el ATP para convertir luciferina en oxiluciferina, y esta reacción genera luz que se discierne y analiza (véase, por ejemplo, Margulies, M. et al. Nature 437:376-380 (2005)).
Otra tecnología de secuenciación de ácido nucleico que puede usarse en los métodos proporcionados en el presente documento es la tecnología SOLiD™ de Applied Biosystems. En la secuenciación mediante ligación SOLiD™, se prepara una biblioteca de fragmentos de ácido nucleico a partir de la muestra y se usa para preparar poblaciones de perlas clonales. Con este método, una especie de fragmento de ácido nucleico estará presente en la superficie de cada perla (por ejemplo, perla magnética). El ácido nucleico de muestra (por ejemplo, ADN genómico) se somete a cizallamiento para dar fragmentos, y posteriormente se unen adaptadores a los extremos 5' y 3' de los fragmentos para generar una biblioteca de fragmentos. Los adaptadores normalmente son secuencias de adaptador universales, de modo que la secuencia de inicio de cada fragmento es tanto conocida como idéntica. La PCR en emulsión tiene lugar en microrreactores que contienen todos los reactivos necesarios para la PCR. Luego, los productos de PCR resultantes unidos a las perlas se unen de manera covalente a un portaobjetos de vidrio. Luego se hibridan cebadores a la secuencia de adaptador dentro del molde de biblioteca. Un conjunto de cuatro sondas de dibases marcadas de manera fluorescente compiten por la ligación al cebador de secuenciación. La especificidad de la sonda de dibases se logra explorando cada base 1a y 2a en cada reacción de ligación. Se realizan múltiples ciclos de ligación, detección y escisión, determinando el número de ciclos la longitud de lectura eventual. Tras una serie de ciclos de ligación, se retira el producto de extensión y se restablece el molde con un cebador complementario a la posición n-1 para una segunda ronda de ciclos de ligación. A menudo, se completan cinco rondas de restablecimiento de cebador para cada etiqueta de secuencia. A través del procedimiento de restablecimiento de cebador, se explora cada base en dos reacciones de ligación independientes mediante dos cebadores diferentes. Por ejemplo, la base en la posición 5 de lectura se somete a ensayo mediante el cebador número 2 en el ciclo 2 de ligación y mediante el cebador número 3 en el ciclo 1 de ligación.
Otra tecnología de secuenciación de ácido nucleico que puede usarse en los métodos descritos en el presente documento es la secuenciación de molécula única verdadera (tSMS) de Helicos. En la técnica de tSMS, se añade una secuencia de poliA al extremo 3' de cada cadena de ácido nucleico (por ejemplo, ADN) a partir de la muestra. Cada cadena se marca mediante la adición de un nucleótido de adenosina marcado de manera fluorescente. Luego se hibridan las cadenas de ADN con una celda de flujo, que contiene millones de sitios de captura de oligo-T que están inmovilizados en la superficie de la celda de flujo. Los moldes pueden tener una densidad de aproximadamente 100 millones de moldes/cm2. Luego se carga la celda de flujo en un aparato de secuenciación y un láser ilumina la superficie de la celda de flujo, revelando la posición de cada molde. Una cámara CCD puede mapear la posición de los moldes en la superficie de la celda de flujo. Luego se escinde y se elimina por lavado el marcador fluorescente de molde. La reacción de secuenciación comienza introduciendo una ADN polimerasa y un nucleótido marcado de manera fluorescente. El ácido nucleico de oligo-T sirve como cebador. La polimerasa incorpora los nucleótidos marcados al cebador de manera dirigida por el molde. Se retiran la polimerasa y los nucleótidos no incorporados. Los moldes que han dirigido la incorporación del nucleótido marcado de manera fluorescente se detectan mediante obtención de imágenes de la superficie de la celda de flujo. Después de la obtención de imágenes, una etapa de escisión retira el marcador fluorescente, y se repite el procedimiento con otros nucleótidos marcados de manera fluorescente hasta lograr la longitud de lectura deseada. Se recopila información de secuencia con cada etapa de adición de nucleótido (véase, por ejemplo, Harris T. D. et al., Science 320:106-109 (2008)).
Otra tecnología de secuenciación de ácido nucleico que puede usarse en los métodos proporcionados en el presente documento es la tecnología de secuenciación en tiempo real de molécula única (SMRT™) de Pacific Biosciences. Con este método, cada una de las cuatro bases de ADN se une a uno de cuatro colorantes fluorescentes diferentes. Estos colorantes están unidos por el grupo fosfato. Se inmoviliza una única ADN polimerasa con una única molécula de ADN monocatenario de molde en la parte inferior de una guía de onda en modo nulo (ZMW). Una ZMW es una estructura de confinamiento que permite la observación de la incorporación de un único nucleótido mediante ADN polimerasa contra el fondo de nucleótidos fluorescentes que difunden rápidamente hacia dentro y fuera de la ZMW (en microsegundos). Se tardan varios milisegundos en incorporar un nucleótido a una cadena en crecimiento. Durante este tiempo, el marcador fluorescente se excita y produce una señal fluorescente, y se elimina por escisión la etiqueta fluorescente. La detección de la fluorescencia correspondiente del colorante indica qué base se incorporó. Luego se repite el procedimiento.
Otra tecnología de secuenciación de ácido nucleico que puede usarse en los métodos descritos en el presente documento es la secuenciación de molécula única ION TORr ENT (Life Technologies) que combina la tecnología de semiconductores con una química de secuenciación sencilla para traducir directamente información químicamente codificada (A, C, G, T) en información digital (0, 1) en un chip semiconductor. ION TORRENT usa una matriz de alta densidad de pocillos micromecanizados para realizar la secuenciación de ácido nucleico de manera masivamente paralela. Cada pocillo alberga una molécula de ADN diferente. Debajo de los pocillos hay una capa sensible a iones y debajo de la misma hay un sensor de iones. Normalmente, cuando se incorpora un nucleótido a una cadena de ADN mediante una polimerasa, se libera un ion de hidrógeno como subproducto. Si se añade un nucleótido, por ejemplo, una C, al molde de ADN y luego se incorpora a una cadena de ADN, se liberará un ion de hidrógeno. La carga de ese ion cambiará el pH de la disolución, lo que puede detectarse mediante un sensor de iones. Un secuenciador puede identificar la base, pasando directamente de información química a información digital. Luego, el secuenciador inunda secuencialmente el chip con un nucleótido tras otro. Si el siguiente nucleótido que inunda el chip no coincide, no se registrará ningún cambio de tensión y no se identificará ninguna base. Si hay dos bases idénticas en la cadena de ADN, la tensión se duplicará, y el chip registrará dos bases idénticas identificadas. Dado que esta es una detección directa (es decir, detección sin barrido, cámaras o luz), cada incorporación de nucleótido se registra en segundos.
Otra tecnología de secuenciación de ácido nucleico que puede usarse en los métodos descritos en el presente documento es la matriz de transistores de efecto de campo sensible a productos químicos (CHEMFET). En un ejemplo de esta técnica de secuenciación, las moléculas de ADN se colocan en cámaras de reacción, y las moléculas de molde pueden hibridarse con un cebador de secuenciación unido a una polimerasa. La incorporación de uno o más trifosfatos a una nueva cadena de ácido nucleico en el extremo 3' del cebador de secuenciación puede detectarse mediante un cambio en la corriente por un sensor de CHEMFET. Una matriz puede tener múltiples sensores de CHEMFET. En otro ejemplo, ácidos nucleicos individuales se unen a perlas, y los ácidos nucleicos pueden amplificarse en la perla, y las perlas individuales pueden transferirse a cámaras de reacción individuales en una matriz de CHEMFET, teniendo cada cámara un sensor de CHEMFET, y pueden secuenciarse los ácidos nucleicos (véase, por ejemplo, la publicación de patente estadounidense n.° 2009/0026082).
Otra tecnología de secuenciación de ácido nucleico que puede usarse en los métodos descritos en el presente documento es la microscopía electrónica. En un ejemplo de esta técnica de secuenciación, se marcan moléculas de ácido nucleico individuales (por ejemplo, ADN) usando marcadores metálicos que son distinguibles usando un microscopio electrónico. Luego se extienden estas moléculas sobre una superficie plana y se obtienen imágenes usando un microscopio electrónico para medir las secuencias (véase, por ejemplo, Moudrianakis E. N. y Beer M. Proc Natl Acad Sci USA. Marzo de 1965; 53:564-71). En algunos casos, se usa microscopía electrónica de transmisión (TEM) (por ejemplo, el método de TEM de Halcyon Molecular). Este método, denominado nanotransferencia rápida por colocación de moléculas individuales (IMPRNT), incluye el uso de imágenes de microscopio electrónico de transmisión de resolución de átomo único de ADN de alto peso molecular (por ejemplo, aproximadamente 150 kb o mayor) marcado selectivamente con marcadores de átomos pesados y la disposición de estas moléculas en películas ultradelgadas en matrices paralelas ultradensas (3 nm de cadena a cadena) con un espaciado coherente entre bases. El microscopio electrónico se usa para obtener imágenes de las moléculas en las películas para determinar la posición de los marcadores de átomos pesados y para extraer información de secuencia de bases a partir del ADN (véase, por ejemplo, la publicación de patente PCT WO 2009/046445).
Otros métodos de secuenciación que pueden usarse para llevar a cabo los métodos en el presente documento incluyen PCR digital y secuenciación mediante hibridación. La reacción en cadena de la polimerasa digital (PCR digital o dPCR) puede usarse para identificar y cuantificar directamente los ácidos nucleicos en una muestra. La PCR digital puede realizarse en una emulsión, en algunas realizaciones. Por ejemplo, se separan los ácidos nucleicos individuales, por ejemplo, en un dispositivo de cámaras microfluídicas, y se amplifica por PCR individualmente cada ácido nucleico. Los ácidos nucleicos pueden separarse de tal manera que no haya más de un ácido nucleico por pocillo. En algunas realizaciones, pueden usarse sondas diferentes para distinguir diversos alelos (por ejemplo, alelos fetales y alelos maternos). Los alelos pueden enumerarse para determinar el número de copias. En la secuenciación mediante hibridación, el método implica poner en contacto una pluralidad de secuencias de polinucleótido con una pluralidad de sondas polinucleotídicas, en el que cada una de la pluralidad de sondas polinucleotídicas puede estar anclada opcionalmente a un sustrato. El sustrato puede ser una superficie plana con una matriz de secuencias de nucleótidos conocidas, en algunas realizaciones. El patrón de hibridación con la matriz puede usarse para determinar las secuencias de polinucleótido presentes en la muestra. En algunas realizaciones, cada sonda está anclada a una perla, por ejemplo, una perla magnética o similar. La hibridación con las perlas puede identificarse y usarse para identificar la pluralidad de secuencias de polinucleótido dentro de la muestra.
En algunas realizaciones, puede usarse secuenciación por nanoporos en los métodos descritos en el presente documento. La secuenciación por nanoporos es una tecnología de secuenciación de molécula única mediante la cual una única molécula de ácido nucleico (por ejemplo, ADN) se secuencia directamente a medida que pasa a través de un nanoporo. Un nanoporo es un orificio o canal pequeño, del orden de 1 nanómetro de diámetro. Determinadas proteínas celulares transmembranarias pueden actuar como nanoporos (por ejemplo, alfahemolisina). Algunas veces pueden sintetizarse los nanoporos (por ejemplo, usando una plataforma de silicio). La inmersión de un nanoporo en un líquido conductor y la aplicación de un potencial a través del mismo da como resultado una ligera corriente eléctrica debida a la conducción de iones a través del nanoporo. La cantidad de corriente que fluye es sensible al tamaño del nanoporo. A medida que una molécula de ADN pasa a través de un nanoporo, cada nucleótido en la molécula de ADN obstruye el nanoporo en un grado diferente y genera cambios característicos en la corriente. Por tanto, la cantidad de corriente que puede pasar a través del nanoporo en cualquier momento dado varía dependiendo de si el nanoporo está bloqueado por una A, una C, una G, una T o, en algunos casos, una metil-C. El cambio en la corriente a través del nanoporo a medida que la molécula de ADN pasa a través del nanoporo representa una lectura directa de la secuencia de ADN. En algunos casos, puede usarse un nanoporo para identificar bases de ADN individuales a medida que pasan a través del nanoporo en el orden correcto (véanse, por ejemplo, Soni GV y Meller A. Clin Chem 53: 1996-2001 (2007); la publicación PCT n.° WO2010/004265).
Existen varios modos en que los nanoporos pueden usarse para secuenciar moléculas de ácido nucleico. En algunas realizaciones, se usa una enzima exonucleasa, tal como una desoxirribonucleasa. En este caso, la enzima exonucleasa se usa para separar secuencialmente nucleótidos a partir de una molécula de ácido nucleico (por ejemplo, ADN). Luego se detectan y discriminan los nucleótidos por el nanoporo en el orden de su liberación, leyendo de ese modo la secuencia de la cadena original. Para una realización de este tipo, la enzima exonucleasa puede unirse al nanoporo de tal manera que una proporción de los nucleótidos liberados a partir de la molécula de ADN pueden entrar e interactuar con el canal del nanoporo. La exonucleasa puede unirse a la estructura del nanoporo en un sitio en proximidad cercana a la parte del nanoporo que forma la abertura del canal. En algunos casos, la enzima exonucleasa puede unirse a la estructura del nanoporo de tal manera que su sitio de trayectoria de salida de nucleótido está orientado hacia la parte del nanoporo que forma parte de la abertura.
En algunas realizaciones, la secuenciación por nanoporos de ácidos nucleicos implica el uso de una enzima que empuja o tira de la molécula de ácido nucleico (por ejemplo, ADN) a través del poro. En este caso, la corriente iónica fluctúa a medida que el nucleótido en la molécula de a Dn pasa a través del poro. Las fluctuaciones en la corriente son indicativas de la secuencia de ADN. Para una realización de este tipo, la enzima puede unirse a la estructura del nanoporo de tal manera que puede empujar o tirar del ácido nucleico diana a través del canal de un nanoporo sin interferir con el flujo de corriente iónica a través del poro. La enzima puede unirse a la estructura del nanoporo en un sitio en proximidad cercana a la parte de la estructura que forma parte de la abertura. La enzima puede unirse a la subunidad, por ejemplo, de tal manera que su sitio activo está orientado hacia la parte de la estructura que forma parte de la abertura.
En algunas realizaciones, la secuenciación por nanoporos de ácidos nucleicos implica la detección de biproductos de polimerasa en proximidad cercana a un detector de nanoporos. En este caso, los fosfatos de nucleósido (nucleótidos) se marcan de modo que se libera una especie marcada con fosfato tras la adición de una polimerasa a la cadena de nucleótido y se detecta la especie marcada con fosfato por el poro. Normalmente, la especie de fosfato contiene un marcador específico para cada nucleótido. A medida que los nucleótidos se añaden secuencialmente a la cadena de ácido nucleico, se detectan los biproductos de la adición de bases. El orden en el que se detectan las especies marcadas con fosfato puede usarse para determinar la secuencia de la cadena de ácido nucleico.
La longitud de la lectura de secuencia a menudo está asociada con la tecnología de secuenciación particular. Los métodos de alto rendimiento, por ejemplo, proporcionan lecturas de secuencia que pueden variar en cuanto a tamaño de desde decenas hasta cientos de pares de bases (pb). La secuenciación por nanoporos, por ejemplo, puede proporcionar lecturas de secuencia que pueden variar en cuanto a tamaño de desde decenas hasta cientos hasta miles de pares de bases. En algunas realizaciones, las lecturas de secuencia tienen una longitud media, mediana o promedio de aproximadamente 15 pb a 900 pb de longitud (por ejemplo, de aproximadamente 20 pb, aproximadamente 25 pb, aproximadamente 30 pb, aproximadamente 35 pb, aproximadamente 40 pb aproximadamente 45 pb, aproximadamente 50 pb, aproximadamente 55 pb, aproximadamente 60 pb aproximadamente 65 pb, aproximadamente 70 pb, aproximadamente 75 pb, aproximadamente 80 pb aproximadamente 85 pb, aproximadamente 90 pb, aproximadamente 95 pb, aproximadamente 100 pb aproximadamente 110 pb, aproximadamente 120 pb, aproximadamente 130, aproximadamente 140 pb aproximadamente 150 pb, aproximadamente 200 pb, aproximadamente 250 pb, aproximadamente 300 pb aproximadamente 350 pb, aproximadamente 400 pb, aproximadamente 450 pb o aproximadamente 500 pb). En algunas realizaciones, las lecturas de secuencia tienen una longitud media, mediana o promedio de aproximadamente 1000 pb o más.
En algunas realizaciones, los ácidos nucleicos pueden incluir información de etiqueta de secuencia o de señal fluorescente. La cuantificación de la señal o etiqueta puede usarse en varias técnicas tales como, por ejemplo, citometría de flujo, reacción en cadena de la polimerasa cuantitativa (qPCR), electroforesis en gel, análisis de chips de genes, microalineamiento, espectrometría de masas, análisis citofluorimétrico, microscopía de fluorescencia, microscopía confocal de barrido láser, citometría de barrido láser, cromatografía de afinidad, separación manual en modo discontinuo, suspensión por campo eléctrico, secuenciación y una combinación de los mismos.
Mapeo de lecturas
Mapear lecturas de secuencia de nucleótidos (es decir, información de secuencia a partir de un fragmento cuya posición genómica física se desconoce) puede realizarse de varios modos, y a menudo comprende el alineamiento de las lecturas de secuencia obtenidas con una secuencia coincidente en un genoma de referencia (por ejemplo, Li et al., “Mapping short DNA sequencing reads and calling variants using mapping quality score”, Genome Res., 19 de agosto de 2008). En tales alineamientos, las lecturas de secuencia generalmente se alinean con respecto a una secuencia de referencia y aquellas que se alinean se designan como “mapeadas” o como “etiqueta de secuencia”. En algunas realizaciones, una lectura de secuencia mapeada se denomina “acierto”. En algunas realizaciones, las lecturas de secuencia mapeadas se agrupan juntas según diversos parámetros y se asignan a secciones particulares del genoma, lo que se comenta con mayor detalle a continuación.
Pueden usarse diversos métodos computacionales para mapear cada lectura de secuencia a una sección de genoma. Los ejemplos no limitativos de algoritmos informáticos que pueden usarse para alinear secuencias incluyen BLAST, BLITZ y FASTA, o variaciones de los mismos. En algunas realizaciones, las lecturas de secuencia pueden encontrarse y/o alinearse con secuencias en las bases de datos de ácidos nucleicos conocidas en la técnica, incluyendo, por ejemplo, GenBank, dbEST, dbSTS, EMBL (Laboratorio Europeo de Biología Molecular) y DDBJ (Banco de Datos de ADN de Japón). Pueden usarse BLAST o herramientas similares para buscar las secuencias identificadas en una base de datos de secuencias. Luego pueden usarse los aciertos de búsqueda para clasificar las secuencias identificadas en secciones apropiadas del genoma (descritas a continuación), por ejemplo.
Una “etiqueta de secuencia” es una secuencia (es decir, una lectura) de ácido nucleico (por ejemplo, ADN) asignada específicamente a una sección del genoma y/o a un cromosoma particular (es decir, uno de cromosomas 1-22, X o Y para un sujeto humano). Una etiqueta de secuencia puede ser repetitiva o no repetitiva dentro de una porción individual del genoma de referencia (por ejemplo, un cromosoma). En algunas realizaciones, se eliminan las etiquetas de secuencia repetitivas del análisis adicional (por ejemplo, cuantificación). En algunas realizaciones, una lectura puede mapear de manera única o no única a porciones en el genoma de referencia. Una lectura se considera “mapeada de manera única” si se alinea con una única secuencia en el genoma de referencia. Una lectura se considera “mapeada de manera no única” si se alinea con dos o más secuencias en el genoma de referencia. En algunas realizaciones, se eliminan las lecturas mapeadas de manera no única del análisis adicional (por ejemplo, cuantificación). Puede permitirse un determinado, y pequeño, grado de apareamiento erróneo (0-1) para representar polimorfismos de un solo nucleótido que pueden existir entre el genoma de referencia y las lecturas a partir de muestras individuales que están mapeándose, en determinadas realizaciones. En algunas realizaciones, no se permite ningún grado de apareamiento erróneo para una lectura mapeada a una secuencia de referencia.
Tal como se usa en el presente documento, una secuencia de referencia o un genoma de referencia a menudo es una secuencia genómica ensamblada o parcialmente ensamblada de un individuo o de múltiples individuos. En determinadas realizaciones, cuando un ácido nucleico de muestra procede de una hembra preñada, una secuencia de referencia algunas veces no procede el feto, de la madre del feto o del padre del feto, y se denomina en el presente documento “referencia externa”. Puede prepararse y usarse una referencia materna en algunas realizaciones. Cuando se prepara una referencia a partir de la hembra preñada (“secuencia de referencia materna”) basándose en una referencia externa, las lecturas a partir del ADN de la hembra preñada que no contiene sustancialmente ADN fetal a menudo se mapean a la secuencia de referencia externa y se ensamblan. En determinadas realizaciones, la referencia externa procede de ADN de un individuo que tiene sustancialmente la misma etnia que la hembra preñada. Una secuencia de referencia materna puede no cubrir completamente el ADN genómico materno (por ejemplo, puede cubrir aproximadamente el 50%, el 60%, el 70%, el 80%, el 90% o más del ADN genómico materno), y la referencia materna puede no coincidir perfectamente con la secuencia de ADN genómico materno (por ejemplo, la secuencia de referencia materna puede incluir múltiples apareamientos erróneos).
Secciones del genoma
En algunas realizaciones, se agrupan juntas las lecturas de secuencia mapeadas (es decir, las etiquetas de secuencia) según diversos parámetros y se asignan a secciones particulares del genoma. A menudo, las lecturas de secuencia mapeadas individuales pueden usarse para identificar una cantidad de una sección del genoma presente en una muestra. En algunas realizaciones, la cantidad de una sección del genoma puede ser indicativa de la cantidad de una secuencia más grande (por ejemplo, un cromosoma) en la muestra. El término “sección del genoma” también pueden denominarse en el presente documento “ventana de secuencia”, “sección”, “zona (bin)’’, “locus”, “región”, “partición” o “segmento”. En algunas realizaciones, una sección del genoma es un cromosoma completo, una porción de un cromosoma, múltiples porciones de cromosoma, múltiples cromosomas, porciones de múltiples cromosomas, y/o combinaciones de los mismos. En algunas realizaciones, una sección del genoma se delimita basándose en uno o más parámetros que incluyen, por ejemplo, la longitud o una característica o características particulares de la secuencia. En algunas realizaciones, una sección del genoma está basada en una longitud particular de secuencia genómica. En algunas realizaciones, los métodos incluyen el análisis de múltiples lecturas de secuencia mapeadas a una pluralidad de secciones del genoma. Las secciones del genoma pueden tener aproximadamente la misma longitud o las secciones del genoma puede tener longitudes diferentes. En algunas realizaciones, una sección del genoma tiene de aproximadamente 10 kilobases (kb) a aproximadamente 100 kb, de aproximadamente 20 kb a aproximadamente 80 kb, de aproximadamente 30 kb a aproximadamente 70 kb, de aproximadamente 40 kb a aproximadamente 60 kb, y algunas veces aproximadamente 50 kb. En algunas realizaciones, la sección del genoma tiene de aproximadamente 10 kb a aproximadamente 20 kb. Las secciones genómicas comentadas en el presente documento no se limitan a series contiguas de secuencia. Por tanto, las secciones del genoma pueden estar formadas por secuencias contiguas o no contiguas. Las secciones genómicas comentadas en el presente documento no se limitan a un único cromosoma y, en algunas realizaciones, pueden trascender a cromosomas individuales. En algunas realizaciones, las secciones genómicas pueden abarcar uno, dos o más cromosomas completos. Además, las secciones genómicas pueden abarcar porciones conjuntas o no conjuntas de múltiples cromosomas.
En algunas realizaciones, las secciones del genoma pueden ser secciones de cromosoma particulares en un cromosoma de interés, tales como, por ejemplo, cromosomas en los que se evalúa una variación genética (por ejemplo, una aneuploidía de los cromosomas 13, 18 y/o 21). Una sección del genoma también puede ser un genoma patógeno (por ejemplo, bacteriano, fúngico o viral) o un fragmento del mismo. Las secciones del genoma pueden ser genes, fragmentos de genes, secuencias reguladoras, intrones, exones, y similares.
En algunas realizaciones, un genoma (por ejemplo, genoma humano) se fracciona en secciones del genoma basándose en el contenido de información de las regiones. Las regiones genómicas resultantes pueden contener secuencias para múltiples cromosomas y/o pueden contener secuencias para porciones de múltiples cromosomas. En algunas realizaciones, el fraccionamiento puede eliminar ubicaciones similares a lo largo del genoma y mantener sólo regiones únicas. Las regiones eliminadas pueden estar dentro de un único cromosoma o pueden abarcar múltiples cromosomas. Por tanto, el genoma resultante se recorta y optimiza para una alineación más rápida, lo que a menudo permite centrarse en secuencias identificables de manera única. En algunas realizaciones, el fraccionamiento puede reducir el peso de regiones similar. El procedimiento para reducir el peso de una sección del genoma se comenta con mayor detalle a continuación. En algunas realizaciones, el fraccionamiento del genoma en regiones que trascienden cromosomas puede estar basado en ganancia de información producida en el contexto de clasificación. Por ejemplo, el contenido de información puede cuantificarse usando el perfil de valores de p que mide la significación de ubicaciones genómicas particulares para distinguir entre grupos de sujetos normales o anómalos confirmados (por ejemplo, sujetos euploides y con trisomía). En algunas realizaciones, el fraccionamiento del genoma en regiones que trascienden cromosomas puede estar basado en cualquier otro criterio, tal como, por ejemplo, velocidad/conveniencia durante el alineamiento de etiquetas, alto o bajo contenido en GC, uniformidad del contenido en GC, otras medidas del contenido de secuencia (por ejemplo, fracción de nucleótidos individuales, fracción de pirimidinas o purinas, fracción de ácidos nucleicos naturales frente a no naturales, fracción de nucleótidos metilados y contenido en CpG), estado de metilación, temperatura de fusión en dúplex, susceptibilidad a secuenciación o PCR, nivel de incertidumbre asignado a zonas individuales y/o una búsqueda dirigida de características particulares.
Resultados y determinación de la presencia o ausencia de una variación genética
Algunas variaciones genéticas están asociadas con afecciones médicas. A menudo, las variaciones genéticas incluyen una ganancia, una pérdida y/o una alteración (por ejemplo, reorganización o sustitución) de información genética (por ejemplo, cromosomas, porciones de cromosomas, regiones polimórficas, regiones translocadas, secuencia de nucleótidos alterada, similares, o combinaciones de los anteriores) que dan como resultado un cambio detectable en el genoma o la información genética de un sujeto de prueba con respecto a un sujeto de referencia sin la variación genética. La presencia o ausencia de una variación genética puede determinarse analizando y/o manipulando lecturas de secuencia que se han mapeado a secciones genómicas (por ejemplo, zonas genómicas) tal como se describe en el presente documento.
Recuento
Las lecturas de secuencia que se han mapeado o fraccionado basándose en una característica o variable seleccionada pueden cuantificarse para determinar el número de lecturas que se mapearon a cada sección genómica (por ejemplo, zona, partición, segmento genómico, y similares), en algunas realizaciones. En determinadas realizaciones, el número total de lecturas de secuencia mapeadas se determina contando todas las lecturas de secuencia mapeadas, y en algunas realizaciones, el número total de lecturas de secuencia mapeadas se determina sumando cuentas mapeadas para cada zona o partición. En determinadas realizaciones, un subconjunto de lecturas de secuencia mapeadas se determina contando un subconjunto predeterminado de lecturas de secuencia mapeadas, y en algunas realizaciones, un subconjunto predeterminado de lecturas de secuencia mapeadas se determina sumando cuentas mapeadas a cada zona o partición predeterminada. En algunas realizaciones, los subconjuntos predeterminados de lecturas de secuencia mapeadas pueden incluir desde 1 hasta n -1 lecturas de secuencia, donde n representa un número igual a la suma de todas las lecturas de secuencia generadas a partir de un sujeto de prueba o una muestra de sujeto de referencia. En determinadas realizaciones, los subconjuntos predeterminados de lecturas de secuencia mapeadas pueden seleccionarse utilizando cualquier característica o variable adecuada.
La cuantificación o el recuento de lecturas de secuencia puede realizarse de cualquier manera adecuada, incluyendo, pero sin limitarse a, métodos de recuento manual y métodos de recuento automático. En algunas realizaciones, un método de recuento automático puede implementarse en software que determina o cuenta el número de lecturas de secuencia o etiquetas de secuencia mapeadas a cada cromosoma y/o una o más secciones genómicas seleccionadas. Tal como se usa en el presente documento, software se refiere a instrucciones de programa legibles por ordenador que, cuando se ejecutan mediante un ordenador, realizan operaciones de ordenador.
El número de lecturas de secuencia mapeadas a cada zona y el número total de lecturas de secuencia para muestras derivadas de sujetos de prueba y/o sujetos de referencia pueden analizarse y procesarse adicionalmente para proporcionar un resultado que determina la presencia o ausencia de una variación genética. Las lecturas de secuencia mapeadas que se han contado se denominan algunas veces “datos” o “conjuntos de datos”. En algunas realizaciones, los datos o conjuntos de datos pueden caracterizarse mediante una o más características o variables (por ejemplo, basadas en secuencia [por ejemplo, contenido en GC, secuencia de nucleótidos específica, similares], específicas de función [por ejemplo, genes expresados, genes cancerosos, similares], basadas en ubicación [específicas de genoma, específicas de cromosoma, específicas de sección genómica o específicas de zona], similares, y combinaciones de los mismos). En determinadas realizaciones, los datos o conjuntos de datos pueden organizarse en una matriz que tiene dos o más dimensiones basándose en una o más características o variables. Los datos organizados en matrices pueden clasificarse usando cualquier característica o variable adecuada. Un ejemplo no limitativo de datos organizados en una matriz incluye datos que se clasifican por edad maternal, ploidía materna y contribución fetal. En determinadas realizaciones, los conjuntos de datos caracterizados por una o más características o variables se procesan algunas veces después del recuento.
Procesamiento de datos
Las lecturas de secuencia mapeadas que se han contado se denominan en el presente documento datos sin procesar, puesto que los datos representan cuentas no manipuladas (por ejemplo, cuentas sin procesar). En algunas realizaciones, los datos de lecturas de secuencia en un conjunto de datos pueden procesarse adicionalmente (por ejemplo, manipularse de manera matemática y/o estadística) y/o presentarse para facilitar la proporción de un resultado. En determinadas realizaciones, los conjuntos de datos, incluyendo conjuntos de datos más grandes, pueden beneficiarse del procesamiento previo para facilitar el análisis adicional. El procesamiento previo de conjuntos de datos algunas veces implica la eliminación de secciones o zonas genómicas redundantes y/o no informativas (por ejemplo, zonas con datos no informativos, lecturas mapeadas redundantes, secciones o zonas genómicas con medianas de cuentas nulas, secuencias sobrerrepresentadas o subrepresentadas). Sin estar limitados por la teoría, el procesamiento y/o procesamiento previo de datos puede (i) eliminar datos ruidosos, (ii) eliminar datos no informativos, (iii) eliminar datos redundantes, (iv) reducir la complejidad de conjuntos de datos más grandes, y/o (v) facilitar la transformación de los datos de una forma a una o más de otras formas. Los términos “procesamiento previo y “procesamiento” cuando se utilizan con respecto a datos o conjuntos de datos se denominan colectivamente en el presente documento “procesamiento”. El procesamiento puede dar lugar a datos más susceptibles al análisis adicional, y puede generar un resultado en algunas realizaciones.
El término “datos ruidosos” tal como se usa en el presente documento se refiere a (a) datos que tienen una varianza significativa entre puntos de datos cuando se analizan o representan gráficamente, (b) datos que tienen una desviación estándar significativa, (c) datos que tienen un error estándar de la media significativo, similares, y combinaciones de los anteriores. Los datos ruidosos algunas veces se producen debido a la cantidad y/o calidad del material de partida (por ejemplo, muestra de ácido nucleico), y algunas veces se producen como parte de los procedimientos para preparar o replicar ADN usado para generar lecturas de secuencia. En determinadas realizaciones, el ruido es el resultado de determinadas secuencias que están sobrerrepresentadas cuando se preparan usando métodos basados en PCR. Los métodos descritos en el presente documento pueden reducir o eliminar la contribución de datos ruidosos y, por tanto, reducir el efecto de datos ruidosos en el resultado proporcionado.
Los términos “datos no informativos”, “zonas no informativas” y “secciones genómicas no informativas” tal como se usan en el presente documento se refieren a secciones genómicas, o a datos derivados de las mismas, que tienen un valor numérico que es significativamente diferente de un valor de umbral de corte predeterminado o que se encuentra fuera de un intervalo de valores de corte predeterminado. A menudo, un valor o intervalo de valores de umbral de corte se calcula manipulando de manera matemática y/o estadística datos de lecturas de secuencia (por ejemplo, de una referencia y/o un sujeto), en algunas realizaciones, y en determinadas realizaciones, los datos de lecturas de secuencia manipulados para generar un valor o intervalo de valores de umbral de corte son datos de lecturas de secuencia (por ejemplo, de una referencia y/o un sujeto). En algunas realizaciones, un valor de umbral de corte se obtiene calculando la desviación estándar y/o la mediana de la deviación absoluta (por ejemplo, MAD) de un perfil de cuentas sin procesar o normalizadas y multiplicando la desviación estándar para el perfil por una constante que representa el número de desviaciones estándar elegidas como umbral de corte (por ejemplo, multiplicar por 3 para 3 desviaciones estándar), mediante lo cual se genera un valor para una incertidumbre. En determinadas realizaciones, una porción o la totalidad de las secciones genómicas que superan el valor de umbral de corte de incertidumbre calculado, o que están fuera del intervalo de valores de umbral de corte, se eliminan como parte, antes o después del procedimiento de normalización. En algunas realizaciones, una porción o la totalidad de las secciones genómicas que superan el valor de umbral de corte de incertidumbre calculado, o que están fuera del intervalo de valores de umbral de corte o puntos de datos sin procesar, se ponderan como parte o antes del procedimiento de normalización o clasificación. En el presente documento se describen ejemplos de ponderación. Los términos “datos redundantes” y “lecturas mapeadas redundantes” tal como se usan en el presente documento se refieren a lecturas de secuencia derivadas de muestra que se identifica que ya se han asignado a una ubicación genómica (por ejemplo, posición de base) y/o contado para una sección genómica.
Puede utilizarse cualquier procedimiento adecuado para procesar los conjuntos de datos descritos en el presente documento. Los ejemplos no limitativos de procedimientos adecuados para su uso para procesar conjuntos de datos incluyen filtrado, normalización, ponderación, monitorización de alturas de pico, monitorización de áreas de pico, monitorización de bordes de pico, determinación de razones de áreas, procesamiento matemático de datos, procesamiento estadístico de datos, aplicación de algoritmos estadísticos, análisis con variables fijas, análisis con variables optimizadas, representación gráfica de datos para identificar patrones o tendencias para el procesamiento adicional, similares, y combinaciones de los anteriores. En algunas realizaciones, los conjuntos de datos se procesan basándose en diversas características (por ejemplo, contenido en GC, lecturas mapeadas redundantes, regiones centroméricas, regiones teloméricas, similares, y combinaciones de los mismos) y/o variables (por ejemplo, sexo fetal, edad materna, ploidía materna, porcentaje de contribución de ácido nucleico fetal, similares, o combinaciones de los mismos). En determinadas realizaciones, procesar conjuntos de datos tal como se describe en el presente documento puede reducir la complejidad y/o dimensionalidad de conjuntos de datos grandes y/o complejos. Un ejemplo no limitativo de un conjunto de datos complejo incluye datos de lecturas de secuencia generados a partir de uno o más sujetos de prueba y una pluralidad de sujetos de referencia de diferentes edades y orígenes étnicos. En algunas realizaciones, los conjuntos de datos pueden incluir desde miles hasta millones de lecturas de secuencia para cada sujeto de prueba y/o de referencia.
El procesamiento de datos puede realizarse en cualquier número de etapas, en determinadas realizaciones. Por ejemplo, los datos pueden procesarse usando un único procedimiento de procesamiento en algunas realizaciones, y en determinadas realizaciones, los datos pueden procesarse usando 1 o más, 5 o más, 10 o más, o 20 o más etapas de procesamiento (por ejemplo, 1 o más etapas de procesamiento, 2 o más etapas de procesamiento, 3 o más etapas de procesamiento, 4 o más etapas de procesamiento, 5 o más etapas de procesamiento, 6 o más etapas de procesamiento, 7 o más etapas de procesamiento, 8 o más etapas de procesamiento, 9 o más etapas de procesamiento, 10 o más etapas de procesamiento, 11 o más etapas de procesamiento, 12 o más etapas de procesamiento, 13 o más etapas de procesamiento, 14 o más etapas de procesamiento, 15 o más etapas de procesamiento, 16 o más etapas de procesamiento, 17 o más etapas de procesamiento, 18 o más etapas de procesamiento, 19 o más etapas de procesamiento, o 20 o más etapas de procesamiento). En algunas realizaciones, las etapas de procesamiento pueden ser la misma etapa repetida dos o más veces (por ejemplo, filtrando dos o más veces, normalizando dos o más veces), y en determinadas realizaciones, las etapas de procesamiento pueden ser dos o más etapas de procesamiento diferentes (por ejemplo, filtrado, normalización; normalización, monitorización de alturas y bordes de pico; filtrado, normalización, normalización con respecto a una referencia, manipulación estadística para determinar los valores de p, y similares), llevadas a cabo de manera simultánea o secuencial. En algunas realizaciones, puede utilizarse cualquier número y/o combinación adecuados de las mismas etapas de procesamiento, o diferentes, para procesar datos de lecturas de secuencia para facilitar la proporción de un resultado. En determinadas realizaciones, procesar los conjuntos de datos mediante los criterios descritos en el presente documento puede reducir la complejidad y/o dimensionalidad de un conjunto de datos. En algunas realizaciones, una o más etapas de procesamiento pueden comprender una o más etapas de filtrado.
El término “filtrado” tal como se usa en el presente documento se refiere a eliminar secciones o zonas genómicas de la consideración. Las zonas pueden seleccionarse para su eliminación basándose en cualquier criterio adecuado, incluyendo, pero sin limitarse a, datos redundantes (por ejemplo, lecturas mapeadas redundantes o solapantes), datos no informativos (por ejemplo, zonas con medianas de cuentas nulas), zonas con secuencias sobrerrepresentadas o subrepresentadas, datos ruidosos, similares, o combinaciones de los anteriores. A menudo, un procedimiento de filtrado implica eliminar una o más zonas de la consideración y restar las cuentas en la una o más zonas seleccionadas para su eliminación de las cuentas contadas o sumadas para las zonas, el cromosoma o los cromosomas, o el genoma en consideración. En algunas realizaciones, las zonas pueden eliminarse sucesivamente (por ejemplo, una cada vez para permitir la evaluación del efecto de la eliminación de cada zona individual), y en determinadas realizaciones, pueden eliminarse al mismo tiempo todas las zonas marcadas para su eliminación.
En algunas realizaciones, una o más etapas de procesamiento pueden comprender una o más etapas de normalización. El término “normalización” tal como se usa en el presente documento se refiere a la división de uno o más conjuntos de datos entre una variable predeterminada. Puede usarse cualquier número adecuado de normalizaciones. En algunas realizaciones, los conjuntos de datos pueden normalizarse 1 o más, 5 o más, 10 o más, o incluso 20 o más veces. Los conjuntos de datos pueden normalizarse con respecto a valores (por ejemplo, valor de normalización) representativos de cualquier característica o variable adecuada (por ejemplo, datos de muestra, datos de referencia, o ambos). Los ejemplos no limitativos de tipos de normalizaciones de datos que pueden usarse incluyen normalización de datos de cuentas sin procesar para una o más secciones genómicas de prueba o de referencia seleccionadas con respecto al número total de cuentas mapeadas al cromosoma o a todo el genoma en el que se mapean la sección o las secciones genómica seleccionadas; normalización de datos de cuentas sin procesar para uno o más segmentos genómicos seleccionados con respecto a una mediana de cuentas de referencia para unas o más secciones genómicas o para el cromosoma en el que se mapean un segmento o segmentos genómicos seleccionados; normalización de datos de cuentas sin procesar con respecto a datos previamente normalizados o derivados de los mismos; y normalización de datos previamente normalizados con respecto a una o más de otras variables de normalización predeterminadas. Normalizar un conjunto de datos algunas veces tiene el efecto de aislar el error estadístico, dependiendo de la característica o propiedad seleccionada como variable de normalización predeterminada. Normalizar un conjunto de datos algunas veces también permite la comparación de características de datos de datos que tienen diferentes escalas, llevando los datos a una escala común (por ejemplo, variable de normalización predeterminada). En algunas realizaciones, pueden utilizarse una o más normalizaciones con respecto a un valor derivado estadísticamente para minimizar las diferencias de datos y disminuir la importancia de los datos atípicos.
En algunas realizaciones, una etapa de procesamiento comprende una ponderación. Los términos “ponderado”, “ponderación” o “función de ponderación” o derivados gramaticales o equivalentes de los mismos, tal como se usan en el presente documento, se refieren a una manipulación matemática de una porción o la totalidad de un conjunto de datos algunas veces utilizado para alterar la influencia de determinadas características o variables del conjunto de datos con respecto a otras características o variables del conjunto de datos (por ejemplo, aumento o disminución de la significación y/o contribución de datos contenidos en una o más secciones o zonas genómicas, basándose en la calidad o utilidad de los datos en la zona o las zonas seleccionadas). Puede usarse una función de ponderación para aumentar la influencia de datos con una varianza de medición relativamente pequeña y/o para disminuir la influencia de datos con una varianza de medición relativamente grande, en algunas realizaciones. Por ejemplo, las zonas con datos de secuencia subrepresentados o de baja calidad pueden “ponderarse por disminución” para minimizar la influencia sobre un conjunto de datos, mientras que las zonas seleccionadas pueden “ponderarse por incremento” para aumentar la influencia sobre un conjunto de datos. Un ejemplo no limitativo de una función de ponderación es [1/(desviación estándar)2]. Algunas veces se realiza una etapa de ponderación de manera sustancialmente similar a una etapa de normalización. En algunas realizaciones, se divide un conjunto de datos entre una variable predeterminada (por ejemplo, variable de ponderación). A menudo, una variable predeterminada (por ejemplo, función objetivo minimizada, Phi) se selecciona para ponderar diferentes partes de un conjunto de datos de manera diferente (por ejemplo, aumentar la influencia de determinados tipos de datos al tiempo que se disminuye la influencia de otros tipos de datos).
En determinadas realizaciones, una etapa de procesamiento puede comprender una o más manipulaciones matemáticas y/o estadísticas. Puede usarse cualquier manipulación matemática y/o estadística adecuada, sola o en combinación, para analizar y/o manipular un conjunto de datos descrito en el presente documento. Puede usarse cualquier número adecuado de manipulaciones matemáticas y/o estadísticas. En algunas realizaciones, un conjunto de datos puede manipularse de manera matemática y/o estadística 1 o más, 5 o más, 10 o más, o 20 o más veces. Los ejemplos no limitativos de manipulaciones matemáticas y estadísticas que pueden usarse incluyen suma, resta, multiplicación, división, funciones algebraica, estimadores de mínimos cuadrados, ajuste de curva, ecuaciones diferenciales, polinomios racionales, polinomios dobles, polinomios ortogonales, puntuaciones de z, valores de p, valores de chi, valores de phi, análisis de elevaciones de pico, determinación de ubicaciones de bordes de pico, cálculo de razones de áreas de pico, análisis de la mediana de elevaciones cromosómicas, cálculo de la desviación absoluta de la media, suma de residuos al cuadrado, media, desviación estándar, error estándar, similares, o combinaciones de los mismos. Una manipulación matemática y/o estadística puede realizarse sobre la totalidad o una porción de datos de lecturas de secuencia, o productos procesados de los mismos. Los ejemplos no limitativos de variables o características del conjunto de datos que pueden manipularse de manera estadística incluyen cuentas sin procesar, cuentas filtradas, cuentas normalizadas, alturas de pico, anchuras de pico, áreas de pico, bordes de pico, tolerancias laterales, valores de P, medianas de elevaciones, elevaciones medias, distribución de cuentas dentro de una región genómica, representación relativa de especies de ácido nucleico, similares, o combinaciones de los mismos.
En algunas realizaciones, una etapa de procesamiento puede incluir el uso de uno o más algoritmos estadísticos. Puede usarse cualquier algoritmo estadístico adecuado, solo o en combinación, para analizar y/o manipular un conjunto de datos descrito en el presente documento. Puede usarse cualquier número adecuado de algoritmos estadísticos. En algunas realizaciones, un conjunto de datos puede analizarse usando 1 o más, 5 o más, 10 o más, o 20 o más algoritmos estadísticos. Los ejemplos no limitativos de algoritmos estadísticos adecuados para su uso con los métodos descritos en el presente documento incluyen árboles de decisión, contranulos, comparaciones múltiples, pruebas ómnibus, problema de Behrens-Fisher, remuestreo ("bootstrapping"), método de Fisher para combinar pruebas de significación independientes, hipótesis nula, error de tipo I, error de tipo II, prueba exacta, prueba Z de una muestra, prueba Z de dos muestras, prueba de la t de una muestra, prueba de la t para datos emparejados, prueba de la t agrupada de dos muestras que tiene varianzas iguales, prueba de la t no agrupada de dos muestras que tiene varianzas distintas, prueba z de una proporción, prueba z de dos proporciones agrupada, prueba z de dos proporciones no agrupada, prueba de chi cuadrado de una muestra, prueba de la F de dos muestras para igualdad de varianzas, intervalo de confianza, intervalo creíble, significación, metaanálisis, regresión lineal sencilla, regresión lineal robusta, similares, o combinaciones de los anteriores. Los ejemplos no limitativos de variables o características del conjunto de datos que pueden analizarse usando algoritmos estadísticos incluyen cuentas sin procesar, cuentas filtradas, cuentas normalizadas, alturas de pico, anchuras de pico, bordes de pico, tolerancias laterales, valores de P, medianas de elevaciones, elevaciones medias, distribución de cuentas dentro de una región genómica, representación relativa de especies de ácido nucleico, similares, o combinaciones de los mismos.
En determinadas realizaciones, un conjunto de datos puede analizarse utilizando múltiples (por ejemplo, 2 o más) algoritmos estadísticos (por ejemplo, regresión de mínimos cuadrados, análisis de componentes principales, análisis discriminante lineal, análisis discriminante cuadrático, empaquetado ("bagging"), redes neuronales, modelos de máquinas de vectores de soporte, bosques aleatorios, modelos de árboles de clasificación, K vecinos más cercanos, regresión logística y/o suavización de pérdidas) y/o manipulaciones matemáticas y/o estadísticas (por ejemplo, denominadas en el presente documento manipulaciones). El uso de múltiples manipulaciones puede generar un especio de N dimensiones que puede usarse para proporcionar un resultado, en algunas realizaciones. En determinadas realizaciones, el análisis de un conjunto de datos utilizando múltiples manipulaciones puede reducir la complejidad y/o dimensionalidad del conjunto de datos. Por ejemplo, el uso de múltiples manipulaciones en un conjunto de datos de referencia puede generar un espacio de N dimensiones (por ejemplo, representación gráfica de la probabilidad) que puede usarse para representar la presencia o ausencia de una variación genética, dependiendo del estado genético de las muestras de referencia (por ejemplo, positivo o negativo para una variación genética seleccionada). Puede usarse el análisis de muestras de prueba usando un conjunto sustancialmente similar de manipulaciones para generar un punto de N dimensiones para cada una de las muestras de prueba. La complejidad y/o dimensionalidad de un conjunto de datos de sujetos de prueba se reduce algunas veces hasta un único valor o punto de N dimensiones que puede compararse fácilmente con el espacio de N dimensiones generado a partir de los datos de referencia. Los datos de muestras de prueba que se encuentran dentro del espacio de N dimensiones poblado por los datos de sujetos de referencia son indicativos de un estado genético sustancialmente similar al de los sujetos de referencia. Los datos de muestras de prueba que se encuentran fuera del espacio de N dimensiones poblado por los datos de sujetos de referencia son indicativos de un estado genético sustancialmente distinto al de los sujetos de referencia. En algunas realizaciones, las referencias son euploides o por lo demás no tienen ninguna variación genética o ninguna afección médica.
En algunas realizaciones, una etapa de procesamiento puede comprender generar uno o más perfiles (por ejemplo, representación gráfica de perfiles) a partir de diversos aspectos de un conjunto de datos o una derivación del mismo (por ejemplo, producto de una o más etapas de procesamiento matemático y/o estadístico de datos conocidas en la técnica y/o descritas en el presente documento). El término "perfil” tal como se usa en el presente documento se refiere a la manipulación matemática y/o estadística de datos que facilita la identificación de patrones y/o correlaciones en grandes cantidades de datos. Por tanto, el término "perfil” tal como se usa en el presente documento a menudo se refiere a valores que son el resultado de una o más manipulaciones de datos o conjuntos de datos, basándose en uno o más criterios. A menudo, un perfil incluye múltiples puntos de datos. Puede incluirse cualquier número adecuado de puntos de datos en un perfil dependiendo de la naturaleza y/o complejidad de un conjunto de datos. En determinadas realizaciones, los perfiles pueden incluir 2 o más puntos de datos, 3 o más puntos de datos, 5 o más puntos de datos, 10 o más puntos de datos, 24 o más puntos de datos, 25 o más puntos de datos, 50 o más puntos de datos, 100 o más puntos de datos, 500 o más puntos de datos, 1000 o más puntos de datos, 5000 o más puntos de datos, 10.000 o más puntos de datos, o 100.000 o más puntos de datos.
En algunas realizaciones, un perfil es representativo de la totalidad de un conjunto de datos, y en determinadas realizaciones, un perfil es representativo de una porción o un subconjunto de un conjunto de datos. Es decir, un perfil algunas veces incluye o está generado a partir de puntos de datos representativos de datos que no se han filtrado para eliminar ningún dato, y algunas veces un perfil incluye o está generado a partir de puntos de datos representativos de datos que se han filtrado para eliminar datos no deseados. En algunas realizaciones, un punto de datos en un perfil representa los resultados de la manipulación de datos para una sección genómica. En determinadas realizaciones, un punto de datos en un perfil representa los resultados de la manipulación de datos para grupos de secciones genómicas. En algunas realizaciones, los grupos de secciones genómicas pueden ser adyacentes entre sí, y en determinadas realizaciones, los grupos de secciones genómicas pueden ser de diferentes partes de un cromosoma o genoma.
Los puntos de datos en un perfil derivados de un conjunto de datos pueden ser representativos de cualquier categorización de datos adecuada. Los ejemplos no limitativos de categorías en las que pueden agruparse los datos para generar puntos de datos de perfil incluyen: secciones genómicas basadas en tamaño, secciones genómicas basadas en características de secuencia (por ejemplo, contenido en GC, contenido en AT, posición en un cromosoma (por ejemplo, brazo corto, brazo largo, centrómero, telómero), y similares), niveles de expresión, cromosoma, similares, o combinaciones de los mismos. En algunas realizaciones, un perfil puede generarse a partir de puntos de datos obtenidos de otro perfil (por ejemplo, perfil de datos normalizados que se renormalizan con respecto a un valor de normalización diferente para generar un perfil de datos renormalizados). En determinadas realizaciones, un perfil generado a partir de puntos de datos obtenidos de otro perfil reduce el número de puntos de datos y/o la complejidad del conjunto de datos. Reducir el número de puntos de datos y/o la complejidad de un conjunto de datos a menudo facilita la interpretación de datos y/o facilita la proporción de un resultado.
Con frecuencia, un perfil se presenta como una representación gráfica, y los ejemplos no limitativos de representaciones gráficas de perfil que pueden generarse incluyen recuento sin procesar (por ejemplo, perfil de cuentas sin procesar o perfil sin procesar), recuento normalizado (por ejemplo, perfil de cuentas normalizadas o perfil normalizado), ponderación por zona, puntuación de z, valor de p, razón de áreas frente a ploidía ajustada, mediana de la elevación frente a razón entre fracción fetal ajustada y medida, componentes principales, similares, o combinaciones de los mismos. Las representaciones gráficas de perfil permiten la visualización de los datos manipulados, en algunas realizaciones. En determinadas realizaciones, puede utilizarse una representación gráfica de perfil para proporcionar un resultado (por ejemplo, razón de áreas frente a ploidía ajustada, mediana de la elevación frente a razón entre fracción fetal ajustada y medida, componentes principales). Los términos “representación gráfica de perfil de cuentas sin procesar” o “representación gráfica de perfil sin procesar” tal como se usan en el presente documento se refieren a una representación gráfica de cuentas en cada sección genómica en una región normalizada con respecto a las cuentas totales en una región (por ejemplo, genoma, cromosoma, porción de cromosoma).
Un perfil generado para un sujeto de prueba se compara algunas veces con un perfil generado para uno o más sujetos de referencia, para facilitar la interpretación de manipulaciones matemáticas y/o estadísticas de un conjunto de datos y/o para proporcionar un resultado. En algunas realizaciones, un perfil se genera basándose en una o más suposiciones de partida (por ejemplo, contribución materna de ácido nucleico (por ejemplo, fracción materna), contribución fetal de ácido nucleico (por ejemplo, fracción fetal), ploidía de muestra de referencia, similares, o combinaciones de los mismos). En determinadas realizaciones, un perfil de prueba a menudo está centrado alrededor de un valor predeterminado representativo de la ausencia de una variación genética, y a menudo se desvía de un valor predeterminado en áreas correspondientes a la ubicación genómica en la que está ubicada la variación genética en el sujeto de prueba, si el sujeto de prueba presentaba la variación genética. En sujetos de prueba que están en riesgo de, o padecen, una afección médica asociada con una variación genética, se espera que el valor numérico para una sección genómica seleccionada varíe significativamente desde el valor predeterminado para ubicaciones genómicas no afectadas. Dependiendo de las suposiciones de partida (por ejemplo, ploidía fija o ploidía optimizada, fracción fetal fija o fracción fetal optimizada, o combinaciones de los mismos), el valor o intervalo de valores de umbral o de corte predeterminado indicativo de la presencia o ausencia de una variación genética puede variar al tiempo que todavía proporciona un resultado útil para determinar la presencia o ausencia de una variación genética. En algunas realizaciones, un perfil es indicativo y/o representativo de un fenotipo.
A modo de ejemplo no limitativo, pueden obtenerse perfiles de recuento de referencia y/o de muestra normalizados a partir de datos de lecturas de secuencia sin procesar mediante (a) calcular la mediana de cuentas de referencia para cromosomas, secciones genómicas o porciones de los mismos seleccionados de un subconjunto de referencias que se sabe que no portan ninguna variación genética, (b) eliminar secciones genómicas no informativas de las cuentas sin procesar de muestra de referencia (por ejemplo, filtrado); (c) normalizar las cuentas de referencia para todas las demás zonas con respecto al número residual total de cuentas (por ejemplo, suma de las demás cuentas después de eliminar las zonas no informativas) para la ubicación genómica seleccionada o el cromosoma seleccionado de muestra de referencia, generando de ese modo un perfil de sujeto de referencia normalizado; (d) eliminar las secciones genómicas correspondientes de la muestra de sujeto de prueba; y (e) normalizar las demás cuentas de sujeto de prueba para una o más ubicaciones genómicas seleccionadas con respecto a la suma de la mediana de cuentas de referencia residuales para el cromosoma o los cromosomas que contiene(n) las ubicaciones genómicas seleccionadas, generando de ese modo un perfil de sujeto de prueba normalizado. En determinadas realizaciones, entre (c) y (d) puede incluirse una etapa de normalización adicional con respecto a todo el genoma, reducido por las secciones genómicas filtradas en (b).
En algunas realizaciones, el uso de una o más muestras de referencia que se sabe que están libres de una variación genética en cuestión puede usarse para generar un perfil de medianas de cuentas de referencia, lo que puede dar como resultado un valor predeterminado representativo de la ausencia de la variación genética, y que a menudo se desvía de un valor predeterminado en áreas correspondientes a la ubicación genómica en la que está ubicada la variación genética el sujeto de prueba, si el sujeto de prueba presentaba la variación genética. En sujetos de prueba que están en riesgo de, o padecen, una afección médica asociada con una variación genética, se espera que el valor numérico para la sección o las secciones genómicas seleccionadas varíe significativamente desde el valor predeterminado para ubicaciones genómicas no afectadas. En determinadas realizaciones, el uso de una o más muestras de referencia que se sabe que portan la variación genética en cuestión puede usarse para generar un perfil de medianas de cuentas de referencia, lo que puede dar como resultado un valor predeterminado representativo de la presencia de la variación genética, y que a menudo se desvía de un valor predeterminado en áreas correspondientes a la ubicación genómica en la que un sujeto de prueba no porta la variación genética. En sujetos de prueba que no están en riesgo de, ni padecen, una afección médica asociada con una variación genética, se espera que el valor numérico para la sección o secciones genómicas seleccionadas varíe significativamente desde el valor predeterminado para ubicaciones genómicas afectadas.
En algunas realizaciones, el análisis y procesamiento de datos puede incluir el uso de una o más suposiciones. Puede utilizarse cualquier número o tipo adecuado de suposiciones para analizar o procesar un conjunto de datos. Los ejemplos no limitativos de suposiciones que pueden usarse para el procesamiento y/o análisis de datos incluyen ploidía materna, contribución fetal, prevalencia de determinadas secuencias en una población de referencia, orígenes étnicos, prevalencia de una afección médica seleccionada en miembros de la familia relacionados, paralelismo entre perfiles de cuentas sin procesar a partir de diferentes pacientes y/o ejecuciones después de la normalización de GC y el enmascaramiento repetido (por ejemplo, GCRM), coincidencias idénticas que representan artefactos de PCR (por ejemplo, posición de base idéntica), suposiciones inherentes en un ensayo cuantificador fetal (por ejemplo, FQA), suposiciones con respecto a mellizos (por ejemplo, si son 2 mellizos, y sólo 1 está afectado, la fracción fetal eficaz es sólo el 50% de la fracción fetal medida total (de manera similar para trillizos, cuatrillizos y similares)), ADN libre de células fetal (por ejemplo, ADNlc) que cubre de manera uniforme todo el genoma, similares, y combinaciones de los mismos.
En aquellos casos en los que la calidad y/o profundidad de lecturas de secuencia mapeadas no permite una predicción de resultado en cuanto a la presencia o ausencia de una variación genética a un nivel de confianza deseado (por ejemplo, un nivel de confianza del 95% o mayor), basados en los perfiles de cuentas normalizadas, pueden utilizarse uno o más algoritmos de manipulación matemática y/o algoritmos de predicción estadística adicionales para generar valores numéricos adicionales útiles para el análisis de datos y/o la proporción de un resultado. El término “perfil de cuentas normalizadas” tal como se usa en el presente documento se refiere a un perfil generado usando cuentas normalizadas. En el presente documento se describen ejemplos de métodos que pueden usarse para generar cuentas normalizadas y perfiles de cuentas normalizadas. Tal como se indica, las lecturas de secuencia mapeadas que se han contado pueden normalizarse con respecto a cuentas de muestras de prueba o cuentas de muestras de referencia. En algunas realizaciones, un perfil de cuentas normalizadas puede presentarse como una representación gráfica.
Tal como se indicó anteriormente, los datos algunas veces se transforman desde una forma a otra forma. Los términos “transformado”, “transformación” y derivaciones gramaticales o equivalentes de los mismos, tal como se usan en el presente documento, se refieren a una alteración de datos a partir de un material de partida físico (por ejemplo, ácido nucleico de muestra de sujeto de prueba y/o de sujeto de referencia) para dar una representación digital del material de partida físico (por ejemplo, datos de lecturas de secuencia), y en algunas realizaciones, incluye una transformación adicional en uno o más valores numéricos o representaciones gráficas de la representación digital que pueden utilizarse para proporcionar un resultado. En determinadas realizaciones, el uno o más valores numéricos y/o representaciones gráficas de datos representados de manera digital pueden utilizarse para representar el aspecto físico del genoma de un sujeto de prueba (por ejemplo, represente de manera virtual o representar de manera visual la presencia o ausencia de una inserción genómica o deleción genómica; representar la presencia o ausencia de una variación en la cantidad física de una secuencia asociada con afeccionesmédicas). Algunas veces, una representación virtual se transforma adicionalmente en uno o más valores numéricos o representaciones gráficas de la representación digital del material de partida. Estos procedimientos pueden transformar el material de partida físico en un valor numérico o una representación gráfica, o una representación del aspecto físico del genoma de un sujeto de prueba.
En algunas realizaciones, la transformación de un conjunto de datos facilita la proporción de un resultado reduciendo la complejidad de datos y/o la dimensionalidad de datos. Algunas veces, la complejidad del conjunto de datos se reduce durante el procedimiento de transformar un material de partida físico en una representación virtual del material de partida (por ejemplo, lecturas de secuencia representativas del material de partida físico). Puede utilizarse cualquier característica o variable adecuada para reducir la complejidad y/o dimensionalidad del conjunto de datos. Los ejemplos no limitativos de características que pueden elegirse para su uso como característica objetivo para el procesamiento de datos incluyen el contenido en GC, la predicción del sexo fetal, la identificación de aneuploidía cromosómica, la identificación de genes o proteínas particulares, la identificación de cáncer, enfermedades, genes/rasgos hereditarios, anomalías cromosómicas, una categoría biológica, una categoría química, una categoría bioquímica, una categoría de genes o proteínas, una ontología de genes, una ontología de proteínas, genes regulados conjuntamente, genes de señalización celular, genes del ciclo celular, proteínas pertenecientes a los genes anteriores, variantes de genes, variantes de proteínas, genes regulados conjuntamente, proteínas reguladas conjuntamente, secuencia de aminoácidos, secuencia de nucleótidos, datos de estructuras de proteínas, y similares, y combinaciones de los anteriores. Los ejemplos no limitativos de reducción de la complejidad y/o dimensionalidad del conjunto de datos incluyen: reducción de una pluralidad de lecturas de secuencia a representaciones gráficas de perfil, reducción de una pluralidad de lecturas de secuencia a valores numéricos (por ejemplo, valores normalizados, puntuaciones de Z, valores de p); reducción de múltiples métodos de análisis a representaciones gráficas de la probabilidad o puntos individuales; análisis de componentes principales de cantidades derivadas; y similares, o combinaciones de los mismos.
Resultado
El análisis y procesamiento de datos pueden proporcionar uno o más resultados. El término “resultado” tal como se usa en el presente documento se refiere a un resultado de procesamiento de datos que facilita la determinación de si un sujeto presentaba, o está en riesgo de presentar, una variación genética. A menudo, un resultado comprende uno o más valores numéricos generados usando un método de procesamiento descrito en el presente documento en el contexto de una o más consideraciones de probabilidad. Una consideración de probabilidad incluye, pero no se limita a: medida de variabilidad, nivel de confianza, sensibilidad, especificidad, desviación estándar, coeficiente de variación (CV) y/o nivel de confianza, puntuaciones de Z, valores de Chi, valores de Phi, valores de ploidía, fracción fetal ajustada, razones de áreas, mediana de la elevación, similares, o combinaciones de los mismos. Una consideración de probabilidad puede facilitar la determinación de si un sujeto está en riesgo de presentar, o presenta, una variación genética, y un resultado determinativo de la presencia o ausencia de un trastorno genético a menudo incluye una consideración de este tipo.
A menudo, un resultado es un fenotipo con un nivel de confianza asociado (por ejemplo, un feto es positivo para la trisomía 21 con un nivel de confianza del 99%, un sujeto de prueba es negativo para un cáncer asociado con una variación genética a un nivel de confianza del 95%). Diferentes métodos de generación de valores de resultado algunas veces pueden producir diferentes tipos de resultados. Generalmente, hay cuatro tipos de posibles puntuaciones o identificaciones que pueden realizarse basándose en los valores de resultado generados usando los métodos descritos en el presente documento: verdadero positivo, falso positivo, verdadero negativo y falso negativo. Los términos “puntuación”, “puntuaciones”, “identificación” e “identificaciones” tal como se usan en el presente documento se refieren a calcular la probabilidad de que una variación genética particular esté presente o ausente en un sujeto/una muestra. El valor de una puntuación puede usarse para determinar, por ejemplo, una variación, diferencia o razón de lecturas de secuencia mapeadas que pueden corresponder a una variación genética. Por ejemplo, calcular una puntuación positiva para una variación genética o sección genómica seleccionada a partir de un conjunto de datos, con respecto a un genoma de referencia, puede conducir a una identificación de la presencia o ausencia de una variación genética, variación genética que algunas veces está asociada con una afección médica (por ejemplo, cáncer, preeclampsia, trisomía, monosomía, y similares). En algunas realizaciones, un resultado comprende un perfil. En aquellas realizaciones en las que un resultado comprende un perfil, puede usarse cualquier perfil o combinación de perfiles adecuado para un resultado. Los ejemplos no limitativos de perfiles que pueden usarse para un resultado incluyen perfiles de puntuaciones de z, perfiles de valores de p, perfiles de valores de chi, perfiles de valores de phi, similares, y combinaciones de los mismos.
Un resultado generado para determinar la presencia o ausencia de una variación genética algunas veces incluye un resultado nulo (por ejemplo, un punto de datos entre dos agrupaciones, un valor numérico con una desviación estándar que abarca valores tanto para la presencia como para la ausencia de una variación genética, un conjunto de datos con una representación gráfica de perfil que no es similar a representaciones gráficas de perfil para sujetos que tienen o están libres de la variación genética que está investigándose). En algunas realizaciones, un resultado indicativo de un resultado nulo todavía es un resultado determinativo, y la determinación puede incluir la necesidad de información adicional y/o una repetición de la generación y/o el análisis de datos para determinar la presencia o ausencia de una variación genética.
Un resultado puede generarse después de realizar una o más etapas de procesamiento descritas en el presente documento, en algunas realizaciones. En determinadas realizaciones, un resultado se genera como resultado de una de las etapas de procesamiento descritas en el presente documento, y en algunas realizaciones, un resultado puede generarse después de realizar cada manipulación estadística y/o matemática de un conjunto de datos. Un resultado referente a la determinación de la presencia o ausencia de una variación genética puede expresarse de cualquier forma adecuada, forma que comprende, sin limitación, una probabilidad (por ejemplo, razón de posibilidades, valor de p), verosimilitud, valor dentro o fuera de una agrupación, valor por encima o por debajo de un valor de umbral, valor con una medida de varianza o confianza, o factor de riesgo, asociados con la presencia o ausencia de una variación genética para un sujeto o una muestra. En determinadas realizaciones, la comparación entre muestras permite la confirmación de la identidad de muestra (por ejemplo, permite la identificación de muestras repetidas y/o muestras que se han confundido (por ejemplo, mal etiquetadas, combinadas, y similares)).
En algunas realizaciones, un resultado comprende un valor por encima o por debajo de un valor de corte o de umbral predeterminado (por ejemplo, mayor de 1, menor de 1), y una incertidumbre o un nivel de confianza asociados con el valor. Un resultado también puede describir cualquier suposición usada en el procesamiento de datos. En determinadas realizaciones, un resultado comprende un valor que se encuentra dentro o fuera de un intervalo de valores predeterminado, y siendo la incertidumbre o el nivel de confianza asociados para ese valor dentro o fuera del intervalo. En algunas realizaciones, un resultado comprende un valor que es igual a un valor predeterminado (por ejemplo, igual a 1, igual a cero), o que es igual a un valor dentro de un intervalo de valores predeterminado, y siendo su incertidumbre o nivel de confianza asociados para ese valor igual al o dentro o fuera del un intervalo. Algunas veces, un resultado se representa gráficamente como una representación gráfica (por ejemplo, una representación gráfica de perfil).
Tal como se indicó anteriormente, un resultado puede caracterizarse como verdadero positivo, verdadero negativo, falso positivo o falso negativo. El término “verdadero positivo” tal como se usa en el presente documento se refiere a un sujeto diagnosticado de manera correcta como que tiene una variación genética. El término “falso positivo” tal como se usa en el presente documento se refiere a un sujeto identificado de manera incorrecta como que tiene una variación genética. El término “verdadero negativo” tal como se usa en el presente documento se refiere a un sujeto identificado de manera correcta como que no tiene una variación genética. El término “falso negativo” tal como se usa en el presente documento se refiere a un sujeto identificado de manera incorrecta como que no tiene una variación genética. Pueden calcularse dos medidas de rendimiento para un método dado basándose en razones de estos acontecimientos: (i) un valor de sensibilidad, que generalmente es la fracción de positivos predichos identificados de manera correcta como positivos; y (ii) un valor de especificidad, que generalmente es la fracción de negativos predichos identificados de manera correcta como negativos. El término “sensibilidad” tal como se usa en el presente documento se refiere al número de verdaderos positivos dividido entre el número de verdaderos positivos más el número de falsos negativos, donde la sensibilidad (sens) puede estar dentro del intervalo de 0 < sens < 1. Idealmente, el número de falsos negativos es igual a cero o próximo a cero, de modo que ningún sujeto se identifica de manera incorrecta como que no tiene al menos una variación genética cuando, de hecho, tienen al menos una variación genética. A la inversa, a menudo se realiza una evaluación de la capacidad de un algoritmo de predicción para clasificar negativos de manera correcta, una medición complementaria a la sensibilidad. El término “especificidad” tal como se usa en el presente documento se refiere al número de verdaderos negativos dividido entre el número de verdaderos negativos más el número de falsos positivos, donde la especificidad (spec) puede estar dentro del intervalo de 0 < spec < 1. Idealmente, el número de falsos positivos es igual a cero o próximo a cero, de modo que ningún sujeto se identifica de manera incorrecta como que tiene al menos una variación genética cuando no tiene la variación genética que está evaluándose.
En determinadas realizaciones, uno o más de sensibilidad, especificidad y/o nivel de confianza se expresan como porcentaje. En algunas realizaciones, el porcentaje, independientemente para cada variable, es mayor de aproximadamente el 90% (por ejemplo, aproximadamente el 90, el 91, el 92, el 93, el 94, el 95, el 96, el 97, el 98 o el 99%, o mayor del 99% (por ejemplo, aproximadamente el 99,5% o mayor, aproximadamente el 99,9% o mayor, aproximadamente el 99,95% o mayor, aproximadamente el 99,99% o mayor)). En algunas realizaciones, el coeficiente de variación (CV) se expresa como porcentaje, y algunas veces el porcentaje es de aproximadamente el 10% o menos (por ejemplo, aproximadamente el 10, el 9, el 8, el 7, el 6, el 5, el 4, el 3, el 2 o el 1%, o menor del 1% (por ejemplo, aproximadamente el 0,5% o menos, aproximadamente el 0,1% o menos, aproximadamente el 0,05% o menos, aproximadamente el 0,01% o menos)). En determinadas realizaciones, una probabilidad (por ejemplo, que un resultado particular no se deba al azar) se expresa como una puntuación de Z, un valor de p o los resultados de una prueba de la t. En algunas realizaciones, pueden generarse una varianza, un intervalo de confianza, una sensibilidad, una especificidad, y similares (por ejemplo, denominados colectivamente parámetros de confianza), medidos para un resultado usando una o más manipulaciones de procesamiento de datos descritas en el presente documento.
Algunas veces se selecciona un método que tiene una sensibilidad y una especificidad que son iguales a uno, o del 100%, o cercanas a uno (por ejemplo, entre aproximadamente el 90% y aproximadamente el 99%). En algunas realizaciones, se selecciona un método que tiene una sensibilidad que es igual a 1, o del 100%, y en determinadas realizaciones, se selecciona un método que tiene una sensibilidad cercana a 1 (por ejemplo, una sensibilidad de aproximadamente el 90%, una sensibilidad de aproximadamente el 91%, una sensibilidad de aproximadamente el 92%, una sensibilidad de aproximadamente el 93%, una sensibilidad de aproximadamente el 94%, una sensibilidad de aproximadamente el 95%, una sensibilidad de aproximadamente el 96%, una sensibilidad de aproximadamente el 97%, una sensibilidad de aproximadamente el 98% o una sensibilidad de aproximadamente el 99%). En algunas realizaciones, se selecciona un método que tiene una especificidad que es igual a 1, o del 100%, y en determinadas realizaciones, se selecciona un método que tiene una especificidad cercana a 1 (por ejemplo, una especificidad de aproximadamente el 90%, una especificidad de aproximadamente el 91%, una especificidad de aproximadamente el 92%, una especificidad de aproximadamente el 93%, una especificidad de aproximadamente el 94%, una especificidad de aproximadamente el 95%, una especificidad de aproximadamente el 96%, una especificidad de aproximadamente el 97%, una especificidad de aproximadamente el 98% o una especificidad de aproximadamente el 99%).
Después de que se hayan generado uno o más resultados, a menudo se usa un resultado para proporcionar una determinación de la presencia o ausencia de una variación genética y/o una afección médica asociada. Un resultado normalmente se proporciona a un profesional sanitario (por ejemplo, técnico o jefe de laboratorio; médico o auxiliar). En algunas realizaciones, un resultado determinativo de la presencia o ausencia de una variación genética se proporciona a un profesional sanitario en forma de un informe, y en determinadas realizaciones el informe comprende una presentación de un valor de resultado y un parámetro de confianza asociado. Generalmente, un resultado puede presentarse en cualquier formato adecuado que facilita la determinación de la presencia o ausencia de una variación genética y/o una afección médica. Los ejemplos no limitativos de formatos adecuados para su uso para informar y/o presentar conjuntos de datos o informar un resultado incluyen datos digitales, un gráfico, un gráfico en 2D, un gráfico en 3D y un gráfico en 4D, una imagen, una pictografía, un esquema, un gráfico de barras, un gráfico de sectores, un diagrama, un diagrama de flujo, un gráfico de dispersión, un mapa, un histograma, un diagrama de densidad, un gráfico de función, un diagrama de circuitos, un diagrama de bloques, un mapa de burbujas, un diagrama de constelaciones, un diagrama de contornos, un cartograma, un diagrama de araña, un diagrama de Venn, un nomograma, y similares, y una combinación de los anteriores.
Uso de resultados
Un profesional sanitario, u otro individuo cualificado, que recibe un informe que comprende uno o más resultados determinativos de la presencia o ausencia de una variación genética puede usar los datos presentados en el informe para realizar una identificación con respecto al estado del sujeto de prueba o paciente. El profesional sanitario puede realizar una recomendación basándose en el resultado proporcionado, en algunas realizaciones. Un profesional sanitario o individuo cualificado puede proporcionar a un sujeto de prueba o paciente una identificación o puntuación con respecto a la presencia o ausencia de la variación genética basándose en el valor o los valores de resultado y en los parámetros de confianza asociados proporcionados en un informe, en algunas realizaciones. En determinadas realizaciones, una puntuación o identificación se realiza manualmente por un profesional sanitario o individuo cualificado, usando observación visual del informe proporcionado. En determinadas realizaciones, una puntuación o identificación se realiza mediante una rutina automatizada, algunas veces incluida en software, y un profesional sanitario o individuo cualificado revisa su exactitud antes de proporcionar la información a un sujeto de prueba o paciente. El término “recibir un informe” tal como se usa en el presente documento se refiere a obtener, mediante cualquier medio de comunicación, una representación por escrito y/o gráfica que comprende un resultado, que tras su revisión permite a un profesional sanitario u otro individuo cualificado realizar una determinación sobre la presencia o ausencia de una variación genética en un sujeto de prueba o paciente. El informe puede generarse por ordenador o mediante entrada manual de datos, y puede comunicarse usando medios electrónicos (por ejemplo, por Internet, por ordenador, por fax, desde una ubicación de red hasta otra ubicación en el mismo sitio físico o en uno diferente) o usando cualquier otro método de envío o recepción de datos (por ejemplo, servicio de correo, servicio de mensajería, y similares). En algunas realizaciones, el resultado se transmite a un profesional sanitario en un medio adecuado, incluyendo, sin limitación, en forma verbal, de documento o de archivo. El archivo puede ser, por ejemplo, pero sin limitarse a, un archivo de auditoría, un archivo legible por ordenador, un archivo en papel, un archivo de laboratorio o un archivo de registro médico.
El término “proporcionar un resultado” y equivalentes gramaticales del mismo, tal como se usan en el presente documento, también pueden referirse a cualquier método para obtener tal información, incluyendo, sin limitación, obtener la información a partir de un archivo de laboratorio. Un archivo de laboratorio puede generarse por un laboratorio que llevó a cabo uno o más ensayos o una o más etapas de procesamiento de datos para determinar la presencia o ausencia de la afección médica. El laboratorio puede estar en la misma ubicación o en una ubicación diferente (por ejemplo, en otro país) que el personal que identifica la presencia o ausencia de la afección médica a partir del archivo de laboratorio. Por ejemplo, el archivo de laboratorio puede generarse en una ubicación y transmitirse a otra ubicación, en el que la información en el mismo se transmitirá a la mujer embarazada. El archivo de laboratorio puede estar en forma tangible o en forma electrónica (por ejemplo, forma legible por ordenador), en determinadas realizaciones.
Un profesional sanitario o individuo cualificado puede proporcionar cualquier recomendación adecuada basándose en el resultado o los resultados proporcionados en el informe. Los ejemplos no limitativos de recomendaciones que pueden proporcionarse basándose en el informe de resultados proporcionado incluyen cirugía, radioterapia, quimioterapia, asesoramiento genético, soluciones de tratamiento posparto (por ejemplo, planificación de vida, atención asistida a largo plazo, medicamentos, tratamientos sintomáticos), aborto provocado, trasplante de órganos, transfusión de sangre, similares, o combinaciones de los anteriores. En algunas realizaciones, la recomendación depende de la clasificación basada en resultados proporcionada (por ejemplo, síndrome de Down, síndrome de Turner, afecciones médicas asociadas con variaciones genéticas en T13, afecciones médicas asociadas con variaciones genéticas en T18).
Puede usarse software para realizar una o más etapas en el procedimiento descrito en el presente documento, incluyendo, pero sin limitarse a: recuento, procesamiento de datos, generación de un resultado y/o proporción de una o más recomendaciones basadas en los resultados generados.
Máquinas, software e interfaces
Pueden usarse aparatos, software e interfaces para llevar a cabo los métodos descritos en el presente documento. Usando aparatos, software e interfaces, un usuario puede entrar, solicitar, consultar o determinar opciones para usar información, programas o procedimientos particulares (por ejemplo, mapear lecturas de secuencia, procesar datos mapeados y/o proporcionar un resultado), lo que puede implicar la implementación de algoritmos de análisis estadístico, algoritmos de significación estadística, algoritmos estadísticos, etapas iterativas, algoritmos de validación y representaciones gráficas, por ejemplo. En algunas realizaciones, un usuario puede introducir un conjunto de datos como información de entrada, un usuario puede descargar uno o más conjuntos de datos mediante cualquier medio de hardware adecuado (por ejemplo, una unidad de memoria) y/o un usuario puede enviar un conjunto de datos desde un sistema hasta otro para su posterior procesamiento y/o proporción de un resultado (por ejemplo, enviar datos de lecturas de secuencia desde un secuenciador hasta un sistema informático para el mapeo de lecturas de secuencia; enviar datos de secuencia mapeados a un sistema informático para procesar y producir un resultado y/o informe).
Por ejemplo, un usuario puede realizar una consulta al software que luego puede adquirir un conjunto de datos a través de acceso a Internet, y en determinadas realizaciones, puede solicitarse a un procesador programare que adquiera un conjunto de datos adecuado basándose en parámetros dados. Un procesador programable también puede solicitar a un usuario que seleccione una o más opciones de conjuntos de datos seleccionadas por el procesador basándose en parámetros dados. Un procesador programable puede solicitar a un usuario que seleccione una o más opciones de conjuntos de datos seleccionadas por el procesador basándose en información encontrada en Internet, otra información interna o externa, o similares. Las opciones pueden elegirse para seleccionar una o más selecciones de características de datos, uno o más algoritmos estadísticos, uno o más algoritmos de análisis estadístico, uno o más algoritmos de significación estadística, etapas iterativas, uno o más algoritmos de validación y una o más representaciones gráficas de métodos, aparatos o programas informáticos.
Los sistemas abordados en el presente documento pueden comprender componentes generales de sistemas informáticos, tales como, por ejemplo, servidores de red, sistemas de ordenador portátil, sistemas de ordenador de mesa, sistemas portátiles, asistentes digitales personales, quioscos informáticos, y similares. Un sistema informático puede comprender uno o más medios de entrada tales como un teclado, una pantalla táctil, un ratón, un reconocimiento de voz u otro medio para permitir al usuario introducir datos en el sistema. Un sistema puede comprender además una o más salidas, incluyendo, pero sin limitarse a, una pantalla de visualización (por ejemplo, CRT o LCD), un altavoz, una máquina de FAX, una impresora (por ejemplo, una impresora láser, de chorro de tinta, de impacto, de blanco y negro o de color) u otra salida útil para proporcionar una salida de información visual, auditiva y/o impresa de información (por ejemplo, resultado y/o informe).
En un sistema, un medio de entrada y de salida puede conectarse a una unidad de procesamiento central que puede comprender, entre otros componentes, un microprocesador para ejecutar instrucciones de programa y una memoria para almacenar datos y códigos de programa. En algunas realizaciones, los procedimientos pueden implementarse como sistema de usuario único ubicado en un único sitio geográfico. En determinadas realizaciones, los procedimientos pueden implementarse como sistema de múltiples usuarios. En el caso de una implementación de múltiples usuarios, pueden conectarse múltiples unidades de procesamiento centrales por medio de una red. La red puede ser local, abarcando un único departamento en una porción de un edificio, un edificio completo, abarcar múltiples edificios, abarcar una región, abarcar todo un país o ser mundial. La red puede ser privada, ser propiedad de y estar controlada por un proveedor, o puede implementarse como un servicio basado en Internet en el que el usuario accede a la página web para introducir y recuperar información. Por consiguiente, en determinadas realizaciones, un sistema incluye una o más máquinas, que pueden ser locales o remotas con respecto al usuario. Un usuario puede acceder a más de una máquina en una ubicación o en múltiples ubicaciones, y los datos pueden mapearse y/o procesarse en serie y/o en paralelo. Por tanto, puede utilizarse cualquier configuración y control adecuados para mapear y/o procesar datos usando múltiples máquinas, tales como en plataformas informáticas de red local, red remota y/o “en la nube”.
Un sistema puede incluir una interfaz de comunicaciones en algunas realizaciones. Una interfaz de comunicaciones permite la transferencia de software y datos entre un sistema informático y uno o más dispositivos externos. Los ejemplos no limitativos de interfaces de comunicaciones incluyen un módem, una interfaz de red (tal como una tarjeta de Ethernet), un puerto de comunicaciones, una tarjeta y ranura PCMCIA, y similares. El software y los datos transferidos a través de una interfaz de comunicaciones están generalmente en forma de señales, que pueden ser electrónicas, electromagnéticas, ópticas y/u otras señales que pueden recibirse por una interfaz de comunicaciones. A menudo, las señales se proporcionan a una interfaz de comunicaciones a través de un canal. A menudo, un canal transporta señales y puede implementarse usando alambre o cable, fibra óptica, una línea de teléfono, un enlace de teléfono celular, un enlace de RF y/u otros canales de comunicaciones. Por tanto, en un ejemplo, puede usarse una interfaz de comunicaciones para recibir información de señal que puede detectarse por un módulo de detección de señales.
Los datos pueden introducirse mediante cualquier dispositivo y/o método adecuado, incluyendo, pero sin limitarse a, dispositivos de introducción manual o dispositivos de entrada directa de datos (DDE). Los ejemplos no limitativos de dispositivos manuales incluyen teclados, teclados conceptuales, pantallas táctiles, lapiceros ópticos, ratón, bolas de seguimiento, palancas de mando, tabletas gráficas, escáneres, cámaras digitales, digitalizadores de video y dispositivos de reconocimiento de voz. Los ejemplos no limitativos de DDE incluyen lectores de códigos de barras, códigos de bandas magnéticas, tarjetas inteligentes, reconocimiento por tinta magnética de caracteres, reconocimiento óptico de caracteres, reconocimiento óptico de marcas y documentos actualizados informáticamente.
En algunas realizaciones, la salida a partir de un aparato de secuenciación puede servir como datos que pueden introducirse a través de un dispositivo de entrada. En determinadas realizaciones, las lecturas de secuencia mapeadas pueden servir como datos que pueden introducirse a través de un dispositivo de entrada. En determinadas realizaciones, se generan datos simulados mediante un procedimiento in silico y los datos simulados sirven como datos que pueden introducirse a través de un dispositivo de entrada. El término “in silico" se refiere a la investigación y a los experimentos realizados usando un ordenador. Los procedimientos in silico incluyen, pero no se limitan a, mapeo de lecturas de secuencia y procesamiento de lecturas de secuencia mapeadas según los procedimientos descritos en el presente documento.
Un sistema puede incluir software útil para realizar un procedimiento descrito en el presente documento, y el software puede incluir uno o más módulos para realizar tales procedimientos (por ejemplo, módulo de adquisición de datos, módulo de procesamiento de datos, módulo de visualización de datos). El término “software” se refiere a instrucciones de programa legibles por ordenador que, cuando son ejecutadas por un ordenador, realizan operaciones de ordenador. El término “módulo” se refiere a una unidad funcional autónoma que puede usarse en un sistema de software más grande. Por ejemplo, un módulo de software forma parte de un programa que realiza un procedimiento o una tarea particular.
A menudo, el software se proporciona en un producto de programa que contiene instrucciones de programa registradas en un medio legible por ordenador, incluyendo, pero sin limitarse a, medios magnéticos incluyendo discos flexibles, discos duros y cintas magnéticas; y medios ópticos incluyendo discos CD-ROM, discos DVD, discos magneto-ópticos, unidades de memoria, RAM, discos flexibles, similares, y otros de tales medios en los que pueden grabarse las instrucciones de programa. En una implementación en línea, un servidor y un sitio web mantenido por una organización pueden configurarse para proporcionar descargas de software para usuarios remotos, o los usuarios remotos pueden acceder a un sistema remoto mantenido por una organización para acceder de forma remota al software.
El software puede obtener o recibir información de entrada. El software puede incluir un módulo que obtiene o recibe específicamente los datos (por ejemplo, un módulo de recepción de datos que recibe datos de lecturas de secuencia y/o datos de lecturas mapeadas) y puede incluir un módulo que procesa específicamente los datos (por ejemplo, un módulo de procesamiento que procesa los datos recibidos (por ejemplo, filtra, normaliza, proporciona un resultado y/o informe). Los términos “obtener” y “recibir” información de entrada se refieren a recibir datos (por ejemplo, lecturas de secuencia, lecturas mapeadas) mediante un medio de comunicación por ordenador a partir de un sitio local o remoto, entrada manual de datos o cualquier otro método de recepción de datos. La información de entrada puede generarse en la misma ubicación en la que se recibe, o puede generarse en una ubicación diferente y transmitirse a la ubicación de recepción. En algunas realizaciones, la información de entrada se modifica antes de procesarse (por ejemplo, se coloca en un formato susceptible al procesamiento (por ejemplo, se tabula)).
En algunas realizaciones, se proporcionan productos de programa informático, tales como, por ejemplo, un producto de programa informático que comprende un medio que puede usarse con ordenador que tiene un código de programa legible por ordenador implementado en el presente documento, estando adaptado el código de programa legible por ordenador para su ejecución para implementar un método que comprende: (a) obtener lecturas de secuencia de nucleótidos a partir de una muestra que comprende ácido nucleico libre de células circulante de una hembra preñada, en el que la muestra se ha enriquecido en una especie de ácido nucleico libre de vesículas y/o una determinada especie de ácido nucleico asociado con histona, (b) mapear las lecturas de secuencia de nucleótidos a secciones del genoma de referencia, (c) contar el número de lecturas de secuencia de nucleótidos mapeadas a cada sección del genoma de referencia, (d) comparar el número de cuentas de las lecturas de secuencia de nucleótidos mapeadas en (c), o un derivado de las mismas, a una referencia, o una porción de la misma, realizando de ese modo una comparación, y (e) proporcionar un resultado determinativo de la presencia o ausencia de una aneuploidía fetal basándose en la comparación.
El software puede incluir uno o más algoritmos en determinadas realizaciones. Puede usarse un algoritmo para procesar datos y/o proporcionar un resultado o informe según una secuencia finita de instrucciones. A menudo, un algoritmo es una lista de instrucciones definidas para completar una tarea. Partiendo de un estado inicial, las instrucciones pueden describir una computación que procede a través de una serie definida de estados sucesivos, terminando eventualmente en un estado de terminación final. La transición de un estado al siguiente no es necesariamente determinística (por ejemplo, algunos algoritmos incorporan aleatoriedad). A modo de ejemplo, y sin limitación, un algoritmo puede ser un algoritmo de búsqueda, algoritmo de clasificación, algoritmo de fusión, algoritmo numérico, algoritmo gráfico, algoritmo de cadenas, algoritmo de modelación, algoritmo geométrico computacional, algoritmo combinatorio, algoritmo de aprendizaje automático, algoritmo de criptografía, algoritmo de comprensión de datos, algoritmo de análisis, y similares. Un algoritmo puede incluir un algoritmo o dos o más algoritmos que trabajan en combinación. Un algoritmo puede ser de cualquier clase de complejidad y/o de complejidad parametrizada adecuada. Puede usarse un algoritmo para el cálculo y/o el procesamiento de datos, y en algunas realizaciones, puede usarse en un enfoque determinístico o probabilístico/predictivo. Un algoritmo puede implementarse en un entorno de computación mediante el uso de un lenguaje de programación adecuado, cuyos ejemplos no limitativos son C, C++, Java, Perl, Python, Fortran, y similares. En algunas realizaciones, un algoritmo puede configurarse o modificarse para incluir margen de errores, análisis estadístico, significación estadística y/o comparación con otros conjuntos de datos o información (por ejemplo, aplicable cuando se usa un algoritmo de agrupación o red neuronal).
En determinadas realizaciones, pueden implementarse varios algoritmos para su uso en software. Estos algoritmos pueden entrenarse con datos sin procesar en algunas realizaciones. Para cada nueva muestra de datos sin procesar, los algoritmos entrenados pueden producir un conjunto de datos o resultado procesado representativo. Algunas veces, un conjunto de datos procesado tiene una complejidad reducida en comparación con el conjunto de datos original que se procesó. Basándose en un conjunto procesado, el rendimiento de un algoritmo entrenado puede evaluarse basándose en sensibilidad y especificidad, en algunas realizaciones. Puede identificarse y utilizarse un algoritmo con la sensibilidad y/o la especificidad más altas, en determinadas realizaciones.
En determinadas realizaciones, los datos simulados (o de simulación) pueden ayudar al procesamiento de datos, por ejemplo, entrenando un algoritmo o sometiendo a prueba un algoritmo. En algunas realizaciones, los datos simulados incluyen diversos muestreos hipotéticos de diferentes agrupaciones de lecturas de secuencia. Los datos simulados pueden estar basados en qué podría esperarse de una población real o pueden sesgarse para someter a prueba un algoritmo y/o para asignar una clasificación correcta. Los datos simulados también se denominan en el presente documento datos “virtuales”. Pueden realizarse simulaciones mediante un programa informático en determinadas realizaciones. Una posible etapa en el uso de un conjunto de datos simulado es evaluar la confianza de un resultado identificado, por ejemplo, cómo de bien un muestreo al azar coincide o representa mejor los datos originales. Un enfoque es calcular un valor de probabilidad (valor de p), que estima la probabilidad de que una muestra al azar tenga una puntuación mejor que las muestras seleccionadas. En algunas realizaciones, puede evaluarse un modelo empírico, en el que se supone que al menos una muestra coincide con una muestra de referencia (con o sin variaciones resueltas). En algunas realizaciones, puede usarse otra distribución, tal como una distribución de Poisson, por ejemplo, para definir la distribución de probabilidades.
Un sistema puede incluir uno o más procesadores en determinadas realizaciones. Un procesador puede conectarse a un bus de comunicación. Un sistema informático puede incluir una memoria principal, a menudo memoria de acceso aleatorio (RAM), y también puede incluir una memoria secundaria. La memoria secundaria puede incluir, por ejemplo, una unidad de disco duro y/o una unidad de almacenamiento extraíble, que representa una unidad de disco flexible, una unidad de cintas magnéticas, una unidad de disco óptico, una tarjeta de memoria, y similares. A menudo, una unidad de almacenamiento extraíble lee a partir de y/o escribe en una unidad de almacenamiento extraíble. Los ejemplos no limitativos de unidades de almacenamiento extraíbles incluyen un disco flexible, cintas magnéticas, un disco óptico, y similares, que pueden ser leídos y escritos por, por ejemplo, una unidad de almacenamiento extraíble. Una unidad de almacenamiento extraíble puede incluir un medio de almacenamiento que puede usarse con ordenador que tiene almacenado en el mismo datos y/o software informático.
Un procesador puede implementar software en un sistema. En algunas realizaciones, un procesador puede programarse para realizar automáticamente una tarea descrita en el presente documento que puede realizar un usuario. Por consiguiente, un procesador, o un algoritmo llevado a cabo por un procesador de este tipo, puede requerir de poca a ninguna supervisión o entrada a partir de un usuario (por ejemplo, el software puede programarse para implementar una función automáticamente). En algunas realizaciones, la complejidad de un procedimiento es tan grande que una sola persona o un grupo de personas no puede realizar el procedimiento en un periodo de tiempo suficientemente corto para proporcionar un resultado determinativo de la presencia o ausencia de una variación genética.
En algunas realizaciones, la memoria secundaria puede incluir otros medios similares para permite la carga de programas informáticos u otras instrucciones en un sistema informático. Por ejemplo, un sistema puede incluir una unidad de almacenamiento extraíble y un dispositivo de interfaz. Los ejemplos no limitativos de tales sistemas incluyen un cartucho de programa y una interfaz de cartucho (tal como la hallada en dispositivos de videojuegos), un chip de memoria extraíble (tal como una EPROM, o PROM) y un enchufe asociado, y otras unidades de almacenamiento extraíbles e interfaces que permiten la transferencia de software y datos desde la unidad de almacenamiento extraíble hasta un sistema informático.
Variaciones genéticas y afecciones médicas
La presencia o ausencia de una variación genética puede determinarse usando un método o aparato descrito en el presente documento. En determinadas realizaciones, la presencia o ausencia de una o más variaciones genéticas se determina según un resultado proporcionado por los métodos y aparatos descritos en el presente documento. Una variación genética generalmente es un fenotipo genético particular presente en determinados individuos y, a menudo, una variación genética está presente en una subpoblación de individuos estadísticamente significativa. En algunas realizaciones, una variación genética es una anomalía cromosómica (por ejemplo, aneuploidía), una anomalía cromosómica parcial o un mosaicismo, cada uno de los cuales se describe con mayor detalle en el presente documento. Los ejemplos no limitativos de variaciones genéticas incluyen una o más deleciones (por ejemplo, microdeleciones), duplicaciones (por ejemplo, microduplicaciones), inserciones, mutaciones, polimorfismos (por ejemplo, polimorfismos de un solo nucleótido), fusiones, repeticiones (por ejemplo, repeticiones cortas en tándem), sitios de metilación distintos, patrones de metilación distintos, similares, y combinaciones de los mismos. Una inserción, repetición, deleción, duplicación, mutación o un polimorfismo puede tener cualquier longitud, y en algunas realizaciones, es de aproximadamente 1 base o par de bases (pb) a aproximadamente 250 megabases (Mb) de longitud. En algunas realizaciones, una inserción, repetición, deleción, duplicación, mutación o un polimorfismo es de aproximadamente 1 base o par de bases (pb) a aproximadamente 1.000 kilobases (kb) de longitud (por ejemplo, aproximadamente 10 pb, 50 pb, 100 pb, 500 pb, 1 kb, 5 kb, 10kb, 50 kb, 100 kb, 500 kb o 1000 kb de longitud).
Algunas veces, una variación genética es una deleción. En algunas realizaciones, una deleción es una mutación (por ejemplo, una aberración genética) en la que falta una parte de un cromosoma o una secuencia de ADN. A menudo, una deleción es la pérdida de material genético. Puede delecionarse cualquier número de nucleótidos. Una deleción puede comprender la deleción de uno o más cromosomas completos, un segmento de un cromosoma, un alelo, un gen, un intrón, un exón, cualquier región no codificante, cualquier región codificante, un segmento de los mismos, o una combinación de los mismos. Una deleción puede comprender una microdeleción. Una deleción puede comprender la deleción de una sola base.
Algunas veces, una variación genética es una duplicación genética. En algunas realizaciones, una duplicación es una mutación (por ejemplo, una aberración genética) en la que se copia e inserta de nuevo en el genoma una parte de un cromosoma o una secuencia de ADN. En algunas realizaciones, una duplicación genética (es decir, una duplicación) es cualquier duplicación de una región de ADN. En algunas realizaciones, una duplicación es una secuencia de ácido nucleico que se repite, a menudo en tándem, dentro de un genoma o cromosoma. En algunas realizaciones, una duplicación puede comprender una copia de uno o más cromosomas completos, un segmento de un cromosoma, un alelo, un gen, un intrón, un exón, cualquier región no codificante, cualquier región codificante, un segmento de los mismos, o una combinación de los mismos. Una duplicación puede comprender una microduplicación. Una duplicación comprende algunas veces una o más copias de un ácido nucleico duplicado. Algunas veces, una duplicación se caracteriza como una región genética repetida una o más veces (por ejemplo, repetida 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 veces). Las duplicaciones pueden variar desde regiones pequeñas (miles de pares de bases) hasta cromosomas completos en algunos casos. Con frecuencia, las duplicaciones se producen como resultado de un error en la recombinación homóloga o debido a un acontecimiento de retrotransposón. Las duplicaciones se han asociado con determinados tipos de enfermedades proliferativas. Las duplicaciones pueden caracterizarse usando micromatrices genómicas o hibridación genética comparativa (CGH).
Algunas veces, una variación genética es una inserción. Una inserción es algunas veces la adición de uno o más pares de bases de nucleótidos a una secuencia de ácido nucleico. Una inserción es algunas veces una microinserción. En algunas realizaciones, una inserción comprende la adición de un segmento de un cromosoma a un genoma, cromosoma o segmento del mismo. En algunas realizaciones, una inserción comprende la adición de un alelo, un gen, un intrón, un exón, cualquier región no codificante, cualquier región codificante, un segmento de los mismos, o una combinación de los mismos a un genoma o segmento del mismo. En algunas realizaciones, una inserción comprende la adición (es decir, inserción) de ácido nucleico de origen desconocido a un genoma, cromosoma o segmento del mismo. En algunas realizaciones, una inserción comprende la adición (es decir, inserción) de una sola base.
Tal como se usa en el presente documento, una “variación de número de copias” generalmente es una clase o un tipo de variación genética o aberración cromosómica. Una variación de número de copias puede ser una deleción (por ejemplo, una microdeleción), una duplicación (por ejemplo, una microduplicación) o una inserción (por ejemplo, una microinserción). A menudo, el prefijo “micro” tal como se usa en el presente documento algunas veces es un segmento de ácido nucleico menor de 5 Mb de longitud. Una variación de número de copias puede incluir una o más deleciones (por ejemplo, una microdeleción), duplicaciones y/o inserciones (por ejemplo, una microduplicación, una microinserción) de un segmento de un cromosoma. En algunas realizaciones, una duplicación comprende una inserción. En algunas realizaciones, una inserción es una duplicación. En algunas realizaciones, una inserción no es una duplicación. Por ejemplo, a menudo, una duplicación de una secuencia en una sección genómica aumenta las cuentas para una sección genómica en la que se encuentra la duplicación. A menudo, una duplicación de una secuencia en una sección genómica aumenta la elevación. En algunas realizaciones, una duplicación presente en secciones genómicas que constituyen una primera elevación aumenta la elevación en relación con una segunda elevación en la que está ausente la duplicación. En algunas realizaciones, una inserción aumenta las cuentas de una sección genómica, y una secuencia que representa la inserción está presente (es decir, duplicada) en otra ubicación dentro de la misma sección genómica. En algunas realizaciones, una inserción no aumenta significativamente las cuentas de una sección genómica o elevación, y la secuencia que se inserta no es una duplicación de una secuencia dentro de la misma sección genómica. En algunas realizaciones, una inserción no se detecta ni representa como duplicación, y una secuencia duplicada que representa la inserción no está presente en la misma sección genómica.
En algunas realizaciones, una variación de número de copias es una variación de número de copias fetal. A menudo, una variación de número de copias fetal es una variación de número de copias en el genoma de un feto. En algunas realizaciones, una variación de número de copias es una variación de número de copias materna. En algunas realizaciones, una variación de número de copias materna y/o fetal es una variación de número de copias dentro del genoma de una hembra preñada (por ejemplo, una hembra que porta un feto), una hembra que dio a luz o una hembra que puede portar un feto. Una variación de número de copias puede ser una variación de número de copias heterocigótica en la que la variación (por ejemplo, una duplicación o deleción) está presente en un alelo de un genoma. Una variación de número de copias puede ser una variación de número de copias homocigótica en la que la variación está presente en ambos alelos de un genoma. En algunas realizaciones, una variación de número de copias es una variación de número de copias fetal heterocigótica u homocigótica. En algunas realizaciones, una variación de número de copias es una variación de número de copias materna y/o fetal heterocigótica u homocigótica. Una variación de número de copias algunas veces está presente en un genoma materno y en un genoma fetal, en un genoma materno y no en un genoma fetal, o en un genoma fetal y no en un genoma materno.
“Ploidía” se refiere al número de cromosomas presente en un feto o una madre. En algunas realizaciones, “ploidía” es lo mismo que “ploidía cromosómica”. En seres humanos, por ejemplo, los cromosomas autosómicos a menudo están presentes por pares. Por ejemplo, en ausencia de una variación genética, la mayoría de seres humanos tienen dos de cada cromosoma autosómico (por ejemplo, cromosomas 1-22). La presencia del complemento normal de 2 cromosomas autosómicos en un ser humano a menudo se denomina euploidía. “Microploidía” es similar en cuanto a significado a ploidía. “Microploidía” a menudo se refiere a la ploidía de un segmento de un cromosoma. El término “microploidía” algunas veces se refiere a la presencia o ausencia de una variación de número de copias (por ejemplo, una deleción, una duplicación y/o una inserción) dentro de un cromosoma (por ejemplo, una deleción, duplicación o inserción homocigótica o heterocigótica, similares, o la ausencia de las mismas). La “ploidía” y “microploidía” algunas veces se determinan después de la normalización de cuentas de una elevación en un perfil (por ejemplo, después de normalizar cuentas de una elevación con respecto a un NRV de 1). Por tanto, una elevación que representa un par de cromosomas autosómicos (por ejemplo, una euploidía) a menudo se normaliza a un NRV de 1 y se denomina ploidía de 1. De manera similar, una elevación dentro de un segmento de un cromosoma que representa la ausencia de una duplicación, deleción o inserción a menudo se normaliza con respecto a un NRV de 1 y se denomina microploidía de 1. La ploidía y microploidía a menudo son específicas de zona (por ejemplo, específicas de sección genómica) y específicas de muestra. La ploidía a menudo se define como múltiplos integrales de ^ , representando los valores de 1, ^ , 0, 3/2 y 2 euploidía (por ejemplo, 2 cromosomas), 1 cromosoma presente (por ejemplo, una deleción de cromosoma), ningún cromosoma presente, 3 cromosomas (por ejemplo, una trisomía) y 4 cromosomas, respectivamente. Del mismo modo, la microploidía a menudo se define como múltiplos integrales de ^ , representando los valores de 1, ^ , 0, 3/2 y 2 euploidía (por ejemplo, ninguna variación de número de copias), una deleción heterocigótica, una deleción homocigótica, una duplicación heterocigótica y una duplicación homocigótica, respectivamente.
En algunas realizaciones, la microploidía de un feto coincide con la microploidía de la madre del feto (es decir, la hembra preñada). En algunas realizaciones, la microploidía de un feto coincide con la microploidía de la madre del feto y tanto la madre como el feto portan la misma variación de número de copias heterocigótica, la misma variación de número de copias homocigótica o ambos son euploides. En algunas realizaciones, la microploidía de un feto es diferente de la microploidía de la madre del feto. Por ejemplo, algunas veces la microploidía de un feto es heterocigótica para una variación de número de copias, la madre es homocigótica para una variación de número de copias y la microploidía del feto no coincide con (por ejemplo, no es igual a) la microploidía de la madre para la variación de número de copias especificada.
Una microploidía a menudo está asociada con una elevación esperada. Por ejemplo, algunas veces una elevación (por ejemplo, una elevación en un perfil, algunas veces una elevación que no incluye sustancialmente ninguna variación de número de copias) se normaliza a un NRV de 1 y la microploidía de una duplicación homocigótica es 2, una duplicación heterocigótica es 1,5, una deleción heterocigótica es 0,5 y una deleción homocigótica es cero.
Una variación genética para la que se identifica la presencia o ausencia para un sujeto está asociada con una afección médica en determinadas realizaciones. Por tanto, puede usarse la tecnología descrita en el presente documento para identificar la presencia o ausencia de una o más variaciones genéticas que están asociadas con una afección médica o un estado médico. Los ejemplos no limitativos de afecciones médicas incluyen los asociados con discapacidad intelectual (por ejemplo, síndrome de Down), proliferación celular aberrante (por ejemplo, cáncer), presencia de un ácido nucleico de microorganismo (por ejemplo, virus, bacteria, hongo, levadura) y preeclampsia.
A continuación se describen ejemplos no limitativos de variaciones genéticas, afecciones y estados médicos.
Sexo fetal
En algunas realizaciones, la predicción de un trastorno relacionado con el género o sexo fetal (por ejemplo, aneuploidía cromosómica sexual) puede determinarse mediante un método o aparato descrito en el presente documento. En algunas realizaciones, un método en el que se determina el sexo fetal también puede comprender determinar la fracción fetal y/o la presencia o ausencia de una variación genética fetal (por ejemplo, aneuploidía cromosómica fetal). Determinar la presencia o ausencia de una variación genética fetal puede realizarse de manera adecuada, cuyos ejemplos no limitativos incluyen análisis del cariotipo, amniocentesis, análisis de ácido nucleico libre de células circulante, análisis de ADN fetal libre de células, análisis de secuencia de nucleótidos, cuantificación de lecturas de secuencia, enfoques dirigidos, enfoques basados en amplificación, enfoques basados en espectrometría de masas, enfoques basados en metilación diferencial, enfoques basados en digestión diferencial, enfoques basados en polimorfismos, enfoques basados en hibridación (por ejemplo, usando sondas), y similares.
La determinación del género se basa generalmente en un cromosoma sexual. En seres humanos, hay dos cromosomas sexuales, los cromosomas X e Y. El cromosoma Y contiene un gen, SRY, que desencadena el desarrollo embrionario como macho. Los cromosomas Y de seres humanos y otros mamíferos también contienen otros genes necesarios para la producción normal de espermatozoide. Los individuos con XX son hembras y los individuos con XY son machos, y las variaciones no limitativas, a menudo denominadas aneuploidías cromosómicas sexuales, incluyen X0, XYY, XXX y XXY. En algunos casos, los machos tienen dos cromosomas X y un cromosoma Y (XXY; síndrome de Klinefelter), o un cromosoma X y dos cromosomas Y (síndrome XYY; síndrome de Jacobs), y algunas hembras tienen tres cromosomas X (XXX; síndrome de triple X) o un único cromosoma X en vez de dos (X0; síndrome de Turner). En algunos casos, sólo una porción de células en un individuo se ven afectadas por una aneuploidía cromosómica sexual que puede denominarse mosaicismo (por ejemplo, mosaicismo de Turner). Otros casos incluyen aquellos en los que SRY está dañado (lo que conduce a una hembra con XY) o copiado al X (lo que conduce a un macho con XX).
En determinados casos, puede ser beneficioso determinar el género de un feto en el útero. Por ejemplo, un paciente (por ejemplo, una hembra preñada) con unos antecedentes familiares de uno o más trastornos ligados a los cromosomas sexuales puede desear determinar el género del feto que lleva para ayudar a evaluar el riesgo de que el feto herede un trastorno de este tipo. Los trastornos ligados a los cromosomas sexuales incluyen, sin limitación, trastornos ligados al cromosoma X y al cromosoma Y. Los trastornos ligados al cromosoma X incluyen trastornos recesivos ligados al cromosoma X y dominantes ligados al cromosoma X. Los ejemplos de trastornos recesivos ligados al cromosoma X incluyen, sin limitación, trastornos inmunitarios (por ejemplo, enfermedad granulomatosa crónica (CYBB), síndrome de Wiskott-Aldrich, inmunodeficiencia combinada grave ligada al cromosoma X, agammaglobulinemia ligada al cromosoma X, síndrome de hiper-IgM de tipo 1, IPEX, enfermedad linfoproliferativa ligada al cromosoma X, deficiencia de properdina), trastornos hematológicos (por ejemplo, hemofilia A, hemofilia B, anemia sideroblástica ligada al cromosoma X), trastornos endocrinos (por ejemplo, síndrome de insensibilidad androgénica/enfermedad de Kennedy, síndrome de Kallmann KAL1, hipoplasia suprarrenal congénita ligada al cromosoma X), trastornos metabólicos (por ejemplo, deficiencia de ornitina transcarbamilasa, síndrome oculocerebrorrenal, adrenoleucodistrofia, deficiencia de glucosa-6-fosfato deshidrogenasa, deficiencia de piruvato deshidrogenasa, enfermedad de Danon/enfermedad de almacenamiento de glicógeno de tipo Ilb, enfermedad de Fabry, síndrome de Hunter, síndrome de Lesch-Nyhan, enfermedad de Menkes/síndrome del cuerno occipital), trastornos del sistema nervioso (por ejemplo, síndrome de Coffin-Lowry, síndrome de MASA, síndrome de retraso mental por alfa-talasemia ligado al cromosoma X, síndrome de retraso mental ligado al cromosoma X de Siderius, daltonismo, albinismo ocular, enfermedad de Norrie, coroideremia, enfermedad de Charcot-Marie-Tooth (CMTX2-3), enfermedad de Pelizaeus-Merzbacher, SMAX2), trastornos de la piel y de tejidos relacionados (por ejemplo, disqueratosis congénita, displasia ectodérmica hipohidrótica (EDA), ictiosis ligada al cromosoma X, distrofia corneal endotelial ligada al cromosoma X), trastornos neuromusculares (por ejemplo, distrofia muscular de Becker/Duchenne, miopatía centronuclear (MTM1), síndrome de Conradi-Hünermann, distrofia muscular de Emery-Dreifuss 1), trastornos urológicos (por ejemplo, síndrome de Alport, enfermedad de Dent, diabetes insípida nefrogénica ligada al cromosoma X), trastornos óseos/dentales (por ejemplo, amelogénesis imperfecta AMELX) y otros trastornos (por ejemplo, síndrome de Barth, síndrome de McLeod, síndrome de Smith-Fineman-Myers, síndrome de Simpson-Golabi-Behmel, síndrome de Mohr-Tranebj^rg, síndrome nasodigitoacústico). Los ejemplos de trastornos dominantes ligados al cromosoma X incluyen, sin limitación, hipofosfatemia ligada al cromosoma X, hipoplasia dérmica focal, síndrome del cromosoma X frágil, síndrome de Aicardi, incontinencia pigmentaria, síndrome de Rett, síndrome de CHILD, síndrome de Lujan-Fryns y síndrome orofaciodigital 1. Los ejemplos de trastornos ligados al cromosoma Y incluyen, sin limitación, infecundidad masculina, retinits pigmentosa y azoospermia.
Anomalías cromosómicas
En algunas realizaciones, la presencia o ausencia de una anomalía cromosómica fetal puede determinarse usando un método o aparato descrito en el presente documento. Las anomalías cromosómicas incluyen, sin limitación, la ganancia o pérdida de un cromosoma completo o de una región de un cromosoma que comprende uno o más genes. Las anomalías cromosómicas incluyen monosomías, trisomías, polisomías, pérdida de heterocigosidad, deleciones y/o duplicaciones de una o más secuencias de nucleótidos (por ejemplo, uno o más genes), incluyendo deleciones y duplicaciones provocadas por translocaciones desequilibradas. Los términos “aneuploidía” y “aneuploide” tal como se usan en el presente documento se refieren a un número anómalo de cromosomas en las células de un organismo. Dado que diferentes organismos tienen complementos cromosómicos ampliamente variables, el término “aneuploidía” no se refiere a ningún número particular de cromosomas, sino más bien a la situación en la que el contenido del cromosoma dentro de una célula o células dadas de un organismo es anómalo. En algunas realizaciones, el término “aneuploidía” en el presente documento se refiere a un desequilibrio del material genético provocado por la pérdida o ganancia de un cromosoma completo, o de una parte de un cromosoma. Una “aneuploidía” puede referirse a una o más deleciones y/o inserciones de un segmento de un cromosoma.
El término “monosomía” tal como se usa en el presente documento se refiere a la falta de un cromosoma del complemento normal. Puede producirse una monosomía parcial en translocaciones o deleciones desequilibradas, en las que está presente sólo un segmento del cromosoma en una única copia. La monosomía de cromosomas sexuales (45, X) provoca el síndrome de Turner, por ejemplo.
El término “disomía” se refiere a la presencia de dos copias de un cromosoma. Para organismos tales como seres humanos que tienen dos copias de cada cromosoma (los que son diploides o “euploides”), la disomía es la condición normal. Para organismos que normalmente tienen tres o más copias de cada cromosoma (los que son triploides o superiores), la disomía es un estado cromosómico aneuploide. En disomía uniparental, ambas copias de un cromosoma proceden del mismo progenitor (sin contribución del otro progenitor).
El término “euploide”, en algunas realizaciones, se refiere a un complemento normal de cromosomas.
El término “trisomía” tal como se usa en el presente documento se refiere a la presencia de tres copias, en vez de dos copias, de un cromosoma particular. La presencia de un cromosoma 21 extra, que se encuentra en síndrome de Down humano, se denomina “trisomía 21”. La trisomía 18 y la trisomía 13 son otras dos trisomías autosómicas humanas. La trisomía de cromosomas sexuales puede observarse en hembras (por ejemplo, 47, XXX en síndrome de triple X) o machos (por ejemplo, 47, XXY en síndrome de Klinefelter; o 47, XYY en síndrome de Jacobs).
Los términos “tetrasomía” y “pentasomía” tal como se usan en el presente documento se refieren a la presencia de cuatro o cinco copias de un cromosoma, respectivamente. Aunque rara vez se observan con autosomas, la tetrasomía y la pentasomía de cromosoma sexuales se ha notificado en seres humanos, incluyendo XXXX, XXXY, XXYY, XYYY, XXXXX, XXXXY, XXXYY, XXYYY y XYYYY.
Las anomalías cromosómicas pueden estar provocadas por una variedad de mecanismos. Los mecanismos incluyen, pero no se limitan a, (i) la no disyunción que se produce como resultado de un punto de control mitótico debilitado, (ii) puntos de control mitóticos inactivos que provocan la no disyunción en múltiples cromosomas, (iii) la unión merotélica que se produce cuando un cinetocoro se une a ambos polos del husillo mitótico, (iv) la formación de un husillo multipolar cuando se forman más de dos polos del husillo, (v) la formación de un husillo monopolar cuando se forma sólo un único polo del husillo, y (vi) un intermedio tetraploide que se produce como resultado final del mecanismo del husillo monopolar.
Los términos “monosomía parcial” y “trisomía parcial” tal como se usan en el presente documento se refieren a un desequilibrio de material genético provocado por la pérdida o ganancia de parte de un cromosoma. Una monosomía parcial o trisomía parcial puede ser el resultado de una translocación desequilibrada, en la que un individuo porta un cromosoma derivado formado a través de la rotura y fusión de dos cromosomas diferentes. En esta situación, el individuo tendría tres copias de parte de un cromosoma (dos copias normales y el segmento que existe en el cromosoma derivado) y sólo una copia de parte del otro cromosoma implicado en el cromosoma derivado.
El término “mosaicismo” tal como se usa en el presente documento se refiere a aneuploidía en algunas células, pero no en todas las células, de un organismo. Determinadas anomalías cromosómicas pueden existir como anomalías cromosómicas en mosaico y no en mosaico. Por ejemplo, determinados individuos con trisomía 21 tienen síndrome de Down en mosaico y algunos tienen síndrome de Down no en mosaico. Diferentes mecanismos pueden conducir al mosaicismo. Por ejemplo, (i) un cigoto inicial puede tener tres cromosomas 21, lo que normalmente daría como resultado una trisomía 21 sencilla, pero durante el transcurso de la división celular, una o más líneas celulares pierden uno de los cromosomas 21; y (ii) un cigoto inicial puede tener dos cromosomas 21, pero durante el transcurso de la división celular, se duplica uno de los cromosomas 21. El mosaicismo somático probablemente se produce a través de mecanismos distintos de los asociados normalmente con síndromes genéticos que implican aneuploidía completa o en mosaico. El mosaicismo somático se ha identificado en determinados tipos de cánceres y en neuronas, por ejemplo. En determinados casos, la trisomía 12 se ha identificado en leucemia linfocítica crónica (LLC) y la trisomía 8 se ha identificado en leucemia mielógena aguda (LMA). Además, los síndromes genéticos en los que un individuo está predispuesto a la rotura de cromosomas (síndromes de inestabilidad cromosómica) están asociados con frecuencia a un mayor riesgo de diversos tipos de cáncer, destacando por tanto el papel de la aneuploidía somática en la carcinogénesis. Los métodos y protocolos descritos en el presente documento pueden identificar la presencia o ausencia de anomalías cromosómicas en mosaico y no en mosaico.
Las tablas 1A y 1B presentan una lista no limitativa de estados, síndromes y/o anomalías cromosómicos que posiblemente pueden identificarse mediante los métodos y aparatos descritos en el presente documento. La tabla 1B es de la base de datos DECIPHER a fecha del 6 de octubre de 2011 (por ejemplo, versión 5.1, basada en posiciones mapeadas a GRCh37; disponible en el localizador de recursos uniforme (URL) dechipher.sanger.ac.uk).
Tabla 1A
Figure imgf000046_0001
Figure imgf000047_0002
Tabla 1B
Figure imgf000047_0001
Figure imgf000048_0001
Figure imgf000049_0001
Las condiciones de grado 1 a menudo tienen una o más de las siguientes características; anomalía patogénica; fuerte acuerdo entre los genetistas; muy penetrantes; todavía pueden tener fenotipo variable pero algunas características comunes; todos los casos en la bibliografía tienen un fenotipo clínico; ningún caso de individuos sanos con la anomalía; no notificados en bases de datos de DVG ni hallados en población sana; datos funcionales que confirman el efecto de dosificación de un único gen o de múltiples genes; genes candidatos confirmados o fuertes; implicaciones de gestión clínica definidas; riesgo conocido de cáncer con implicación para la vigilancia; múltiples fuentes de información (OMIM, GeneReviews, Orphanet, Unique, Wikipedia); y/o disponibles para uso diagnóstico (asesoramiento reproductivo).
Las condiciones de grado 2 a menudo tienen una o más de las siguientes características; anomalía probablemente patogénica; muy penetrantes; fenotipo variable sin características consistentes distintas de DD; pequeño número de casos/informes en la bibliografía; todos los casos notificados tienen un fenotipo clínico; sin datos funcionales ni genes patógenos confirmados; múltiples fuentes de información (OMIM, Genereviews, Orphanet, Unique, Wikipedia); y/o pueden usarse con fines diagnósticos y asesoramiento reproductivo.
Las condiciones de grado 3 a menudo tienen una o más de las siguientes características; locus de susceptibilidad; individuos sanos o progenitores no afectados de un probando descrito; presentes en poblaciones de control; no penetrantes; fenotipo leve e inespecífico; características menos consistentes; sin datos funcionales ni genes patógenos confirmados; fuentes de datos más limitadas; la posibilidad de un segundo diagnóstico sigue siendo una posibilidad para casos que se desvían de la mayoría o si están presentes hallazgos clínicos novedosos; y/o precaución cuando se usan con fines diagnósticos y consejo cauteloso para asesoramiento reproductivo.
Preeclampsia
En algunas realizaciones, la presencia o ausencia de preeclampsia se determina usando un método o aparato descrito en el presente documento. La preeclampsia es un estado en el que surge hipertensión en el embarazo (es decir, hipertensión inducida por el embarazo) y está asociada con cantidades significativas de proteína en la orina. En algunos casos, la preeclampsia también está asociada con niveles elevados de ácido nucleico extracelular y/o alteraciones en los patrones de metilación. Por ejemplo, se ha observado una correlación positiva entre los niveles extracelulares de RASSF1A hipermetilada de origen fetal y la gravedad de la preeclampsia. En determinados ejemplos, se observa un aumento de la metilación de ADN para el gen H19 en placentas con preeclampsia en comparación con controles normales.
La preeclampsia es una de las principales causas de morbimortalidad materna y fetal/neonatal en todo el mundo. Los ácidos nucleicos libres de célula circulantes en plasma y suero son novedosos biomarcadores con prometedoras aplicaciones clínicas en diferentes campos médicos, incluyendo el diagnóstico prenatal. Se han notificado cambios cuantitativos de ADN fetal libre de células (ADNlcc) en plasma materno como indicador para preeclampsia inminente en diferentes estudios, por ejemplo, usando PCR cuantitativa en tiempo real para los loci SRY o DYS 14 específicos de machos. En casos de preeclampsia de aparición temprana, pueden observarse niveles elevados en el primer trimestre. Los niveles aumentados de ADNlcc antes de la aparición de los síntomas pueden deberse a la hipoxia/reoxigenación dentro del espacio intervelloso que conduce a estrés oxidativo tisular y a un aumento de la apoptosis y necrosis placentaria. Además de las evidencias de un aumento de la eliminación de ADNlcc en la circulación materna, también hay evidencias de una reducción del aclaramiento renal de ADNIcc en preeclampsia. Dado que la cantidad de ADN fetal se determina actualmente cuantificando secuencias específicas del cromosoma Y, enfoques alternativos tales como la medición de ADN libre de células total o el uso de marcadores epigenéticos fetales independientes del género, tales como la metilación de ADN, ofrecen una alternativa. El ARN libre de células de origen placentario es otro biomarcador alternativo que puede usarse para detectar y diagnosticar la preeclampsia en la práctica clínica. El ARN fetal está asociado con partículas placentarias subcelulares que lo protegen frente a la degradación. Los niveles de ARN fetal algunas veces son diez veces mayores en hembras preñadas con preeclampsia en comparación con controles y, por tanto, es un biomarcador alternativo que puede usarse para detectar y diagnosticar la preeclampsia en la práctica clínica.
Patógenos
En algunas realizaciones, la presencia o ausencia de un estado patógeno se determina mediante un método o aparato descrito en el presente documento. Un estado patógeno puede estar provocado por la infección de un huésped por parte de un patógeno, incluyendo, pero sin limitarse a, una bacteria, un virus o un hongo. Puesto que los patógenos normalmente presentan ácido nucleico (por ejemplo, ADN genómico, ARN genómico, ARNm) que puede distinguirse del ácido nucleico huésped, pueden usarse los métodos y aparatos proporcionados en el presente documento para determinar la presencia o ausencia de un patógeno. A menudo, los patógenos presentan ácido nucleico con características únicas para un patógeno particular tales como, por ejemplo, estado epigenético y/o una o más variaciones, duplicaciones y/o deleciones de secuencia. Por tanto, pueden usarse los métodos proporcionados en el presente documento para identificar un patógeno o una variante de patógeno particular (por ejemplo, una cepa).
Cánceres
En algunas realizaciones, la presencia o ausencia de un trastorno de proliferación celular (por ejemplo, un cáncer) se determina usando un método o aparato descrito en el presente documento. Por ejemplo, los niveles de ácido nucleico libre de células en suero pueden estar elevados en pacientes con diversos tipos de cáncer en comparación con pacientes sanos. Los pacientes con enfermedades metastásicas, por ejemplo, algunas veces pueden tener niveles de ADN en suero aproximadamente dos veces mayores que los pacientes no metastásicos. Los pacientes con enfermedades metastásicas también pueden identificarse mediante marcadores específicos de cáncer y/o determinados polimorfismos de un solo nucleótido o repeticiones cortas en tándem, por ejemplo. Los ejemplos no limitativos de tipos de cáncer que pueden correlacionarse de manera positiva con niveles elevados de ADN circulante incluyen cáncer de mama, cáncer colorrectal, cáncer gastrointestinal, cáncer hepatocelular, cáncer de pulmón, melanoma, linfoma no Hodgkin, leucemia, mieloma múltiple, cáncer de vejiga, hepatoma, cáncer de cuello uterino, cáncer de esófago, cáncer de páncreas y cáncer de próstata. Diversos cánceres pueden presentar, y algunas veces pueden liberar en el torrente circulatorio, ácidos nucleicos con características que pueden distinguirlos de los ácidos nucleicos de células sanas no cancerosas, tales como, por ejemplo, el estado epigenético y/o variaciones, duplicaciones y/o deleciones de secuencia. Por ejemplo, tales características pueden ser específicas de un tipo de cáncer particular. Por tanto, se contempla además que puede usarse un método proporcionado en el presente documento para identificar un tipo de cáncer particular.
Ejemplos
Los ejemplos expuestos a continuación ilustran determinadas realizaciones y no limitan la tecnología.
Ejemplo 1: Captura de nucleosomas para aumentarla fracción fetal
En este ejemplo, se describe un procedimiento para enriquecer la cantidad de ADN de origen fetal en relación con el ADN total (de origen materno fetal), también expresado como fracción fetal, en muestras de plasma. El ADN preparado a partir de plasma a menudo se denomina ADN libre de células circulante (ADNlcc), tal como se describe en el presente documento. El ADN libre de células circulante puede existir en múltiples estados dentro de sangre completa. El ADN puede estar desnudo, unido a histona (es decir, nucleosomas que contienen ADN e histonas) o encapsulado en una bicapa lipídica como micropartícula (por ejemplo, en una estructura apoptótica). El ADN fetal libre de células circulante puede estar asociado con micropartículas y nucleosomas (por ejemplo, unido a histona) procedentes de tejido fetal. El ADN materno libre de células circulante puede estar asociado con micropartículas y nucleosomas (unido a histona) procedentes de tejido materno. Por tanto, la utilización de anticuerpos específicos de fuente fetal para seleccionar como diana micropartículas y/o nucleosomas de origen fetal puede enriquecer el ADN fetal. Este ejemplo describe un procedimiento para enriquecer específicamente el ADN fetal libre de células circulante asociado a nucleosomas (unido a histona).
El ADN de nucleosoma normalmente está asociado con un octámero de ocho histonas principales: H2A (2), H2B (2), H3 (2) y H4 (2); y una histona ligadora H1. En sangre y plasma clarificado maternos, el ADNlcc fetal puede tener una menor ocupación de H1 (es decir, un porcentaje más pequeño del ADN de nucleosoma de origen fetal puede tener H1 unida, en relación con el porcentaje de ADNlcc materno que tiene H1 unida). Sin estar limitados por la teoría, la distribución de tamaño típica de ADNlcc fetal frente a ADNlcc materno es según este concepto, puesto que el ADN de nucleosoma sin H1 unida puede ser más susceptible a digestión con endonucleasas, dando como resultado de ese modo fragmentos más cortos.
El uso de un anticuerpo contra histona H1 (por ejemplo, sin especificidad particular contra subtipos o fuentes de H1) puede servir como enfoque de selección negativa adecuado para enriquecer el ADN fetal. El tratamiento de plasma con tal anticuerpo en un protocolo de inmunoprecipitación (por ejemplo, inmunoprecipitación de cromatina (CHIP)) puede agotar el ADNlcc materno a partir de la muestra, aumentando de ese modo la fracción de ADNlcc fetal en la muestra residual.
Los anticuerpos contra histonas fetales específicas (por ejemplo, H1.1, H1.3, H1.5) pueden enriquecer el ADNlcc fetal cuando se usan en enfoques de selección positiva. Los anticuerpos contra histonas maternas específicas (por ejemplo, H1.0) puede enriquecer el ADNlcc fetal cuando se usan en enfoques de enriquecimiento basado en agotamiento (es decir, selección negativa). Estos enfoques pueden incluir enfoques convencionales de inmunoprecipitación y de inmunoprecipitación de cromatina (CHIP). Los anticuerpos contra histona H1M (expresada en embriones de Xenopus) y contra H1FOO (que se expresan en ovocitos) pueden ofrecer algo de reactividad cruzada con y selectividad para el ADN de cromatina de origen fetal humano y, por tanto, también pueden usarse como estrategia de selección positiva.
Hay aproximadamente once variantes de H1, algunas de las cuales pueden ser específicas de (o mostrar una unión preferente a) ADNlcc de origen fetal. Además, pueden aprovecharse diversas diferencias maternas frente a fetales en el subtipo de histona H3 para enriquecer la fracción fetal. Por ejemplo, pueden usarse anticuerpos que reconocen diferencias de exposición conformacional para la histona H3.1 (por ejemplo, diferencias entre H3.1 fetal y materna) para el enriquecimiento de ADN fetal a partir de plasma tratado con tales anticuerpos. Por ejemplo, puede aprovecharse la variación de secuencia (por ejemplo, 10 aminoácidos extra en el extremo C-terminal de H3.1 fetal), y la metilación particular de H3.1 en fetal frente a materno, para el enriquecimiento de ADN fetal.
A continuación se describen métodos para identificar determinados anticuerpos (por ejemplo, selectivos para nucleosomas de origen fetal frente a nucleosomas de origen materno) a partir de poblaciones comerciales u obtenidas de anticuerpos, fragmentos de anticuerpo o aptámeros.
Materiales y métodos
Se usan muestras clínicas derivadas de sangre recogida en tubos de recogida de sangre (BCT) de ADN libre de células STRECK y procesados para obtener plasma. Las muestras recogidas de mujeres embarazadas y no embarazadas se recogen bajo la aprobación del comité de revisión apropiado con el consentimiento de los pacientes, y se incluyen en las investigaciones. En las evaluaciones se incluyen recogidas emparejadas en tubos de recogida de sangre adicionales (ACD, heparina, PPAK, BCT de ADN libre de células Streck® (que contienen un agente de reticulación y un anticoagulante (EDTA)) y otros tubos de recogida de sangre conocidos en la técnica), para tener un impacto en la integridad de biomarcadores. Las muestras de plasma (de preñadas y no preñadas) se preparan a partir de sangre recogida tal como antes, o tubos de recogida de sangre similares que contienen un anticoagulante, mediante centrifugación para retirar las células. Las condiciones de centrifugación típicas son: de 800 g a 16.000 g durante 5-30 min. En determinados casos, las condiciones de centrifugación son: de 800 g a 2500 g durante hasta 30 min seguido de 2500 g a 12.000 g durante hasta 30 min. También pueden usarse velocidades de centrifugación más grandes. El plasma preparado puede utilizarse directamente para la detección o el enriquecimiento, o puede congelarse a -80°C antes de su uso. Para muestras posteriores a la congelacióndescongelación, se realiza una etapa de centrifugación adicional de 800 g a 16.000 g durante hasta 30 min, o de 800 g a 2500 g durante hasta 30 min. En determinados casos, no se realiza ninguna centrifugación posterior en las muestras posteriores a la congelación-descongelación.
Las muestras de plasma pueden someterse posteriormente a reticulación con un agente de fijación tal como formaldehído o glutaraldehído u otro aldehído o agente de reticulación de proteína-proteína o proteína-ADN habitualmente conocido (por ejemplo, N-hidrosuccinamida), o un agente que libera un agente de fijación de este tipo, si aún no está incluido en los tubos de recogida de sangre. Tal procesamiento puede afectar a la reticulación para reforzar la interacción ADN-histona antes de la unión selectiva con anticuerpos seleccionados como diana. Las muestras recogidas en un tubo de recogida de sangre (BCT) que contiene un agente de fijación tal como formaldehído o glutaraldehído u otro aldehído o agente de liberación de aldehído u otro agente de reticulación de proteína-proteína o proteína-ADN conocido pueden no requerir una fijación adicional antes de la unión con anticuerpos, sin embargo puede usarse tal fijación en determinados casos. Por ejemplo, las muestras recogidas en BCT de ADN libre de células Streck® pueden no requerir una fijación adicional antes de la reacción con anticuerpos. Si se utilizan condiciones próximas a la normalidad fisiológica con respecto a pH (por ejemplo, de pH 6 a pH 8) y la normalidad de fuerza iónica para todas las etapas de procesamiento, la reticulación puede no ser necesaria independientemente del BCT (por ejemplo, disoluciones que contienen ion sodio 140 mM, ion cloruro 100 mM, carbonato 25 mM, o que tienen una molaridad global de 35 mM a 350 mM).
Los anticuerpos contra H1.1, H1.3 y/o H1.5 se investigan en enfoques de selección positiva para ADNlcc de origen fetal. Los anticuerpos contra H1.0 y/o H1 se seleccionan como diana para enfoques de enriquecimiento basado en agotamiento (selección negativa). Los anticuerpos contra histona H1M (expresada en embriones de Xenopus) y contra H1FOO (expresada en ovocitos) pueden reaccionar de manera cruzada con material de origen humano y, por tanto, ofrecen selectividad para el ADN de cromatina de origen fetal humano. Tales anticuerpos pueden ser útiles para una estrategia de selección positiva de ADNlcc fetal. Hay once variantes de H1 caracterizadas, y algunas pueden ser específicas de (o mostrar una unión preferente por) ADNlcc de origen fetal tal como se indicó anteriormente. Además, el uso de un anticuerpo contra H1, sin especificidad particular, puede servir como enfoque de selección negativa adecuado. El tratamiento de plasma aclarado con uno o más tales anticuerpos en un protocolo de inmunoprecipitación puede efectuar un agotamiento significativo de ADNlcc materno a partir de una muestra, aumentando de ese modo la fracción fetal de ADNlcc.
Además, se aprovechan diversas diferencias maternas frente a fetales en el subtipo de histona H3 para enriquecer la fracción fetal. Por ejemplo, se usan anticuerpos que reconocen una o más diferencias de exposición conformacional de histona H3.1 en fetal frente a materno (por ejemplo, variación de secuencia (por ejemplo, 10 aminoácidos extra en el extremo C-terminal de H3.1 fetal) y diferencias de metilación particulares para el enriquecimiento de ADN fetal a partir de plasma tratado con tales anticuerpos.
Determinados anticuerpos se identifican a través de ensayos que usan muestras de plasma procesadas tal como se describió anteriormente. Se usan ELISA, inmunotransferencia de tipo Western, Luminex u otros enfoques similares para someter a prueba rápidamente la selectividad de anticuerpos. En un sistema de ensayo de este tipo, se evalúa inicialmente la selectividad para ADNlcc fetal o materno específico basándose en la reactividad cruzada con muestras de plasma derivadas de mujeres embarazadas y no embarazadas. Los anticuerpos que demuestran capacidad para reaccionar preferentemente con plasma derivado de muestras de mujeres embarazadas frente a no embarazadas ofrecen un grado de selectividad para nucleosomas fetales y, por tanto, son útiles para enfoques de selección positiva. Tales anticuerpos se priorizan para métodos preparativos (por ejemplo, inmunoprecipitación) para enriquecer la fracción fetal. Los anticuerpos que reaccionan en ambos tipos de muestras pueden ser maternos específicos y pueden unirse sólo a ADNlcc materno (unido a nucleosomas) y, por tanto, son adecuados para enfoques de selección negativa (es decir, el enriquecimiento de ADNlcc fetal mediante el agotamiento de ADNlcc materno). Los anticuerpos que reaccionan en muestras tanto de mujeres embarazadas como de no embarazadas, en determinados casos, se caracterizan y se distinguen adicionalmente con respecto a especificidad (fetal frente a materna) sometiendo a prueba con muestras de ADN derivadas de células mononucleares de sangre periférica (PBMC) aisladas de “capa leucoplaquetaria”. Se realiza una validación adicional de la selectividad para histona de los anticuerpos, en determinados casos, usando enfoques de inmunoprecipitación y el análisis de fragmentos de ADN resultantes de enfoques de enriquecimiento. Además, se usan secuenciación y/o ensayos fetales específicos tales como FQA (ensayo cuantificador fetal, para fetos tanto masculinos como femeninos) y/o ensayo de qPCR (aplicable a fetos masculinos) para validar la especificidad de anticuerpos, en determinados casos.
Se usan varios formatos de ensayo ELISA para la selección. En este caso se destacan procedimientos de ensayo típicos. Después de lavados iniciales, en primer lugar se recubre una placa de microtitulación u otra superficie con una proteína de unión a ADN o un anticuerpo de unión a histona. El anticuerpo contra histona primaria debe unirse a uno cualquiera de los 4 tipos principales de histona primaria: H2A, H2B, H3, H4, para proporcionar la captura de todo el ADN de nucleosoma. Este anticuerpo no debe ser selectivo para subtipos de histona específicos o modificaciones posteriores a la traducción de los mismos para evitar la especificidad de tejido o ciclo celular. De manera similar, la proteína de unión a ADN debe ser inespecífica para proporcionar la captura de todo el ADN de nucleosoma. Tras varios lavados con tampón a pH neutro (o casi neutro) y con una fuerza isotónica física similar, se realiza el bloqueo con un agente tal como caseína o un agente que contiene albúmina sérica bovina. Tras varios lavados con tampón a pH neutro (o casi neutro) y con una fuerza isotónica física similar, a cada pocillo se le aplica una porción de plasma analito (ya sea una porción de plasma analito materna de mujeres embarazadas (control positivo) o una porción de plasma analito materna de mujeres no embarazadas (control negativo)). La captura de ADN de nucleosoma se logra mediante la incubación durante al menos 2 min a temperatura ambiental o después de la incubación a temperaturas tan altas como de 42°C. Tras varios lavados con tampón a pH neutro (o casi neutro) y con una fuerza isotónica física similar, a cada pocillo se le aplica cada uno de los anticuerpos sometidos a prueba para determinar la unión primaria específica de histona o histona fetal. Esta mezcla se somete a incubación normalmente durante al menos 2 min a temperatura ambiental o después de la incubación a temperaturas tan altas como de 42°C. Tal anticuerpo primario se marca normalmente con biotina u otro agente. Tal anticuerpo primario no se marca, en determinados casos, en cuyo caso se usa un anticuerpo específico de isotipo (especie) de isotipo (especie) diferente como anticuerpo secundario. En esta etapa, sólo reaccionarán con el anticuerpo primario muestras y anticuerpos con especificidad coincidente. Tras varios lavados con tampón a pH neutro (o casi neutro) y con una fuerza iónica fisiológica similar, se retira el exceso de anticuerpo primario de cada pocillo. Luego se aplica el anticuerpo secundario, específico o bien del marcador (por ejemplo, estreptavidina con respecto a biotina) o bien del isotipo (especie) del anticuerpo primario. El anticuerpo secundario se marca directamente con un colorante marcado de manera colorimétrica o fluorescente, en determinados casos, o más normalmente se marca con una enzima que puede convertir un agente no colorimétrico o no fluorescente en uno que se visualiza a través de medios colorimétricos o fluorescentes. El anticuerpo secundario se somete a incubación normalmente durante al menos 2 min a temperatura ambiental o después de la incubación a temperaturas tan altas como de 42°C. Tras varios lavados con tampón a pH neutro (o casi neutro) y con una fuerza iónica física similar, se retira el exceso de anticuerpo secundario para cada pocillo. Tras esta etapa, se añade un agente de notificación. Por ejemplo, se añade una mezcla de reactivos ABTS a un sistema de anticuerpo secundario marcado con peroxidasa. Se permite el desarrollo de color y posteriormente se mide de manera espectrofotométrica.
En lugar de usar un soporte sólido para la captura de los nucleosomas, se usa una perla o micropartícula (por ejemplo, magnética o no magnética) en determinados casos. En lugar de usar un anticuerpo soluble, se sustituye un anticuerpo conjugado con o adsorbido sobre una perla o micropartícula para proporcionar la captura, en determinados casos. Un anticuerpo o bien primario o bien secundario puede conjugarse o asociarse de otro modo con la perla. Para sistemas de soporte sólido basados en perlas, el análisis se lleva a cabo usando un citómetro de flujo, en determinados casos.
Para los métodos en los que no se requiere un análisis colorimétrico o fluorescente secundario, se usa un anticuerpo específico del material capturado (por ejemplo, ADN de nucleosoma), en determinados casos. El anticuerpo se marca con estreptavidina y se captura con perlas marcadas con biotina, en determinados casos. Un sistema de este tipo permite el aislamiento preparativo de ADN de nucleosoma seleccionado como diana.
En determinados casos, se usa una perla o micropartícula para facilitar el aislamiento de material con ADN que tiene una fracción fetal enriquecida de nucleosomas (ADN unido a histona), ya sea a través de sedimentación (por ejemplo, sedimentación por gravedad o centrifugación) o a través de separación con un imán para recoger las perlas magnéticas. En determinados casos, se selecciona ADNlcc de nucleosoma a través de selección positiva con un anticuerpo dirigido contra una o más histonas fetales específicas (tal como se describió anteriormente) y se separa de la disolución a granel y se lava para eliminar las impurezas con varios lavados con tampón a pH neutro (o casi neutro) y con una fuerza iónica física similar. Luego se eluye el ADNlcc de nucleosoma enriquecido con respecto a la fracción fetal a partir de la perla mediante la adición de un exceso de etiqueta de afinidad por competidor al sistema (por ejemplo, en el caso de unión basada en biotina/estreptavidina, añadir un exceso de perlas marcadas con biotina a un anticuerpo conjugado con estreptavidina (o viceversa)). La liberación se logra con un exceso de biotina o un exceso de estreptavidina, en determinados casos. El ADN se toma directamente usando un protocolo de extracción de ADN (por ejemplo, kit de ácido nucleico circulante de Qiagen), en determinados casos.
En determinados casos, el ADNlcc de nucleosoma se selecciona a través de selección negativa con un anticuerpo dirigido contra una o más histonas maternas específicas (tal como se describió anteriormente). En tales casos, el ADN de nucleosoma materno se separa del plasma a granel, que contiene ADNlcc agotado de ADN unido a nucleosoma materno, y el plasma a granel residual se enriquece en ADN fetal. Luego se procesa la muestra de plasma a través de extracción de ADN o análisis directo en enfoques de secuenciación o basados en amplificación (PCR), en determinados casos. La extracción de ADN se logra usando un sistema de extracción tal como el kit de ácido nucleico circulante de Qiagen, en determinados casos.
Varios ensayos basados en ELISA para la detección de nucleosomas están disponibles comercialmente. Estos incluyen, por ejemplo, sistema ELISA-PLUS de detección de muerte celular (Roche) y kit de ELISA de nucleosomas QIA25 (EMD Millipore, Calbiochem). Tales ensayos pueden modificarse para incluir anticuerpos anti-histona específicos (fetales específicos o maternos específicos tal como se describe en el presente documento) para identificar y validar la especificidad fetal frente a materna.
Los anticuerpos útiles para el agotamiento de ADN de nucleosoma materno (selección negativa) incluyen, pero no se limitan a: anticuerpo anti-histona H1 de Abcam [1415-1] - extremo carboxilo-terminal (ab62884), anticuerpo antihistona H1.0 de Abcam (EPR6536) (ab134914), anticuerpo anti-histona H1 de Abcam (EPR6537) (ab125027), anticuerpo P10412 de UniProt, histona H1.4 también conocida como H1b, H1s4.
Los anticuerpos útiles para el enriquecimiento de ADN de nucleosoma fetal (selección positiva) incluyen: Abcam Ltd. (Cambridge, R.U.): anticuerpo H1.3 anti-histona H1.3 (ab24174), anticuerpo H1.1 anti-histona H1.1 (ab17584) y anticuerpos H1.5 anti-histona H1.5 (ab24175), H1.5 (ab18208), Novus Biologics, anticuerpo contra histona h 1.3 (NBP1-4l140), Abcam Ltd. (Cambridge, R.U.): H1.3 (ab24174) Fitzgerald, anticuerpo contra histona H3.1 (Fosfo-Thr3) (70R-11156), anticuerpo contra histona H3.1 (70R-11159).
En algunos casos, se aísla el tejido velloso placentario, y se preparan núcleos y cromatina y nucleosomas contenidas. Posteriormente, se conjuga o combina este material con un adyuvante tal como KLH para inmunizar a roedores y provocar una respuesta inmunitaria y, por tanto, generar anticuerpos. Los anticuerpos monoclonales se aíslan a través de métodos que se describen bien en la bibliografía. Tales anticuerpos monoclonales se seleccionan en ELISA tal como se describió anteriormente, con muestras de plasma de mujeres embarazadas y no embarazadas o a través de presentación en fago.
Ejemplo 2: Enriquecimiento de ADN fetal mediante ultracentrifugación
En este ejemplo, se estimó la cantidad de ADN fetal y ADN materno en micropartículas circulantes y en la fase “soluble” (es decir, no en micropartículas) en muestras de plasma agrupadas de mujeres embarazadas. El plasma de sujetos embarazadas normalmente contiene ADN “libre”, ADN de nucleosoma y ADN encerrado en micropartículas circulantes (por ejemplo, cuerpos apoptóticos) y se denominan colectivamente ADNlcc. La ultracentrifugación puede enriquecer micropartículas circulantes (cMP) de diferente tamaño (por ejemplo, exosomas (aproximadamente 70-120 nm de diámetro; que principalmente portan ARN) con respecto a cuerpos apoptóticos (de aproximadamente 300 nm a más de aproximadamente 1000 nm). Aproximadamente el 90% de cuerpos apoptóticos circulantes contienen ADN y aproximadamente el 10% contienen ARN, normalmente sin partículas mixtas que contienen ácido nucleico. Si la mayoría de cuerpos apoptóticos a las de 10 a 12 semanas de embarazo son de origen fetal, entonces la purificación de cuerpos apoptóticos es un medio para enriquecer el ADN fetal. En determinados casos se usan el fraccionamiento de estructuras subcelulares mediante centrifugación a fuerzas g seleccionadas y la centrifugación por densidad de sacarosa (o PERCOLL). Las explicaciones de determinadas abreviaturas y términos especializados usados en este ejemplo se presentan en la tabla 2 a continuación.
Figure imgf000054_0001
Enriquecimiento de ADN fetal mediante ultracentrifugación (N=2)
En determinados casos, se estimó la cantidad de ADN fetal y ADN materno en micropartículas circulantes y en la fase “soluble” (es decir, no en micropartículas) en muestras de plasma agrupadas de mujeres embarazadas usando una pequeña colección de muestras (algunas veces denominada “prueba previa”). Para mostrar que el ADN fetal se enriquece en cuerpos apoptóticos, se separaron cMP en muestras de plasma agrupadas (N=2) mediante ultracentrifugación. Se extrajo el ADN a partir de los sobrenadantes y sedimentos resultantes, y se cuantificó mediante ensayos de qPCR (por ejemplo, para p-globina y DYS1). Se calculó la fracción fetal de sobrenadantes y sedimentos de modo que se registró el enriquecimiento de ADN fetal, si estaba presente. La mayoría de ADN fetal (74%) y ADN total (70%) del plasma original (sin ultracentrifugación) estaba en el estado “soluble”, y no en el sedimento, es decir, en cMP. La distribución de ADN total y ADN fetal en el sedimento 25K x g era del 62% al 38%. Los exosomas más pequeños normalmente no albergan ADN sino ARN. Después de la centrifugación del sobrenadante 25K a 100Kx g, los resultados mostraron una distribución del 82% de ADN total en el sobrenadante y del 18% en el sedimento, lo que respalda la idea de que las partículas (principalmente exosomas) en el sedimento 100K pueden no contener grandes cantidades del a Dn circulante disponible. La fracción fetal para el control sin centrifugación fue de 0,06, para el sobrenadante 25K x g fue de 0,07 y para el sobrenadante 100K x g fue de 0,06. Los números de copias fetales en los sedimentos fueron demasiado bajos como para permitir cálculos sensibles de la fracción fetal.
Enriquecimiento de ADN fetal mediante ultracentrifugación
En determinados casos, se estimó la cantidad de ADN fetal y ADN materno en micropartículas circulantes y en la fase “soluble” (es decir, no en micropartículas) en muestras de plasma agrupadas de mujeres embarazadas usando una colección más grande de muestras. Para mostrar que el ADN fetal se enriquece en cuerpos apoptóticos, se calculó la fracción fetal de sobrenadantes y sedimentos de ultracentrifugación apropiados.
Materiales y métodos
Se realizaron determinadas observaciones, predicciones y/o conclusiones cuando se diseñó el ensayo a continuación. Por ejemplo, determinadas condiciones de centrifugación (por ejemplo, 25.000 x g durante 1 hora) pueden provocar la sedimentación de cuerpos apoptóticos y estructuras subcelulares más grandes que no se eliminan mediante las centrifugaciones previas (por ejemplo, 1600 x g durante 15 minutos y 2500 x g durante 10 minutos), en determinados casos. La mayoría de ADN fetal encerrado reside en cuerpos apoptóticos y no en otras estructuras subcelulares, en determinados casos. La prueba previa descrita anteriormente con muestras de 2 x 4 ml en réplicas (16 ml en total) estaba limitada por un bajo número de muestras. Para la cuantificación de ADN fetal, el ensayo de qPCR usado estaba limitado por la presencia de cromosomas Y (feto masculino). Se corrigió el ADN fetal sometido a ensayo por qPCR mediante un factor de 2 para reflejar una contribución estimada de machos del 50% en Super Pool 12.
Se recogió sangre periférica materna en tres tipos de tubos de recogida de sangre (BCT): BCT SCAT PPACK (1x), BCT de ADN libre de células STRECK (2 x tubos STRECK) y tubos ACD-A (2x). En el plazo de 6 horas, se produjo plasma usando el protocolo de tubos STRECK convencional: 1600 x g durante 15 minutos, retirada de plasma, seguido de 2500 x g durante 10 minutos, seguido de almacenamiento congelado de las muestras de plasma. En algunos casos, se usó plasma de STRECK Super Pool 12 (sujetos embarazadas, principalmente a las de 10 a 12 semanas de gestación) inmediatamente después de crear la agrupación (24 ml), es decir, las muestras de plasma no experimentaron la etapa de congelación convencional.
Para mantener las mismas condiciones experimentales, se centrifugaron las muestras de plasma “frescas” (congeladas sólo una vez) a 1600 x g durante 10 minutos a 4°C para retirar el posible residuo. Se usó el plasma clarificado para los estudios de ultracentrifugación.
En este ejemplo, se desarrolló un enfoque secuencial: se añadió el sobrenadante de la primera ultracentrifugación (25K x g) a un tubo de centrífuga nuevo y se centrifugó a 100K x g. Las etapas de ultracentrifugación fueron durante 1 hora cada una. Se procesaron las muestras de plasma (4 ml) por duplicado y se procesaron las muestras de qPCR (5 |il) por cuadruplicado. Se usó una centrífuga Optima MAX-XP de Beckman Coulter con un rotor de cubetas basculantes MLS-50 junto con tubos de polialómero de paredes delgadas #356819. Todas las centrifugaciones se realizaron a 4°C.
Se extrajo el ADN en plasma y sobrenadantes de centrifugación usando el protocolo del kit CNA de QIAGEN de 4 ml. El volumen de elución fue de aproximadamente 53 |il. Se extrajo el ADN en sedimentos usando el kit Investigator de QIAGEN. Se resuspendieron los sedimentos en los 200 |il de disolución de lisis que se añadieron. El volumen de elución final fue de aproximadamente 40 |il. Se almacenó el ADN a 4°C hasta su uso.
El análisis de ADN extraído de plasma (“sobrenadante”) y los sedimentos recuperados después de la centrifugación incluyó ensayos de PCR cuantitativa (qPCR) que seleccionan como diana p-globina (copias totales de ADN) y DYS1 (copias del cromosoma Y). En determinados casos, la cuantificación se realizó usando el método de curva de calibración usando ADN genómico de control humano TAQMAN (Life Tech #4312660). En determinados casos, la cuantificación se realizó usando una curva de calibración generada a partir de vellosidades de hembras no preñadas (NPF, total) y machos (macho/fetal). Los resultados experimentales de qPCR se aceptaron cuando estaban dentro del intervalo lineal de las curvas de calibración de p-globina o DYS1. Una configuración de ejemplo para la qPCR se presenta en la tabla 3 a continuación.
Figure imgf000055_0001
Figure imgf000056_0001
Los ensayos de qPCR para ADN total y ADN fetal en sobrenadantes y sedimentos (entrada: 5 |il cada una) se ejecutaron en reacciones por cuadruplicado en pocillos independientes. Se expresaron los resultados de qPCR de sobrenadante en copias/reacción (5 |il de los (53/4) |il, que representa el 37,6% de 1 ml de plasma o el 9,4% de 4 ml de plasma). Se realizó la conversión de copias/rxn a copias/ml multiplicando por 2,66. Se expresaron los resultados de qPCR de sedimento en copias/rxn (5 |il de los 40 |il). En este caso, se realizó la conversión de copias de sedimento/rxn a copias en sedimento/ml de plasma multiplicando por 2. Los datos de FQA4b para muestras de Super Pool 12 se expresaron en copias/ml de plasma. Se proporciona un resumen de reactivos de ensayo, instrumentación y software usados en este ejemplo en la tabla 4 a continuación.
Figure imgf000057_0001
Resultados
Se extrajo el ADN de muestras de plasma Super Pool 12 (congeladas sólo una vez) usando el procedimiento CNA de QIAGEN convencional y sirvió como referencia para las condiciones de ultracentrifugación. Tal como se determinó mediante qPCR, el promedio de plasma original fue de 42 copias fetales/rxn. En comparación, el sobrenadante 25K tenía 34 copias/rxn y los sedimentos 25K tenían 3 copias/rxn con un total de 37 copias fetales/rxn, en comparación con las 42 copias fetales originales. El sobrenadante 100K tenía 31 copias/rxn y el sedimento 100K tenía 1 copia/rxn con un total de 32 copias/rxn, de nuevo en comparación con las 42 copias fetales originales. En cambio, para FQA4b, el número de copias fetales fue de 334 copias/ml en la muestra previamente congelada (figura 2).
Para la evaluación de las copias totales, el promedio de plasma original fue de 698 copias de ADN total/rxn. En comparación, el sobrenadante 25K tenía 522 copias de a Dn total/rxn y los sedimentos 25K tenían 322 copias/rxn con un total de 844 copias fetales/rxn, en comparación con las 522 copias fetales originales. El sobrenadante 100K tenía 489 copias de a Dn total/rxn y el sedimento 100K tenía 107 copias de ADN total/rxn con un total de 596 copias de ADN total/rxn, en comparación con las 698 copias de ADN total originales. En cambio, para FQA4b, el número de copias de ADN total fue de 5376 copias/ml en la muestra previamente congelada (figura 3).
La fracción fetal en el plasma original era un promedio de 0,06. En el sobrenadante 25K, la fracción fetal era de 0,07 y en el sedimento correspondiente era de 0,01 (nota: sólo se detectaron y usaron 3 copias fetales en el cálculo de la fracción fetal en el sedimento). La fracción fetal en el sobrenadante 100K era de 0,06 y 0,01 (nota: sólo se detectó y usó 1 copia fetal en el cálculo de la fracción fetal en el sedimento) en el sedimento 100K. En cambio, para FQA4b, la fracción fetal usando FQA4b fue de 0,07 (figura 4).
Se calcularon las copias totales medias o las copias fetales medias de los sobrenadantes (S) y sedimentos (P) para cada condición. Para el control sin tratamiento (Super Pool 12), sólo se usó el sobrenadante (figura 5, columnas 2 y 3 de la tabla). Se calculó el total general para cada condición (figura 5, columna 4 de la tabla). Si no había pérdidas y los ensayos tenían una precisión alta, estos tres números no deben ser diferente. También se calculó la distribución de ADN total y fetal en sobrenadante y sedimento para las dos condiciones de centrifugación (figura 5, columnas 5 y 6 de la tabla). Después de la centrifugación 25K x g, se halló el 62% de ADN total en el sobrenadante y el 38% en el sedimento; la distribución cambió después de la centrifugación 100K x g al 82% y al 18%, respectivamente.
Se estimó la recuperación de ADN fetal y total “soluble” comparando los números de copias por reacción para las condiciones sin centrifugación, de 25K y de 100K. Después de la centrifugación 25K x g, se recuperaron el 75% de ADN total y el 83% de ADN fetal en el sobrenadante (figura 6). Se observaron una pérdida del 6% de ADN total y una pérdida del 10% de ADN fetal en el sobrenadante después de la etapa de centrifugación 100Kx g.
En general, se recuperaron el 70% de ADN total y el 74% de ADN fetal a partir de los sobrenadantes.
Además, cuando se comparó la cuantificación del número de copias total y fetal mediante los dos ensayos, ensayo de qPCR y FQA4b, se recuperaron el 27% de ADN total y el 14% de ADN fetal en el plasma. En este caso, se usaron los valores posteriores a la congelación para FQA4b, debido a la centrifugación 1600 x g adicional en ambos protocolos (figura 6; SP 12 = Super Pool 12).
La tecnología descrita de manera ilustrativa en el presente documento puede ponerse en práctica de manera adecuada en ausencia de cualquier elemento no dado a conocer específicamente en el presente documento. Por tanto, por ejemplo, en cada caso en el presente documento, cualquiera de los términos “que comprende”, “que consiste esencialmente en” y “que consiste en” puede reemplazarse por cualquier de los otros dos términos. Los términos y las expresiones que se han empleado se usan en cuanto a descripción y no de limitación, y el uso de tales términos y expresiones no excluye ningún equivalente de las características mostradas y descritas o porciones de las mismas, y son posibles diversas modificaciones dentro del alcance de la tecnología reivindicada. El término “un” o “una” puede referirse a uno de o una pluralidad de los elementos a los que modifica (por ejemplo, “un reactivo” puede significar uno o más reactivos) a menos que resulte contextualmente claro que se describe cualquiera de los elementos o más de uno de los elementos. El término “aproximadamente” tal como se usa en el presente documento se refiere a un valor dentro del 10% del parámetro subyacente (es decir, más o menos el 10%), y el uso del término “aproximadamente” al comienzo de una cadena de valores modifica cada uno de los valores (es decir, “aproximadamente 1, 2 y 3” se refiere a aproximadamente 1, aproximadamente 2 y aproximadamente 3). Por ejemplo, un peso de “aproximadamente 100 gramos” puede incluir pesos de entre 90 gramos y 110 gramos. Además, cuando se describe una lista de valores en el presente documento (por ejemplo, aproximadamente el 50%, el 60%, el 70%, el 80%, el 85% o el 86%), la lista incluye todos los valores intermedios y fraccionarios de los mismos (por ejemplo, el 54%, el 85,4%). Por tanto, debe entenderse que aunque la presente tecnología se ha dado a conocer específicamente mediante realizaciones representativas y características opcionales, los expertos en la técnica pueden recurrir a la modificación y variación de los conceptos dados a conocer en el presente documento, y tales modificaciones y variaciones se consideran dentro del alcance de esta tecnología.

Claims (15)

  1. REIVINDICACIONES
    i. Método para enriquecer ácido nucleico canceroso a partir de una muestra biológica que comprende células cancerosas de un sujeto, en el que el ácido nucleico de muestra comprende una primera especie de ácido nucleico asociado con histona y una segunda especie de ácido nucleico asociado con histona, comprendiendo el método:
    separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona a partir de la segunda especie de ácido nucleico asociado con histona, generando de ese modo un producto de separación enriquecido en la segunda especie de ácido nucleico asociado con histona, en el que el ácido nucleico canceroso en el producto de separación está enriquecido en relación con el ácido nucleico canceroso en el ácido nucleico de muestra,
    en el que separar parte o sustancialmente la totalidad de la primera especie de ácido nucleico asociado con histona a partir de la segunda especie de ácido nucleico asociado con histona comprende:
    a) poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con la primera especie de ácido nucleico asociado con histona, en el que la histona es una histona H1; o
    b) poner en contacto el ácido nucleico de muestra con un agente que se une específicamente a una histona asociada con la segunda especie de ácido nucleico asociado con histona, en el que la histona es H3.
  2. 2. Método según la reivindicación 1, en el que la muestra biológica comprende células cancerosas y no cancerosas.
  3. 3. Método según la reivindicación 1 ó 2, que comprende (c) analizar el ácido nucleico en el producto de separación.
  4. 4. Método según una cualquiera de las reivindicaciones 1 a 3, en el que la histona H1 es H1.0 o H1b.
  5. 5. Método según una cualquiera de las reivindicaciones 1 a 4, en el que la etapa a) del método comprende además
    i) aislar ácidos nucleicos libres de células que no están unidos al agente que se une específicamente a la histona H1, y
    ii) poner en contacto los ácidos nucleicos libres de células aislados de i) con un agente que se une específicamente a H3.
  6. 6. Método según las reivindicaciones 1 a 5, en el que la histona H3 está metilada y/o la histona H1 no está metilada.
  7. 7. Método según las reivindicaciones 1 a 6, en el que la histona H3 se selecciona del grupo que consiste en
    H3.1, H3.2 y H3t.
  8. 8. Método según una cualquiera de las reivindicaciones 1 a 7, en el que el agente es un anticuerpo.
  9. 9. Método según una cualquiera de las reivindicaciones 1 a 8, en el que a) poner en contacto el ácido nucleico de muestra con el agente implica inmunoprecipitación.
  10. 10. Método según una cualquiera de las reivindicaciones 1 a 9, en el que la muestra biológica comprende una muestra de sangre, una muestra de suero o una muestra de plasma.
  11. 11. Método según una cualquiera de las reivindicaciones 1 a 10, en el que obtener el ácido nucleico de muestra comprende someter la muestra biológica a un procedimiento in vitro que aísla el ácido nucleico de muestra de otros componentes de muestra.
  12. 12. Método según una cualquiera de las reivindicaciones 1 a 11, en el que el producto de separación comprende aproximadamente el 50% o más de segunda especie de ácido nucleico asociado con histona.
  13. 13. Método según una cualquiera de las reivindicaciones 3 a 12, en el que analizar el ácido nucleico en el producto de separación comprende el uso de un procedimiento de secuenciación.
  14. 14. Método según una cualquiera de las reivindicaciones 3 a 13, que comprende (d) determinar la presencia o ausencia de una variación genética según el análisis en (c).
  15. 15. Método según una cualquiera de las reivindicaciones 1 a 14, en el que las células cancerosas son de un cáncer de mama, un cáncer colorrectal, un cáncer gastrointestinal, un cáncer hepatocelular, un cáncer de pulmón, melanoma, linfoma no Hodgkin, leucemia, mieloma múltiple, un cáncer de vejiga, hepatoma, un cáncer de cuello uterino, un cáncer de esófago, un cáncer de páncreas o un cáncer de próstata.
ES20170556T 2012-03-02 2013-03-01 Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica Active ES2930180T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261606226P 2012-03-02 2012-03-02

Publications (1)

Publication Number Publication Date
ES2930180T3 true ES2930180T3 (es) 2022-12-07

Family

ID=47884590

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20170556T Active ES2930180T3 (es) 2012-03-02 2013-03-01 Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica

Country Status (5)

Country Link
US (4) US9605313B2 (es)
EP (4) EP2820129A1 (es)
ES (1) ES2930180T3 (es)
HK (1) HK1206055A1 (es)
WO (1) WO2013131021A1 (es)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080228700A1 (en) 2007-03-16 2008-09-18 Expanse Networks, Inc. Attribute Combination Discovery
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
CA2785020C (en) 2009-12-22 2020-08-25 Sequenom, Inc. Processes and kits for identifying aneuploidy
GB201115095D0 (en) 2011-09-01 2011-10-19 Singapore Volition Pte Ltd Method for detecting nucleosomes containing nucleotides
US10437858B2 (en) 2011-11-23 2019-10-08 23Andme, Inc. Database and data processing system for use with a network-based personal genetics services platform
ES2930180T3 (es) 2012-03-02 2022-12-07 Sequenom Inc Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
AU2013290102B2 (en) 2012-07-13 2018-11-15 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2014168711A1 (en) 2013-03-13 2014-10-16 Sequenom, Inc. Primers for dna methylation analysis
GB201304810D0 (en) * 2013-03-15 2013-05-01 Isis Innovation Assay
EP3117011B1 (en) 2014-03-13 2020-05-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN104164417A (zh) * 2014-06-26 2014-11-26 北京圣谷同创科技发展有限公司 一种外周血胎儿游离dna提取方法
US20170211143A1 (en) * 2014-07-25 2017-07-27 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
CA2965752C (en) * 2014-10-29 2024-04-02 Belgian Volition Sprl Method for the enrichment of circulating tumor dna
WO2016168844A1 (en) * 2015-04-17 2016-10-20 The Translational Genomics Research Institute Quality assessment of circulating cell-free dna using multiplexed droplet digital pcr
GB201518665D0 (en) 2015-10-21 2015-12-02 Singapore Volition Pte Ltd Method for enrichment of cell free nucleosomes
GB201518674D0 (en) * 2015-10-21 2015-12-02 Singapore Volition Pte Ltd Method for detecting nuleosomes containing histone modifications and variants
WO2017083599A1 (en) * 2015-11-12 2017-05-18 Goetzl Edward J Platelet biomarkers and diagnostic methods for vascular diseases
CN109415431A (zh) * 2016-04-20 2019-03-01 爱兰细胞技术公司 与k180二甲基化h1.0蛋白相关的组合物和方法
US11299780B2 (en) 2016-07-15 2022-04-12 The Regents Of The University Of California Methods of producing nucleic acid libraries
CA3050055C (en) 2017-01-24 2023-09-19 Sequenom, Inc. Methods and processes for assessment of genetic variations
EP3575399A4 (en) * 2017-01-24 2020-01-08 BGI Shenzhen EXOSOMAL DNA-BASED METHOD FOR CARRYING OUT A NON-INVASIVE PRENATAL DIAGNOSIS AND APPLICATION THEREOF
CN111770761A (zh) 2017-10-25 2020-10-13 爱兰细胞技术公司 H1.0k180me2抗体、其制造方法和用途
EP3737504A4 (en) * 2018-01-08 2021-10-20 Cradle Genomics, Inc. NUCLEIC ACID ISOLATION PROCESSES AND KITS
JP7296969B2 (ja) 2018-01-12 2023-06-23 クラレット バイオサイエンス, エルエルシー 核酸を解析するための方法および組成物
AU2019280712A1 (en) 2018-06-06 2021-01-07 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
WO2020069350A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
EP3874510A4 (en) 2018-10-31 2022-08-03 Ancestry.com DNA, LLC ESTIMATION OF PHENOTYPES USING DNA, PEDIGREE AND HISTORICAL DATA
US20200400656A1 (en) * 2019-06-21 2020-12-24 Stemcell Technologies Canada Inc. Particle assemblies, methods of making and use
US20240052334A1 (en) * 2019-10-04 2024-02-15 Santersus Ag Method for isolating and analyzing cell free dna
IL293342A (en) * 2019-12-02 2022-07-01 Belgian Volition Srl Use of cell-free nucleosomes as biomarkers
JP6952811B2 (ja) * 2020-01-17 2021-10-20 株式会社Cygames 情報処理プログラム、情報処理方法および情報処理システム
JP7138672B2 (ja) * 2020-03-23 2022-09-16 株式会社バンダイ プログラム、端末及びゲーム管理装置に関する。
US20220050105A1 (en) * 2020-08-12 2022-02-17 Boston Molecules, Inc. Method and apparatus for detecting viruses in biological samples
US20230366007A1 (en) * 2022-05-10 2023-11-16 Centre For Novostics Limited Analysis of nucleic acids associated with extracellular vesicles

Family Cites Families (284)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1000227A (en) * 1911-02-24 1911-08-08 William Albert Bennett Spray-burner.
JPS5727375B2 (es) 1973-06-01 1982-06-10
US4179337A (en) 1973-07-20 1979-12-18 Davis Frank F Non-immunogenic polypeptides
DE2712230C2 (de) 1977-03-19 1985-05-23 Bayer Ag, 5090 Leverkusen Verzweigte Segmentpolymere
US4109496A (en) 1977-12-20 1978-08-29 Norris Industries Trapped key mechanism
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US4522811A (en) 1982-07-08 1985-06-11 Syntex (U.S.A.) Inc. Serial injection of muramyldipeptides and liposomes enhances the anti-infective activity of muramyldipeptides
GB8311018D0 (en) 1983-04-22 1983-05-25 Amersham Int Plc Detecting mutations in dna
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5656493A (en) 1985-03-28 1997-08-12 The Perkin-Elmer Corporation System for automated performance of the polymerase chain reaction
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4676980A (en) 1985-09-23 1987-06-30 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Target specific cross-linked heteroantibodies
US4868103A (en) 1986-02-19 1989-09-19 Enzo Biochem, Inc. Analyte detection by means of energy transfer
EP0264166B1 (en) 1986-04-09 1996-08-21 Genzyme Corporation Transgenic animals secreting desired proteins into milk
US4851331A (en) 1986-05-16 1989-07-25 Allied Corporation Method and kit for polynucleotide assay including primer-dependant DNA polymerase
US5202231A (en) 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
US5525464A (en) 1987-04-01 1996-06-11 Hyseq, Inc. Method of sequencing by hybridization of oligonucleotide probes
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5080891A (en) 1987-08-03 1992-01-14 Ddi Pharmaceuticals, Inc. Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols
US5048530A (en) 1988-08-17 1991-09-17 Robert Hurwitz Method of using an amniocentesis needle with improved sonographic visibility
US5720928A (en) 1988-09-15 1998-02-24 New York University Image processing and analysis of individual nucleic acid molecules
ATE135370T1 (de) 1988-12-22 1996-03-15 Kirin Amgen Inc Chemisch modifizierte granulocytenkolonie erregender faktor
US5075212A (en) 1989-03-27 1991-12-24 University Of Patents, Inc. Methods of detecting picornaviruses in biological fluids and tissues
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5766849A (en) 1989-07-11 1998-06-16 Gen-Probe Incorporated Methods of amplifying nucleic acids using promoter-containing primer sequence
GB2236186B (en) 1989-08-22 1994-01-05 Finnigan Mat Gmbh Process and device for laser desorption of analyte molecular ions, especially of biomolecules
ES2090297T5 (es) 1989-11-06 2005-03-01 Cell Genesys, Inc. Produccion de proteinas que utilizan recombinacion homologa.
US5641628A (en) 1989-11-13 1997-06-24 Children's Medical Center Corporation Non-invasive method for isolation and detection of fetal DNA
US5272071A (en) 1989-12-22 1993-12-21 Applied Research Systems Ars Holding N.V. Method for the modification of the expression characteristics of an endogenous gene of a given cell line
JPH05503423A (ja) 1990-01-12 1993-06-10 スクリップス クリニック アンド リサーチ ファウンデーション Dna切断用核酸酵素
US6013431A (en) 1990-02-16 2000-01-11 Molecular Tool, Inc. Method for determining specific nucleotide variations by primer extension in the presence of mixture of labeled nucleotides and terminators
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US6004744A (en) 1991-03-05 1999-12-21 Molecular Tool, Inc. Method for determining nucleotide identity through extension of immobilized primer
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
DK51092D0 (da) 1991-05-24 1992-04-15 Ole Buchardt Oligonucleotid-analoge betegnet pna, monomere synthoner og fremgangsmaade til fremstilling deraf samt anvendelser deraf
DE4214112A1 (de) 1991-08-02 1993-02-04 Europ Lab Molekularbiolog Neues verfahren zur sequenzierung von nukleinsaeuren
US5700922A (en) 1991-12-24 1997-12-23 Isis Pharmaceuticals, Inc. PNA-DNA-PNA chimeric macromolecules
CA2087413A1 (en) 1992-01-17 1993-07-18 Joseph R. Lakowicz Fluorescent energy transfer immunoassay
GB9208733D0 (en) 1992-04-22 1992-06-10 Medical Res Council Dna sequencing method
GB9211979D0 (en) 1992-06-05 1992-07-15 Buchard Ole Uses of nucleic acid analogues
JPH08502723A (ja) 1992-07-27 1996-03-26 ハイブライドン インコーポレイテッド オリゴヌクレオチド・アルキルホスホノチオエート
DE69333366T2 (de) 1992-10-30 2004-09-16 The General Hospital Corp., Boston Ein neues zellzyklus kontrollprotein
JPH08509857A (ja) 1993-01-07 1996-10-22 シーケノム・インコーポレーテッド マススペクトロメトリーによるdna配列決定法
US5605798A (en) 1993-01-07 1997-02-25 Sequenom, Inc. DNA diagnostic based on mass spectrometry
US6194144B1 (en) 1993-01-07 2001-02-27 Sequenom, Inc. DNA sequencing by mass spectrometry
CA2154358A1 (en) 1993-01-21 1994-08-04 Hybridon, Inc. Integrated oligonucleotides
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6156501A (en) 1993-10-26 2000-12-05 Affymetrix, Inc. Arrays of modified nucleic acid probes and methods of use
JPH09505397A (ja) 1993-11-17 1997-05-27 アマーシャム・インターナショナル・ピーエルシー プライマー伸長質量分光分析による核酸配列決定法
CA2182517C (en) 1994-02-07 2001-08-21 Theo Nikiforov Ligase/polymerase-mediated primer extension of single nucleotide polymorphisms and its use in genetic analysis
US5637684A (en) 1994-02-23 1997-06-10 Isis Pharmaceuticals, Inc. Phosphoramidate and phosphorothioamidate oligomeric compounds
US5851770A (en) 1994-04-25 1998-12-22 Variagenics, Inc. Detection of mismatches by resolvase cleavage using a magnetic bead support
DE69531612D1 (de) 1994-04-25 2003-10-02 Avitech Diagnostics Inc Die bestimmung von mutationen durch spaltung mit resolvase
US5834189A (en) 1994-07-08 1998-11-10 Visible Genetics Inc. Method for evaluation of polymorphic genetic sequences, and the use thereof in identification of HLA types
EP0773991B1 (en) 1994-07-15 2004-06-09 Cephalon, Inc. Active calpain expressed by baculovirus
US5849483A (en) 1994-07-28 1998-12-15 Ig Laboratories, Inc. High throughput screening method for sequences or genetic alterations in nucleic acids
US5589330A (en) 1994-07-28 1996-12-31 Genzyme Corporation High-throughput screening method for sequence or genetic alterations in nucleic acids using elution and sequencing of complementary oligonucleotides
US5662813A (en) 1994-10-21 1997-09-02 Bioseparations, Inc. Method for separation of nucleated fetal erythrocytes from maternal blood samples
US5807718A (en) 1994-12-02 1998-09-15 The Scripps Research Institute Enzymatic DNA molecules
DE69535789D1 (de) 1995-01-09 2008-08-28 Boehringer Ingelheim Int Il-2r-assoziiertes polypeptid und dafür kodierende dna-molekülen
US6239273B1 (en) 1995-02-27 2001-05-29 Affymetrix, Inc. Printing molecular library arrays
DE19515552A1 (de) 1995-04-27 1996-10-31 Europ Lab Molekularbiolog Simultane Sequenzierung von Nukleinsäuren
US5955599A (en) 1995-06-01 1999-09-21 Hybridon, Inc. Process for making oligonucleotides containing o- and s- methylphosphotriester internucleoside linkages
US5962674A (en) 1995-06-01 1999-10-05 Hybridon, Inc. Synthesis of oligonucleotides containing alkylphosphonate internucleoside linkages
US6140482A (en) 1995-06-01 2000-10-31 Hybridon, Inc. Primary phosphoramidate internucleoside linkages and oligonucleotides containing the same
US5614622A (en) 1995-06-01 1997-03-25 Hybridon, Inc. 5-pentenoyl moiety as a nucleoside-amino protecting group, 4-pentenoyl-protected nucleotide synthons, and related oligonucleotide syntheses
US5981186A (en) 1995-06-30 1999-11-09 Visible Genetics, Inc. Method and apparatus for DNA-sequencing using reduced number of sequencing mixtures
US5637683A (en) 1995-07-13 1997-06-10 Cornell Research Foundation, Inc. Nucleic acid analog with amide linkage and method of making that analog
US5652356A (en) 1995-08-17 1997-07-29 Hybridon, Inc. Inverted chimeric and hybrid oligonucleotides
JP3193301B2 (ja) 1995-09-14 2001-07-30 麒麟麦酒株式会社 生理活性タンパク質p160
US5869242A (en) 1995-09-18 1999-02-09 Myriad Genetics, Inc. Mass spectrometry to assess DNA sequence polymorphisms
GB9519638D0 (en) 1995-09-26 1995-11-29 Dynal As Method
EP0886681A1 (en) 1996-03-04 1998-12-30 Genetrace Systems, Inc. Methods of screening nucleic acids using mass spectrometry
WO1997037041A2 (en) 1996-03-18 1997-10-09 Sequenom, Inc. Dna sequencing by mass spectrometry
US6329179B1 (en) 1996-03-26 2001-12-11 Oncomedx, Inc. Method enabling use of extracellular RNA extracted from plasma or serum to detect, monitor or evaluate cancer
US6759217B2 (en) 1996-03-26 2004-07-06 Oncomedx, Inc. Method enabling use of extracellular RNA extracted from plasma or serum to detect, monitor or evaluate cancer
DE69737513T2 (de) 1996-04-25 2007-12-13 Genicon Sciences Corp., San Diego Teilchenförmiges markierungsmittel verwendendes analytassay
US5928906A (en) 1996-05-09 1999-07-27 Sequenom, Inc. Process for direct sequencing during template amplification
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
IL127560A0 (en) 1996-06-14 1999-10-28 Sarnoff Corp Method for polynucleotide sequencing
US6117992A (en) 1996-08-26 2000-09-12 Hybridon, Inc. Reagents and process for synthesis of oligonucleotides containing phosphorodithioate internucleoside linkages
US5849546A (en) 1996-09-13 1998-12-15 Epicentre Technologies Corporation Methods for using mutant RNA polymerases with reduced discrimination between non-canonical and canonical nucleoside triphosphates
US5886165A (en) 1996-09-24 1999-03-23 Hybridon, Inc. Mixed backbone antisense oligonucleotides containing 2'-5'-ribonucleotide- and 3'-5'-deoxyribonucleotides segments
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
US6057134A (en) 1996-10-07 2000-05-02 Ambion, Inc. Modulating the efficiency of nucleic acid amplification reactions with 3' modified oligonucleotides
US6140053A (en) 1996-11-06 2000-10-31 Sequenom, Inc. DNA sequencing by mass spectrometry via exonuclease degradation
US7285422B1 (en) 1997-01-23 2007-10-23 Sequenom, Inc. Systems and methods for preparing and analyzing low volume analyte array elements
CA2268740C (en) 1996-11-06 2010-07-20 Sequenom, Inc. High density immobilization of nucleic acids
US6024925A (en) 1997-01-23 2000-02-15 Sequenom, Inc. Systems and methods for preparing low volume analyte array elements
DE69719220T2 (de) 1996-11-18 2004-01-22 Takeshi Imanishi Neue nucleotidanaloga
US6017702A (en) 1996-12-05 2000-01-25 The Perkin-Elmer Corporation Chain-termination type nucleic acid sequencing method including 2'-deoxyuridine-5'-triphosphate
US5876934A (en) 1996-12-18 1999-03-02 Pharmacia Biotech Inc. DNA sequencing method
US6046005A (en) 1997-01-15 2000-04-04 Incyte Pharmaceuticals, Inc. Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
US5849497A (en) 1997-04-03 1998-12-15 The Research Foundation Of State University Of New York Specific inhibition of the polymerase chain reaction using a non-extendable oligonucleotide blocker
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
US5739314A (en) 1997-04-25 1998-04-14 Hybridon, Inc. Method for synthesizing 2'-O-substituted pyrimidine nucleosides
ES2355631T3 (es) 1997-05-30 2011-03-29 Trovagene, Inc. Procedimiento para detectar secuencias de ácidos nucleicos en la orina.
EP1002264B1 (en) 1997-07-25 2004-04-14 Affymetrix, Inc. (a Delaware Corporation) Method for providing a bioinformatics database
ATE280246T1 (de) 1997-08-15 2004-11-15 Affymetrix Inc Polymorphismuserkennung mit hilfe cluster-analyse
US6029041A (en) 1997-11-21 2000-02-22 Minolta Co., Ltd. Image forming apparatus
DE19754482A1 (de) 1997-11-27 1999-07-01 Epigenomics Gmbh Verfahren zur Herstellung komplexer DNA-Methylierungs-Fingerabdrücke
US5998143A (en) 1997-12-05 1999-12-07 The Perkin-Elmer Corporation Cycle sequencing thermal profiles
DE69902996T2 (de) 1998-02-04 2003-04-30 Variagenics Inc Techniken zu detektion von fehlpaarungen
US6183958B1 (en) 1998-05-06 2001-02-06 Variagenics, Inc. Probes for variance detection
US6723564B2 (en) 1998-05-07 2004-04-20 Sequenom, Inc. IR MALDI mass spectrometry of nucleic acids using liquid matrices
US20030022207A1 (en) 1998-10-16 2003-01-30 Solexa, Ltd. Arrayed polynucleotides and their use in genome analysis
US6140054A (en) 1998-09-30 2000-10-31 University Of Utah Research Foundation Multiplex genotyping using fluorescent hybridization probes
US6610492B1 (en) 1998-10-01 2003-08-26 Variagenics, Inc. Base-modified nucleotides and cleavage of polynucleotides incorporating them
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US6520551B1 (en) 1999-01-06 2003-02-18 Michael V. Crnkovich Open door security device
US6142681A (en) 1999-02-22 2000-11-07 Vialogy Corporation Method and apparatus for interpreting hybridized bioelectronic DNA microarray patterns using self-scaling convergent reverberant dynamics
US6136541A (en) 1999-02-22 2000-10-24 Vialogy Corporation Method and apparatus for analyzing hybridized biochip patterns using resonance interactions employing quantum expressor functions
DK1163250T3 (da) 1999-03-24 2006-11-13 Exiqon As Forbedret syntese af [2.2.1]bicyclonukleosider
US6368834B1 (en) 1999-04-06 2002-04-09 Genome Technologies, Llc PCR genome walking with synthetic primer
JP5615997B2 (ja) 1999-04-30 2014-10-29 シークエノム・インコーポレーテツド 特異的切断および質量分析法の組合せによる診断的配列決定
KR20010001577A (ko) 1999-06-07 2001-01-05 윤종용 고분자 광산발생제를 이용한 올리고펩티드 핵산 탐침의 제조방법
AU779988B2 (en) 1999-06-28 2005-02-24 California Institute Of Technology Microfabricated elastomeric valve and pump systems
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
AU6629200A (en) 1999-08-25 2001-03-19 Philip P Garner Alpha-helical peptide nucleic acid alpha-pna
US20050287592A1 (en) 2000-08-29 2005-12-29 Yeda Research And Development Co. Ltd. Template-dependent nucleic acid polymerization using oligonucleotide triphosphates building blocks
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
WO2001025485A2 (en) 1999-10-06 2001-04-12 Amersham Biosciences Corp Method for detecting mutations using arrayed primer extension
EP1235932A2 (en) 1999-10-08 2002-09-04 Protogene Laboratories, Inc. Method and apparatus for performing large numbers of reactions using array assembly
US6221600B1 (en) 1999-10-08 2001-04-24 Board Of Regents, The University Of Texas System Combinatorial oligonucleotide PCR: a method for rapid, global expression analysis
US6297016B1 (en) 1999-10-08 2001-10-02 Applera Corporation Template-dependent ligation with PNA-DNA chimeric probes
US7332275B2 (en) 1999-10-13 2008-02-19 Sequenom, Inc. Methods for detecting methylated nucleotides
US6709816B1 (en) 1999-10-18 2004-03-23 Affymetrix, Inc. Identification of alleles
US6660229B2 (en) 2000-06-13 2003-12-09 The Trustees Of Boston University Use of nucleotide analogs in the analysis of oligonucleotide mixtures and in highly multiplexed nucleic acid sequencing
WO2002018616A1 (en) 2000-09-01 2002-03-07 Hitachi Chemical Co., Ltd. Adjusting the efficiency of nucleic acid template amplification by attenuated pcr with template-mimic oligonucleotides
US6664056B2 (en) 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
ES2254306T3 (es) 2000-10-25 2006-06-16 F. Hoffmann-La Roche Ag Amplificacion usando cebadores modificados.
US6929911B2 (en) 2000-11-01 2005-08-16 The Board Of Trustees Of The Leland Stanford Junior University Method for determining genetic affiliation, substructure and gene flow within human populations
US20060136142A1 (en) 2000-11-02 2006-06-22 Kurt Berlin Systems, methods and computer program products for guiding selection of a therapeutic treatment regimen based on the methylation status of the DNA
DE10061348C2 (de) 2000-12-06 2002-10-24 Epigenomics Ag Verfahren zur Quantifizierung von Cytosin-Methylierungen in komplex amplifizierter genomischer DNA
EP1229128A1 (en) 2001-01-31 2002-08-07 Boehringer Mannheim Gmbh New method for genotype determination
DE10112515B4 (de) 2001-03-09 2004-02-12 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungsmustern mit hoher Sensitivität
WO2002086163A1 (en) 2001-04-20 2002-10-31 Karolinska Innovations Ab Methods for high throughput genome analysis using restriction site tagged microarrays
DE10130800B4 (de) 2001-06-22 2005-06-23 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität
US20050037388A1 (en) 2001-06-22 2005-02-17 University Of Geneva Method for detecting diseases caused by chromosomal imbalances
IL159482A0 (en) 2001-06-22 2004-06-01 Univ Geneve Method for detecting diseases caused by chromosomal imbalances
AU2002318253A1 (en) 2001-07-15 2003-03-03 Keck Graduate Institute Methylation analysis using nicking agents
ATE502119T1 (de) 2001-07-25 2011-04-15 Oncomedx Inc Verfahren zur bewertung pathologischer krankheitszustände unter verwendung extrazellulärer rna
KR20040028991A (ko) 2001-08-20 2004-04-03 다카라 바이오 가부시키가이샤 핵산 증폭 방법
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
DE10201138B4 (de) 2002-01-08 2005-03-10 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungsmustern durch exponentielle Ligation hybridisierter Sondenoligonukleotide (MLA)
JP2005514956A (ja) 2002-01-18 2005-05-26 ジェンザイム・コーポレーション 胎児dnaの検出および対立遺伝子の定量化のための方法
JP2005517431A (ja) * 2002-02-20 2005-06-16 ユニバーシティ オブ バージニア パテント ファウンデーション ヒストン修飾マーカーを利用した非侵襲的診断検査
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US7285394B2 (en) 2002-03-15 2007-10-23 Epigenomics Ag Discovery and diagnostic methods using 5-methylcytosine DNA glycosylase
US20050164193A1 (en) 2002-03-25 2005-07-28 Epigenomics Ag Method for the analysis of methylation patterns within nucleic acids by means of mass spectrometry
US7081339B2 (en) 2002-04-12 2006-07-25 Primera Biosystems, Inc. Methods for variation detection
US7442506B2 (en) 2002-05-08 2008-10-28 Ravgen, Inc. Methods for detection of genetic disorders
US20030211483A1 (en) 2002-05-09 2003-11-13 Schroeder Benjamin G. Methods for the enrichment of low-abundance polynucleotides
WO2004013284A2 (en) 2002-08-02 2004-02-12 Tufts University A method to assess genomic dna methylation using high-performance liquid chromatography-electospray ionization mass spectrometry
CN1703521B (zh) 2002-09-06 2011-11-16 波士顿大学信托人 基因表达的定量
AU2003298733B2 (en) 2002-11-27 2009-06-18 Agena Bioscience, Inc. Fragmentation-based methods and systems for sequence variation detection and discovery
CA2513292C (en) 2003-01-17 2016-04-05 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
CA2513541A1 (en) 2003-01-29 2004-08-19 454 Corporation Method for preparing single-stranded dna libraries
AU2003900944A0 (en) 2003-02-28 2003-03-13 The University Of Queensland Cell isolation & enrichment
EP1601785A4 (en) 2003-02-28 2007-02-07 Ravgen Inc METHOD FOR DETECTING GENETIC DISEASES
AU2004217872B2 (en) 2003-03-05 2010-03-25 Genetic Technologies Limited Identification of fetal DNA and fetal cell markers in maternal plasma or serum
US20050009059A1 (en) 2003-05-07 2005-01-13 Affymetrix, Inc. Analysis of methylation status using oligonucleotide arrays
WO2005010145A2 (en) 2003-07-05 2005-02-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
DE602004019941D1 (de) 2003-07-31 2009-04-23 Sequenom Inc Verfahren für multiplex-polymerasekettenreaktionen auf hohem niveau und homogenen massenverlängerungsreaktionen zur genotypisierung von polymorphismen
AU2003263660A1 (en) 2003-08-29 2005-03-16 Pantarhei Bioscience B.V. Prenatal diagnosis of down syndrome by detection of fetal rna markers in maternal blood
WO2005023091A2 (en) 2003-09-05 2005-03-17 The Trustees Of Boston University Method for non-invasive prenatal diagnosis
WO2005028674A2 (en) 2003-09-22 2005-03-31 Trisogen Biotechnology Limited Partnership Methods and kits useful for detecting an alteration in a locus copy number
EP1689884A4 (en) 2003-10-08 2007-04-04 Univ Boston METHODS OF PRENATAL DIAGNOSIS OF CHROMOSOMIC ANOMALIES
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
AU2004286235B2 (en) 2003-10-21 2011-05-12 Orion Genomics Llc Differential enzymatic fragmentation
US20070111233A1 (en) 2003-10-30 2007-05-17 Bianchi Diana W Prenatal diagnosis using cell-free fetal DNA in amniotic fluid
AU2004286845A1 (en) 2003-10-30 2005-05-19 Tufts-New England Medical Center Prenatal diagnosis using cell-free fetal DNA in amniotic fluid
US7709262B2 (en) 2004-02-18 2010-05-04 Trustees Of Boston University Method for detecting and quantifying rare mutations/polymorphisms
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
JP4492156B2 (ja) 2004-03-03 2010-06-30 ニプロ株式会社 血清アルブミンドメインを含む蛋白質
US7608394B2 (en) 2004-03-26 2009-10-27 Sequenom, Inc. Methods and compositions for phenotype identification based on nucleic acid methylation
EP2395098B1 (en) 2004-03-26 2015-07-15 Agena Bioscience, Inc. Base specific cleavage of methylation-specific amplification products in combination with mass analysis
US7468249B2 (en) 2004-05-05 2008-12-23 Biocept, Inc. Detection of chromosomal disorders
EP1765994B1 (en) 2004-06-01 2009-11-18 The University of North Carolina at Chapel Hill Reconstituted histone methyltransferase complex and methods of identifying modulators thereof
US7709194B2 (en) 2004-06-04 2010-05-04 The Chinese University Of Hong Kong Marker for prenatal diagnosis and monitoring
EP1794321A2 (en) 2004-07-30 2007-06-13 Whitehead Institute For Biomedical Research Markers of alterations in the y chromosome and uses therefor
WO2006034427A2 (en) 2004-09-20 2006-03-30 Proteogenix, Inc. Diagnosis of fetal aneuploidy
AU2005308916B2 (en) 2004-11-29 2011-07-21 Sequenom, Inc. Kits and methods for detecting methylated DNA
CA2589487C (en) 2004-11-29 2014-07-29 Klinikum Der Universitat Regensburg Means and methods for detecting methylated dna
CN101137760B (zh) 2005-03-18 2011-01-26 香港中文大学 检测染色体非整倍性的方法
CA3007182A1 (en) 2005-03-18 2006-09-21 The Chinese University Of Hong Kong Markers for prenatal diagnosis, monitoring or predicting preeclampsia
US20070048755A1 (en) 2005-03-22 2007-03-01 New York University Assay for determining the sex of primates
EP1910574A2 (en) 2005-08-02 2008-04-16 Sequenom, Inc. Methods and compositions for disease prognosis based on nucleic acid methylation
US20070122823A1 (en) 2005-09-01 2007-05-31 Bianchi Diana W Amniotic fluid cell-free fetal DNA fragment size pattern for prenatal diagnosis
SI1981995T2 (sl) 2006-02-02 2019-08-30 The Board Of Trustees Of The Leland Stanford Junior University Neinvazivni genetski presejalni test ploda z digitalno analizo
AU2007220991C1 (en) 2006-02-28 2013-08-15 University Of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
KR20080107464A (ko) 2006-03-06 2008-12-10 더 트러스티이스 오브 콜롬비아 유니버시티 인 더 시티 오브 뉴욕 혼합된 태아-모체 소스로부터 태아 dna 서열의 특이적 증폭
US20070243549A1 (en) 2006-04-12 2007-10-18 Biocept, Inc. Enrichment of circulating fetal dna
US7901884B2 (en) 2006-05-03 2011-03-08 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
US7754428B2 (en) 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
US8679741B2 (en) 2006-05-31 2014-03-25 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
EP2029779A4 (en) 2006-06-14 2010-01-20 Living Microsystems Inc HIGHLY PARALLEL SNP GENOTYPING UTILIZATION FOR FETAL DIAGNOSIS
US20080096766A1 (en) 2006-06-16 2008-04-24 Sequenom, Inc. Methods and compositions for the amplification, detection and quantification of nucleic acid from a sample
US7902345B2 (en) 2006-12-05 2011-03-08 Sequenom, Inc. Detection and quantification of biomolecules using mass spectrometry
US8133701B2 (en) 2006-12-05 2012-03-13 Sequenom, Inc. Detection and quantification of biomolecules using mass spectrometry
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2118298B1 (en) 2007-02-08 2013-01-09 Sequenom, Inc. Nucleic acid-based tests for rhd typing
WO2008103763A2 (en) 2007-02-20 2008-08-28 Sequenom, Inc. Methods and compositions for cancer diagnosis and treatment based on nucleic acid methylation
GB0703996D0 (en) 2007-03-01 2007-04-11 Oxitec Ltd Nucleic acid detection
GB2447493A (en) 2007-03-15 2008-09-17 Marcus Lewis User-controllable operation of local outgoing and incoming message stores
EP2140031A4 (en) 2007-03-26 2011-04-20 Sequenom Inc RESTRICTION ENDONUCLEASE REINFORCED POLYMORPHIC SEQUENCE DETECTION
WO2008157264A2 (en) 2007-06-15 2008-12-24 Sequenom, Inc. Combined methods for the detection of chromosomal aneuploidy
DK2557517T3 (da) 2007-07-23 2022-11-28 Univ Hong Kong Chinese Bestemmelse af ubalance i nukleinsyresekvens
US20090053719A1 (en) 2007-08-03 2009-02-26 The Chinese University Of Hong Kong Analysis of nucleic acids by digital pcr
WO2009032779A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
ATE549419T1 (de) 2007-08-29 2012-03-15 Sequenom Inc Verfahren und zusammensetzungen für die universelle grössenspezifische polymerasekettenreaktion
US8748100B2 (en) 2007-08-30 2014-06-10 The Chinese University Of Hong Kong Methods and kits for selectively amplifying, detecting or quantifying target DNA with specific end sequences
JP2010539906A (ja) * 2007-09-21 2010-12-24 バイオセプト インコーポレイティッド 胎児の細胞および核酸の同定および単離
US8455197B2 (en) 2007-10-04 2013-06-04 Commonwealth Scientific And Industrial Research Organisation Nucleic acid amplification
JP2010539991A (ja) 2007-10-04 2010-12-24 ハルシオン モレキュラー 電子顕微鏡を用いた核酸ポリマーの配列決定
US8093063B2 (en) 2007-11-29 2012-01-10 Quest Diagnostics Investments Incorporated Assay for detecting genetic abnormalities in genomic nucleic acids
EP3360972B1 (en) 2008-01-17 2019-12-11 Sequenom, Inc. Single molecule nucleic acid sequence analysis processes
CA2717320A1 (en) 2008-03-11 2009-09-17 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
EP2276858A4 (en) 2008-03-26 2011-10-05 Sequenom Inc RESTRICTED ENDONUCLEASE AMPLIFIED POLYMORPHIC SEQUENCE DETECTION
WO2010017214A1 (en) 2008-08-04 2010-02-11 Gene Security Network, Inc. Methods for allele calling and ploidy calling
US20110229877A1 (en) 2008-07-07 2011-09-22 Oxford Nanopore Technologies Limited Enzyme-pore constructs
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
EP3103871B1 (en) 2008-09-16 2020-07-29 Sequenom, Inc. Processes for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for fetal nucleic acid quantification
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
PL2334812T3 (pl) * 2008-09-20 2017-06-30 The Board Of Trustees Of The Leland Stanford Junior University Nieinwazyjna diagnostyka aneuploidii płodu za pomocą sekwencjonowania
US20100240054A1 (en) 2008-09-22 2010-09-23 Biocept, Inc. Identification and isolation of fetal cells and nucleic acid
US7897356B2 (en) 2008-11-12 2011-03-01 Caris Life Sciences Methods and systems of using exosomes for determining phenotypes
WO2010065470A2 (en) 2008-12-01 2010-06-10 Consumer Genetics, Inc. Compositions and methods for detecting background male dna during fetal sex determination
DE102009005043A1 (de) 2009-01-15 2009-06-25 Takata-Petri Ag Insassenrückhalteeinrichtung
US20100279295A1 (en) 2009-03-18 2010-11-04 Sequenom, Inc. Use of thermostable endonucleases for generating reporter molecules
EP3211095B1 (en) 2009-04-03 2019-01-02 Sequenom, Inc. Nucleic acid preparation compositions and methods
US8563242B2 (en) 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
EP2824191A3 (en) 2009-10-26 2015-02-18 Lifecodexx AG Means and methods for non-invasive diagnosis of chromosomal aneuploidy
SI3783110T1 (sl) * 2009-11-05 2023-02-28 The Chinese University Of Hong Kong, Genomska analiza ploda iz materinega biološkega vzorca
WO2011054936A1 (en) 2009-11-06 2011-05-12 The Chinese University Of Hong Kong Size-based genomic analysis
CA2785020C (en) 2009-12-22 2020-08-25 Sequenom, Inc. Processes and kits for identifying aneuploidy
EP3006573B1 (en) 2010-01-19 2018-03-07 Verinata Health, Inc Methods for determining fraction of fetal nucleic acids in maternal samples
AU2011207561B2 (en) 2010-01-19 2014-02-20 Verinata Health, Inc. Partition defined detection methods
EA023565B1 (ru) 2010-01-26 2016-06-30 ЭнАйПиДи ДЖЕНЕТИКС ЛТД. Способы и композиции для неинвазивной пренатальной диагностики анеуплоидии плода
WO2011100057A2 (en) 2010-02-09 2011-08-18 Eugene Spier Methods and compositions for universal detection of nucleic acids
US9189086B2 (en) 2010-04-01 2015-11-17 Smart Technologies Ulc Interactive input system and information input method therefor
EP2569447A4 (en) 2010-05-14 2013-11-27 Fluidigm Corp ANALYZES FOR DETECTION OF GENOTYPE, MUTATIONS, AND / OR ANEUPLOIDIE
WO2011143659A2 (en) 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
CA2798758C (en) 2010-05-18 2019-05-07 Natera, Inc. Methods for non-invasive prenatal ploidy calling
WO2011150974A1 (en) * 2010-06-03 2011-12-08 Porto Conte Ricerche S.R.L. Biomarkers for lung neuroendocrine tumors
US8603742B2 (en) 2010-07-06 2013-12-10 University of Pittsburgh—of the Commonwealth System of Higher Education Methods for the diagnosis of fetal disease
TWI786520B (zh) 2010-11-30 2022-12-11 香港中文大學 與癌症有關之基因或分子變異之檢測
WO2012078792A2 (en) 2010-12-07 2012-06-14 Stanford University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
US20120184449A1 (en) 2010-12-23 2012-07-19 Sequenom, Inc. Fetal genetic variation detection
US20120219950A1 (en) 2011-02-28 2012-08-30 Arnold Oliphant Assay systems for detection of aneuploidy and sex determination
US8460872B2 (en) 2011-04-29 2013-06-11 Sequenom, Inc. Quantification of a minority nucleic acid species
CA2742327A1 (en) * 2011-05-20 2012-11-20 The University Of British Columiba Systems and methods for enhanced scoda
WO2012174256A2 (en) 2011-06-17 2012-12-20 The Regents Of The University Of Michigan Dna methylation profiles in cancer
US9139874B2 (en) 2011-07-07 2015-09-22 Life Technologies Corporation Bi-directional sequencing compositions and methods
US8981066B2 (en) * 2011-08-23 2015-03-17 Buck Institute For Research On Aging Epigenetic mechanisms related to DNA damage and aging
GB201115099D0 (en) 2011-09-01 2011-10-19 Belgian Volition Sa Method for detecting nucleosomes
GB201115098D0 (en) 2011-09-01 2011-10-19 Belgian Volition Sa Method for detecting nucleosomes containing histone variants
EP2764459B1 (en) 2011-10-06 2021-06-30 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
DK2766496T3 (en) 2011-10-11 2017-05-15 Sequenom Inc METHODS AND PROCESSES FOR NON-INVASIVE ASSESSMENT OF GENETIC VARIATIONS
RU2634266C2 (ru) 2011-12-07 2017-10-24 Белджиан Волишн Спрл Способ детекции аддуктов нуклеосом
PL2805280T3 (pl) 2012-01-20 2022-11-21 Sequenom, Inc. Procesy diagnostyczne będące czynnikiem warunków doświadczalnych
ES2930180T3 (es) 2012-03-02 2022-12-07 Sequenom Inc Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
EP3978621B1 (en) 2012-05-21 2023-08-30 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
AU2013290102B2 (en) 2012-07-13 2018-11-15 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2014168711A1 (en) 2013-03-13 2014-10-16 Sequenom, Inc. Primers for dna methylation analysis
KR102540202B1 (ko) 2013-05-24 2023-06-02 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
US10174375B2 (en) 2013-09-20 2019-01-08 The Chinese University Of Hong Kong Sequencing analysis of circulating DNA to detect and monitor autoimmune diseases
WO2015061359A1 (en) 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
EP3117011B1 (en) 2014-03-13 2020-05-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US11783911B2 (en) 2014-07-30 2023-10-10 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
WO2016057901A1 (en) 2014-10-10 2016-04-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2965752C (en) 2014-10-29 2024-04-02 Belgian Volition Sprl Method for the enrichment of circulating tumor dna
GB201518665D0 (en) 2015-10-21 2015-12-02 Singapore Volition Pte Ltd Method for enrichment of cell free nucleosomes

Also Published As

Publication number Publication date
WO2013131021A1 (en) 2013-09-06
US20130230858A1 (en) 2013-09-05
US20170321276A1 (en) 2017-11-09
US10738359B2 (en) 2020-08-11
EP2820129A1 (en) 2015-01-07
US11312997B2 (en) 2022-04-26
EP3401399B1 (en) 2020-04-22
US20200362412A1 (en) 2020-11-19
EP4155401A1 (en) 2023-03-29
US9605313B2 (en) 2017-03-28
EP3757210B1 (en) 2022-08-24
US20220356523A1 (en) 2022-11-10
HK1206055A1 (en) 2015-12-31
EP3757210A1 (en) 2020-12-30
EP3401399A1 (en) 2018-11-14

Similar Documents

Publication Publication Date Title
ES2930180T3 (es) Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica
JP7296969B2 (ja) 核酸を解析するための方法および組成物
JP6227095B2 (ja) 遺伝的変異の非侵襲的評価のための方法およびプロセス
JP6680680B2 (ja) 染色体変化の非侵襲性評価のための方法およびプロセス
JP6431769B2 (ja) 実験条件を要因として含める診断プロセス
CA2850785C (en) Methods and processes for non-invasive assessment of genetic variations
DK2766496T3 (en) METHODS AND PROCESSES FOR NON-INVASIVE ASSESSMENT OF GENETIC VARIATIONS
JP2015513392A5 (es)
AU2011348267A1 (en) Fetal genetic variation detection
WO2013176958A1 (en) Methods and compositions for analyzing nucleic acid
Pei et al. Identifying balanced chromosomal translocations in human embryos by Oxford nanopore sequencing and breakpoints region analysis
Gahan Circulating nucleic acids in plasma and serum: applications in diagnostic techniques for noninvasive prenatal diagnosis
EP4172357B1 (en) Methods and compositions for analyzing nucleic acid
WO2023158739A2 (en) Methods and compositions for analyzing nucleic acid